摘要:随着国际互联网的迅猛发展,网上文本信息资源以指数级的速度增长如何快速有效地将文本按其内容进行分门别类的整理,以便于利用这些海量文本,变得越来越重要和困难因此,研究文本自动分类技术具有很重要的现实意义 本文分析考察了文本分类过程中的主要技术中文分词、特征选择、粗糙集和分类器构造,并在广泛研究现有文本自动分类方法的基础上,利用人工神经网络具有的自学习性、自组织性、联想记忆功能和推理意识等在文本自动分类上的独特优势,构建了神经网络分类器由于BPBackProPagation,反向传播神经网络广泛应用于文本自动分类领域,因此本文对BP网络文本分类过程分阶段进行了改进,并证明了本文方法的优越性 本文改进了BP神经网络分类方法,主要设计思路如下首先从已有文本中随机选择部分文本,并建立训练语料库接着对训练文本进行分词,去掉停用词和标点符号,然后词频统计,并生成各文本类的特征向量接着分别使用改进互信息、X2统计方法和本文提出的联合特征选择法,对特征空间做降维处理然后使用粗糙集理论进行属性约简最后建立BP神经网络文本分类器并初始化网络,用训练语料库训练BP文本分类器,直至网络的训练满足一定的收敛条件至此,基于BP神经网络的文本分类器构造完成标题:神经网络中文文本文本分类专业:计算机软件与理论学位:硕士单位:南京邮电大学@关键词:神经网络 中文文本 文本分类 论文时间:2008分类:TP391.1 TP183 导师:陈慧南 张卫丰 语种:中文文摘URL:
神经网络中文文本文本分类
来源:互联网 发布日期:2011-09-16 11:21:03 浏览:23223次
相关内容
AiLab云推荐
最新资讯
本月热点
热门排行
-
最坏时期已过,美国5G市场即将迎来回暖?
阅读量:34597
-
华为5G-A实现规模组网,下载速度超过4Gbps,比5G快10倍
阅读量:34266
-
回望2023年5G发展:释放和提升价值成最大课题
阅读量:11947
-
全球吹响5G-A商用号角
阅读量:10200
-
首发新款麒麟5G芯片!曝华为nova 12系列12月26日登场
阅读量:9261
-
5.5G在欧洲突破,DNA首次将5.5G技术引入现网
阅读量:8460
推荐内容
- 2024第25届中国兰州国际医疗器械博览会
- 2024第九届中国西安丝绸之路国际旅游博览会
- 2024第27届重庆都市文化旅游节暨城际旅游交易会
- 2024年第25届广西广告展览会
- 2024宁夏(银川)国际广告节
- 2024中国(青岛)国际户外用品暨房车露营装备博览会、2024中国(青岛)国际体育用品、健身器材暨泳池设施装备博览会、第五届新电商产业博览会
- 2024第二十三届中国西部国际广告节
- IBS 2024第十二届生物质能源与有机固废资源化利用高峰论坛
- 2024第二届中国(西安)国际消防技术装备展览会
- 2024长三角国际环保产业展览会
- FEC2024第17届广州国际服装供应链博览会
- 2024第60届沈阳医疗器械展3月28日盛大召开!!!
- 2024第二届成渝经济圈表面工程博览会
- 2024南京充电桩展览会
- 2024第十四届中国(郑州)塑料产业博览会
- 2024HOTELEX第32届上海国际酒店及餐饮业博览会 HOTELEX上海展
- 海名·2024上海火锅食材及用品展览会
- 2024第29届中国(北京)国际美博会
- 2024宁波国际文具展
- 第二十届中国(重庆)国际润滑油、脂、添加剂、养护用品及技术设备展览会
- 2024上海国际酒店工程设计与用品博览会