共 13 条
中文文本分类中的特征词抽取方法
被引:16
作者:

论文数: 引用数:
h-index:
机构:
机构:
[1] 西北师范大学数学与信息科学学院
来源:
关键词:
特征抽取;
无词典分词;
位置权重;
词条过滤;
文本分类;
D O I:
10.16208/j.issn1000-7024.2009.17.042
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
针对目前各类主流的中文文本特征词抽取方法中只关心词频信息却不关注特征的位置这一现象,给出了位置权重的概念,对以往提出的无词典分词算法进行了适当的修改,并在此基础上提出将信息增益、卡方统计和互信息这3种常用的特征选择方法有机的结合起来,构成新的特征选择方法。这种新方法综合考虑了特征的各类信息,从而更加准确地选取文本中的有效特征词,并且试验结果也验证了这种改进算法的可行性和有效性。
引用
收藏
页码:4127 / 4129
页数:3
相关论文
共 13 条
- [1] 一种改进的文本特征选择方法的研究与设计[J]. 微型电脑应用, 2008, (05) : 21 - 23+4论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:路遥论文数: 0 引用数: 0 h-index: 0机构: 安徽农业大学信息与计算机学院 安徽农业大学信息与计算机学院涂立静论文数: 0 引用数: 0 h-index: 0机构: 安徽农业大学信息与计算机学院 安徽农业大学信息与计算机学院
- [2] 基于位置权重的文本分类[J]. 安徽水利水电职业技术学院学报, 2008, (01) : 64 - 66台德艺论文数: 0 引用数: 0 h-index: 0机构: 合肥工业大学计算机信息学院谢飞论文数: 0 引用数: 0 h-index: 0机构: 合肥工业大学计算机信息学院胡学钢论文数: 0 引用数: 0 h-index: 0机构: 合肥工业大学计算机信息学院
- [3] 一种改进的高效分词词典机制[J]. 贵州大学学报(自然科学版), 2007, (04) : 380 - 384+389王东论文数: 0 引用数: 0 h-index: 0机构: 贵州大学计算机科学与技术学院陈笑蓉论文数: 0 引用数: 0 h-index: 0机构: 贵州大学计算机科学与技术学院
- [4] 无词典中文特征词自动抽取的桥接模式滤除算法[J]. 计算机应用研究, 2007, (07) : 168 - 170宣照国论文数: 0 引用数: 0 h-index: 0机构: 大连理工大学系统工程研究所论文数: 引用数: h-index:机构:
- [5] 文本分类中特征降维方式的研究[J]. 海南大学学报(自然科学版), 2007, (01) : 62 - 66伍建军论文数: 0 引用数: 0 h-index: 0机构: 海南大学信息科学技术学院论文数: 引用数: h-index:机构:
- [6] 汉语分词词典设计[J]. 计算机工程与应用 , 2007, (01) : 1 - 2+26翟伟斌论文数: 0 引用数: 0 h-index: 0机构: 不详周振柳论文数: 0 引用数: 0 h-index: 0机构: 不详蒋卓明论文数: 0 引用数: 0 h-index: 0机构: 不详许榕生论文数: 0 引用数: 0 h-index: 0机构: 不详
- [7] 一个面向文本分类的中文特征词自动抽取方法[J]. 计算机工程与应用, 2006, (15) : 165 - 167付德宇论文数: 0 引用数: 0 h-index: 0机构: 哈尔滨工业大学信息与网络中心代成琴论文数: 0 引用数: 0 h-index: 0机构: 哈尔滨工业大学信息与网络中心
- [8] 中文文本分类中的特征选择算法研究[J]. 光通信研究, 2005, (03) : 44 - 46胡佳妮论文数: 0 引用数: 0 h-index: 0机构: 北京邮电大学徐蔚然论文数: 0 引用数: 0 h-index: 0机构: 北京邮电大学郭军论文数: 0 引用数: 0 h-index: 0机构: 北京邮电大学邓伟洪论文数: 0 引用数: 0 h-index: 0机构: 北京邮电大学
- [9] 基于改进贝叶斯模型的问题分类[J]. 中文信息学报, 2005, (02) : 100 - 105论文数: 引用数: h-index:机构:刘挺论文数: 0 引用数: 0 h-index: 0机构: 哈尔滨工业大学计算机学院信息检索研究室文勖论文数: 0 引用数: 0 h-index: 0机构: 哈尔滨工业大学计算机学院信息检索研究室
- [10] 中文文本分类中特征抽取方法的比较研究[J]. 中文信息学报, 2004, (01) : 26 - 32论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构: