基于文本表示的特征项权值确定方法研究

被引:8
作者
王海涌
郑丽英
刘丽艳
机构
[1] 光电技术与智能控制教育部重点实验室(兰州交通大学)
关键词
文本分类; 特征项; 权值确定;
D O I
10.16468/j.cnki.issn1004-0366.2005.03.026
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
文本表示中特征项的权值确定方法决定了文本特征的提取,在很大程度上影响了文本分类的准确率.通过系统总结常用的几种特征项权值的确定方法,并逐一比较分析和研究,提出了一种性能较好的确定方法——据位定权函数,经实验验证据位定权函数确实能够有效地提高文本分类的准确性.
引用
收藏
页码:86 / 89
页数:4
相关论文
共 4 条
[1]   中文文本挖掘中的无词典分词的算法及其应用 [J].
胥桂仙 ;
苏筱蔚 ;
陈淑艳 .
吉林工学院学报(自然科学版), 2002, (01) :16-18
[2]   Web文本挖掘技术研究 [J].
王继成 ;
潘金贵 ;
张福炎 .
计算机研究与发展, 2000, (05) :513-520
[3]  
知识发现.[M].史忠植著;.清华大学出版社.2002,
[4]  
智能系统非经典数学方法.[M].朱剑英[著];.华中科技大学出版社.2001,