文本分类中特征项权重的计算方法

被引:9
作者
贝雨馨
崔荣一
机构
[1] 延边大学理工学院计算机科学与技术系
关键词
文本分类; 向量空间模型; 特征项权重;
D O I
10.16379/j.cnki.issn.1004-4353.2004.03.012
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
特征项权重的计算方法是基于向量空间模型的文本分类中一个核心问题 ,计算方法的选择关系到最终分类的效果 .本文对文本分类中特征项权重的计算方法进行了说明 ,并根据实验对几种特征项权重的计算方法进行了比较
引用
收藏
页码:202 / 204+234 +234
页数:4
相关论文
共 5 条
[1]   文本挖掘研究进展 [J].
湛燕 ;
陈昊 ;
袁方 ;
王丽娟 .
河北大学学报(自然科学版), 2003, (02) :221-226
[2]   文本索引词项相对权重计算方法与应用 [J].
蓝海洋 ;
周杰韩 ;
张和明 ;
不详 .
计算机工程与应用 , 2003, (15) :68-70
[3]   基于向量空间模型的中文信息检索技术研究 [J].
杨小平 ;
丁浩 ;
黄都培 .
计算机工程与应用, 2003, (15) :109-111
[4]   文本分类中的特征抽取 [J].
秦进 ;
陈笑蓉 ;
汪维家 ;
陆汝占 .
计算机应用, 2003, (02) :45-46
[5]   一个基于向量空间模型的中文文本自动分类系统 [J].
朱华宇 ;
孙正兴 ;
张福炎 .
计算机工程, 2001, (02) :15-17+63