基于命名实体的Web新闻文本分类方法

被引:6
作者
潘正高 [1 ,2 ]
侯传宇 [2 ]
谈成访 [2 ]
机构
[1] 合肥工业大学计算机与信息学院
[2] 宿州学院智能信息处理重点实验室
关键词
文本分类; 向量空间模型; 特征选择; 命名实体;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文章对Web新闻领域的文本自动分类问题进行了研究,提出一种基于新闻实体要素的分类方法;在应用空间向量模型的基础上,充分考虑命名实体对Web新闻文本分类的特殊作用,并进行了实验。实验结果表明,以新闻实体要素为特征的文本分类系统可得到较高的分类精度,该方法具有一定的实用价值。
引用
收藏
页码:1178 / 1182
页数:5
相关论文
共 4 条
[1]   基于向量空间模型的自动摘要冗余处理研究 [J].
张筱丹 ;
胡学钢 .
合肥工业大学学报(自然科学版), 2010, 33 (09) :1355-1358
[2]   基于实体识别的在线主题检测方法 [J].
付艳 ;
杨冬青 ;
唐世渭 ;
伍伟 ;
王腾蛟 ;
高军 .
北京大学学报(自然科学版), 2009, 45 (02) :227-232
[3]   基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报 , 2006, (02) :87-94
[4]  
Hierarchically classifying documents using very few words .2 D. Koller,and M. Sahami. Proceedings of the Fourteenth International Conference on Machine Learning (ICML‘97) . 1997