一种改进的基于共现关系的短文本特征扩展算法研究

被引:4
作者
王细薇
张凯
机构
[1] 河南城建学院
关键词
共现关系; 特征扩展; 短文本分类;
D O I
10.14140/j.cnki.hncjxb.2012.04.009
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对短文本单一共现词特征扩展效果不理想的情况,提出一种改进的基于共现关系的短文本特征扩展算法,改进之处在于考虑了多个共现词同时出现的情况,改进了特征词权重计算公式及特征扩展策略,并应用于中文短文本分类,使分类准确度得到了一定提升。
引用
收藏
页码:48 / 50
页数:3
相关论文
共 4 条
[1]   中文短文本分类方法研究 [J].
王细薇 ;
沈云琴 .
现代计算机(专业版), 2010, (07) :28-31
[2]   基于属性选择的半监督短文本分类算法 [J].
蔡月红 ;
朱倩 ;
孙萍 ;
程显毅 .
计算机应用, 2010, 30 (04) :1015-1018
[3]   一种基于特征扩展的中文短文本分类方法 [J].
王细薇 ;
樊兴华 ;
赵军 .
计算机应用, 2009, 29 (03) :843-845
[4]   面向短文本的命名实体识别 [J].
王丹 ;
樊兴华 .
计算机应用, 2009, 29 (01) :143-145+171