中文短文本分类方法研究

被引:5
作者
王细薇
沈云琴
机构
[1] 河南城建学院信息中心
关键词
短文本分类; 共现关系; 特征扩展;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
区别于传统的基于词的中文短文本自动分类方法,以训练数据作为背景语料,利用关联规则挖掘算法挖掘训练集文本中的共现关系,创建特征共现集作为扩展词表。用特征共现集分别对训练文本和测试文本进行特征扩展建立短文本分类模型。实验表明,改进后的两种方法使短文本分类系统具有较高的精度。
引用
收藏
页码:28 / 31
页数:4
相关论文
共 1 条
[1]   基于关联规则挖掘的中文文本自动分类 [J].
王元珍 ;
钱铁云 ;
冯小年 .
小型微型计算机系统, 2005, (08) :1380-1383