基于主题的中文短信文本分类研究

被引:20
作者
刘金岭
机构
[1] 淮阴工学院计算机工程系
关键词
短信文本; KNN算法; 主题句;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
根据中文短信文本分类的特点,提出同义概念归并、上下位概念的聚焦以及短信文本重点词汇的确定方法,利用主题句选取算法获取短信文本的主题,采用KNN算法将短信文本的主题进行分类。仿真实验结果表明,该算法能够有效提高短信文本的分类速度。
引用
收藏
页码:30 / 32
页数:3
相关论文
共 3 条
[1]
基于语义的高质量中文短信文本聚类算法 [J].
刘金岭 .
计算机工程, 2009, 35 (10) :201-202+205
[2]
一种基于TFIDF方法的中文关键词抽取算法 [J].
徐文海 ;
温有奎 .
情报理论与实践, 2008, (02) :298-302
[3]
补偿型的Sleeping expert文本分类算法 [J].
解冲锋 ;
李星 .
清华大学学报(自然科学版), 2001, (07) :39-42