基于BBS热点主题发现的文本聚类方法

被引:14
作者
唐果
陈宏刚
机构
[1] 西南大学计算机与信息科学学院
关键词
浏览机制; 文本聚类; 热点主题;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对电子公告板(BBS)帖子浏览机制不完善和主题发现效率不高的问题,提出一种基于BBS热点主题发现的文本聚类方法。将含有关键词的文档向量相加,经权重处理后计算其两两距离,合并最小的2类,并逐次进行,使最终类的大小比较均匀,以分等级的菜单方式组织帖子便于逐层浏览。实验结果表明,该方法比常规方法更适用于BBS主题浏览。
引用
收藏
页码:79 / 81
页数:3
相关论文
共 5 条
[1]   一种基于DASOM的两阶段中文文本聚类方法 [J].
朱红灿 ;
唐毅 .
情报杂志 , 2007, (09) :101-104
[2]   一种基于语义内积空间模型的文本聚类算法 [J].
彭京 ;
杨冬青 ;
唐世渭 ;
付艳 ;
蒋汉奎 .
计算机学报, 2007, (08) :1354-1363
[3]   基于非对称相似度的文本聚类方法 [J].
宋韶旭 ;
李春平 .
清华大学学报(自然科学版), 2006, (07) :1325-1328
[4]   基于LSI和自组织神经网络的高效文本聚类方法 [J].
徐建锁 ;
王正欧 .
天津大学学报, 2004, (11) :1026-1030
[5]   TCBLSA:一种中文文本聚类新方法 [J].
王国勇 ;
徐建锁 .
计算机工程, 2004, (05) :21-22+37