共 5 条
基于BBS热点主题发现的文本聚类方法
被引:14
作者:
唐果
陈宏刚
机构:
[1] 西南大学计算机与信息科学学院
来源:
关键词:
浏览机制;
文本聚类;
热点主题;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
针对电子公告板(BBS)帖子浏览机制不完善和主题发现效率不高的问题,提出一种基于BBS热点主题发现的文本聚类方法。将含有关键词的文档向量相加,经权重处理后计算其两两距离,合并最小的2类,并逐次进行,使最终类的大小比较均匀,以分等级的菜单方式组织帖子便于逐层浏览。实验结果表明,该方法比常规方法更适用于BBS主题浏览。
引用
收藏
页码:79 / 81
页数:3
相关论文