基于模糊聚类的网络论坛热点话题挖掘

被引:18
作者
鲁明羽
姚晓娜
魏善岭
机构
[1] 大连海事大学信息科学技术学院
关键词
网络论坛(BBS); 热点话题挖掘; 模糊聚类; 帖子线索;
D O I
10.16411/j.cnki.issn1006-7736.2008.04.032
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
为解决单个帖子线索的多话题性问题,识别聚类中的孤立点,提出一种基于模糊聚类的网络论坛(BBS)热点话题挖掘算法.采用模糊聚类进行话题识别,使得一个帖子线索可以隶属于多个话题,而对于隶属度远小于类内平均隶属度的帖子线索,则当作孤立点来处理.此外,还给出了一种面向BBS文本的特征表示方法,并结合隶属度给出基于模糊划分的话题热度评分公式.实验结果验证了该算法的有效性.
引用
收藏
页码:52 / 54+58 +58
页数:4
相关论文
共 2 条