一种新的网络热点话题提取方法

被引:6
作者
蒙祖强
黄柏雄
机构
[1] 广西大学计算机与电子信息学院
关键词
热点话题; 极大相容块; 词共现网络; 词聚类; 文本聚类;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
网络热点话题提取是网络舆情分析的重要手段,已成为信息检索领域研究的热点内容之一.传统聚类方法因其聚类结果不允许相交等因素,暴露了其在基于(主题)词聚类进行话题发现中的诸多缺点.本文基于小世界理论建立词的共现网络模型并去除大量冗余词,然后运用极大相容块技术并基于过滤后的词共现网络实现对相交话题的提取,获取网络热点话题.本文方法与传统聚类方法有本质区别,基于(主题)词聚类进行话题发现具有独特的优势,较好克服了已有方法的缺点.实验说明了本文方法对提取网络热点话题是有效和可行的,比同类算法具有更好的性能,且具有较好的可伸缩性.
引用
收藏
页码:743 / 748
页数:6
相关论文
共 13 条
[1]   基于流信息距离的多文本流热点挖掘 [J].
杨宁 ;
唐常杰 ;
王悦 ;
陈瑜 ;
郑皎凌 ;
李红军 .
软件学报, 2011, 22 (08) :1761-1770
[2]   基于概念和语义网络的近似网页检测算法 [J].
曹玉娟 ;
牛振东 ;
赵堃 ;
彭学平 .
软件学报, 2011, 22 (08) :1816-1826
[3]   基于词聚类的热点话题检测算法 [J].
龙志祎 ;
程葳 .
计算机工程与设计, 2011, 32 (06) :2214-2217
[4]   基于多中心模型的网络热点话题发现算法 [J].
王巍 ;
杨武 ;
齐海凤 .
南京理工大学学报(自然科学版), 2009, 33 (04) :422-426+431
[5]   基于语义域语言模型的中文话题关联检测 [J].
洪宇 ;
张宇 ;
范基礼 ;
刘挺 ;
李生 .
软件学报, 2008, (09) :2265-2275
[6]   网络文本主题词的提取与组织研究 [J].
曾依灵 ;
许洪波 ;
白硕 .
中文信息学报, 2008, (03) :64-70+80
[7]   网络热点信息发现研究 [J].
曾依灵 ;
许洪波 .
通信学报, 2007, (12) :141-146
[8]   基于主题子空间的文本模糊C均值聚类方法 [J].
吉翔华 ;
陈超 ;
邵正荣 ;
俞能海 .
小型微型计算机系统, 2007, (12) :2225-2228
[9]   话题检测与跟踪的评测及研究综述 [J].
洪宇 ;
张宇 ;
刘挺 ;
李生 .
中文信息学报, 2007, (06) :71-87
[10]   流量内容词语相关度的网络热点话题提取 [J].
周亚东 ;
孙钦东 ;
管晓宏 ;
李卫 ;
陶敬 .
西安交通大学学报, 2007, (10) :1142-1145+1150