基于熵值的网络论坛热点话题发现

被引:10
作者
孙永利
李东
张玥
机构
[1] 哈尔滨工业大学计算机网络与信息安全技术研究中心
关键词
网络论坛; 话题发现; 属性特征; 热度熵值; 热点话题追踪; 舆情监测;
D O I
暂无
中图分类号
TP393.09 []; TP391.1 [文字信息处理];
学科分类号
080402 ; 081203 ; 0835 ;
摘要
针对网络论坛热点话题的识别、发现和舆情监测问题,提出一种基于热度熵值的热点话题发现方法。通过网络爬虫抓取网络论坛中的数据,在对数据进行预处理和分析热点话题属性特征的基础上,合理定义各属性的权重和话题的热度熵值,并以此对话题的热点信息进行分析、统计与评估,从而发现和追踪网络论坛中的热点话题。同时,对话题的热度进行细致划分和各种类型的定义,采用不同阈值策略计算不同类型的热度信息标注的准确率。实验结果表明,该方法合理、有效,相比于传统的话题语义分析方法具有较高的准确率,可作为互联网论坛舆情监测的依据。
引用
收藏
页码:312 / 316
页数:5
相关论文
共 8 条
[1]   基于中心化的微博热点发现方法 [J].
蔡淑琴 ;
张静 ;
王旸 ;
马玉涛 ;
林勇 .
管理学报, 2012, 9 (06) :874-879
[2]   基于BBS的热点话题发现与态势预测技术的研究 [J].
卢珺珈 ;
张宏莉 ;
张玥 .
智能计算机与应用, 2012, 2 (02) :1-5
[3]   一种中文微博新闻话题检测的方法 [J].
郑斐然 ;
苗夺谦 ;
张志飞 ;
高灿 .
计算机科学, 2012, 39 (01) :138-141
[4]   基于内容分析的中文BBS话题检测系统的设计与实现 [J].
赵艳红 ;
聂哲 .
计算机应用与软件, 2011, 28 (06) :242-246
[5]   面向网络论坛的突发话题发现 [J].
陈友 ;
程学旗 ;
杨森 .
中文信息学报, 2010, 24 (03) :29-36
[6]   一种基于信息检索技术的网络新闻影响力分析方法 [J].
杨伟杰 ;
戴汝为 ;
崔霞 .
软件学报, 2009, 20 (09) :2397-2406
[7]   网络论坛中发帖行为复杂性研究 [J].
程葳 ;
钟华 ;
孙娇华 .
系统工程学报, 2009, (04) :385-391
[8]  
Using text mining and sentiment analysis for online forums hotspot detection and forecast[J] . Nan Li,Desheng Dash Wu.Decision Support Systems . 2009 (2)