一种基于时序主题模型的网络热点话题演化分析系统

被引:23
作者
廖君华
孙克迎
钟丽霞
机构
[1] 山东理工大学科技信息研究所
关键词
主题模型; 话题演化; 热点话题; LDA;
D O I
暂无
中图分类号
G350 [情报学]; G206 [传播理论];
学科分类号
摘要
设计基于网络数据的时序主题演化系统Hot Topics Analysis System(HTAS),实现网络热点话题数据源自动定制、自动获取和自动存储。针对中文话题分析,HTAS集成了Google的开源分词系统IKAnalyzer,批量处理中文文档。采用LDA模型对网络热点话题主题进行提取,并利用时间标签发现热点话题,通过图标形式可视化展示其演化规律。通过"钓鱼岛事件"的实验证明,HTAS系统能快速获取、存储网络热点话题,并能有效地分析其演化趋势。
引用
收藏
页码:96 / 102+118 +118
页数:8
相关论文
共 8 条