热点主题词提取方法研究

被引:5
作者
程肖
陆蓓
谌志群
机构
[1] 杭州电子科技大学计算机应用技术研究所
关键词
网络舆情; 中文分词; 主题词; 权重计算;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
针对热点主题词的提取,在候选主题词的多级过滤中,尝试通过对大规模数据处理,分析其在时间标签基础上的统计规律来确定噪音词,提出联合方差的概念。基于多特征的融合提出热点主题词权重计算方法,构造出热点主题词判断公式HK,实现对热点主题词的提取。实验结果表明,该方法对热点主题词的提取有一定的效果。
引用
收藏
页码:43 / 48
页数:6
相关论文
共 6 条
[1]   基于改进蚁群聚类的热点主题发现算法研究 [J].
陆蓓 ;
程肖 ;
谌志群 .
现代图书情报技术, 2010, (04) :66-71
[2]   互联网舆情挖掘研究述略 [J].
陆蓓 ;
程肖 ;
谌志群 .
情报资料工作, 2010, (02) :41-45
[3]   网络热点事件发现系统的设计 [J].
刘星星 ;
何婷婷 ;
龚海军 ;
陈龙 .
中文信息学报, 2008, 22 (06) :80-85
[4]   网络文本主题词的提取与组织研究 [J].
曾依灵 ;
许洪波 ;
白硕 .
中文信息学报, 2008, (03) :64-70+80
[5]   知识抽取中的停用词处理技术 [J].
化柏林 .
现代图书情报技术, 2007, (08) :48-51
[6]  
基于主题词的网络热点话题发现[A]. 李恒训,张华平,秦鹏,于满泉,刘金刚.第五届全国信息检索学术会议论文集[C]. 2009