基于新词发现的网络新闻热点排名

被引:17
作者
王馨
王煜
王亮
机构
[1] 河北大学计算机科学与技术学院
关键词
关联规则; 未登录词; 互信息; 热点度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
[目的 /意义]随着网络新闻的广泛快速传播,通过辨析网络新词,及时掌握新闻热点关键词,对于了解新闻热点和社会舆情的预警控制具有十分重要的意义。[方法 /过程]利用改进的关联规则算法对网络新闻标题进行挖掘,相邻、有序地输出频繁字符串集合。根据互信息计算字符串的相似度,形成热点新闻的关键词集合,以实际的网络新闻为语料进行实验。[结果 /结论]实验结果表明,本文所提出的方法不仅能有效地发现词典中不存在的新词汇以及当前网络中流行的热词,而且有效地区别词汇集合中的复合式新词,继而可通过热词集合的热点度计算对网络新闻热点进行排名。
引用
收藏
页码:68 / 74
页数:7
相关论文
共 9 条
[1]
网络新词识别算法研究 [J].
刘哲 ;
黄永峰 ;
罗芳 ;
陈跻 ;
王丙坤 .
计算机工程与科学, 2013, 35 (09) :141-145
[2]
基于词共现关系强度和关键词词频的叙词选词方法探究 [J].
浦墨 ;
郑彦宁 ;
赵筱媛 ;
刘志辉 .
图书情报工作, 2013, 57 (15) :121-125+49
[3]
基于词共现图的中文微博新闻话题识别 [J].
赵文清 ;
侯小可 .
智能系统学报, 2012, 7 (05) :444-449
[4]
Chinese New Word Identification:A Latent Discriminative Model with Global Features[J] 孙晓;黄德根;宋海玉;任福继; Journal of Computer Science & Technology 2011, 01
[5]
Internet中的新词识别 [J].
李钝 ;
曹元大 ;
万月亮 .
北京邮电大学学报, 2008, (01) :26-29
[6]
网络热词传播现象研究[D] 李铁锤 华中科技大学 2012,
[7]
新词语的特点分析及其认知解释[D] 游玉祥 上海外国语大学 2012,
[8]
新词识别和热词排名方法研究 [D]. 
耿升华 .
重庆大学,
2013
[9]
A Method of Hot Topic Detection in Blogs Using N-gram Model[J] Xiaodong Wang;Juan Wang Journal of Software 2013,