基于能量演化线索的潜在爆发词探测方法

被引:14
作者
洪娜 [1 ]
张智雄 [2 ]
乐小虬 [2 ]
机构
[1] 中国医学科学院医学信息研究所
[2] 中国科学院国家科学图书馆
关键词
时间序列; 爆发词; 潜在爆发词; 能量;
D O I
暂无
中图分类号
G353 [情报资料的处理];
学科分类号
1205 ;
摘要
从跟踪词能量演化线索的角度分析潜在爆发词探测的可行性,提出一种基于词的能量和能量增长趋势的潜在爆发词探测方法。首先对词的生命周期及其演化现象进行阐述,在方法分析和词的能量积累与衰减、能量趋势变化分析的基础上,提出建模依据,设计EneTr模型,并分别针对EneTr模型中的关键问题提出相应的解决方案,实现具体的算法,最后分别针对网络新闻和科学文献两种类型的文档流进行分析和实验,验证本方法的效果。
引用
收藏
页码:45 / 52
页数:8
相关论文
共 8 条
[1]   基于主题词频和g指数的研究热点分析方法 [J].
赵星 ;
高小强 ;
郭吉安 ;
陶乃航 .
图书情报工作, 2009, 53 (02) :59-61+7
[2]   基于科技文献中词语的科技发展监测方法研究 [J].
魏晓俊 .
情报杂志, 2007, (03) :34-36+39
[3]  
搜索引擎发展阶段研究及热点发现[J]. 唐琴,许侃,林鸿飞.情报学报. 2008 (05)
[4]  
基于主题聚类的学科研究热点及其趋势监测方法[J]. 章成志,梁勇.情报学报. 2010 (02)
[5]   Bursty and hierarchical structure in streams [J].
Kleinberg, J .
DATA MINING AND KNOWLEDGE DISCOVERY, 2003, 7 (04) :373-397
[6]  
ThemeRiver:Visualizing Theme Changes over Time. Havre S,Nowell L. Proceedings of IEEE Symposium on Information Visualiza-tion.InfoVis2000 . 2000
[7]  
Mapping Topics and Topic Bursts in PNAS. Mane K K,B rner K. Proceedings ofthe National Academy ofSciences ofthe United States ofAmerica . 2004
[8]  
An Experimental Comparison of Naive Bayesian and Keyword-Based Anti-Spam Filtering with Encrypted Personal E-mail Messages. Ion Androutsopoulos, John Koutsias, Konstantinos V Chandrinos, et al. Proceedings of the 23rd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2000) . 2000