一种基于TF·IEF模型的在线新闻事件探测方法

被引:3
作者
张辉
李国辉
贾立
孙博良
机构
[1] 国防科技大学信息系统与管理学院
基金
湖南省自然科学基金;
关键词
在线新闻事件探测; TF·IEF模型; 增量事件模型; Single-Pass聚类;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
为了提升在线新闻事件探测的性能,提出一种基于TF.IEF模型的在线新闻事件探测方法。该方法受TF.IDF思想的启发,直接计算特征词表征事件的权重,建立新的增量事件模型,并将探测过程分为两个阶段:第一阶段利用Single-Pass将一定时段内收集到的报道聚成微簇;第二阶段将微簇与已有事件进行相似性匹配,然后通过重新计算事件向量实现模型更新。实验结果表明,该方法运算速度快,特征信息丢失少,提高了探测的效率和准确率。
引用
收藏
页码:55 / 60
页数:6
相关论文
共 6 条
[1]   基于增量型聚类的自动话题检测研究 [J].
张小明 ;
李舟军 ;
巢文涵 .
软件学报, 2012, 23 (06) :1578-1587
[2]   基于实体识别的在线主题检测方法 [J].
付艳 ;
杨冬青 ;
唐世渭 ;
伍伟 ;
王腾蛟 ;
高军 .
北京大学学报(自然科学版), 2009, 45 (02) :227-232
[3]   基于子话题分治匹配的新事件检测 [J].
洪宇 ;
张宇 ;
范基礼 ;
刘挺 ;
李生 .
计算机学报, 2008, (04) :687-695
[4]   基于词元再评估的新事件检测模型 [J].
张阔 ;
李涓子 ;
吴刚 ;
王克宏 .
软件学报, 2008, (04) :817-828
[5]  
新闻话题表示模型和关联追踪技术研究[D]. 张晓艳.国防科学技术大学. 2010
[6]  
The 2003 topic detection and tracking task definitionand evaluation plan .2 NIST. http://www.itl.nist.gov/iaui/894.01/tests/tdt/tdt2003/evalplan.htm .