基于新闻要素的新事件检测方法研究

被引:8
作者
薛晓飞 [1 ]
张永奎 [1 ,2 ]
任晓东 [1 ]
机构
[1] 山西大学计算机与信息技术学院
[2] 山西大学计算智能与中文信息处理教育部重点实验室
关键词
新事件检测; 事件模型; 相似度计算;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
新事件检测(NED)的目标是检测出报道一个新闻话题种子事件的第一个新闻。考虑到新闻的基本要素在新闻中的作用,采用特征加权的方式对传统的词频和倒排文档频率(TF-IDF)模型进行改进,并在新闻报道中提取出时间信息和地点信息,分别对内容相似度、时间相似度和地点相似度进行计算,并将三者结合来检测新事件。实验证明这种方法有效。
引用
收藏
页码:2975 / 2977
页数:3
相关论文
共 4 条
  • [1] 一种组合型中文文本分类特征选择方法
    刘海峰
    王元元
    刘守生
    [J]. 广西师范大学学报(自然科学版), 2007, (04) : 208 - 211
  • [2] 基于改进向量空间模型的话题识别与跟踪
    宋丹
    王卫东
    陈英
    [J]. 计算机技术与发展, 2006, (09) : 62 - 64+67
  • [3] 话题识别与跟踪研究
    李保利
    俞士汶
    不详
    [J]. 计算机工程与应用 , 2003, (17) : 7 - 10+109
  • [4] 文档中词语权重计算方法的改进
    鲁松
    李晓黎
    白硕
    王实
    [J]. 中文信息学报, 2000, (06) : 8 - 13+20