中文新闻关键事件的主题句识别

被引:11
作者
王伟 [1 ,2 ]
赵东岩 [1 ,3 ]
赵伟 [1 ]
机构
[1] 北京大学计算科学与技术研究所
[2] 武警工程学院电子技术系
[3] 计算语言学教育部重点实验室
基金
高等学校博士学科点专项科研基金;
关键词
计算机应用; 中文信息处理; 自然语言处理; 自动文摘; 事件抽取; 新闻标题;
D O I
10.13209/j.0479-8023.2011.110
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
提出在单文档中通过提取主题句以获取关键事件信息的思想。根据新闻的体裁特点,分析了新闻报道与事件的关系,以及新闻标题在内容、形式和语言方面的特征。提出利用标题的提示性信息提取主题句来描述新闻关键事件的方法。该方法首先对新闻标题按信息含量进行分类,然后结合新闻句子的词频、长度、位置、与标题的相似度等特征计算句子的重要性。实验表明,该方法能够准确提取新闻主题句,为进一步抽取事件信息打好了基础。
引用
收藏
页码:789 / 796
页数:8
相关论文
共 12 条
[1]   基于事件框架的主题事件融合研究 [J].
许荣华 ;
吴刚 ;
李培峰 ;
朱巧明 .
计算机应用研究, 2009, 26 (12) :4542-4545
[2]   基于指代消解的中文事件融合方法 [J].
许荣华 ;
吴刚 ;
李培峰 ;
朱巧明 .
计算机应用, 2009, 29 (08) :2264-2267
[3]   中文事件抽取技术研究 [J].
赵妍妍 ;
秦兵 ;
车万翔 ;
刘挺 .
中文信息学报, 2008, (01) :3-8
[4]   目前网络新闻标题语法修辞的缺失及对策 [J].
杨琳 ;
周耀民 .
社科纵横, 2007, (04) :137-139
[5]   基于事件框架的信息抽取系统 [J].
梁晗 ;
陈群秀 ;
吴平博 .
中文信息学报, 2006, (02) :40-46
[6]   网络新闻标题与报纸新闻标题比较 [J].
徐小立 .
新闻前哨, 2006, (Z1) :102-103
[7]   基于时空分析的线索性事件的抽取与集成系统研究 [J].
吴平博 ;
陈群秀 ;
马亮 .
中文信息学报, 2006, (01) :21-28
[8]   一种事件信息抽取模式获取方法 [J].
姜吉发 .
计算机工程, 2005, (15) :96-98
[10]   基于事件框架的事件相关文档的智能检索研究 [J].
吴平博 ;
陈群秀 ;
马亮 .
中文信息学报, 2003, (06) :25-30+59