共 12 条
中文新闻关键事件的主题句识别
被引:11
作者:
王伟
[1
,2
]
赵东岩
[1
,3
]
赵伟
[1
]
机构:
[1] 北京大学计算科学与技术研究所
[2] 武警工程学院电子技术系
[3] 计算语言学教育部重点实验室
基金:
高等学校博士学科点专项科研基金;
关键词:
计算机应用;
中文信息处理;
自然语言处理;
自动文摘;
事件抽取;
新闻标题;
D O I:
10.13209/j.0479-8023.2011.110
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
提出在单文档中通过提取主题句以获取关键事件信息的思想。根据新闻的体裁特点,分析了新闻报道与事件的关系,以及新闻标题在内容、形式和语言方面的特征。提出利用标题的提示性信息提取主题句来描述新闻关键事件的方法。该方法首先对新闻标题按信息含量进行分类,然后结合新闻句子的词频、长度、位置、与标题的相似度等特征计算句子的重要性。实验表明,该方法能够准确提取新闻主题句,为进一步抽取事件信息打好了基础。
引用
收藏
页码:789 / 796
页数:8
相关论文