基于特征加权的新闻主题句抽取

被引:7
作者
万国
张桂平
白宇
朱耀辉
机构
[1] 沈阳航空航天大学知识工程研究中心
关键词
特征加权; 重合度; 关联度; 加权二部图;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
根据新闻文本的特点,分别对新闻标题与正文进行分析,该文提出了一种针对新闻文本的特征加权的主题句抽取方法。首先对新闻主题句在文本中的分布情况进行分析,选取了位置特征;然后根据新闻标题对于新闻主旨的提示作用,选取了标题句子重合度与关联度的特征,且在关联度特征中将基于加权二部图的最大匹配算法融入其中;最后依据句子的得分排名,进行主题句抽取。实验显示,利用该方法进行主题句抽取的P@1为75.9%,P@3达到92.4%。
引用
收藏
页码:120 / 126
页数:7
相关论文
共 15 条
[1]   基于无向图构建策略的主题句抽取 [J].
葛斌 ;
李芳芳 ;
李阜 ;
肖卫东 .
计算机科学, 2011, 38 (05) :181-185
[2]   基于综合方法的文本主题句的自动抽取 [J].
张云涛 ;
龚玲 ;
王永成 .
上海交通大学学报, 2006, (05) :771-774+782
[3]   利用串匹配技术实现网上新闻的主题提取(英文) [J].
尹中航 ;
王永成 ;
蔡巍 ;
韩客松 .
软件学报, 2002, (02) :159-167
[4]  
iSpreadRank: Ranking sentences for extraction-based summarization using feature weight propagation in the sentence similarity network[J] . Jen-Yuan Yeh,Hao-Ren Ke,Wei-Pang Yang. &nbspExpert Systems With Applications . 2007 (3)
[5]  
Text Classification based on the Latent Topics of Important Sentences extracted by the PageRank Algorithm. Ogura Y,Kobayashi I. Proceedings of the ACL Student Research Workshop . 2013
[6]  
Information Retrieval Model Combining Sentence Level Retrieval. Zuo J,Wang M,Wan J,et al. International Conference on Asian Language Processing . 2013
[7]  
An Approach to Sentiment Analysis for Chinese News Text Based on Topic Sentences Extraction. You J,ZhangY,Tong Y. International Journal of Knowledge and Language Processing . 2014
[8]  
An automatic online news topic keyphrase extraction system. Canhui Wang,Min Zhang,Liyun Ru,Shaoping Ma. ACM International Conference on Web Intelligence and Intelligent Agent Technology . 2008
[9]  
Automatic single-document key fact extraction from newswire articles. Kastner I,Monz C. Proceedings of the 12th Conference of the European Chapter of the Association for Computational Linguistics . 2009
[10]  
Automatic single-document key fact extraction from newswire articles. Kastner I,Monz C. Proceedings of the 12th Conference of the European Chapter of the Association for Computational Linguistics . 2009