基于加权TextRank的新闻关键事件主题句提取

被引:11
作者
蒲梅
周枫
周晶晶
严馨
周兰江
机构
[1] 昆明理工大学信息工程与自动化学院
关键词
TextRank算法; 句子相似度; 关键事件; 主题句提取; 影响权重;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
为了在大量的新闻中快速找到自己感兴趣的内容,提出在单文档中基于加权TextRank算法提取主题句的方法,以得到新闻关键事件信息。通过计算新闻文本句子关键词的互信息值,对新闻报道进行事件句和非事件句的分类,过滤出非事件句。基于TextRank算法的思想,构建一个事件句有向图,引入句子位置、句子相似度和关键词覆盖频率3个影响因子,以此计算句子之间的影响权重,利用TextRank模型对图中的每个点计算权重,并选取排序最靠前的句子作为关键事件的主题句。实验结果表明,该方法的抽取效果优于基于词频-逆文档概率和新闻标题的主题句抽取方法。
引用
收藏
页码:219 / 224
页数:6
相关论文
共 13 条
[1]   基于HMM的加权Textrank单文档的关键词抽取算法 [J].
方康 ;
韩立新 .
信息技术, 2015, (04) :114-116+120
[2]   融合LDA与TextRank的关键词抽取研究 [J].
顾益军 ;
夏天 .
现代图书情报技术 , 2014, (Z1) :41-47
[3]   词语位置加权TextRank的关键词抽取研究 [J].
夏天 .
现代图书情报技术, 2013, (09) :30-34
[4]   基于无向图构建策略的主题句抽取 [J].
葛斌 ;
李芳芳 ;
李阜 ;
肖卫东 .
计算机科学, 2011, 38 (05) :181-185
[5]   基于WFC和MI的主题句提取方法 [J].
薛扣英 ;
原盛 ;
张心严 .
计算机工程, 2009, 35 (20) :184-186
[6]   基于句子关系图的网页文本主题句抽取 [J].
何维 ;
王宇 .
现代图书情报技术, 2009, (03) :57-61
[7]   文本主题的自动提取方法研究与实现 [J].
张其文 ;
李明 .
计算机工程与设计, 2006, (15) :2744-2746+2766
[8]   基于综合方法的文本主题句的自动抽取 [J].
张云涛 ;
龚玲 ;
王永成 .
上海交通大学学报, 2006, (05) :771-774+782
[9]   一种基于字同现频率的汉语文本主题抽取方法 [J].
马颖华 ;
王永成 ;
苏贵洋 ;
张宇萌 .
计算机研究与发展, 2003, (06) :874-878
[10]   三个层面的中文文本主题自动提取研究 [J].
韩客松 ;
王永成 ;
沈洲 ;
吴芳芳 .
中文信息学报, 2001, (04) :20-27