共 13 条
基于加权TextRank的新闻关键事件主题句提取
被引:11
作者:
蒲梅
周枫
周晶晶
严馨
周兰江
机构:
[1] 昆明理工大学信息工程与自动化学院
来源:
关键词:
TextRank算法;
句子相似度;
关键事件;
主题句提取;
影响权重;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
为了在大量的新闻中快速找到自己感兴趣的内容,提出在单文档中基于加权TextRank算法提取主题句的方法,以得到新闻关键事件信息。通过计算新闻文本句子关键词的互信息值,对新闻报道进行事件句和非事件句的分类,过滤出非事件句。基于TextRank算法的思想,构建一个事件句有向图,引入句子位置、句子相似度和关键词覆盖频率3个影响因子,以此计算句子之间的影响权重,利用TextRank模型对图中的每个点计算权重,并选取排序最靠前的句子作为关键事件的主题句。实验结果表明,该方法的抽取效果优于基于词频-逆文档概率和新闻标题的主题句抽取方法。
引用
收藏
页码:219 / 224
页数:6
相关论文