基于词向量包的自动文摘方法

被引:5
作者
白淑霞 [1 ]
鲍玉来 [1 ]
张晖 [2 ]
机构
[1] 内蒙古大学图书馆
[2] 内蒙古大学计算机学院
关键词
词向量; 词包向量; 自动文摘;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
[目的]利用向量空间描述语义信息,研究基于词向量包的自动文摘方法;[方法]文摘是文献内容缩短的精确表达;而词向量包可以在同一个向量空间下表示词、短语、句子、段落和篇章,其空间距离用于反映语义相似度。提出一种基于词向量包的自动文摘方法,用词向量包的表示距离衡量句子与整篇文献的语义相似度,将与文献语义相似的句子抽取出来最终形成文摘;[结果]在DUC01数据集上,实验结果表明,该方法能够生成高质量的文摘,结果明显优于其它方法;[结论]实验证明该方法明显提升了自动文摘的性能。
引用
收藏
页码:8 / 13
页数:6
相关论文
共 8 条
  • [1] 基于机器学习的自动文摘研究综述
    曹洋
    成颖
    裴雷
    [J]. 图书情报工作 , 2014, (18) : 122 - 130
  • [2] A new sentence similarity measure and sentence based extractive technique for automatic text summarization[J] . Ramiz M. Aliguliyev. Expert Systems With Applications . 2008 (4)
  • [3] Semantic hashing[J] . Ruslan Salakhutdinov,Geoffrey Hinton. International Journal of Approximate Reasoning . 2008 (7)
  • [4] A novel document similarity measure based on earth mover's distance
    Wan, Xiaojun
    [J]. INFORMATION SCIENCES, 2007, 177 (18) : 3718 - 3730
  • [5] Text summarization using a trainable summarizer and latent semantic analysis[J] . Jen-Yuan Yeh,Hao-Ren Ke,Wei-Pang Yang,I-Heng Meng. Information Processing and Management . 2004 (1)
  • [6] Training a selection function for extraction .2 Lin C. Y. Proceedings of the eighth internationalconference on Information and knowledge management . 1999
  • [7] Enhancing Single-document Summarization by Combining RankNet and Third-party Sources .2 Svore K M,Vanderwende L,Burges C J C. Emnlp . 2007
  • [8] Generic text summarization using relevance measure and latent semantic anal-ysis .2 Gong Y,Liu X. Proceedings of the24th annual international ACM SIGIR conference on Research anddevelopment in information retrieval . 2001