基于关键词抽取的自动文摘算法

被引：11

作者：

蒋效宇

机构：

[1] 北京服装学院商学院

来源：

计算机工程 | 2012年 / 38卷 / 03期

关键词：

自动文摘; 向量空间模型; 关键词抽取; 词汇链; 未登录词识别;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

针对生成文摘内容不完整的问题,利用相邻词的共现频率进行未登录词识别,提出一种通过词汇链的构建进行中文关键词抽取和文摘生成的算法,并给出一种采用《知网》为知识库构建词汇链的方法。通过计算词义相似度构建词汇链,结合词汇所在词汇链的强度、信息熵和出现位置等属性,进行关键词抽取和句子重要度计算。实验结果表明,与已有算法相比,该算法能够提高生成摘要的召回率和准确率。

引用

页码：183 / 186

页数：4

共 6 条

[1] 基于自动文本分类的关键词抽取算法 [J].