共 6 条
基于关键词抽取的自动文摘算法
被引:11
作者:
蒋效宇
机构:
[1] 北京服装学院商学院
来源:
关键词:
自动文摘;
向量空间模型;
关键词抽取;
词汇链;
未登录词识别;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
针对生成文摘内容不完整的问题,利用相邻词的共现频率进行未登录词识别,提出一种通过词汇链的构建进行中文关键词抽取和文摘生成的算法,并给出一种采用《知网》为知识库构建词汇链的方法。通过计算词义相似度构建词汇链,结合词汇所在词汇链的强度、信息熵和出现位置等属性,进行关键词抽取和句子重要度计算。实验结果表明,与已有算法相比,该算法能够提高生成摘要的召回率和准确率。
引用
收藏
页码:183 / 186
页数:4
相关论文