基于关键词抽取的自动文摘算法

被引:11
作者
蒋效宇
机构
[1] 北京服装学院商学院
关键词
自动文摘; 向量空间模型; 关键词抽取; 词汇链; 未登录词识别;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
针对生成文摘内容不完整的问题,利用相邻词的共现频率进行未登录词识别,提出一种通过词汇链的构建进行中文关键词抽取和文摘生成的算法,并给出一种采用《知网》为知识库构建词汇链的方法。通过计算词义相似度构建词汇链,结合词汇所在词汇链的强度、信息熵和出现位置等属性,进行关键词抽取和句子重要度计算。实验结果表明,与已有算法相比,该算法能够提高生成摘要的召回率和准确率。
引用
收藏
页码:183 / 186
页数:4
相关论文
共 6 条
[1]   基于自动文本分类的关键词抽取算法 [J].
张虹 .
计算机工程, 2009, 35 (12) :145-147
[2]   基于相邻词的中文关键词自动抽取 [J].
王灿辉 ;
张敏 ;
马少平 ;
黄宇 .
广西师范大学学报(自然科学版), 2007, (02) :161-164
[3]   基于规则和统计的中文自动文摘系统 [J].
傅间莲 ;
陈群秀 .
中文信息学报, 2006, (05) :10-16
[4]   基于词汇链的文本过滤模型 [J].
尤文建 ;
李绍滋 ;
李堂秋 .
计算机应用研究, 2003, (09) :32-35
[5]   一种篇章结构指导的中文Web文档自动摘要方法 [J].
王继成 ;
武港山 ;
周源远 ;
张福炎 .
计算机研究与发展, 2003, (03) :398-405
[6]   面向非受限领域的综合式自动中文文摘方法 [J].
郭玉箐 ;
万敏 ;
罗振声 .
清华大学学报(自然科学版), 2002, (01) :139-142