基于潜在语义索引和句子聚类的中文自动文摘

被引:5
作者
陈戈
段建勇
陆汝占
机构
[1] 上海交通大学计算机科学与工程系
关键词
自动文摘; 潜在语义索引; 句子聚类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
自动文摘是自然语言处理领域的一项重要的研究课题。提出一种基于潜在语义索引和句子聚类的中文自动文摘方法。该方法的特色在于:使用潜在语义索引计算句子的相似度,并将层次聚类算法和K-中心聚类算法相结合进行句子聚类,这样提高了句子相似度计算和主题划分的准确性,有利于生成的文摘在全面覆盖文档主题的同时减少自身的冗余。实验结果验证了该文提出的方法的有效性,对比传统的基于聚类的自动文摘方法,该方法生成的文摘质量获得了显著的提高。
引用
收藏
页码:82 / 85
页数:4
相关论文
empty
未找到相关数据