面向非受限领域的综合式自动中文文摘方法

被引:10
作者
郭玉箐
万敏
罗振声
机构
[1] 清华大学中国语言文学系
关键词
自动文摘方法; 向量空间模型; 文本形式特征; 可读性;
D O I
10.16511/j.cnki.qhdxxb.2002.01.038
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
讨论了一种面向非受限领域的综合式中文自动文摘方法。其基本思路是 :采用向量空间模型对篇章结构进行自动分析 ,建立基于语义相似度的段落关系图 ,获取段落的重要度信息 ,并使用标题或聚类的方法划分意义段 ;根据词的频度 ,句子位置、提示语等文本形式特征计算句子的权值 ,分别从各意义段中选取高权值的句子作为文摘句 ;对文摘句进行句法和语义分析 ,消除冗余 ,解决指代词悬挂、文摘不连贯等问题 ,最终组成一篇简洁、通顺、可读性好的文摘
引用
收藏
页码:139 / 142
页数:4
相关论文
共 7 条
[1]  
光电检测技术.[M].钱浚霞;郑坚立编著;.机械工业出版社.1993,
[2]  
半导体光检测器.[M].(美)臧(Tsang;W.T.)主编;杜宝勋等译;.清华大学出版社.1992,
[3]  
光电信号检测.[M].吴 杰编;.哈尔滨工业大学出版社.1990,
[4]  
结型场效应晶体管电路设计与应用.[M].陈光增;林吉申编著;.福建科学技术出版社.1987,
[5]  
光敏感器件及其应用.[M].齐丕智 编著.科学出版社.1987,
[6]  
半导体光电器件及其应用.[M].潘天明 编著.冶金工业出版社.1985,
[7]  
光电检测原理及应用.[M].秦积荣 编著.国防工业出版社.1985,