文本聚类在自动文摘中的应用研究

被引:4
作者
郭庆琳
樊孝忠
柳长安
机构
[1] 华北电力大学(北京)计算机系
[2] 北京理工大学计算机科学与工程系
[3] 华北电力大学(北京)计算机系 北京
[4] 北京
关键词
自动文摘; 文本聚类; 多文档;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对当前自动文摘方法的不足,提出了基于文本聚类的自动文摘实现方法。将文本聚类引入自动文摘中,能实现多文档的自动文摘。实现了面向“塑料”行业的基于文本聚类的自动文摘系统TCAAS,其单文档自动文摘的正确率和召回率在80%以上,多文档自动文摘的正确率和召回率在75%以上。实验表明该方法可行,对自动文摘系统的设计具有借鉴意义和深入研究的价值。
引用
收藏
页码:1036 / 1038
页数:3
相关论文
共 4 条
[1]  
聚类分析及其在农业物种信息自动提取中的应用.[D].吴思.湘潭大学.2001, 01
[2]   基于潜在语义分析的BBS文档Bayes鉴别器 [J].
刘昌钰 ;
唐常杰 ;
于中华 ;
杜永萍 ;
郭颖 .
计算机学报, 2004, (04) :566-572
[3]   全信息理论在自动文摘系统中的应用 [J].
李蕾 ;
钟义信 ;
郭祥昊 .
计算机工程与应用, 2000, (01) :4-7
[4]   自动文摘的四种主要方法 [J].
刘挺 ;
王开铸 .
情报学报, 1999, (01) :10-19