基于同义词词林的中文文本主题词提取

被引:11
作者
程涛 [1 ]
施水才 [1 ]
王霞 [2 ]
吕学强 [1 ]
机构
[1] 北京信息科技大学中文信息处理研究中心
[2] 抚顺市第十五中学
关键词
主题词提取; 同义词词林; 权值; 同义词;
D O I
10.16088/j.issn.1001-6600.2007.02.034
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
中文文本主题词的提取可以浓缩一篇文章,可以提炼一个中文网页,还可以帮助实现网上广告与网页的精确匹配。提出了一种基于同义词词林的中文文本主题词提取方法,不仅考虑了传统的影响主题词语权重的因素,还考虑到了同义词、相关词以及下位词的出现对于词语权重的影响。实验表明,用该方法对中文文本
引用
收藏
页码:145 / 148
页数:4
相关论文
共 6 条
[1]   基于语义的汉语文献主题词提取算法研究 [J].
唐培丽 ;
王树明 ;
胡明 .
吉林大学学报(信息科学版), 2005, (05) :535-540
[2]   关键词抽取方法的研究 [J].
郑家恒 ;
卢娇丽 .
计算机工程, 2005, (18) :194-196
[3]   Internet上的搜索引擎和元搜索引擎 [J].
彭洪汇 ;
林作铨 .
计算机科学, 2002, (09) :1-12+32
[4]   三个层面的中文文本主题自动提取研究 [J].
韩客松 ;
王永成 ;
沈洲 ;
吴芳芳 .
中文信息学报, 2001, (04) :20-27
[5]   汉字自适应散列分组查找算法 [J].
王忠效 ;
范植华 .
中文信息学报, 2001, (02) :16-22
[6]   汉字异或动态散列分组查找算法 [J].
王忠效 ;
范植华 .
中文信息学报, 1998, (04) :61-66