共 6 条
基于同义词词林的中文文本主题词提取
被引:11
作者:
程涛
[1
]
施水才
[1
]
王霞
[2
]
吕学强
[1
]
机构:
[1] 北京信息科技大学中文信息处理研究中心
[2] 抚顺市第十五中学
来源:
关键词:
主题词提取;
同义词词林;
权值;
同义词;
D O I:
10.16088/j.issn.1001-6600.2007.02.034
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
中文文本主题词的提取可以浓缩一篇文章,可以提炼一个中文网页,还可以帮助实现网上广告与网页的精确匹配。提出了一种基于同义词词林的中文文本主题词提取方法,不仅考虑了传统的影响主题词语权重的因素,还考虑到了同义词、相关词以及下位词的出现对于词语权重的影响。实验表明,用该方法对中文文本
引用
收藏
页码:145 / 148
页数:4
相关论文