一种基于加权投票的术语自动识别方法

被引：17

作者：

游宏梁 ^{[1
]}

张巍 ^{[2
]}

沈钧毅 ^{[1
]}

刘挺 ^{[3
]}

机构：

[1] 西安交通大学电子与信息工程学院

[2] 北京文献服务处

[3] 哈尔滨工业大学计算机学院

来源：

中文信息学报 | 2011年 / 03期

关键词：

自动术语识别; 投票算法; 信息抽取; 文本挖掘;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

术语自动识别目的是获取领域术语表中未登录的规范化词汇,是信息抽取、文本挖掘等领域中的重要任务。近年来,利用统计方法抽取术语取得了一定进展,出现了C-Value、NC-Value、TermExtractor等有效方法。但是,对各种统计指标进行加权投票的方法研究较少。该文首先从大量已知术语中收集术语的词性模板,并借之抽取候选术语,接着利用了统计指标加权投票对这些候选术语进行排序。在IEEE 2006-2007电子工程领域文献上的实验结果表明,加权投票方法比任一单独指标的识别效果更好。

引用

页码：9 / 16

页数：8