利用浅层句法分析提取特征的词义消歧

被引：1

作者：

孙超

张仰森

机构：

[1] 北京信息科技大学智能信息处理研究所

来源：

计算机工程与设计 | 2010年 / 31卷 / 21期

基金：

北京市自然科学基金;

关键词：

词义消歧; 浅层句法分析; 语块; 特征提取; 最大熵模型;

D O I：

10.16208/j.issn1000-7024.2010.21.016

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

针对如何从文本中提取高质量消歧特征的问题,提出了基于浅层句法分析的消歧特征提取算法,建立了以语块分析识别为核心的特征提取模型。该模型通过对实词类型语块识别、分析中心词语词性和虚词类型语块分析,得到多义词的消歧特征。以北京大学计算语言研究所的现代汉语基本标注语料库为基础,选取了44个多义词,通过使用最大熵消歧模型进行训练和预测实验,准确率达到了78.71%。

引用

页码：4704 / 4707

页数：4

共 6 条

[1] 基于最大熵模型的汉语词义消歧与标注方法 [J].