利用浅层句法分析提取特征的词义消歧

被引:1
作者
孙超
张仰森
机构
[1] 北京信息科技大学智能信息处理研究所
基金
北京市自然科学基金;
关键词
词义消歧; 浅层句法分析; 语块; 特征提取; 最大熵模型;
D O I
10.16208/j.issn1000-7024.2010.21.016
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
针对如何从文本中提取高质量消歧特征的问题,提出了基于浅层句法分析的消歧特征提取算法,建立了以语块分析识别为核心的特征提取模型。该模型通过对实词类型语块识别、分析中心词语词性和虚词类型语块分析,得到多义词的消歧特征。以北京大学计算语言研究所的现代汉语基本标注语料库为基础,选取了44个多义词,通过使用最大熵消歧模型进行训练和预测实验,准确率达到了78.71%。
引用
收藏
页码:4704 / 4707
页数:4
相关论文
共 6 条
[1]   基于最大熵模型的汉语词义消歧与标注方法 [J].
张仰森 .
计算机工程, 2009, 35 (18) :15-18
[2]   无监督词义消歧研究 [J].
王瑞琴 ;
孔繁胜 .
软件学报, 2009, 20 (08) :2138-2152
[3]   词义消歧研究:资源、方法与评测 [J].
吴云芳 .
当代语言学, 2009, 11 (02) :113-123+189
[4]   基于语言模型验证的词义消歧语料获取 [J].
郭宇航 ;
车万翔 ;
刘挺 .
中文信息学报, 2008, (06) :38-42
[5]   基于多知识源的汉语词义消歧方法 [J].
张仰森 ;
黄改娟 .
汉语学报, 2008, (02) :46-52+96
[6]   基于向量空间模型的无导词义消歧 [J].
陈浩 ;
程良伦 ;
张小波 .
计算机工程与设计, 2007, (05) :1215-1218