共 6 条
利用浅层句法分析提取特征的词义消歧
被引:1
作者:
孙超
张仰森
机构:
[1] 北京信息科技大学智能信息处理研究所
来源:
基金:
北京市自然科学基金;
关键词:
词义消歧;
浅层句法分析;
语块;
特征提取;
最大熵模型;
D O I:
10.16208/j.issn1000-7024.2010.21.016
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
针对如何从文本中提取高质量消歧特征的问题,提出了基于浅层句法分析的消歧特征提取算法,建立了以语块分析识别为核心的特征提取模型。该模型通过对实词类型语块识别、分析中心词语词性和虚词类型语块分析,得到多义词的消歧特征。以北京大学计算语言研究所的现代汉语基本标注语料库为基础,选取了44个多义词,通过使用最大熵消歧模型进行训练和预测实验,准确率达到了78.71%。
引用
收藏
页码:4704 / 4707
页数:4
相关论文