信息处理用词语义项区分的原则和方法

被引:30
作者
吴云芳
俞士汶
机构
[1] 北京大学计算语言学研究所
基金
中国博士后科学基金;
关键词
义项; 多义词; 词义标注; 词义消歧; 语料库;
D O I
10.16499/j.cnki.1003-5397.2006.02.020
中图分类号
H08 [应用语言学];
学科分类号
050211 ;
摘要
本文探讨了面向汉语信息处理的词语义项区分应该遵守的原则和方法。先界定了作为计算机自动词义消歧对象的多义词的范围;然后指出面对大规模真实文本,词语义项区分应具有可操作性,即应具有完备性和离散性;最后论证了上下文语境是计算机区分词语意义的最终凭借,信息处理用词语义项区分的依据应主要来自词语的句法行为。
引用
收藏
页码:126 / 133
页数:8
相关论文
共 9 条
[1]   现代汉语同形同音词与多义词的区分原则和方法 [J].
张博 .
语言教学与研究, 2004, (04) :36-45
[3]   义项的属性与界定 [J].
潘竟翰 .
辞书研究, 2000, (05) :39-48
[4]   论英语同形异义词与多义词的识别——与曹务堂先生商榷 [J].
龚放 .
外语教学, 1998, (02) :8-14
[5]   辞书编写中有关义项处理的几个新问题 [J].
赵大明 .
语言文字应用, 1996, (04) :84-89
[6]  
现代汉语语法信息词典详解[M]. 清华大学出版社 , 俞士汶等著, 2003
[7]  
《现代汉语词典》学术研讨会论文集[M]. 商务印书馆 , 吕叔湘等著, 1996
[8]   Consistent Criteria for Sense Distinctions [J].
Martha Palmer .
Computers and the Humanities, 2000, 34 :217-222
[9]   I don't believe in word senses [J].
Kilgarriff, A .
COMPUTERS AND THE HUMANITIES, 1997, 31 (02) :91-113