基于向量空间模型中义项词语的无导词义消歧

被引:34
作者
鲁松
白硕
黄雄
机构
[1] 中国科学院计算技术研究所
关键词
词义消歧; 无导方法; 义项词语; 上下文位置权重计算; 向量空间模型;
D O I
10.13328/j.cnki.jos.2002.06.007
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
有导词义消歧机器学习方法的引入虽然使词义消歧取得了长足的进步,但由于需要大量人力进行词义标注,使其难以适用于大规模词义消歧任务.针对这一问题,提出了一种避免人工词义标注巨大工作量的无导学习方法.在仅需义项词语知识库的支持下,将待消歧多义词与义项词语映射到向量空间中,基于k-NN(k=1)方法,计算二者相似度来实现词义消歧任务.在对10个典型多义词进行词义消歧的测试实验中,采用该方法取得了平均正确率为83.13%的消歧结果.
引用
收藏
页码:1082 / 1089
页数:8
相关论文
共 4 条
  • [1] AutomaticInformationOrganization andRetrieval. Salton,G. . 1968
  • [2] The research onChinese word sense disambiguation[Ph.D.Thesis]. Li,Juan-zi. . 1999
  • [3] An experiment in computational discrimination ofEnglish word senses. Black,E. IBM Journal ofResearch andDevelopment . 1988
  • [4] Automatic word sense discrimination. Schutze,H. Computational Linguistics . 1998