词语间依存关系的定量识别

被引:3
作者
王建会
王雷
胡运发
机构
[1] 复旦大学计算机与信息技术系
关键词
计算机应用; 中文信息处理; 词语搭配; 依存关系; 定量识别;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
本文扩展和改进了现有的词语间依存关系定量识别算法,充分考虑词项概率分布的影响;明确区分词项之间的搭配关系、并列关系和从属关系,针对它们不同的特点,提出不同的识别算法;提出字串匹配模型;充分考虑两个词项之间相互位置的离散分布和距离的影响、以及它们的概率分布特性,提出词项间的依存强度模型,并据此构建词语间依存关系树;提出更新策略,对已经建好的依存关系树进行裁剪,并挖掘出潜在的依存关系。应用实验结果表明,本文提出的算法可以有效地识别出词语间的依存关系。
引用
收藏
页码:31 / 38
页数:8
相关论文
共 4 条
  • [1] 基于最大熵方法的中英文基本名词短语识别
    周雅倩
    郭以昆
    黄萱菁
    吴立德
    [J]. 计算机研究与发展, 2003, (03) : 440 - 446
  • [2] 基于统计的常用词搭配(Collocation)的发现方法
    孙健
    王伟
    钟义信
    [J]. 情报学报, 2002, (01) : 12 - 16
  • [3] 现代汉语实词搭配词典[M]. 商务印书馆 , 张寿康, 1992
  • [4] 模式识别[M]. 清华大学出版社 , 边肇祺编著, 1988