一种被定义项的识别策略

被引:4
作者
张榕
宋柔
机构
[1] 北京语言大学汉语速成学院
关键词
自然语言处理; 被定义项; 识别; 智能匹配;
D O I
暂无
中图分类号
H085 [机器翻译];
学科分类号
摘要
被定义项即是带定义性描述的词或词组。被定义项的识别对于文本检索、文本标引、文本分类、机器翻译、术语数据库的建立与更新等自然语言处理工作具有重要意义。由于被定义项可以出现在定义中的任何一个位置,缺乏明显的位置信息,识别它们具有一定的困难。本文提出了一种在定义模板的基础上抽取被定义项的识别策略,同时考虑被定义项的上下文环境,将抽取出的候选项进行词性组合过滤,针对嵌套与非嵌套候选词的词长与词频,给出不同的处理方法。实验取得了较好的效果,有效地解决了被定义项的识别问题。
引用
收藏
页码:33 / 38+93 +93
页数:7
相关论文
共 3 条
  • [1] 面向Internet的中文新词语检测
    邹纲
    刘洋
    刘群
    孟遥
    于浩
    西野文人
    亢世勇
    [J]. 中文信息学报, 2004, (06) : 1 - 9
  • [2] 基于互联网的汉语术语定义提取研究[A]. 张榕,宋柔.全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C]. 2005
  • [3] 信息技术领域术语自动提取和动态更新研究[A]. 李芸,王强军,张普.辉煌二十年——中国中文信息学会二十周年学术会议论文集[C]. 2001