学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
一种被定义项的识别策略
被引:4
作者
:
论文数:
引用数:
h-index:
机构:
张榕
论文数:
引用数:
h-index:
机构:
宋柔
机构
:
[1]
北京语言大学汉语速成学院
来源
:
当代语言学
|
2007年
/ 01期
关键词
:
自然语言处理;
被定义项;
识别;
智能匹配;
D O I
:
暂无
中图分类号
:
H085 [机器翻译];
学科分类号
:
摘要
:
被定义项即是带定义性描述的词或词组。被定义项的识别对于文本检索、文本标引、文本分类、机器翻译、术语数据库的建立与更新等自然语言处理工作具有重要意义。由于被定义项可以出现在定义中的任何一个位置,缺乏明显的位置信息,识别它们具有一定的困难。本文提出了一种在定义模板的基础上抽取被定义项的识别策略,同时考虑被定义项的上下文环境,将抽取出的候选项进行词性组合过滤,针对嵌套与非嵌套候选词的词长与词频,给出不同的处理方法。实验取得了较好的效果,有效地解决了被定义项的识别问题。
引用
收藏
页码:33 / 38+93 +93
页数:7
相关论文
共 3 条
[1]
面向Internet的中文新词语检测
邹纲
论文数:
0
引用数:
0
h-index:
0
机构:
中科院计算技术研究所数字化实验室
邹纲
论文数:
引用数:
h-index:
机构:
刘洋
论文数:
引用数:
h-index:
机构:
刘群
孟遥
论文数:
0
引用数:
0
h-index:
0
机构:
中科院计算技术研究所数字化实验室
孟遥
于浩
论文数:
0
引用数:
0
h-index:
0
机构:
中科院计算技术研究所数字化实验室
于浩
西野文人
论文数:
0
引用数:
0
h-index:
0
机构:
中科院计算技术研究所数字化实验室
西野文人
亢世勇
论文数:
0
引用数:
0
h-index:
0
机构:
中科院计算技术研究所数字化实验室
亢世勇
[J].
中文信息学报,
2004,
(06)
: 1
-
9
[2]
基于互联网的汉语术语定义提取研究[A]. 张榕,宋柔.全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C]. 2005
[3]
信息技术领域术语自动提取和动态更新研究[A]. 李芸,王强军,张普.辉煌二十年——中国中文信息学会二十周年学术会议论文集[C]. 2001
←
1
→
共 3 条
[1]
面向Internet的中文新词语检测
邹纲
论文数:
0
引用数:
0
h-index:
0
机构:
中科院计算技术研究所数字化实验室
邹纲
论文数:
引用数:
h-index:
机构:
刘洋
论文数:
引用数:
h-index:
机构:
刘群
孟遥
论文数:
0
引用数:
0
h-index:
0
机构:
中科院计算技术研究所数字化实验室
孟遥
于浩
论文数:
0
引用数:
0
h-index:
0
机构:
中科院计算技术研究所数字化实验室
于浩
西野文人
论文数:
0
引用数:
0
h-index:
0
机构:
中科院计算技术研究所数字化实验室
西野文人
亢世勇
论文数:
0
引用数:
0
h-index:
0
机构:
中科院计算技术研究所数字化实验室
亢世勇
[J].
中文信息学报,
2004,
(06)
: 1
-
9
[2]
基于互联网的汉语术语定义提取研究[A]. 张榕,宋柔.全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C]. 2005
[3]
信息技术领域术语自动提取和动态更新研究[A]. 李芸,王强军,张普.辉煌二十年——中国中文信息学会二十周年学术会议论文集[C]. 2001
←
1
→