学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于分隔符和上下文术语的领域现象术语抽取
被引:7
作者
:
论文数:
引用数:
h-index:
机构:
刘里
论文数:
引用数:
h-index:
机构:
刘小明
机构
:
[1]
北京理工大学计算机学院
来源
:
华南理工大学学报(自然科学版)
|
2011年
/ 39卷
/ 07期
关键词
:
术语抽取;
分隔符;
复合词;
NC-value算法;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
领域现象术语常常是复合型短语,很难根据局部上下文特征用传统的机器学习方法来抽取.为此,文中提出了一种领域现象术语的抽取方法.该方法首先用基于上下文的方法抽取得到分隔符集,然后结合分隔符集和上下文术语用改进的NC-value算法进行候选领域现象术语抽取,最后在候选领域现象术语中过滤掉名词性术语,进而得到最终结果.实验表明,文中方法对领域现象术语的抽取效果优于基于词频的方法和基于分隔符的方法.
引用
收藏
页码:146 / 149+155 +155
页数:5
相关论文
共 7 条
[1]
基于语言特性的中文领域术语抽取算法
傅继彬
论文数:
0
引用数:
0
h-index:
0
机构:
河南财经学院计算机与信息工程学院
北京理工大学计算机学院
河南财经学院计算机与信息工程学院
傅继彬
樊孝忠
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机学院
河南财经学院计算机与信息工程学院
樊孝忠
毛金涛
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机学院
河南财经学院计算机与信息工程学院
毛金涛
论文数:
引用数:
h-index:
机构:
余正涛
[J].
北京理工大学学报,
2010,
30
(03)
: 307
-
310
[2]
知识抽取中的停用词处理技术
论文数:
引用数:
h-index:
机构:
化柏林
[J].
现代图书情报技术,
2007,
(08)
: 48
-
51
[3]
基于互信息的中文术语抽取系统
张锋
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学与工程系
张锋
许云
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学与工程系
许云
论文数:
引用数:
h-index:
机构:
侯艳
樊孝忠
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学与工程系
樊孝忠
[J].
计算机应用研究,
2005,
(05)
: 72
-
73+77
[4]
基于语义依存的汉语句子相似度计算
李彬
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院智能内容管理实验室
李彬
刘挺
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院智能内容管理实验室
刘挺
论文数:
引用数:
h-index:
机构:
秦兵
论文数:
引用数:
h-index:
机构:
李生
[J].
计算机应用研究,
2003,
(12)
: 15
-
17
[5]
动词性并列式复合词的历时发展特点与词化程度的等级
论文数:
引用数:
h-index:
机构:
董秀芳
[J].
河北师范大学学报(哲学社会科学版),
2000,
(01)
: 57
-
63
[6]
现代术语学引论[M]. 语文出版社 , 冯志伟著, 1997
[7]
Automatic recognition of multi-word terms:. the C-value/NC-value method[J] . Katerina Frantzi,Sophia Ananiadou,Hideki Mima.International Journal on Digital Libraries . 2000 (2)
←
1
→
共 7 条
[1]
基于语言特性的中文领域术语抽取算法
傅继彬
论文数:
0
引用数:
0
h-index:
0
机构:
河南财经学院计算机与信息工程学院
北京理工大学计算机学院
河南财经学院计算机与信息工程学院
傅继彬
樊孝忠
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机学院
河南财经学院计算机与信息工程学院
樊孝忠
毛金涛
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机学院
河南财经学院计算机与信息工程学院
毛金涛
论文数:
引用数:
h-index:
机构:
余正涛
[J].
北京理工大学学报,
2010,
30
(03)
: 307
-
310
[2]
知识抽取中的停用词处理技术
论文数:
引用数:
h-index:
机构:
化柏林
[J].
现代图书情报技术,
2007,
(08)
: 48
-
51
[3]
基于互信息的中文术语抽取系统
张锋
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学与工程系
张锋
许云
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学与工程系
许云
论文数:
引用数:
h-index:
机构:
侯艳
樊孝忠
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学与工程系
樊孝忠
[J].
计算机应用研究,
2005,
(05)
: 72
-
73+77
[4]
基于语义依存的汉语句子相似度计算
李彬
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院智能内容管理实验室
李彬
刘挺
论文数:
0
引用数:
0
h-index:
0
机构:
哈尔滨工业大学计算机科学与技术学院智能内容管理实验室
刘挺
论文数:
引用数:
h-index:
机构:
秦兵
论文数:
引用数:
h-index:
机构:
李生
[J].
计算机应用研究,
2003,
(12)
: 15
-
17
[5]
动词性并列式复合词的历时发展特点与词化程度的等级
论文数:
引用数:
h-index:
机构:
董秀芳
[J].
河北师范大学学报(哲学社会科学版),
2000,
(01)
: 57
-
63
[6]
现代术语学引论[M]. 语文出版社 , 冯志伟著, 1997
[7]
Automatic recognition of multi-word terms:. the C-value/NC-value method[J] . Katerina Frantzi,Sophia Ananiadou,Hideki Mima.International Journal on Digital Libraries . 2000 (2)
←
1
→