学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
中文专利文献术语抽取
被引:18
作者
:
论文数:
引用数:
h-index:
机构:
徐川
[
1
]
论文数:
引用数:
h-index:
机构:
施水才
[
1
,
2
]
论文数:
引用数:
h-index:
机构:
房祥
[
1
,
2
]
论文数:
引用数:
h-index:
机构:
吕学强
[
1
,
2
]
机构
:
[1]
北京信息科技大学网络文化与数字传播北京市重点实验室
[2]
北京拓尔思信息技术股份有限公司
来源
:
计算机工程与设计
|
2013年
/ 34卷
/ 06期
关键词
:
术语;
边界结合度;
串边结合度;
双字词性过滤法;
D O I
:
10.16208/j.issn1000-7024.2013.06.049
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
为了有效解决专利文献中术语抽取问题,提出采用字符串之间的结合强度融合词性过滤法抽取术语的方法。根据专利文献中术语出现的特点,提出了字符串之间的边界结合度方法和字符串之间的串边结合度方法,度量了字符串间的结合强度。在此基础之上,根据术语内部结构中词性的组成特点,提出了术语双字词性过滤的方法,并与结合强度的计算方法进行融合。实验结果表明,该方法对中文专利术语抽取有很好的效果,平均正确率为80.24%,平均召回率为80.61%。
引用
收藏
页码:2175 / 2179
页数:5
相关论文
共 12 条
[1]
统计与规则相结合的术语抽取
[J].
唐涛
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳航空航天大学知识工程研究中心
唐涛
;
论文数:
引用数:
h-index:
机构:
周俏丽
;
论文数:
引用数:
h-index:
机构:
张桂平
.
沈阳航空航天大学学报,
2011,
28
(05)
:71
-74
[2]
基于分隔符和上下文术语的领域现象术语抽取
[J].
论文数:
引用数:
h-index:
机构:
刘里
;
论文数:
引用数:
h-index:
机构:
刘小明
.
华南理工大学学报(自然科学版),
2011,
39
(07)
:146
-149+155
[3]
基于领域中文文本的术语抽取方法研究
[J].
论文数:
引用数:
h-index:
机构:
谷俊
;
论文数:
引用数:
h-index:
机构:
王昊
.
现代图书情报技术,
2011,
(04)
:29
-34
[4]
面向术语抽取的双阈值互信息过滤方法
[J].
陈士超
论文数:
0
引用数:
0
h-index:
0
机构:
信息工程大学电子技术学院
陈士超
;
郁滨
论文数:
0
引用数:
0
h-index:
0
机构:
信息工程大学电子技术学院
郁滨
.
计算机应用,
2011,
31
(04)
:1070
-1073
[5]
政务领域本体术语的自动抽取
[J].
论文数:
引用数:
h-index:
机构:
翟笃风
;
论文数:
引用数:
h-index:
机构:
刘柏嵩
.
现代图书情报技术,
2010,
(04)
:59
-65
[6]
C值和互信息相结合的术语抽取
[J].
论文数:
引用数:
h-index:
机构:
梁颖红
;
论文数:
引用数:
h-index:
机构:
张文静
;
论文数:
引用数:
h-index:
机构:
张有承
.
计算机应用与软件,
2010,
27
(04)
:108
-110
[7]
采用CRF技术的军事情报术语自动抽取研究
[J].
论文数:
引用数:
h-index:
机构:
贾美英
;
论文数:
引用数:
h-index:
机构:
杨炳儒
;
论文数:
引用数:
h-index:
机构:
郑德权
;
论文数:
引用数:
h-index:
机构:
杨靖
.
计算机工程与应用,
2009,
45
(32)
:126
-129
[8]
中文领域本体学习中术语的自动抽取
[J].
温春
论文数:
0
引用数:
0
h-index:
0
机构:
电子工程学院网络工程系
温春
;
王晓斌
论文数:
0
引用数:
0
h-index:
0
机构:
电子工程学院网络工程系
王晓斌
;
石昭祥
论文数:
0
引用数:
0
h-index:
0
机构:
电子工程学院网络工程系
石昭祥
.
计算机应用研究,
2009,
26
(07)
:2652
-2655
[9]
基于隐马尔科夫模型的中文术语识别研究
[J].
论文数:
引用数:
h-index:
机构:
岑咏华
;
论文数:
引用数:
h-index:
机构:
韩哲
;
论文数:
引用数:
h-index:
机构:
季培培
.
现代图书情报技术,
2008,
(12)
:54
-58
[10]
基于正则表达式的大规模网页术语对抽取研究
[J].
论文数:
引用数:
h-index:
机构:
程岚岚
.
情报杂志,
2008,
(11)
:62
-64+68
←
1
2
→
共 12 条
[1]
统计与规则相结合的术语抽取
[J].
唐涛
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳航空航天大学知识工程研究中心
唐涛
;
论文数:
引用数:
h-index:
机构:
周俏丽
;
论文数:
引用数:
h-index:
机构:
张桂平
.
沈阳航空航天大学学报,
2011,
28
(05)
:71
-74
[2]
基于分隔符和上下文术语的领域现象术语抽取
[J].
论文数:
引用数:
h-index:
机构:
刘里
;
论文数:
引用数:
h-index:
机构:
刘小明
.
华南理工大学学报(自然科学版),
2011,
39
(07)
:146
-149+155
[3]
基于领域中文文本的术语抽取方法研究
[J].
论文数:
引用数:
h-index:
机构:
谷俊
;
论文数:
引用数:
h-index:
机构:
王昊
.
现代图书情报技术,
2011,
(04)
:29
-34
[4]
面向术语抽取的双阈值互信息过滤方法
[J].
陈士超
论文数:
0
引用数:
0
h-index:
0
机构:
信息工程大学电子技术学院
陈士超
;
郁滨
论文数:
0
引用数:
0
h-index:
0
机构:
信息工程大学电子技术学院
郁滨
.
计算机应用,
2011,
31
(04)
:1070
-1073
[5]
政务领域本体术语的自动抽取
[J].
论文数:
引用数:
h-index:
机构:
翟笃风
;
论文数:
引用数:
h-index:
机构:
刘柏嵩
.
现代图书情报技术,
2010,
(04)
:59
-65
[6]
C值和互信息相结合的术语抽取
[J].
论文数:
引用数:
h-index:
机构:
梁颖红
;
论文数:
引用数:
h-index:
机构:
张文静
;
论文数:
引用数:
h-index:
机构:
张有承
.
计算机应用与软件,
2010,
27
(04)
:108
-110
[7]
采用CRF技术的军事情报术语自动抽取研究
[J].
论文数:
引用数:
h-index:
机构:
贾美英
;
论文数:
引用数:
h-index:
机构:
杨炳儒
;
论文数:
引用数:
h-index:
机构:
郑德权
;
论文数:
引用数:
h-index:
机构:
杨靖
.
计算机工程与应用,
2009,
45
(32)
:126
-129
[8]
中文领域本体学习中术语的自动抽取
[J].
温春
论文数:
0
引用数:
0
h-index:
0
机构:
电子工程学院网络工程系
温春
;
王晓斌
论文数:
0
引用数:
0
h-index:
0
机构:
电子工程学院网络工程系
王晓斌
;
石昭祥
论文数:
0
引用数:
0
h-index:
0
机构:
电子工程学院网络工程系
石昭祥
.
计算机应用研究,
2009,
26
(07)
:2652
-2655
[9]
基于隐马尔科夫模型的中文术语识别研究
[J].
论文数:
引用数:
h-index:
机构:
岑咏华
;
论文数:
引用数:
h-index:
机构:
韩哲
;
论文数:
引用数:
h-index:
机构:
季培培
.
现代图书情报技术,
2008,
(12)
:54
-58
[10]
基于正则表达式的大规模网页术语对抽取研究
[J].
论文数:
引用数:
h-index:
机构:
程岚岚
.
情报杂志,
2008,
(11)
:62
-64+68
←
1
2
→