学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
一种面向科技文献引言的信息抽取方法
被引:10
作者
:
论文数:
引用数:
h-index:
机构:
朱丽萍
[
1
,
2
]
论文数:
引用数:
h-index:
机构:
李洪奇
[
1
,
2
]
论文数:
引用数:
h-index:
机构:
杨中国
[
1
,
2
]
论文数:
引用数:
h-index:
机构:
刘蔷
[
1
,
2
]
机构
:
[1]
中国石油大学(北京)石油数据挖掘北京市重点实验室
[2]
中国石油大学(北京)地球物理与信息工程学院
来源
:
山东大学学报(理学版)
|
2015年
/ 50卷
/ 07期
关键词
:
科技文献;
信息抽取;
背景知识;
线索词;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
分析了引言部分写作模型,将文本按照句子级别划分为背景知识、问题分析、工作描述三个类别。统计每个部分句子的引导词、句型表达、线索词、所处位置的特征,并构建相应规则库。在分词和词性标注基础上,利用规则匹配每个句子得出所属的类别,从而抽取出三个部分的信息。以石油勘探开发类科技文献和数据挖掘类科技文献为例,进行人工判别和本文方法抽取试验,结果表明本文方法能准确获取相应信息。
引用
收藏
页码:23 / 30+37 +37
页数:9
相关论文
共 16 条
[1]
科技文献的文本特征抽取研究与应用
[D].
于亮
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学
北京邮电大学
于亮
.
北京邮电大学,
2009
[2]
基于语义的科技文献共享平台的信息抽取系统
[D].
黄泽武
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学
华中科技大学
黄泽武
.
华中科技大学,
2007
[3]
面向科技文献的混合语义信息抽取方法研究
[J].
冷伏海
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院国家科学图书馆
中国科学院国家科学图书馆
冷伏海
;
论文数:
引用数:
h-index:
机构:
白如江
;
论文数:
引用数:
h-index:
机构:
祝清松
.
图书情报工作,
2013,
(11)
:112
-119
[4]
正则表达式的研究及在Web中的应用
[J].
唐惠丽
论文数:
0
引用数:
0
h-index:
0
机构:
上海师范大学计算机系
唐惠丽
;
郑小妹
论文数:
0
引用数:
0
h-index:
0
机构:
上海师范大学计算机系
郑小妹
.
计算机技术与发展,
2013,
23
(02)
:82
-84+88
[5]
用规则抽取句子中事件信息
[J].
论文数:
引用数:
h-index:
机构:
孙荣
;
周文
论文数:
0
引用数:
0
h-index:
0
机构:
上海大学计算机工程与科学学院
上海大学计算机工程与科学学院
周文
;
论文数:
引用数:
h-index:
机构:
刘宗田
.
小型微型计算机系统,
2011,
32
(11)
:2309
-2314
[6]
自组织神经网络在火成岩岩性识别中的应用
[J].
论文数:
引用数:
h-index:
机构:
张平
;
论文数:
引用数:
h-index:
机构:
潘保芝
;
论文数:
引用数:
h-index:
机构:
张莹
;
王鹏
论文数:
0
引用数:
0
h-index:
0
机构:
中国石油大庆石油管理局钻探集团测井公司
中国石油勘探开发研究院西北分院
王鹏
;
董瑞新
论文数:
0
引用数:
0
h-index:
0
机构:
中国石油大庆石油管理局钻探集团测井公司
中国石油勘探开发研究院西北分院
董瑞新
.
石油物探,
2009,
(01)
:53
-56+16
[7]
基于统计和规则相结合的科技术语自动抽取研究
[J].
刘豹
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳航空工业学院知识工程中心
刘豹
;
论文数:
引用数:
h-index:
机构:
张桂平
;
论文数:
引用数:
h-index:
机构:
蔡东风
.
计算机工程与应用 ,
2008,
(23)
:147
-150
[8]
应用主题词/副主题词关联规则对专题知识的挖掘分析及评价
[J].
论文数:
引用数:
h-index:
机构:
侯跃芳
;
论文数:
引用数:
h-index:
机构:
崔雷
;
论文数:
引用数:
h-index:
机构:
朱利娜
.
情报理论与实践,
2008,
(02)
:234
-236
[9]
基于主题词对的文档重排方法
[J].
论文数:
引用数:
h-index:
机构:
何婷婷
;
许婷
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学系
许婷
;
瞿国忠
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学系
瞿国忠
;
论文数:
引用数:
h-index:
机构:
涂新辉
.
计算机工程与应用,
2007,
(11)
:161
-163
[10]
学术论文引言中的参考文献简析
[J].
朱大明
论文数:
0
引用数:
0
h-index:
0
机构:
防护工程编辑部,河南洛阳
朱大明
.
编辑学报,
2005,
(03)
:190
-191
←
1
2
→
共 16 条
[1]
科技文献的文本特征抽取研究与应用
[D].
于亮
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学
北京邮电大学
于亮
.
北京邮电大学,
2009
[2]
基于语义的科技文献共享平台的信息抽取系统
[D].
黄泽武
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学
华中科技大学
黄泽武
.
华中科技大学,
2007
[3]
面向科技文献的混合语义信息抽取方法研究
[J].
冷伏海
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院国家科学图书馆
中国科学院国家科学图书馆
冷伏海
;
论文数:
引用数:
h-index:
机构:
白如江
;
论文数:
引用数:
h-index:
机构:
祝清松
.
图书情报工作,
2013,
(11)
:112
-119
[4]
正则表达式的研究及在Web中的应用
[J].
唐惠丽
论文数:
0
引用数:
0
h-index:
0
机构:
上海师范大学计算机系
唐惠丽
;
郑小妹
论文数:
0
引用数:
0
h-index:
0
机构:
上海师范大学计算机系
郑小妹
.
计算机技术与发展,
2013,
23
(02)
:82
-84+88
[5]
用规则抽取句子中事件信息
[J].
论文数:
引用数:
h-index:
机构:
孙荣
;
周文
论文数:
0
引用数:
0
h-index:
0
机构:
上海大学计算机工程与科学学院
上海大学计算机工程与科学学院
周文
;
论文数:
引用数:
h-index:
机构:
刘宗田
.
小型微型计算机系统,
2011,
32
(11)
:2309
-2314
[6]
自组织神经网络在火成岩岩性识别中的应用
[J].
论文数:
引用数:
h-index:
机构:
张平
;
论文数:
引用数:
h-index:
机构:
潘保芝
;
论文数:
引用数:
h-index:
机构:
张莹
;
王鹏
论文数:
0
引用数:
0
h-index:
0
机构:
中国石油大庆石油管理局钻探集团测井公司
中国石油勘探开发研究院西北分院
王鹏
;
董瑞新
论文数:
0
引用数:
0
h-index:
0
机构:
中国石油大庆石油管理局钻探集团测井公司
中国石油勘探开发研究院西北分院
董瑞新
.
石油物探,
2009,
(01)
:53
-56+16
[7]
基于统计和规则相结合的科技术语自动抽取研究
[J].
刘豹
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳航空工业学院知识工程中心
刘豹
;
论文数:
引用数:
h-index:
机构:
张桂平
;
论文数:
引用数:
h-index:
机构:
蔡东风
.
计算机工程与应用 ,
2008,
(23)
:147
-150
[8]
应用主题词/副主题词关联规则对专题知识的挖掘分析及评价
[J].
论文数:
引用数:
h-index:
机构:
侯跃芳
;
论文数:
引用数:
h-index:
机构:
崔雷
;
论文数:
引用数:
h-index:
机构:
朱利娜
.
情报理论与实践,
2008,
(02)
:234
-236
[9]
基于主题词对的文档重排方法
[J].
论文数:
引用数:
h-index:
机构:
何婷婷
;
许婷
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学系
许婷
;
瞿国忠
论文数:
0
引用数:
0
h-index:
0
机构:
华中师范大学计算机科学系
瞿国忠
;
论文数:
引用数:
h-index:
机构:
涂新辉
.
计算机工程与应用,
2007,
(11)
:161
-163
[10]
学术论文引言中的参考文献简析
[J].
朱大明
论文数:
0
引用数:
0
h-index:
0
机构:
防护工程编辑部,河南洛阳
朱大明
.
编辑学报,
2005,
(03)
:190
-191
←
1
2
→