学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于OMKast的术语关系获取和验证
被引:2
作者
:
论文数:
引用数:
h-index:
机构:
王娜娜
[
1
,
2
]
论文数:
引用数:
h-index:
机构:
黄运有
[
1
,
2
]
论文数:
引用数:
h-index:
机构:
唐素勤
[
1
]
论文数:
引用数:
h-index:
机构:
王石
[
2
]
论文数:
引用数:
h-index:
机构:
曹存根
[
2
]
机构
:
[1]
广西师范大学计算机科学与信息工程学院
[2]
中国科学院计算技术研究所智能信息处理重点实验室
来源
:
计算机应用研究
|
2015年
/ 32卷
/ 11期
关键词
:
术语;
术语间关系;
关系公理;
文本知识获取;
术语关系获取;
术语关系验证;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
为了从海量数据中获取知识,提出了术语间关系的抽取方法:定义了上下位关系和整分关系,在此基础上新增加了N条关系,从关系的定义域和值域、关系的限制条件、关系的公理等出发,准确地定义出关系的内涵,并根据关系的内涵定义出关系的语义特征。最后针对关系表达的灵活性,总结出了关系表述的语法特征和表述文法。结合上述语法特征和语义特征,编写了一种可执行的知识抽取程序——OMKast程序,并从原始文本语料中抽取关系。利用语义特征和统计学的方法验证抽取出的关系。实验结果表明,该方法具有良好的有效性。
引用
收藏
页码:3319 / 3323
页数:5
相关论文
共 10 条
[1]
语义网原理与技术.[M].陆建江等; 编著.科学出版社.2007,
[2]
人工智能原理.[M].石纯一等编著;.清华大学出版社.1993,
[3]
从中文Web网页中获取实体简称的研究
[J].
论文数:
引用数:
h-index:
机构:
丁远钧
;
论文数:
引用数:
h-index:
机构:
曹存根
;
论文数:
引用数:
h-index:
机构:
王石
;
论文数:
引用数:
h-index:
机构:
符建辉
.
计算机科学,
2012,
39
(03)
:174
-182+195
[4]
社会群体角色本体的构建方法研究
[J].
论文数:
引用数:
h-index:
机构:
江利萍
;
论文数:
引用数:
h-index:
机构:
曹存根
;
论文数:
引用数:
h-index:
机构:
张再跃
.
计算机科学,
2012,
39
(02)
:222
-226+249
[5]
基于领域本体网络模型的知识获取技术
[J].
论文数:
引用数:
h-index:
机构:
张德政
;
庄洪波
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学信息工程学院
庄洪波
.
计算机工程,
2007,
(07)
:190
-191+200
[6]
基于领域本体的半结构化文本知识自动获取方法的设计和实现
[J].
论文数:
引用数:
h-index:
机构:
王海涛
;
论文数:
引用数:
h-index:
机构:
曹存根
;
论文数:
引用数:
h-index:
机构:
高颖
.
计算机学报,
2005,
(12)
:2010
-2018
[7]
语义Web的逻辑基础
[J].
论文数:
引用数:
h-index:
机构:
史忠植
;
董明楷
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所智能信息处理重点实验室,中国科学院计算技术研究所智能信息处理重点实验室,中国科学院计算技术研究所智能信息处理重点实验室,中国科学院计算技术研究所智能信息处理重点实验室北京,北京,北京,北京
董明楷
;
论文数:
引用数:
h-index:
机构:
蒋运承
;
张海俊
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所智能信息处理重点实验室,中国科学院计算技术研究所智能信息处理重点实验室,中国科学院计算技术研究所智能信息处理重点实验室,中国科学院计算技术研究所智能信息处理重点实验室北京,北京,北京,北京
张海俊
.
中国科学E辑:信息科学,
2004,
(10)
:1123
-1138
[8]
关于现代汉语通称词的几个问题
[J].
论文数:
引用数:
h-index:
机构:
吴汉江
.
语文学刊,
2004,
(07)
:63
-65+72
[9]
试析辞书释义中的总称、统称、合称
[J].
卢莹
论文数:
0
引用数:
0
h-index:
0
机构:
商务印书馆
卢莹
;
王金鑫
论文数:
0
引用数:
0
h-index:
0
机构:
商务印书馆
王金鑫
.
辞书研究,
2003,
(03)
:8
-14
[10]
文本知识发现:基于信息抽取的文本挖掘
[J].
论文数:
引用数:
h-index:
机构:
周雪忠
;
论文数:
引用数:
h-index:
机构:
吴朝晖
.
计算机科学,
2003,
(01)
:63
-66
←
1
→
共 10 条
[1]
语义网原理与技术.[M].陆建江等; 编著.科学出版社.2007,
[2]
人工智能原理.[M].石纯一等编著;.清华大学出版社.1993,
[3]
从中文Web网页中获取实体简称的研究
[J].
论文数:
引用数:
h-index:
机构:
丁远钧
;
论文数:
引用数:
h-index:
机构:
曹存根
;
论文数:
引用数:
h-index:
机构:
王石
;
论文数:
引用数:
h-index:
机构:
符建辉
.
计算机科学,
2012,
39
(03)
:174
-182+195
[4]
社会群体角色本体的构建方法研究
[J].
论文数:
引用数:
h-index:
机构:
江利萍
;
论文数:
引用数:
h-index:
机构:
曹存根
;
论文数:
引用数:
h-index:
机构:
张再跃
.
计算机科学,
2012,
39
(02)
:222
-226+249
[5]
基于领域本体网络模型的知识获取技术
[J].
论文数:
引用数:
h-index:
机构:
张德政
;
庄洪波
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学信息工程学院
庄洪波
.
计算机工程,
2007,
(07)
:190
-191+200
[6]
基于领域本体的半结构化文本知识自动获取方法的设计和实现
[J].
论文数:
引用数:
h-index:
机构:
王海涛
;
论文数:
引用数:
h-index:
机构:
曹存根
;
论文数:
引用数:
h-index:
机构:
高颖
.
计算机学报,
2005,
(12)
:2010
-2018
[7]
语义Web的逻辑基础
[J].
论文数:
引用数:
h-index:
机构:
史忠植
;
董明楷
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所智能信息处理重点实验室,中国科学院计算技术研究所智能信息处理重点实验室,中国科学院计算技术研究所智能信息处理重点实验室,中国科学院计算技术研究所智能信息处理重点实验室北京,北京,北京,北京
董明楷
;
论文数:
引用数:
h-index:
机构:
蒋运承
;
张海俊
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所智能信息处理重点实验室,中国科学院计算技术研究所智能信息处理重点实验室,中国科学院计算技术研究所智能信息处理重点实验室,中国科学院计算技术研究所智能信息处理重点实验室北京,北京,北京,北京
张海俊
.
中国科学E辑:信息科学,
2004,
(10)
:1123
-1138
[8]
关于现代汉语通称词的几个问题
[J].
论文数:
引用数:
h-index:
机构:
吴汉江
.
语文学刊,
2004,
(07)
:63
-65+72
[9]
试析辞书释义中的总称、统称、合称
[J].
卢莹
论文数:
0
引用数:
0
h-index:
0
机构:
商务印书馆
卢莹
;
王金鑫
论文数:
0
引用数:
0
h-index:
0
机构:
商务印书馆
王金鑫
.
辞书研究,
2003,
(03)
:8
-14
[10]
文本知识发现:基于信息抽取的文本挖掘
[J].
论文数:
引用数:
h-index:
机构:
周雪忠
;
论文数:
引用数:
h-index:
机构:
吴朝晖
.
计算机科学,
2003,
(01)
:63
-66
←
1
→