基于OMKast的术语关系获取和验证

被引:2
作者
王娜娜 [1 ,2 ]
黄运有 [1 ,2 ]
唐素勤 [1 ]
王石 [2 ]
曹存根 [2 ]
机构
[1] 广西师范大学计算机科学与信息工程学院
[2] 中国科学院计算技术研究所智能信息处理重点实验室
关键词
术语; 术语间关系; 关系公理; 文本知识获取; 术语关系获取; 术语关系验证;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
为了从海量数据中获取知识,提出了术语间关系的抽取方法:定义了上下位关系和整分关系,在此基础上新增加了N条关系,从关系的定义域和值域、关系的限制条件、关系的公理等出发,准确地定义出关系的内涵,并根据关系的内涵定义出关系的语义特征。最后针对关系表达的灵活性,总结出了关系表述的语法特征和表述文法。结合上述语法特征和语义特征,编写了一种可执行的知识抽取程序——OMKast程序,并从原始文本语料中抽取关系。利用语义特征和统计学的方法验证抽取出的关系。实验结果表明,该方法具有良好的有效性。
引用
收藏
页码:3319 / 3323
页数:5
相关论文
共 10 条
[1]
语义网原理与技术.[M].陆建江等; 编著.科学出版社.2007,
[2]
人工智能原理.[M].石纯一等编著;.清华大学出版社.1993,
[3]
从中文Web网页中获取实体简称的研究 [J].
丁远钧 ;
曹存根 ;
王石 ;
符建辉 .
计算机科学, 2012, 39 (03) :174-182+195
[4]
社会群体角色本体的构建方法研究 [J].
江利萍 ;
曹存根 ;
张再跃 .
计算机科学, 2012, 39 (02) :222-226+249
[5]
基于领域本体网络模型的知识获取技术 [J].
张德政 ;
庄洪波 .
计算机工程, 2007, (07) :190-191+200
[6]
基于领域本体的半结构化文本知识自动获取方法的设计和实现 [J].
王海涛 ;
曹存根 ;
高颖 .
计算机学报, 2005, (12) :2010-2018
[7]
语义Web的逻辑基础 [J].
史忠植 ;
董明楷 ;
蒋运承 ;
张海俊 .
中国科学E辑:信息科学, 2004, (10) :1123-1138
[8]
关于现代汉语通称词的几个问题 [J].
吴汉江 .
语文学刊, 2004, (07) :63-65+72
[9]
试析辞书释义中的总称、统称、合称 [J].
卢莹 ;
王金鑫 .
辞书研究, 2003, (03) :8-14
[10]
文本知识发现:基于信息抽取的文本挖掘 [J].
周雪忠 ;
吴朝晖 .
计算机科学, 2003, (01) :63-66