中文词汇网络:跨语言知识处理基础架构的设计理念与实践

被引:37
作者
黄居仁 [1 ,2 ]
谢舒凯 [3 ]
洪嘉馡 [4 ]
陈韵竹 [1 ]
苏依莉 [1 ]
陈永祥 [5 ]
黄胜伟 [1 ]
机构
[1] “中央研究院”语言学研究所
[2] 香港理工大学人文学院
[3] 台湾师范大学英语学系
[4] 台湾大学语言学研究所
[5] 台湾大学资讯工程学研究所
关键词
计算机应用; 中文信息处理; 中文词汇网络; 全球词汇网络网格; 知识本体; 多语处理; 跨语言整合;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
中文词汇网络(Chinese WordNet,简称CWN)的设计理念,是在完整的知识系统下兼顾词义与词义关系的精确表达与语言科技应用。中文词义的区分与词义间关系的精确表征必须建立在语言学理论,特别是词汇语义学的基础上。而词义内容与词义关系的发掘与验证,则必须源自实际语料。我们采用的方法是分析与语料结合。结合的方式则除了验证与举例外,主要是在大量语料上平行进行词义标记,以反向回馈验证。完整、强健知识系统的建立,是兼顾知识本体(ontology)的完备规范(formal integrity)和人类语言系统内部的完整知识。我们采用了上层共享知识本体(SUMO)来提供知识的规范系统表征。
引用
收藏
页码:14 / 23
页数:10
相关论文
共 4 条
[1]
中文概念词典的结构 [J].
于江生 ;
俞士汶 .
中文信息学报, 2002, (04) :12-20+44
[2]
中文词义关系的定义与判定原则 [J].
蔡柏生 ;
黄居仁 ;
曾淑娟 ;
林贞仪 ;
陈克健 ;
庄元珣 .
中文信息学报, 2002, (04) :21-31
[3]
Exploring interoperability of language resources: the case of cross-lingual semi-automatic enrichment of wordnets[J] Claudia Soria;Monica Monachini;Francesca Bertagna;Nicoletta Calzolari;Chu-Ren Huang;Shu-Kai Hsieh;Andrea Marchetti;Maurizio Tesconi Language Resources and Evaluation 2009,
[4]
SUMO; http://www.ontologyportal.org ,