共 15 条
综合型语言知识库的建设与利用
被引:28
作者:
俞士汶
段慧明
朱学锋
张化瑞
机构:
[1] 北京大学计算语言学研究所
[2] 北京大学计算语言学研究所 北京
[3] 北京
来源:
关键词:
计算机应用;
中文信息处理;
语言处理;
语言知识库;
语言数据资源;
电子词典;
语料库;
D O I:
暂无
中图分类号:
TP392 [各种专用数据库];
学科分类号:
081203 ;
0835 ;
摘要:
语言知识库的规模和质量决定了自然语言处理系统的成败。经过 18年的努力 ,北京大学计算语言学研究所已经积累了一系列颇具规模、质量上乘的语言数据资源 :现代汉语语法信息词典 ,大规模基本标注语料库 ,现代汉语语义词典 ,中文概念词典 ,不同单位对齐的双语语料库 ,多个专业领域的术语库 ,现代汉语短语结构规则库 ,中国古代诗词语料库等等。本项研究将把这些语言数据资源集成为一个综合型的语言知识库。集成不同的语言数据资源时 ,必须克服它们之间的“缝隙”。规划中的综合型语言知识库除了有统一的友好的使用界面和方便的应用程序接口外 ,还将提供支持知识挖掘的工具软件 ,促使现有的语言数据资源从初级产品形式向深加工产品形式不断发展 ;提供多种形式的知识传播和信息服务机制 ,让综合型语言知识库为语言信息处理研究、语言学本体研究和语言教学提供全方位的、多层次的支持
引用
收藏
页码:1 / 10
页数:10
相关论文