综合型语言知识库的建设与利用

被引:28
作者
俞士汶
段慧明
朱学锋
张化瑞
机构
[1] 北京大学计算语言学研究所
[2] 北京大学计算语言学研究所 北京
[3] 北京
关键词
计算机应用; 中文信息处理; 语言处理; 语言知识库; 语言数据资源; 电子词典; 语料库;
D O I
暂无
中图分类号
TP392 [各种专用数据库];
学科分类号
081203 ; 0835 ;
摘要
语言知识库的规模和质量决定了自然语言处理系统的成败。经过 18年的努力 ,北京大学计算语言学研究所已经积累了一系列颇具规模、质量上乘的语言数据资源 :现代汉语语法信息词典 ,大规模基本标注语料库 ,现代汉语语义词典 ,中文概念词典 ,不同单位对齐的双语语料库 ,多个专业领域的术语库 ,现代汉语短语结构规则库 ,中国古代诗词语料库等等。本项研究将把这些语言数据资源集成为一个综合型的语言知识库。集成不同的语言数据资源时 ,必须克服它们之间的“缝隙”。规划中的综合型语言知识库除了有统一的友好的使用界面和方便的应用程序接口外 ,还将提供支持知识挖掘的工具软件 ,促使现有的语言数据资源从初级产品形式向深加工产品形式不断发展 ;提供多种形式的知识传播和信息服务机制 ,让综合型语言知识库为语言信息处理研究、语言学本体研究和语言教学提供全方位的、多层次的支持
引用
收藏
页码:1 / 10
页数:10
相关论文
共 15 条
[1]   《汉语高频词语法信息词典》的研制 [J].
朱学锋 ;
张化瑞 ;
段慧明 ;
俞士汶 .
语言文字应用, 2004, (03) :98-104
[2]   语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》 [J].
靳光瑾 ;
郭曙纶 ;
肖航 ;
章云帆 .
语言文字应用, 2003, (04) :16-24
[3]   名人网页的相关度评价 [J].
昝红英 ;
苏玉梅 ;
孙斌 ;
俞士汶 .
中文信息学报, 2003, (05) :27-33
[4]   基于语义依存关系的汉语语料库的构建 [J].
尤昉 ;
李涓子 ;
王作英 .
中文信息学报, 2003, (01) :46-53
[5]   北京大学现代汉语语料库基本加工规范 [J].
俞士汶 ;
段慧明 ;
朱学锋 ;
孙斌 .
中文信息学报, 2002, (05) :49-64
[6]   唐宋诗之计算机辅助深层研究 [J].
胡俊峰 ;
俞士汶 .
北京大学学报(自然科学版), 2001, (05) :727-733
[7]   汉语词的概率语法属性描述 [J].
俞士汶 ;
段慧明 ;
朱学锋 .
语言文字应用, 2001, (03) :21-26
[8]   关于词汇使用度的初步研究 [J].
孙茂松 .
语言文字应用, 2000, (01) :6-10
[9]   关于大规模真实文本语料库的几点理论思考 [J].
张普 .
语言文字应用, 1999, (01) :35-44
[10]   中文输入中语法分析技术的应用 [J].
俞士汶 .
中文信息学报, 1988, (03) :20-26