中医药古文献语料库设计与开发研究

被引:9
作者
刘耀 [1 ]
段慧明 [2 ]
王惠临 [1 ]
周扬 [3 ]
王振国 [3 ]
李宏展 [2 ]
机构
[1] 中国科学技术信息研究所
[2] 北京大学计算语言学研究所
[3] 山东中医药大学文献研究所
关键词
计算机应用; 中文信息处理; 自然语言处理; 语料库; 中医药古文献; 知识工程;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP392 [各种专用数据库];
学科分类号
081203 ; 0835 ;
摘要
专业领域语料库是对专业领域文献进行自然语言处理的重要的不可或缺的基础,是对专业文本内容与意图进行深层把握的必由之路。通过对研究背景的分析,进一步明析了专业文献进行自然语言处理的必要性,并在对专业文献语料库的研究特点进行分析的基础上,深入探讨了专业语料库的设计思想及原理,同时,对语料库词类的标注信息进行了深入研究。成功地开发了针对专业领域语料库的辅助加工系统,为专业领域语料库建设提供了理论指导和技术支撑。
引用
收藏
页码:24 / 30
页数:7
相关论文
共 7 条
[2]   西医教育模式对中医基础学科体系形成的影响及反思 [J].
张效霞 ;
王振国 .
中医教育, 2004, (06) :51-54
[3]   综合型语言知识库的建设与利用 [J].
俞士汶 ;
段慧明 ;
朱学锋 ;
张化瑞 .
中文信息学报, 2004, (05) :1-10
[4]   北京大学现代汉语语料库基本加工规范 [J].
俞士汶 ;
段慧明 ;
朱学锋 ;
孙斌 .
中文信息学报, 2002, (05) :49-64
[5]   大规模现代汉语标注语料库的加工规范 [J].
俞士汶 ;
朱学锋 ;
段慧明 .
中文信息学报, 2000, (06) :58-64
[6]   大规模汉语标注语料库的制作与使用 [J].
段慧明 ;
松井久仁於 ;
徐国伟 ;
胡国昕 ;
俞士汶 .
语言文字应用, 2000, (02) :72-77
[7]  
现代汉语语法信息词典详解[M]. 清华大学出版社 , 俞士汶等著, 2003