大数据时代的汉语语言学研究

被引:13
作者
詹卫东
机构
[1] 北京大学中文系/中国语言学研究中心/计算语言学教育部重点实验室
关键词
大数据; 计算语言学; 汉语语言学语言资源; 形式化; 可视化;
D O I
暂无
中图分类号
H1 [汉语]; TP311.13 [];
学科分类号
0501 ; 050103 ; 1201 ;
摘要
借助互联网的迅猛发展,当今社会已经进入"大数据"时代。文章通过回顾计算机科学与语言学的交叉学科——计算语言学的发展历程,从一个侧面揭示了大数据处理对科学研究的冲击和影响,并在此基础上探讨汉语语言学研究的未来之路。文章认为,首先,汉语语言学研究应该更加注重语言工程的研究和开发,以提高汉语大规模语言资源的数量、类型及易获得性,因此,汉语语言资源建设应努力实现语言范畴形式化、语言数据专项化和语言知识可视化;其次,汉语语言学的研究应更加开放、更具多元化视角、更加注重多学科的交叉和融合。
引用
收藏
页码:70 / 77
页数:8
相关论文
共 11 条