大数据时代的汉语中介语语料库建设

被引:9
作者
郑通涛
曾小燕
机构
[1] 厦门大学海外教育学院
关键词
大数据; 汉语中介语,语料库; 复杂动态系统; 数据挖掘;
D O I
暂无
中图分类号
H14 [语法];
学科分类号
0501 ; 050103 ;
摘要
汉语国际教育迅速发展,与之相应的研究却跟不上快速发展的步伐,其最主要的问题在于缺乏科学且可靠的汉语中介语语料库支持。国内中介语语料库存在的问题主要在于缺乏高质量且真实的口语语料资源和跨学科视角、语料数据来源存在局限性、缺少建设学习者的历史语料库、语料库数据尚不能充分共享等五个方面。中介语语料库建设具有复杂动态和非线性涌现的特征。基于大数据思维,"新一代汉语中介语语料库"的设计原则应增设词网技术、学习者特征、社会语言学特征三项;建设原则应遵循真实性、广泛性、历史性、跨学科、课内外、全媒体、无障碍共享等七项原则;实施方法应配置新一代互联网信息的管理系统和抽取系统、网络智能挖掘技术及网络代理。
引用
收藏
页码:53 / 63
页数:11
相关论文
共 7 条
[1]  
语言演化:多元视角之下——第六届演化语言学国际研讨会综述[J]. 曾小燕,郑通涛,方环海.海外华文教育. 2015(04)
[2]   网络信息抽取技术分析与比较 [J].
宋鑫莹 ;
赵铁军 .
智能计算机与应用, 2013, 3 (05) :24-27+30
[3]   全球汉语学习者语料库建设方案 [J].
崔希亮 ;
张宝林 .
语言文字应用, 2011, (02) :100-108
[4]   基于语义的互联网药品信息抽取算法 [J].
沈元一 ;
郑骁庆 ;
顾轶灵 .
计算机系统应用, 2011, 20 (01) :41-47
[5]   汉语中介语语料库建设的现状与对策 [J].
张宝林 .
语言文字应用, 2010, (03) :129-138
[6]   因特网文本智能挖掘的模糊聚类算法研究 [J].
王晓勇 ;
肖四友 ;
张文祥 .
计算机仿真, 2009, 26 (07) :216-219
[7]  
Understanding figurative and literal language: The graded salience hypothesis[J] . RACHEL GIORA.Cognitive Linguistics (includes Cognitive Linguistic Bibliography) . 2009 (3)