基于平行词同现网络的语言聚类

被引:5
作者
刘海涛
丛进
机构
[1] 浙江大学外国语言文化与国际交流学院
关键词
词同现网络; 斯拉夫语言; 平行文本; 语言分类; 聚类分析;
D O I
暂无
中图分类号
G633.3 [汉语语文];
学科分类号
04 ; 0401 ;
摘要
考察了在语言精细分类中使用复杂网络以及在基于复杂网络的语言分类中使用平行词同现网络替代句法依存网络的可行性.采用12种斯拉夫语言和2种非斯拉夫语言的平行文本,构建了14个词同现网络.通过这些网络的主要参数的恰当组合,聚类分析能够将斯拉夫诸语言与非斯拉夫语言区分开来,并能将12种斯拉夫语言正确地划分到各自的语支中去.另外,聚类也能反映某些斯拉夫语言在其语支内部的亲缘关系.结果表明,平行词同现网络能够被用于语言的精细分类,而且在基于复杂网络的语言分类中可被用作句法依存网络的一种更为便捷的替代品.
引用
收藏
页码:432 / 437
页数:6
相关论文
共 7 条
[1]   汉语句法网络的中心节点研究 [J].
陈芯莹 ;
刘海涛 .
科学通报, 2011, (10) :726-731
[2]   语言复杂网络的聚类研究 [J].
刘海涛 .
科学通报, 2010, 55(Z2) (Z2) :2567-2574
[3]   汉语语义网络的统计特性 [J].
刘海涛 .
科学通报 , 2009, (14) :2060-2064
[4]   Automatic Language Classification by means of Syntactic Dependency Networks [J].
Abramov, Olga ;
Mehler, Alexander .
JOURNAL OF QUANTITATIVE LINGUISTICS, 2011, 18 (04) :291-336
[5]   Can syntactic networks indicate morphological complexity of a language? [J].
Liu, Haitao ;
Xu, Chunshan .
EPL, 2011, 93 (02)
[6]  
Language networks: Their structure, function, and evolution[J] . Ricard V.Solé,BernatCorominas‐Murtra,SergiValverde,LucSteels. Complexity . 2010 (6)
[7]  
Characterization of complex networks: A survey of measurements[J] . L. da F. Costa,F. A. Rodrigues,G. Travieso,P. R. Villas Boas. Advances in Physics . 2007 (1)