语言复杂网络的聚类研究

被引:16
作者
刘海涛 [1 ,2 ]
机构
[1] 不详
[2] 浙江大学外语学院
[3] 不详
[4] 中国传媒大学应用语言学研究所
[5] 不详
关键词
复杂网络; 语言类型; 语言网络; 依存句法; 聚类分析; 语言分类;
D O I
暂无
中图分类号
O157.5 [图论];
学科分类号
摘要
利用15种语言的依存句法树库,构造了15个语言网络,并采用复杂网络研究工具对这些语言网络进行了研究,其目的是研究复杂网络在语言分类中的可行性.研究结果显示,通过复杂网络的主要参数,即节点的平均度、聚类系数、平均路径长度、网络中心度、直径、节点度幂律分布的幂指数、度分布与幂律拟合的决定系数,可以对人类语言进行分类,其准确性与利用现代语序类型学主要指标进行的语言分类准确性相当.克服了类型学研究中语种库语料为非真实语料及参数选择中过于注重微观的问题,所得到的结果更能体现语言的整体类型学特征.本研究不仅丰富了现有的语言类型学方法,也拓展了复杂网络在人文、社会与生命科学等领域的应用.
引用
收藏
页码:2567 / 2574
页数:8
相关论文
共 12 条
[1]   汉语语义网络的统计特性 [J].
刘海涛 .
科学通报, 2009, 54 (14) :2060-2064
[2]   中国城市航空网络航线连接机制分析 [J].
刘宏鲲 ;
张效莉 ;
曹崀 ;
汪秉宏 ;
周涛 .
中国科学(G辑:物理学 力学 天文学), 2009, 39 (07) :935-942
[3]   自然语言处理的概率配价模式理论 [J].
刘海涛 ;
冯志伟 .
语言科学, 2007, (03) :32-41
[4]   汉语词组网的组织结构与无标度特性 [J].
韦洛霞 ;
李勇 ;
康世勇 ;
罗诗裕 .
科学通报, 2005, (15) :1575-1579
[5]   Power-Law Distributions in Empirical Data [J].
Clauset, Aaron ;
Shalizi, Cosma Rohilla ;
Newman, M. E. J. .
SIAM REVIEW, 2009, 51 (04) :661-703
[6]  
Self-organization of the Sound Inventories: Analysis and Synthesis of the Occurrence and Co-occurrence Networks of Consonants*[J] . Animesh Mukherjee,Monojit Choudhury,Anupam Basu,Niloy Ganguly.Journal of Quantitative Linguistics . 2009 (2)
[7]  
The networks of syllables and characters in Chinese*[J] . Gang Peng,James W. Minett,William S. -Y. Wang.Journal of Quantitative Linguistics . 2008 (3)
[8]   What role does syntax play in a language network? [J].
Liu, Haitao ;
Hu, Fengguo .
EPL, 2008, 83 (01)
[9]  
Floresta sinta(c)tica: A treebank for Portuguese .2 Afonso S. Pro- ceedings of LREC-2002 . 2002
[10]  
Dependency distance as a metric of language comprehension difficulty .2 Liu H. J Cognit Sci . 2008