语料库间词汇差异的统计方法研究

被引:3
作者
葛诗利 [1 ,2 ]
机构
[1] 广东外语外贸大学
[2] 华南理工大学
关键词
语料库; 词汇差异; 卡方检验; 秩和检验;
D O I
暂无
中图分类号
H319 [语文教学];
学科分类号
050201 ;
摘要
语料库之间词汇或其他特征出现频率的差异研究是语料库语言学的一项基本研究内容,使用的统计方法主要是卡方检验。任何统计方法的应用都有一定的前提假设,由于词汇差异研究不能够完全符合卡方检验的要求,使得研究结果存在较大误差。可应用于词汇差异分析的其他统计方法包括对数似然率和秩和检验。实验证明,对数似然率与卡方检验类似,在词汇差异检验中都会受到样本量以及样本代表性的影响而产生统计偏误,秩和检验能在一定程度上解决这些问题,得到比较客观的统计结果。
引用
收藏
页码:249 / 257+328 +328-329
页数:11
相关论文
共 10 条
[1]   我国学生英语演讲中的语块特点:基于语料库的考察 [J].
王立非 ;
钱娟 .
外语学刊, 2009, (02) :115-120
[2]   中国大学生英语口语中的互动话语词块研究 [J].
许家金 ;
许宗瑞 .
外语教学与研究, 2007, (06) :437-443+481
[3]   中国学生英语口语的短语学特征研究——COLSEC语料库的词块证据分析 [J].
卫乃兴 .
现代外语, 2007, (03) :280-291+329
[4]  
实用非参数统计.[M].(美)W.J.Conover著;崔恒建译;.人民邮电出版社.2006,
[5]  
基于CLEC语料库的中国学习者英语分析.[M].杨惠中;桂诗春;杨达复主编;.上海外语教育出版社.2005,
[6]  
中国学习者英语语料库.[M].桂诗春;杨惠中编著;.上海外语教育出版社.2003,
[7]  
语料库语言学导论.[M].卫乃兴等编著;杨惠中主编;.上海外语教育出版社.2002,
[8]  
语言研究中的统计学.[M].李绍山编著;.西安交通大学出版社.2001,
[9]  
Comparing Corpora.[J].Adam Kilgarriff.International Journal of Corpus Linguistics.2001, 1
[10]  
Poisson mixtures.[J].Kenneth W. Church;William A. Gale.Natural Language Engineering.1995, 2