汉语搭配定量分析初探

被引:55
作者
孙茂松
黄昌宁
方捷
机构
[1] 北京清华大学计算机科学技术系
[2] 北京清华大学计算机科学技术系
关键词
算法; 离散度; 尖峰; 否定条件; 消极条件; 共现; 定量分析;
D O I
暂无
中图分类号
H195 [对外汉语教学];
学科分类号
摘要
搭配在语言教学和语言信息处理中具有一定的应用价值。汉语搭配的研究仍停留在主要以人的主观判断为标准的定性分析阶段,缺乏定量数据的支待。本文借鉴了国外在语言学和语料库语言学两个方面关于搭配的研究成果,提出了包括强度、离散度及尖峰三项统计指标在内的搭配定量评估体系,构造了相应的搭配判断算法。作为对算法的初步测试,我们以一个约710万词次的新华社新闻语料库为工作平台,利用计算机对"能力"一词可能构成的搭配进行了全面分析。实验结果显示,就该词而言,算法自动发现搭配的准确率约为33.94%。本项研究可望为语言学家客观、系统、一致地分析搭配提供定量辅助手段。
引用
收藏
页码:29 / 38
页数:10
相关论文
共 3 条
[1]  
汉语动词-结果补语搭配词典.[M].王砚农等编;.北京语言学院出版社.1987,
[2]  
汉语常用动词搭配词典.[M].王砚农;焦庞〓编著;.外语教学与研究出版社.1984,
[3]  
A Combinatory Dictionary of English.[J].Morton. Benson.Dictionaries: Journal of the Dictionary Society o.1985, 1