基于语料库和语料库驱动的词语搭配研究

被引:219
作者
卫乃兴
机构
[1] 上海交通大学语言文字工程研究所
关键词
索引; 类联接; 搭配词; 显著搭配; 词丛; 定量研究; 数据驱动;
D O I
暂无
中图分类号
H146 [近代、现代语法];
学科分类号
摘要
本文介绍和讨论语料库证据支持的词语搭配研究的基本方法和主要原则。基本研究方法可分为“基于语料库数据”和“语料库数据驱动”两类。基于数据的方法以语料库索引为基本依据,在传统的句法框架内对词项的搭配进行检查与概括;数据驱动的方法基本上不将句法结构作为主要参照,而设计和采用一套概念体系、步骤和程序提取和计算搭配词,凭借统计测量手段研究词语搭配的模式,或者采用技术手段提取和计算词丛。主要原则包括:以“自然发生数据”为基本依据,定量分析与定性分析相结合,采用词语中心的研究方法,以发现词组为目的等四项。文章首先讨论词语搭配研究的基本方法,然后概括研究应遵循的主要原则。
引用
收藏
页码:101 / 114+157 +157
页数:15
相关论文
empty
未找到相关数据