人机并存,“质”“量”合一—谈谈制定信息处理用汉语词表的策略

被引:6
作者
孙茂松
张磊
机构
[1] 清华大学计算机科学与技术系
关键词
分词单位; 词频; 结构体; 互信息; 中文信息处理; 词表; 词汇表; 灰色区域; 策略;
D O I
10.16499/j.cnki.1003-5397.1997.01.018
中图分类号
TP391 [信息处理(信息加工)];
学科分类号
081203 ; 0835 ;
摘要
中文信息处理事业迫切需要为人们普遍接受的汉语词表。从语言工程的角度讨论制定此类词表的策略,强调要调动两方面的因素,即人在“质”上的理性判断,以及利用计算机和大型语料库在“量”上的经验约定。词表应是上述手段共同作用的结果
引用
收藏
页数:8
相关论文
empty
未找到相关数据