基于词二元接续的中文文本自动查错研究

被引:3
作者
王虹
张仰森
机构
[1] 贵州大学计算中心!贵阳
[2] 山西大学计算机科学系!太原
关键词
中文文本自动查错; 二元接续关系; 互信息; t-测试差; Markov模型;
D O I
10.15958/j.cnki.gdxbzrb.2001.01.004
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
运用语料库语言学统计方法对中文文本自动查错的有关问题进行探讨 ,运用词二元接续关系进行查错 ,主要依据词二元同现概率、互信息、t -测试差 .其中 ,t-测试差是首次被应用于查错 .
引用
收藏
页码:16 / 21
页数:6
相关论文
共 5 条
[1]   一种混合的中文文本校对方法 [J].
于勐 ;
姚天顺 ;
不详 .
中文信息学报 , 1998, (02) :32-37
[2]   利用汉字二元语法关系解决汉语自动分词中的交集型歧义 [J].
孙茂松 ;
黄昌宁 ;
邹嘉彦 ;
陆方 ;
沈达阳 .
计算机研究与发展 , 1997, (05) :14-21
[3]   计算机汉语文稿校对系统 [J].
易蓉湘 ;
何克抗 .
计算机研究与发展, 1997, (05) :28-32
[4]   中文计算机辅助校对系统原理 [J].
刘挺 ;
施洪滨 ;
邵艳秋 .
中文信息, 1997, (02) :21-22
[5]  
中文文本自动分词和标注.[M].刘开瑛著;.商务印书馆.2000,