汉语文本压缩研究及其应用

被引:8
作者
王忠效
机构
[1] 中国科学院软件研究所中国科学技术大学管理学院
关键词
汉语文本压缩,算术编码,Hufman编码,Lempel-Ziv算法,熵;
D O I
暂无
中图分类号
O157.4 [编码理论(代数码理论)];
学科分类号
摘要
汉语文本压缩至今很少受到重视,然而,作为许多计算机应用系统的支撑技术,其重要性毋庸置疑。本文结合汉语文本的特征对现行文本压缩技术进行评述,指出汉语文本理论上可能获得的平均压缩比率(〉3.9)及现行压缩算法所能达到的水平(1.6左右)。此外,讨论了汉语文本压缩的研究方向以及几种典型的应用。
引用
收藏
页码:58 / 65
页数:8
相关论文
共 7 条
[1]   关于Lempel-Ziv 77压缩算法及其实现的研究 [J].
王忠效,姜丹 .
计算机研究与发展 , 1996, (05)
[2]   基于字符串匹配的通用数据压缩算法 [J].
王忠效 .
计算机应用, 1995, (01) :38-40
[3]   中文文本压缩的自适应算法 [J].
贺前华 ;
徐秉铮 ;
彭磊 .
中文信息学报, 1993, (03) :46-54
[4]   中文文本压缩的LZW算法 [J].
徐秉铮 ;
吴立忠 ;
Victor K.Wei .
华南理工大学学报(自然科学版), 1989, (03) :1-9
[5]   汉字字频分布、最佳编码与输入问题 [J].
石贵青 ;
徐秉铮 .
电子学报, 1984, (04) :94-96
[6]  
现代汉字和计算机[M]. 北京大学出版社 , 冯志伟编著, 1989
[7]  
现代汉语频率词典[M]. 北京语言学院出版社 , 北京语言学院语言教学研究所编, 1986