中文文本压缩的自适应算法

被引:7
作者
贺前华
徐秉铮
彭磊
机构
[1] 华南理工大学无线电与自动控制研究所
关键词
文本压缩; LZW; 中文文本; 算法; 编码法; 码表; 编码过程; 码树; 树(数学); 压缩率; 使用次数;
D O I
暂无
中图分类号
学科分类号
摘要
本文初步分析了中文文本的存储结构特征,并将其应用于文本压缩,对LZW(Lemple Ziv Welch)算法进行了两方面的改进:1、采用变码长编码,对短文本的压缩有显著的效果;2、建立—删除规则,当码本加满以后对码本进行删除整理,使编码过程一直能够积累输入文本的相关信息,对较长文本,其压缩效果比基本LZM算法有显著改善。
引用
收藏
页码:46 / 54
页数:9
相关论文
共 3 条
[1]   汉字字频分布、最佳编码与输入问题 [J].
石贵青 ;
徐秉铮 .
电子学报, 1984, (04) :94-96
[2]  
GB 2312-1980. 信息交换用汉字编码字符集基本集[S]. 1982
[3]  
现代汉字和计算机[M]. 北京大学出版社 , 冯志伟编著, 1989