一种基于算术编码的文本数据压缩算法

被引:19
作者
李英 [1 ]
崔艳鹏 [2 ]
高新波 [1 ]
机构
[1] 西安电子科技大学电子工程学院
[2] 西安电子科技大学网络行为研究中心
关键词
算术编码; 参数优化; 预测编码; 文本数据压缩;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
提出了一种基于算术编码的文本数据压缩算法,将扫描产生的偏移量、匹配数据长度等全局优化问题转化为局部优化问题,并从Glomb编码思路出发,推导出一种参数选择算法;对LZ77算法进行修正,提出一种预测编码方法,获得预测参数。对预测参数、偏移量、数据匹配长度、保留文本数据使用MQ算术编码器进行编码,针对不同类型数据,设计出不同的编码算法和相应的上下文算法。对算法进行仿真,并与Winzip、Win Rar压缩效率进行比较,结果表明对纯文本数据、Word文档数据、C语言程序代码,图像数据等,该压缩算法优于Winzip;在纯文本数据、Word文档数据、C语言程序代码压缩方面与Win Rar相当或者略好,但在图像压缩方面的性能与Win Rar相比略有不足。
引用
收藏
页码:929 / 933
页数:5
相关论文
共 7 条
[1]
基于整数数据的文档压缩编码方案 [J].
特日跟 ;
江晟 ;
李雄飞 ;
李军 .
吉林大学学报(工学版) , 2016, (01) :228-234
[2]
An image joint compression-encryption algorithm based on adaptive arithmetic coding [J].
Deng Jia-Xian ;
Deng Hai-Tao .
CHINESE PHYSICS B, 2013, 22 (09)
[3]
基于改进零树编码的图像联合压缩加密算法 [J].
邓家先 ;
任玉莉 .
光子学报, 2013, (01) :121-126
[4]
一种支持ANSI编码的中文文本压缩算法 [J].
常为领 ;
方滨兴 ;
云晓春 ;
王树鹏 ;
余翔湛 .
中文信息学报, 2010, (05) :96-105
[5]
基于分类重排LZW的图像无损压缩算法 [J].
谢耀华 ;
汤晓安 ;
孙茂印 ;
张永亮 .
中国图象图形学报, 2010, 15 (02) :236-241
[6]
汉语文本压缩研究及其应用[J] 王忠效 中文信息学报 1997, 03
[7]
Improving performance of network covert timing channel through Huffman coding[J] Jingzheng Wu;Yongji Wang;Liping Ding;Xiaofeng Liao Mathematical and Computer Modelling 2011,