`
jimmee
  • 浏览: 537992 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

文本压缩笔记(一):总述

 
阅读更多

1. huffman coding

about five bits per character

 

2. Ziv-Lempel coding和Arithmetic Coding都是使用自适应的压缩方式

 

其中Arithmetic Coding更基础,它可以使一类基于它的自适应的压缩方法得以实现。

 

Ziv-Lempel about four bits per character

 

Arithmetic Coding over two bits per character.-->压缩和解压都会慢,同时内存也会多。

 

3. PPM(Prediction by Partial matching)是基于Arithmetic Coding的。

 

4. 压缩方法可以分类两类: 符号方法(symbolwise methods)和字典方法(dictionary methods)。

 

Symbolwise methods are usually based on either Huffman coding or arithmetic coding, and they

differ mainly in how they estimate probabilities for symbols。

 

Dictionary methods generally use quite simple representations to code references to

entries in the dictionary。The most significant dictionary methods are based on

Ziv-Lempel coding,which use the idea of replacing strings of characters with a reference

to a previous occurrence of the string。

 

2.2 Adaptive models

The method that always uses the same model regardless of what text is being coded is 
called static modeling.

One solution is to generate a model specially for each file that is to be compressed.
An initial pass is made through the file to estimate symbol probabilities, and these
are transmitted to the decoder before transmitting the encoded symbols.This approach
is called semi-static modeling.

Adaptive modeling is an elegant solution to these problems. An adaptive model begins
with a bland probability distribution and gradually alters it as more symbols are
encountered.

Zero-frequency problem solution: One is to allow one extra count, which is divided evenly
among any symbols that have not been obaserved int the input. Another possibility is 
to artificially inflate the count of ervery character in the alphabet by one, thereby
ensuring that none has a zero frequency.

2.3 Huffman coding

Coding is the task of determining the output representation of a symbol, based on
a probability distribution supplied by a model.
分享到:
评论

相关推荐

    模型算法大全:总述(4份).zip

    模型算法大全:总述(4份),供大家学习参考: 常用数学模型及建模方法.doc 数学建模思想方法大全及方法适用范围(10页).pdf 数学建模竞赛中应当掌握的十类算法(5页).pdf 数模大全 (738页).pdf

    碳中和碳达峰系列研究之总述篇:双碳下的“双新”趋势.pdf

    碳中和碳达峰系列研究之总述篇:双碳下的“双新”趋势 本研究报告对中国的碳中和碳达峰行动的发展趋势进行了深入分析和研究。报告认为,整个“双碳”行动将会按“双新”的趋势有序推进,即“新能源”与“新电气化...

    简易内存数据库(一)总述

    《简易内存数据库(一)总述》这篇文章主要探讨了内存数据库的基本概念、设计原则和应用场景。内存数据库是一种将数据存储在计算机内存中的数据库系统,它相比传统的磁盘存储数据库具有更快的数据读写速度,尤其适合...

    20210809-招商银行-新能源行业碳中和碳达峰系列研究之总述篇:双碳下的“双新”趋势.pdf

    20210809-招商银行-新能源行业碳中和碳达峰系列研究之总述篇:双碳下的“双新”趋势.pdf

    串行接口总述

    串行接口总述,详细描述串口接口,望补充。

    CST2008教程翻译--后处理总述

    CST2008教程翻译--后处理总述,微波仿真软件,很好的入门资料 格式: RAR PDF 其他: *资源分1分,如果评论资源的话,会返还2分,欢迎评论。我这样设置的原因是:希望您下载资源之后,能够评论一下,也好让我知道...

    城市设计-05.-方案文本.小麦岛修建性详细规划.rar

    1. 方案总述:介绍规划背景、目标和愿景,以及规划的基本理念和策略。 2. 区域分析:包括地形地貌、气候条件、现有用地情况、交通网络、社区结构等分析。 3. 功能布局:展示不同功能区的划分,如居住区、商业区、...

    同等学力英语学习笔记

    【同等学力英语学习笔记】是一份专门为准备同等学力英语考试的学习资料,它涵盖了考试技巧、参考书目以及各个重要部分的复习要点。参考书由王蕙和王建华主编,经济管理出版社于2007年出版。这份笔记特别强调了阅读...

    第一编空压站车间总述.docx

    《第一编空压站车间总述》文档详细阐述了中铝山西分公司氧化铝一分厂空压站车间的治理制度和工作理念,旨在提供一个高效、安全的生产环境,以达到公司的经营目标。以下是对该文档内容的详细解读: 1. **治理理念**...

    语言程序设计资料:Java网络编程 总述.ppt

    2. 面向对象:Java是一种纯粹的面向对象编程语言,所有内容都是对象,强调数据和操作数据的方法。 3. 分布式:Java支持网络通信,提供了处理TCP/IP协议的库,便于分布式计算。 4. 安全:Java具有多层安全机制,包括...

    部编版三年级语文下册知识点总结课堂笔记24.火烧云.docx

    《部编版三年级语文下册知识点总结课堂笔记24.火烧云》主要涵盖了关于小学三年级语文下学期的一个重要课文——《火烧云》的学习要点。这篇课文以生动的语言描绘了夕阳时分天空中火烧云的壮丽景象,让学生们领略到...

    java主流开发环境与工具总述与比较.pdf

    Java 主流开发环境与工具总述与比较 Java 语言从诞生之日起经历了多次的磨砺与蜕变,已成为当今最流行、最通用的软件开发语言之一,是许多专业人士首选的开发语言。为了更好的了解和学习 Java 语言,本文针对 Java ...

    GNUmake v3 中文版.chm

    第三章:Makefile 总述 第四章:Makefile的规则 第六章:Makefile中的变量 第七章:Makefile的条件执行 第九章:执行make 第十章:make的隐含规则 第十一章:使用make更新静态库文件 第十二章 : GNU make的特点 第...

    操作系统哈哈哈很牛逼一共有5章

    **第一章:总述** 在这一章,我们将对操作系统有一个宏观的认识。操作系统是计算机系统的灵魂,它作为用户和硬件之间的桥梁,承担着调度、协调和管理各种任务。这一章会介绍操作系统的分类(如批处理、分时、实时、...

    2021版高考语文一轮复习第1板块现代文阅读1论述类文本阅读2整体阅读成竹在胸课件

    【论述类文本阅读】是高考语文复习中的一个重要板块,尤其在一轮复习阶段,对考生的阅读理解能力提出了较高的要求。2021版高考语文一轮复习的【整体阅读成竹在胸】课件旨在帮助学生掌握论述类文本的阅读策略,提高...

    2022年建材行业发展总述报告:内需之变和绿色增长下的行业走向(15页).pdf

    报告标题:“2022年建材行业发展总述报告:内需之变和绿色增长下的行业走向” 报告描述:本报告详细分析了2022年建材行业在内需变化和绿色增长背景下的发展趋势,涵盖了需求端和供给端的动态,以及投资策略和相关...

Global site tag (gtag.js) - Google Analytics