`
greennetboy
  • 浏览: 71156 次
文章分类
社区版块
存档分类
最新评论

lzw压缩算法

阅读更多

using System;
using System.IO;

namespace Gif.Components
{
 public class LZWEncoder
 {

  private static readonly int EOF = -1;

  private int imgW, imgH;
  private byte[] pixAry;
  private int initCodeSize;
  private int remaining;
  private int curPixel;

  // GIFCOMPR.C       - GIF Image compression routines
  //
  // Lempel-Ziv compression based on 'compress'.  GIF modifications by
  // David Rowley (mgardi@watdcsu.waterloo.edu)

  // General DEFINEs

  static readonly int BITS = 12;

  static readonly int HSIZE = 5003; // 80% occupancy

  // GIF Image compression - modified 'compress'
  //
  // Based on: compress.c - File compression ala IEEE Computer, June 1984.
  //
  // By Authors:  Spencer W. Thomas      (decvax!harpo!utah-cs!utah-gr!thomas)
  //              Jim McKie              (decvax!mcvax!jim)
  //              Steve Davies           (decvax!vax135!petsd!peora!srd)
  //              Ken Turkowski          (decvax!decwrl!turtlevax!ken)
  //              James A. Woods         (decvax!ihnp4!ames!jaw)
  //              Joe Orost              (decvax!vax135!petsd!joe)

  int n_bits; // number of bits/code
  int maxbits = BITS; // user settable max # bits/code
  int maxcode; // maximum code, given n_bits
  int maxmaxcode = 1 << BITS; // should NEVER generate this code

  int[] htab = new int[HSIZE];//这个是放hash的筒子,在这里面可以很快的找到1个key
  int[] codetab = new int[HSIZE];

  int hsize = HSIZE; // for dynamic table sizing

  int free_ent = 0; // first unused entry

  // block compression parameters -- after all codes are used up,
  // and compression rate changes, start over.
  bool clear_flg = false;

  // Algorithm:  use open addressing double hashing (no chaining) on the
  // prefix code / next character combination.  We do a variant of Knuth's
  // algorithm D (vol. 3, sec. 6.4) along with G. Knott's relatively-prime
  // secondary probe.  Here, the modular division first probe is gives way
  // to a faster exclusive-or manipulation.  Also do block compression with
  // an adaptive reset, whereby the code table is cleared when the compression
  // ratio decreases, but after the table fills.  The variable-length output
  // codes are re-sized at this point, and a special CLEAR code is generated
  // for the decompressor.  Late addition:  construct the table according to
  // file size for noticeable speed improvement on small files.  Please direct
  // questions about this implementation to ames!jaw.

  int g_init_bits;

  int ClearCode;
  int EOFCode;

  // output
  //
  // Output the given code.
  // Inputs:
  //      code:   A n_bits-bit integer.  If == -1, then EOF.  This assumes
  //              that n_bits =< wordsize - 1.
  // Outputs:
  //      Outputs code to the file.
  // Assumptions:
  //      Chars are 8 bits long.
  // Algorithm:
  //      Maintain a BITS character long buffer (so that 8 codes will
  // fit in it exactly).  Use the VAX insv instruction to insert each
  // code in turn.  When the buffer fills up empty it and start over.

  int cur_accum = 0;
  int cur_bits = 0;

  int [] masks =
  {
   0x0000,
   0x0001,
   0x0003,
   0x0007,
   0x000F,
   0x001F,
   0x003F,
   0x007F,
   0x00FF,
   0x01FF,
   0x03FF,
   0x07FF,
   0x0FFF,
   0x1FFF,
   0x3FFF,
   0x7FFF,
   0xFFFF };

  // Number of characters so far in this 'packet'
  int a_count;

  // Define the storage for the packet accumulator
  byte[] accum = new byte[256];

  //----------------------------------------------------------------------------
  public LZWEncoder(int width, int height, byte[] pixels, int color_depth)
  {
   imgW = width;
   imgH = height;
   pixAry = pixels;
   initCodeSize = Math.Max(2, color_depth);
  }
 
  // Add a character to the end of the current packet, and if it is 254
  // characters, flush the packet to disk.
  void Add(byte c, Stream outs)
  {
   accum[a_count++] = c;
   if (a_count >= 254)
    Flush(outs);
  }
 
  // Clear out the hash table

  // table clear for block compress
  void ClearTable(Stream outs)
  {
   ResetCodeTable(hsize);
   free_ent = ClearCode + 2;
   clear_flg = true;

   Output(ClearCode, outs);
  }
 
  // reset code table
        // 全部初始化为-1
  void ResetCodeTable(int hsize)
  {
   for (int i = 0; i < hsize; ++i)
    htab[i] = -1;
  }
 
  void Compress(int init_bits, Stream outs)
  {
   int fcode;
   int i /* = 0 */;
   int c;
   int ent;
   int disp;
   int hsize_reg;
   int hshift;

   // Set up the globals:  g_init_bits - initial number of bits
            //原始数据的字长,在gif文件中,原始数据的字长可以为1(单色图),4(16色),和8(256色)
            //开始的时候先加上1
            //但是当原始数据长度为1的时候,开始为3
            //因此原始长度1->3,4->5,8->9

            //?为何原始数据字长为1的时候,开始长度为3呢??
            //如果+1=2,只能表示四种状态,加上clearcode和endcode就用完了。所以必须扩展到3
   g_init_bits = init_bits;

   // Set up the necessary values
            //是否需要加清除标志
            //GIF为了提高压缩率,采用的是变长的字长(VCL)。比如说原始数据是8位,那么开始先加上1位(8+1=9)
            //当标号到2^9=512的时候,超过了当前长度9所能表现的最大值,此时后面的标号就必须用10位来表示
            //以此类推,当标号到2^12的时候,因为最大为12,不能继续扩展了,需要在2^12=4096的位置上插入一个ClearCode,表示从这往后,从9位重新再来了        
   clear_flg = false;
   n_bits = g_init_bits;
            //获得n位数能表述的最大值(gif图像中开始一般为3,5,9,故maxcode一般为7,31,511)
   maxcode = MaxCode(n_bits);
            //表示从这里我重新开始构造字典字典了,以前的所有标记作废,
            //开始使用新的标记。这个标号集的大小多少比较合适呢?据说理论上是越大压缩率越高(我个人感觉太大了也不见得就好),
            //不过处理的开销也呈指数增长
            //gif规定,clearcode的值为原始数据最大字长所能表达的数值+1;比如原始数据长度为8,则clearcode=1<<(9-1)=256
   ClearCode = 1 << (init_bits - 1);
            //结束标志为clearcode+1
   EOFCode = ClearCode + 1;
            //这个是解除结束的
   free_ent = ClearCode + 2;
            //清楚数量
   a_count = 0; // clear packet
            //从图像中获得下一个像素
   ent = NextPixel();

   hshift = 0;
   for (fcode = hsize; fcode < 65536; fcode *= 2)
    ++hshift;
            //设置hash码范围
   hshift = 8 - hshift; // set hash code range bound

   hsize_reg = hsize;
            //清除固定大小的hash表,用于存储标记,这个相当于字典
   ResetCodeTable(hsize_reg); // clear hash table

   Output(ClearCode, outs);

   outer_loop : while ((c = NextPixel()) != EOF)
       {
        fcode = (c << maxbits) + ent;                            
        i = (c << hshift) ^ ent; // xor hashing
                             //嘿嘿,小样,又来了,我认识你
        if (htab[i] == fcode)
        {
         ent = codetab[i];
         continue;
        }
                             //这小子,新来的
        else if (htab[i] >= 0) // non-empty slot
        {
         disp = hsize_reg - i; // secondary hash (after G. Knott)
         if (i == 0)
          disp = 1;
         do
         {
          if ((i -= disp) < 0)
           i += hsize_reg;

          if (htab[i] == fcode)
          {
           ent = codetab[i];
           goto outer_loop;
          }
         } while (htab[i] >= 0);
        }
         Output(ent, outs);
                             //从这里可以看出,ent就是前缀(prefix),而当前正在处理的字符标志就是后缀(suffix)
        ent = c;
                             //判断终止结束符是否超过当前位数所能表述的范围
        if (free_ent < maxmaxcode)
        {
                                 //如果没有超
         codetab[i] = free_ent++; // code -> hashtable
                                 //hash表里面建立相应索引
         htab[i] = fcode;
        }
        else
                                 //说明超过了当前所能表述的范围,清空字典,重新再来
         ClearTable(outs);
       }
   // Put out the final code.
   Output(ent, outs);
   Output(EOFCode, outs);
  }
 
  //----------------------------------------------------------------------------
  public void Encode( Stream os)
  {
   os.WriteByte( Convert.ToByte( initCodeSize) ); // write "initial code size" byte
            //这个图像包含多少个像素
   remaining = imgW * imgH; // reset navigation variables
            //当前处理的像素索引
   curPixel = 0;

   Compress(initCodeSize + 1, os); // compress and write the pixel data

   os.WriteByte(0); // write block terminator
  }
 
  // Flush the packet to disk, and reset the accumulator
  void Flush(Stream outs)
  {
   if (a_count > 0)
   {
    outs.WriteByte( Convert.ToByte( a_count ));
    outs.Write(accum, 0, a_count);
    a_count = 0;
   }
  } 
      
        /// <summary>
        /// 获得n位数所能表达的最大数值
        /// </summary>
        /// <param name="n_bits">位数,一般情况下n_bits = 9</param>
        /// <returns>最大值,例如n_bits=8,则返回值就为2^8-1=255</returns>
  int MaxCode(int n_bits)
  {
   return (1 << n_bits) - 1;
  }
 
  //----------------------------------------------------------------------------
  // Return the next pixel from the image
  //----------------------------------------------------------------------------
        /// <summary>
        /// 从图像中获得下一个像素
        /// </summary>
        /// <returns></returns>
  private int NextPixel()
  {
            //还剩多少个像素没有处理
            //如果没有了,返回结束标志
   if (remaining == 0)
    return EOF;
            //否则处理下一个,并将未处理像素数目-1
   --remaining;
            //当前处理的像素
   int temp = curPixel + 1;
            //如果当前处理像素在像素范围之内
   if ( temp < pixAry.GetUpperBound( 0 ))
   {
                //下一个像素
    byte pix = pixAry[curPixel++];
    return pix & 0xff;
   }
   return 0xff;
  }
     /// <summary>
     /// 输出字到输出流
     /// </summary>
     /// <param name="code">要输出的字</param>
     /// <param name="outs">输出流</param>
  void Output(int code, Stream outs)
  {
            //得到当前标志位所能表示的最大标志值
   cur_accum &= masks[cur_bits];

   if (cur_bits > 0)
    cur_accum |= (code << cur_bits);
   else
               //如果标志位为0,就将当前标号为输入流
    cur_accum = code;
            //当前能标志的最大字长度(9-10-11-12-9-10。。。。。。。)
   cur_bits += n_bits;
            //如果当前最大长度大于8
   while (cur_bits >= 8)
   {
                //向流中输出一个字节
    Add((byte) (cur_accum & 0xff), outs);
                //将当前标号右移8位
    cur_accum >>= 8;
    cur_bits -= 8;
   }

   // If the next entry is going to be too big for the code size,
   // then increase it, if possible.
   if (free_ent > maxcode || clear_flg)
   {
    if (clear_flg)
    {
     maxcode = MaxCode(n_bits = g_init_bits);
     clear_flg = false;
    }
    else
    {
     ++n_bits;
     if (n_bits == maxbits)
      maxcode = maxmaxcode;
     else
      maxcode = MaxCode(n_bits);
    }
   }

   if (code == EOFCode)
   {
    // At EOF, write the rest of the buffer.
    while (cur_bits > 0)
    {
     Add((byte) (cur_accum & 0xff), outs);
     cur_accum >>= 8;
     cur_bits -= 8;
    }

    Flush(outs);
   }
  }
 }
}



jillzhang 2006-10-17 17:58 发表评论
分享到:
评论

相关推荐

    LZW压缩算法

    总的来说,LZW压缩算法是数据压缩领域的重要技术,它通过构建动态字典来实现对数据的高效压缩。虽然有其局限性,但在很多场景下,LZW仍然是一种实用且有效的压缩手段。在实际应用中,开发者需要根据具体需求选择合适...

    LZW压缩算法.zip

    总的来说,LZW压缩算法提供了一种有效的数据压缩方法,通过VS2013进行编译,可以方便地在Windows环境中实现文件的压缩和解压缩。理解并掌握这一算法有助于提升对数据压缩原理的理解,为开发相关应用打下坚实基础。

    LZW压缩算法 在matlab 中对图片的处理

    通过以上步骤,你可以在MATLAB中实现LZW压缩算法对图像的处理。记住,压缩率和压缩速度会受到字典大小、编码策略以及图像内容的影响。在实际应用中,你可能需要调整算法参数以达到理想的压缩效果。

    LZW压缩算法_很详细的压缩算法原理

    看了就会的好资料,LZW压缩算法_很详细的压缩算法原理

    verliog编写的LZW压缩算法

    使用quartus的verliog硬件语言编写的LZW压缩算法,采用的是512的字典,以及双口ram的乒乓原理。由于仿真文件较大,所以未上传modisim仿真,如果需要或者不懂的可以留言告知,尽量帮你解决。写的有点乱,望见谅。

    一篇关于lzw压缩算法简介的文章

    一篇关于lzw压缩算法lzw压缩算法简介简介的文章,通俗易懂,值得一看

    LZW算法源码C语言.rar_LZW c++_lzw C语言_lzw压缩算法_lzw算法

    LZW压缩算法简介 作者:宋成 描述:一篇关于LZW压缩算法简介的文章,通俗易懂,值得一看! 备注:该文章整理自软件报1998年合订本上册。 LZW压缩算法是一种新颖的压缩方法,由Lemple-Ziv-Welch 三人共同创造,用他们...

    LZW压缩算法的VC 示例程序源代码.rar

    LZW(Lempel-Ziv-Welch...通过研究和实践这个VC++源码,你不仅可以深入了解LZW压缩算法的实现细节,还能提升C++编程技巧,特别是文件操作和算法实现方面的能力。同时,这也为你提供了将理论知识应用于实际项目的基础。

    LZW压缩算法的实现和研究

    ### LZW压缩算法的实现和研究 #### 一、引言 随着信息技术的快速发展,数据存储和传输的需求日益增加,而图像数据占据了其中相当大的一部分。为了提高存储效率和网络传输速度,压缩技术成为了关键的一环。在众多的...

    多媒体作业-lzw压缩算法

    **多媒体作业——LZW压缩算法详解** 在信息技术领域,数据压缩是提高存储效率和传输速度的重要手段。LZW(Lempel-Ziv-Welch)压缩算法是一种无损压缩方法,广泛应用于图像、文本和多媒体数据的压缩。本作业将深入...

    LZW.rar_lzw_lzw压缩c++_lzw压缩算法_lzw算法

    LZW压缩算法是一种高效且灵活的无损数据压缩技术,它通过建立和扩展动态字典来优化数据编码。在C++中实现LZW,需要处理输入输出流、维护字典以及进行编码和解码操作。虽然有其复杂性和历史上的专利问题,但LZW至今仍...

    用VC++实现的LZW压缩算法

    在VC++环境下实现LZW压缩算法,可以为开发人员提供一个高效的实时压缩工具。 LZW算法的核心思想是通过查找和匹配输入数据中的重复模式来减少信息量。它首先创建一个空字典,将每个单个字符作为初始的字典项。随着...

    多媒体技术LZW压缩算法

    在这个多媒体技术教程中,我们将深入探讨LZW压缩算法的原理、编码与解码过程,并且会看到如何用C++语言来实现这一算法。 首先,LZW算法的基本思想是利用数据中的重复模式进行编码。在压缩过程中,数据被分割成一...

    LZW压缩算法,可以实现文件的快速压缩

    以下是关于LZW压缩算法的详细解释: 1. **字典构建**:在LZW算法开始时,字典包含所有单个字符,每个字符对应一个唯一的编码。随着算法的进行,字典会动态扩展,包含输入流中出现的连续字符序列。 2. **编码过程**...

    lzw压缩算法java实现

    LZW(Lemple-Ziv-Welch)压缩算法是一种高效的无损数据压缩方法,由Lemple、Ziv和Welch三位科学家共同开发。该算法基于字典编码思想,通过构建和更新动态字典来实现数据的压缩。在Java中实现LZW算法主要涉及以下几个...

    LZW压缩算法(VC++实现)

    LZW压缩算法是一种数据压缩方法,最初由Lempel、Ziv和Welch在1977年提出,因其高效性和简洁性而被广泛应用。在本文中,我们将深入探讨LZW算法的基本原理、实现过程以及如何在VC++环境中实现该算法。 ### LZW算法...

    LZW压缩算法VC++

    在VC++环境中实现LZW压缩算法,可以为开发者提供一种高效处理大量数据的方式,特别是在存储和传输资源有限的情况下。以下是关于LZW压缩算法的关键知识点和实现细节: 1. **LZW算法的基本原理**: - LZW的核心思想...

    LZW压缩算法和GUI实现

    在C++Builder环境中实现LZW压缩算法,通常涉及以下几个关键步骤: 1. **词汇表构建**:LZW算法的核心是动态构建词汇表。初始化时,词汇表包含所有单个字符,然后在压缩过程中不断添加新词汇。每个新词汇由之前已...

    lzw 压缩解压缩算法

    总之,LZW压缩算法是一种高效的数据压缩技术,尤其适合处理具有重复模式的数据。它的运作机制基于动态字典和编码替换,既可以在资源有限的系统上运行,也能适应多种数据类型。了解并掌握LZW算法有助于我们理解和实现...

    LZW压缩算法源码

    在本文中,我们将深入探讨LZW压缩算法的基本原理、工作流程以及源码实现的关键部分。 **LZW算法的基本思想** LZW的核心在于动态构建字典,将输入数据流中的连续重复出现的字符序列进行编码,从而减少信息的存储量...

Global site tag (gtag.js) - Google Analytics