`
qq_24665727
  • 浏览: 121634 次
  • 性别: Icon_minigender_1
  • 来自: 长沙
社区版块
存档分类
最新评论

数据结构之霍夫曼压缩,更易理解文件压缩过程

阅读更多

中间遇到过很多问题,不断的找办法,其实网上有很多前辈遇到过类似的问题,基本上我们目前这个学习阶段遇到的都有解决方法,我体会很深,需要不断坚持和学习;在学习霍夫曼的过程中,我了解了其他的lzw字典压缩方法,可以用于文件夹的压缩,这也算意外收获吧,凡事亲力亲为,必然收获很大;

<!--EndFragment-->

 

1.霍夫曼树应用利用霍夫曼编码实现了文件的压缩和解压,代码有点多,树的运用主要在Tree这个类里面);

功能:实现单个文件压缩的和解压;(500MB左右的文件我用系统给的api里面的方法实现了,代码很短,用eclipse写的,这个不能实现文件夹的操作,另外一个博客里面写了压缩文件件夹的方法);

压缩

1.利用字节流读取计算文件里面每一字节出现次数;

2.用出现次数来作为节点权值构建哈弗曼树;

3.利用节点类构建哈弗曼树的时候给节点添加属性来记录编码;

4.利用递归得到每一个叶子节点的哈弗曼编码,然后获得所有字节的01串;

5.利用已经得到的01串进行byte和string类型转换实现进一步压缩;

6. 接下来便是写文件,但是这才是需要细心的地方:

       (写入顺序)压缩文件的内容:

         a.将原文件大小写入文件// dos.writeInt(fileSize);

         b.将码表的大小写入文件//dos.writeInt(mapSize);

         c.将每个字节写入文件//fos.write(listBy.get(i));

         d.将每个字节对应的哈夫曼编码大小写入文件//fos.write(codeSize);

         e.将每个字符对应的哈夫曼编码写入文件

        //   dos.writeChars(hfmcode_next); 

         f.写入压缩后的字节数组的大小

         g.写入压缩后的文件内容

解压

  1.fileSize = dis.readInt();// 得到原文件的大小

  2.int mapSize = dis.readInt();// 得到码表的大小

  3. 利用循环读取码表内容开始存入为名称大小编码(前面两个使用byte类型写入,编码是writeChars(),则取出来时也要对应将取得的字节名称还有编码存入map,清空hadmcode_next最后得到码表map

   4.int len = dis.readInt();// 得到压缩好的字节数组的大小

   5.得到压缩时存入的文件的字节数组,转换成Int[]0然后得到01

   6.解码过程,取得数组中第一个数或者字节然后遍历码表,用码表键的字节名称与之进行匹配,解码

 

(写的有点口语化,如果看不清楚,请直接去程序里面看,写的很详细!)

 

 

使用方法

(没有写界面,因为只能压缩一个单文件)首先的新建一个用于测试的文件,最好里面的字节重复率高一点,因为这样哈弗曼编码会越短进而压缩率会高; 打开Main类,已经new了一个jieya和yasuo类的实例,可以分别调用实现压缩和解压;文件路径可以修改一下;

 

3.详细设计(详细代码附在文件里面,需要的话可以免费下载)

注意:这个程序有5个类,分别是Node,Tree,yasuo,jieya,Main;

 

<!--EndFragment-->

<!--EndFragment-->
1
1
分享到:
评论

相关推荐

    数据结构文件压缩

    此外,"数据结构文件霍夫曼编码压缩与解压.docx"文档很可能是对霍夫曼编码在数据结构课程设计中的具体应用进行的详细解释,包括了压缩和解压的步骤和原理。而"寻找关键路径.exe"和"Huffman-文件压缩与解压.exe"是...

    霍夫曼压缩解压缩代码

    7. 数据结构设计:在C语言中,可以使用结构体来表示霍夫曼树的节点,包括字符、频率以及指向左右子节点的指针。同时,还需要维护一个哈希表或查找表,以便在解码时根据编码快速找到对应的字符。 8. 效率优化:为了...

    数据结构作业霍夫曼编码译码器

    在本实验中,我们关注的是数据结构中的一个重要概念——霍夫曼编码,它是一种用于无损数据压缩的高效编码方式。霍夫曼编码基于字符出现频率进行编码,频率越低的字符,编码长度越长;反之,频率越高的字符,编码长度...

    数据结构课程设计-文本文件压缩

    数据结构课程设计是计算机科学教育中的一个重要环节,它旨在让学生深入理解各种数据组织方式及其在实际问题中的应用。本项目聚焦于"文本文件压缩",采用了一种经典的压缩方法——霍夫曼编码,这是一种基于频率的无损...

    霍夫曼技术图像压缩重建_霍夫曼技术;图像重建_

    `Mat2Huff.m`和`Huff2Mat.m`是两个关键的文件,它们分别负责将图像数据转换为霍夫曼编码(编码过程)和将霍夫曼编码解码回原始数据(解码过程)。编码过程中,每个像素值被其对应的霍夫曼码替代,而解码过程则是根据...

    霍夫曼编码文件压缩和解压

    首先,需要构建一个最小堆(也称为优先队列),这个数据结构用于存储霍夫曼树的节点。最小堆的作用是在任何时候都能保证顶部的元素是堆中最小的元素,这对于霍夫曼树的构建至关重要。在霍夫曼树的构建过程中,会不断...

    matlab实现霍夫曼压缩与解压缩

    在MATLAB中实现霍夫曼编码,可以定义一个结构体来存储字符及其频率,然后用队列(queue)数据结构来帮助构建霍夫曼树。编码过程涉及到遍历树并生成编码,这可以通过递归或栈来完成。解压缩则需要逆向操作,根据预...

    霍夫曼编码源程序用于压缩文件

    在"霍夫曼压缩"这个文件中,可能包含了实现霍夫曼编码的源代码,以及可能的测试用例。源代码可能包括以下几个关键部分: - **频率统计**:读取原始文件,计算每个字符的出现频率。 - **构建霍夫曼树**:根据频率...

    霍夫曼图像压缩算法

    霍夫曼图像压缩算法是一种基于频率统计的无损数据压缩技术,主要应用于图像处理领域。在理解这个算法之前,我们首先要了解两个基本概念:霍夫曼编码和图像压缩。 霍夫曼编码是信息论中的一个重要组成部分,由克劳德...

    数据结构课程设计—— 霍夫曼编码

    在数据结构课程设计中,霍夫曼编码是一个典型的实践项目,旨在让学生理解并掌握数据结构与算法的关系,以及它们如何应用于实际问题的解决。 在这个课程设计中,你可能会涉及以下几个关键知识点: 1. **霍夫曼树**...

    java实现霍夫曼树压缩文本文件和解压

    总结来说,通过Java实现霍夫曼编码不仅可以加深对数据结构和算法的理解,还能够实际应用到文件压缩和解压缩的场景中。这个过程涉及到文件操作、数据结构(二叉树和优先队列)、编码和解码等多方面的知识,对于提升...

    c++文本压缩 数据结构课程设计

    总之,C++文本压缩结合霍夫曼编码的课程设计涵盖了数据结构、算法和文件操作等多个IT领域的核心知识点。通过这个项目,学生不仅可以提升编程技能,还能深入理解数据压缩原理,为未来在软件开发、数据分析等领域的...

    基于霍夫曼编码的图像压缩重建-Matlab

    在Matlab中,可以使用内置的数据结构和循环来实现这个过程。 压缩阶段,将图像的像素值替换为它们的霍夫曼编码。由于编码是二进制的,因此可以将编码序列转化为二进制矩阵,进一步可以转换成字节流进行存储。在这个...

    全网最全霍夫曼图像压缩

    霍夫曼编码是一种高效的数据压缩方法,特别是在文本和图像数据的压缩中表现出色。它基于频率的编码方式,使得在数据流中出现频率较高的字符或像素用较短的编码,而出现频率较低的则用较长的编码,以此实现平均码长...

    数据结构课程设计--霍夫曼问题

    这种编码方式被称为霍夫曼编码,而相关的数据压缩过程就被称为霍夫曼压缩。 在本文中,作者常胜以霍夫曼编码和译码为主题进行了课程设计,旨在实现对特定字母串的编码和解码功能。设计过程中,选择了Windows XP作为...

    数据结构霍夫曼树的课程设计

    在这个"数据结构霍夫曼树的课程设计"中,我们可能需要完成以下内容: 1. **霍夫曼树的构建**:首先,我们需要根据字符及其出现频率创建一个霍夫曼树。这通常通过霍夫曼算法来实现,该算法将频率最低的两个节点合并...

    用霍夫曼树实现的文本压缩

    对于几十K的文本文件,霍夫曼压缩可以显著地减少文件大小,尤其当文件包含大量重复字符时。然而,霍夫曼编码并不适用于所有情况,例如,对于已经压缩过的数据或者含有大量不常见字符的文件,可能不会有太大的压缩...

    基于霍夫曼(Huffman)图像编码的图像压缩和重建-含Matlab代码.docx

    在图像处理领域,数据压缩是...总之,霍夫曼编码是图像压缩的重要手段,通过Matlab实现,我们可以直观地理解编码和解码过程,为实际工程应用提供便利。在学习和实践中,应结合理论知识和编程实践,以深入掌握这一技术。

    基于霍夫曼编码实现文件压缩

    在C++实现中,可能需要用到`std::priority_queue`来构建最小堆,以及自定义的数据结构来表示霍夫曼树节点。此外,为了处理ASCII码,我们需要确保编码和解码过程中处理的范围是0-127,这是标准ASCII码的范围。对于非...

Global site tag (gtag.js) - Google Analytics