浅谈哈夫曼压缩
什么是哈夫曼压缩啊?其实,在做 之前看过前一组的一个同学做哈夫曼压缩的过程,那是我刚开始做画图板,看他写了好多,我什么都看不懂。这学期,经过龙哥的讲解,对哈夫曼压缩有了一定的了解,下面就简单的写一下自己的理解。
一、哈夫曼树
哈夫曼树也称最优二叉树,它是将给定的n个权值作为n个节点构造的一棵二叉树,其带权路径长度最小。
二、哈夫曼编码
哈夫曼编码是一种可变字长编码,是根据字符 出现的概率来构造平均长度最小的01串,是一种很好的编码方式。
三、压缩原理
1、哈夫曼压缩:
哈夫曼压缩是一种无损压缩,在压缩过程中不会丢失信息,适合用于对应用程序 和重要资料进行压缩,应用十分广泛。
2、实现原理:
就是将被压缩文件中的个体符号用一个特定长度的位序列代替。在文件中出现频率高的字符用短的位序列代替, 而那些较少出现的出现的字符用长位序列代替。
大家都知道,计算机中的数据都是以二进制存储的,一个字节占8个“0”,“1” 位, 所以我们就可以将读取的字符进行“0”“1”编码,以计算机的存储方式用位的方法写入另一个文件就可以实现编码了。
四、压缩步骤
[size=medium]
1、统计文件中每个字节出现的次数
/**
* 读取文件的方法,以字节的形式读取
* @param fileName文件名
* @return将读取的字节转化为整型返回
*/
public int[] readFile(String fileName)
{
try{
//创建输出流对象
FileInputStream ins=new FileInputStream(fileName);
int i=0;
//创建数组
int[] array=new int [256];
//统计读取的字节数
int count=0;
while((i=ins.read())!=-1)
{
int j ;
//读取
i=ins.read();
for(j=1;j<array.length;j++)
if(i==j)
{
//数组元素值加1
array[j]++;
}
count ++;
}
//返回数组
return array;
}catch(Exception ef)
{
return null;
}
}
2、以次数为权值构建哈夫曼树
/**
* 将数组中的元素作为结点存储在队列中
*
* @param array传入数组
* @return返回一个人排好序的队列
*/
public PriorityQueue<TreeNode> array2List(int[] array) {
// 根据指定的比较器创建一个优先队列
PriorityQueue<TreeNode> list = new PriorityQueue<TreeNode>(11,new MyComparator());
// 将数组中的每一个元素都作为一个结点
for (int i = 0; i < array.length; i++) {
if(array[i]!=0)
{
// 创建结点对象
TreeNode node = new TreeNode(array[i]);
node.b=i;
// 将结点放入队列
list.add(node);
}
}
return list;
}
/**
* 根据传入的优先队列构造哈夫曼树
*
* @param list
* @return
*/
public TreeNode queue2Tree(PriorityQueue<TreeNode> list) {
while (list.size() > 1) {
// 从优先队列中取得前两个结点对象
TreeNode node1 = list.poll();
TreeNode node2 = list.poll();
// 根据两个结点的权值和构造新结点,作为父节点
TreeNode root = new TreeNode(node1.obj + node2.obj);
//建立相互关系
root.left = node1;
root.right = node2;
node1.parent = root;
node2.parent = root;
node1.flag=0;
node2.flag=1;
// 将新结点放入队列
list.add(root);
}
// 取出最后一个结点,就是哈夫曼树的根结点
TreeNode rootNode = list.poll();
return rootNode;
}
3、根据哈夫曼树得到每个叶子节点的编码,用字符串数组存储
/**
* 根据哈夫曼树得到每个叶子结点的哈夫曼编码
*
* @param root
* @return 将编码放在一个字符串数组中返回,数组长度是256,数组的下标对应每一个字节
*/
public String[] getHFMCodeByTree(TreeNode root) {
String[] codes = new String[256];
getOneNodeCode(root, codes, "");
return codes;
}
/**
* 递归得到每个叶结点的编码
*
* @param root 哈夫曼树
* @param codes 存放每个字节编码的字符串数组 数组下标为每个字节
* @param num 生成的哈夫曼编码
*/
private void getOneNodeCode(TreeNode root, String[] codes, String str) {
if (root != null) {
if (root.flag != null) {
str = str + root.flag;
if (root.left == null && root.right == null) {
// 当递归到叶子结点的时候就把得到的字符串放到结点中的字节作为下标的位置
codes[root.b] = str;
}
}
//左节点
TreeNode left = root.left;
getOneNodeCode(left, codes, str);
//右节点
TreeNode right = root.right;
getOneNodeCode(right, codes, str);
}
}
4、将文件中的字节用对应的编码表示,得到“0”,“1”字符串
5、将字符串以每8个为一组作为二进制转换为十进制,形成一个字节
//写入哈夫曼编码
for(int i=0;i<codes.length;i++){
int lenth=codes[i].length();//得懂每个哈夫曼编码的长度
if(lenth<1){
//如果编码为空,把长度写入
dops.write(lenth);
}
if(lenth>0&&lenth<8){
//如果编码的的长度小于8,就把它转化为一个字节
dops.write(lenth);//写入编码的长度
byte b=Byte.parseByte(codes[i], 2);
//写入编码
dops.write(b);
}
else if(lenth>7&&lenth<32){
//如果编码的长度大于7并且小于32,就把它转化为一个整数
//写入编码的长度
dops.write(lenth);
int it=Integer.parseInt(codes[i], 2);
//按一个整型写进去
dops.writeInt(it);
}
6、将所有的字节写入另一个文件,该文件即为压缩后的文件[/size]
分享到:
相关推荐
mypage文件可能包含了实现哈夫曼压缩和解压缩算法的C源代码文件,以及相关的测试数据或结果。通过阅读和理解这些代码,你可以深入学习哈夫曼编码的工作原理,以及如何在C语言中实现这一算法。同时,还可以了解到如何...
总之,哈夫曼压缩解压缩是数据压缩领域的一个重要方法,通过MFC和VC++,我们可以构建出直观且高效的压缩工具,便于学习和研究。在这个过程中,理解哈夫曼编码的原理、掌握MFC的使用以及实现压缩和解压缩的算法,都是...
《哈夫曼压缩》是一种广泛应用于数据压缩领域的高效算法,由大卫·艾尔·哈夫曼在1952年提出。它属于一种基于字符频率的无损压缩方法,特别适用于压缩那些存在大量重复字符的数据。哈夫曼编码是哈夫曼压缩的核心,...
在Java中实现哈夫曼压缩涉及到的主要步骤包括统计字节频率、构建哈夫曼树以及生成哈夫曼编码。首先,我们需要创建一个字节类(`NodeData`)来表示每个字节及其对应的权重(频率)。下面我们将详细讲解这些步骤: 1....
在Java中实现哈夫曼压缩和解压涉及到以下几个关键知识点: 1. **哈夫曼树**: 哈夫曼树(Huffman Tree)是一种带权路径长度最短的二叉树,也称为最优二叉树。它通过将频率较低的字符编码为较短的位序列,而频率较...
vc++哈夫曼压缩算法 vc++哈夫曼压缩算法
哈夫曼压缩是一种高效的数据压缩方法,它基于字符出现频率构建一种特殊的二叉树——哈夫曼树。在计算机科学中,尤其是信息处理和文件压缩领域,哈夫曼编码是广泛应用的技术之一。ASC II码是计算机中用8位二进制数...
在Java编程环境中实现哈夫曼压缩与解压缩程序,我们可以利用面向对象的特性,设计多个类来完成不同部分的功能。 1. **FileChooserDemo.java**:这是一个用户界面类,通常包含用于让用户选择输入和输出文件的控件。...
在C++中实现哈夫曼压缩和解压,主要涉及到数据结构(如优先队列、二叉树)和文件操作(读写)。`huffmain`可能是这个C++项目的主程序文件,其中可能包含了构建哈夫曼树、生成编码、压缩和解压等核心功能的实现。具体...
哈夫曼压缩与解压缩源码.zip哈夫曼压缩与解压缩源码.zip哈夫曼压缩与解压缩源码.zip哈夫曼压缩与解压缩源码.zip哈夫曼压缩与解压缩源码.zip哈夫曼压缩与解压缩源码.zip哈夫曼压缩与解压缩源码.zip哈夫曼压缩与解压缩...
在C++中实现哈夫曼压缩软件,我们需要理解以下几个核心概念和技术: 1. **哈夫曼树**:哈夫曼树是一种带权路径长度最短的二叉树,也称为最优二叉树。构建哈夫曼树的过程是通过合并频度最低的两个节点来逐渐构建整个...
本压缩包文件包含了一个可以直接运行的哈夫曼压缩与解压程序,是用C++语言编写的。C++是一种通用的、面向对象的编程语言,具有高效、灵活和丰富的库支持,非常适合实现这样的算法。 在压缩过程中,首先需要统计输入...
在Java中实现哈夫曼压缩涉及到以下几个关键步骤: 1. **统计字符频率**:首先,需要遍历输入文本,统计每个字符出现的次数,生成一个字符频率表。这是构建哈夫曼树的基础。 2. **构建哈夫曼树**:使用字符频率表,...
哈夫曼编码是一种高效的数据压缩方法,由大卫·哈夫曼在1952年提出。它是基于一种称为哈夫曼树(也叫最优二叉树)的数据结构。在这个课程设计中,你将深入理解哈夫曼编码的原理,并通过C++编程语言实现文件的压缩与...
哈夫曼压缩算法,全称为哈夫曼编码(Huffman Coding),是一种高效的无损数据压缩方法,由美国科学家大卫·艾尔·哈夫曼在1952年提出。它是基于字符频率(权重)构建最优二叉树的思想,通过创建一棵特殊的二叉树——...
在Java中实现哈夫曼压缩通常包括以下几个关键步骤: 1. **构建哈夫曼树**:首先,需要统计输入文本中每个字符出现的频率。然后,根据这些频率创建一个哈夫曼树。哈夫曼树是一种特殊的二叉树,其特点是叶子节点代表...
哈夫曼压缩是一种高效的数据编码方法,主要用于无损数据压缩,其原理是基于字符出现频率构建最优的二叉树(哈夫曼树),并以此进行编码。在C++实现哈夫曼压缩的过程中,我们需要理解以下几个关键知识点: 1. **...
在C++中实现哈夫曼压缩,我们需要理解以下几个关键知识点: 1. **哈夫曼树(Huffman Tree)**:哈夫曼树是一种特殊的二叉树,也称为最优二叉树,其叶子节点代表待编码的字符,非叶子节点表示字符的组合。树的构建...
哈弗曼编码(Huffman Coding)是一种数据压缩算法,由美国计算机科学家大卫·艾尔文·哈弗曼在1952年提出。这个算法基于一种称为“最优二叉树”(也称哈弗曼树)的数据结构,主要用于对频率不同的字符进行编码,从而...