2016.08.20
上课内容:哈夫曼树
哈夫曼树(霍夫曼树)又称为最优二叉树.
1、路径和路径长度
在一棵树中,从一个结点往下可以达到的孩子或孙子结点之间的通路,称为路径。通路中分支的数目称为路径长度。若规定根结点的层数为1,则从根结点到第L层结点的路径长
2、结点的权及带权路径长度
若将树中结点赋给一个有着某种含义的数值,则这个数值称为该结点的权。结点的带权路径长度为:从根结点到该结点之间的路径长度与该结点的权的乘积。
3、树的带权路径长度
树的带权路径长度规定为所有叶子结点的带权路径长度之和,记为WPL
WPL=(W1*L1+W2*L2+W3*L3+...+Wn*Ln)
N个权值Wi(i=1,2,...n)构成一棵有N个叶结点的二叉树,相应的叶结点的路径长度为Li(i=1,2,...n)。
哈夫曼树的形式如图1所示:
父节点(parent)又分为左节点(left)和右节点(right),其遍历方式有四种,即:前序遍历,中序遍历,后续遍历,层次遍历
图3为带权路径长度的算法,哈夫曼树的带权路径最短。
练习:找出哈夫曼树的节点和带权值
import java.util.*; public class HuffmanTree { public static class Node<E> { E data; double weight; Node leftChild; Node rightChild; public Node(E data , double weight) { this.data = data; this.weight = weight; } public String toString() { return "Node[数字:" + data + " 频率:" + weight + "]"; } } public static void main(String[] args) { List<Node> nodes = new ArrayList<Node>(); nodes.add(new Node("A" , 40.0)); nodes.add(new Node("B" , 8.0)); nodes.add(new Node("C" , 10.0)); nodes.add(new Node("D" , 30.0)); nodes.add(new Node("E" , 10.0)); nodes.add(new Node("F" , 2.0)); Node root = HuffmanTree.createTree(nodes); System.out.println(breadthFirst(root)); } /** * 构造哈夫曼树 * @param nodes 节点集合 * @return 构造出来的哈夫曼树的根节点 */ private static Node createTree(List<Node> nodes) { //只要nodes数组中还有2个以上的节点 while (nodes.size() > 1) { quickSort(nodes); //获取权值最小的两个节点 Node left = nodes.get(nodes.size() - 1); Node right = nodes.get(nodes.size() - 2); //生成新节点,新节点的权值为两个子节点的权值之和 Node parent = new Node(null , left.weight + right.weight); //让新节点作为权值最小的两个节点的父节点 parent.leftChild = left; parent.rightChild = right; //删除权值最小的两个节点 nodes.remove(nodes.size() - 1); nodes.remove(nodes.size() - 1); //将新生成的父节点添加到集合中 nodes.add(parent); } //返回nodes集合中唯一的节点,也就是根节点 return nodes.get(0); } //将指定数组的i和j索引处的元素交换 private static void swap(List<Node> nodes, int i, int j) { Node tmp; tmp = nodes.get(i); nodes.set(i , nodes.get(j)); nodes.set(j , tmp); } //实现快速排序算法,用于对节点进行排序。从大到小的排序 private static void subSort(List<Node> nodes, int start , int end) { //需要排序 if (start < end) { //以第一个元素作为分界值 Node base = nodes.get(start); //i从左边搜索,搜索大于分界值的元素的索引 int i = start; //j从右边开始搜索,搜索小于分界值的元素的索引 int j = end + 1; while(true) { //找到大于分界值的元素的索引,或i已经到了end处 while(i < end && nodes.get(++i).weight >= base.weight); //找到小于分界值的元素的索引,或j已经到了start处 while(j > start && nodes.get(--j).weight <= base.weight); if (i < j) { swap(nodes , i , j); } else { break; } } swap(nodes , start , j); //递归左子序列 subSort(nodes , start , j - 1); //递归右边子序列 subSort(nodes , j + 1, end); } } public static void quickSort(List<Node> nodes) { subSort(nodes , 0 , nodes.size() - 1); } //广度优先遍历 public static List<Node> breadthFirst(Node root) { Queue<Node> queue = new ArrayDeque<Node>(); List<Node> list = new ArrayList<Node>(); if( root != null) { //将根元素入“队列” queue.offer(root); } while(!queue.isEmpty()) { //将该队列的“队尾”的元素添加到List中 list.add(queue.peek()); Node p = queue.poll(); //如果左子节点不为null,将它加入“队列” if(p.leftChild != null) { queue.offer(p.leftChild); } //如果右子节点不为null,将它加入“队列” if(p.rightChild != null) { queue.offer(p.rightChild); } } return list; } }
哈夫曼树的应用:
在通信及数据传输中多采用二进制编码。为了使电文尽可能的缩短,可以对电文中每个字符出现的次数进行统计。设法让出现次数多的字符的二进制码短些,而让那些很少出现的字符的二进制码长一些。
在数中令左边分支去编码为0,右边编码为1,将从根节点到某个叶子节点上的各左、右分支的编码顺序排列,就得到这个叶子节点所代表的字符的二进制编码,如图4所示。
这些编码拼成的电文不会混淆,因为每个字符的编码不是其它编码的前缀,这种编码称为前缀编码。
相关推荐
哈夫曼树是一种在计算机科学中广泛使用的数据结构,尤其在数据压缩领域有着重要的应用。本实验报告主要探讨了如何运用哈夫曼树对文本文件进行编码和解压缩,以实现无损数据压缩。 首先,我们需要理解哈夫曼树的基本...
哈夫曼树(Huffman Tree),也称为最优二叉树,是数据压缩领域中的一个重要概念。它是基于贪心策略的一种数据结构,用于构建一种特殊的二叉树,使得带权路径长度最短,从而达到编码效率最高。哈夫曼树的核心思想是...
"数据结构哈夫曼树PPT学习教案.pptx" 哈夫曼树是一种特殊的二叉树,它的带权路径长度最小。哈夫曼树的构造是数据结构中的一种重要算法,广泛应用于数据压缩、编码和决策树等领域。 一、基本术语 在哈夫曼树中,...
哈夫曼树是一种特殊的二叉树,用于解决数据编码和压缩问题,特别是在数据通信和文件压缩领域广泛应用。哈夫曼编码是一种高效的前缀编码方法,它根据数据出现频率分配最短的二进制码,频繁出现的字符拥有较短的编码,...
数据结构课程设计的目标是让学生能够灵活运用所学的数据结构知识,特别是哈夫曼树这一重要概念,来解决实际问题。哈夫曼树是一种特殊的二叉树,常用于数据压缩和编码,通过构建最小带权路径长度的二叉树,使得频率高...
数据结构中的哈夫曼树(Huffman Tree),也称为最优二叉树,是一种特殊的二叉树,主要用于数据的编码压缩。哈夫曼树是通过哈夫曼编码(Huffman Coding)来实现的,这是一种用于无损数据压缩的算法。在这个算法中,...
哈夫曼树与哈夫曼编码是数据结构和算法领域中的一个重要概念,广泛应用于数据压缩、文本编码以及优先队列等场景。哈夫曼编码是一种特殊的前缀编码方法,能够为字符提供一种高效的二进制表示,使得频繁出现的字符具有...
哈夫曼树及哈夫曼编码译码的实现 哈夫曼树是一种特殊的二叉树,它的每个节点的权重是其所有子节点的权重之和。哈夫曼树的应用非常广泛,如数据压缩、编码、译码等。 哈夫曼树的存储结构 哈夫曼树的存储结构可以...
从终端读入字符集大小n,以及n个字符和n个权值,建立哈夫曼树并将它存于文件hfmTree中.将已在内存中的哈夫曼树以直观的方式(比如树)显示在终端上; 2.利用已经建好的哈夫曼树(如不在内存,则从文件htmTree中读入...
### 数据结构:哈夫曼树上机实验 #### 实验目的 本次实验旨在通过实际编程操作,加深学生对哈夫曼树(又称最优二叉树)的理解与掌握,熟悉哈夫曼树的构造过程及其应用。 #### 实验背景 哈夫曼树是一种带权路径长度...
根据给定的文件信息,我们可以深入探讨哈夫曼树(Huffman Tree)的基本操作与实现。哈夫曼树是一种在编码领域广泛应用的数据结构,主要用于数据压缩中的编码算法,特别是无损数据压缩。以下是对该代码及其功能的详细...
哈夫曼树的编译码器 哈夫曼树是一种特殊的二叉树,它的叶子结点权值和内部结点权值的关系满足某些特定的条件,常用于数据压缩和编码。在本文中,我们将使用 C 语言实现哈夫曼树的编译码器,包括建立哈夫曼树、...
哈夫曼树是一种特殊的二叉树,也称为最优二叉树或最小带权路径长度树。在信息编码领域,哈夫曼树常用于创建哈夫曼编码,这是一种用于数据压缩的有效方法。它通过构建一种特殊的树结构,使得树中每个叶子节点代表一个...
根据给定的信息,本文将详细解析哈夫曼树的实现及其相关知识点,包括类的定义、构造过程以及编码方法。 ### 哈夫曼树的基本概念 哈夫曼树(Huffman Tree),又称最优二叉树,是一种带权路径长度最短的二叉树,在...
哈夫曼树(Huffman Tree)和哈夫曼编码(Huffman Coding)是数据压缩领域中的基础算法,它们主要用于无损数据压缩。哈夫曼编码是一种可变长度的前缀编码,通过为每个字符分配一个唯一的二进制码,使得出现频率高的...
void HuffmanCoding(HuffmanTree &HT,HuffmanCode &HC,int *w,int num)//w存放n个字符的权值(均>0),构造哈夫曼树HT,并求出n个字符的哈弗曼编码HC { int i,m,c,s1,s2,start,f; HuffmanTree p; char* cd; if...
哈夫曼树程序设计问题 哈夫曼树是一种特殊的二叉树,它的每个节点的权重都是其左右子树的权重之和。哈夫曼树的主要应用是用于数据压缩,特别是文本压缩。哈夫曼树的构建过程是从叶子节点开始,逐渐构建树形结构,...
哈夫曼树(Huffman Tree),也称为最优二叉树,是数据压缩中的一种关键算法。它是基于贪心策略构建的,用于实现哈夫曼编码(Huffman Coding),这是一种无损数据压缩方法。在C++中实现哈夫曼树压缩与解压涉及到几个...
哈夫曼树是一种特殊的二叉树,主要用于数据压缩和编码,尤其在文本传输中能有效减少数据量。它的构建基于赫夫曼编码的概念,通过构建一个具有特定特性的二叉树来实现对字符的编码和解码。 哈夫曼树的构造过程可以...