`
bianku
  • 浏览: 71513 次
  • 性别: Icon_minigender_1
  • 来自: 常州
社区版块
存档分类
最新评论

赫夫曼编码

阅读更多
/* 
Name: 赫夫曼编码 
Copyright: 始发于goal00001111的专栏;允许自由转载,但必须注明作者和出处 
Author: goal00001111 
Date: 16-12-08 21:16 
Description: 赫夫曼编码 
本程序实现了使用赫夫曼编码压缩数据;输入一串字符串sourceCode——为方便理解,暂时要求字符串只包含大写字母和空格,如果你愿意, 
很容易就可以推广到所有的字符——计算出字符串中各个字母的权重,然后对其进行赫夫曼编码,输出赫夫曼树。 
将赫夫曼树的叶子结点存储到有序二叉树中,输出原字符串经压缩后得到的用'0'和'1'表示的新字符串destCode; 
然后利用赫夫曼树将字符串destCode进行译码,得到目标字符串objCode,比较objCode和sourceCode,发现完全一样! 
编码译码成功! 
最后销毁有序二叉树和赫夫曼树。 
本程序的一个亮点是使用了二叉堆来存储需要合并的赫夫曼树结点,这样在求最小值时时间复杂度可以降低到log(n)。 
另外关于赫夫曼编码的详细内容请参考维基百科: http://zh.wikipedia.org/wiki/%E5%93%88%E5%A4%AB%E6%9B%BC%E7%BC%96%E7%A0%81 
和数据结构自考网:http://student.zjzk.cn/course_ware/data_structure/web/shu/shu6.6.2.1.htm 
关于二叉堆的详细内容请参考百度百科:http://baike.baidu.com/view/668854.html 
*/ 
#include<iostream> 

using namespace std; 

typedef char ElemType; 

typedef struct sNode 
{ 
double weight; 
ElemType data; 
} *Source; 

typedef struct hNode 
{ 
double weight; 
ElemType data; 
int lc, rc; 
} *HuffmanTree; 

typedef struct cNode 
{ 
ElemType data; 
string str; 
struct cNode *lc, *rc; 
} *Btree; 

HuffmanTree CreateHuffmanTree(const Source w, int n);//创建一棵赫夫曼树 
void BuildHeap(HuffmanTree t, int n); //构造一个二叉堆;小顶堆 
void PercDown(HuffmanTree t, int pos, int n);//构造二叉堆的功能子函数 
void DeleteMin(HuffmanTree t, int len); //删除二叉堆的根,并通过上移使得新得到的序列仍为二叉堆 
void InsertHfNode(HuffmanTree t, int len, struct hNode x); //把x插入到原长度为len的二叉堆 
void Preorder(HuffmanTree t, int p); //先序遍历赫夫曼树 
void Postorder(Btree & t, HuffmanTree a, int n); //后序遍历赫夫曼树,并记录叶子结点编码 
bool InsertBtNode(Btree & t, Btree s); //向一个二叉排序树t中插入一个结点s 
void Inorder(Btree t); //中序遍历二叉排序树 
Btree Search(Btree p, ElemType data); //查找值为data的结点的递归算法 
string Coding(string s, Btree t); //利用记录了叶子结点编码的排序二叉树,对sourceCode进行编码,返回编码后的字符串 
string Decode(string s, HuffmanTree hT); //利用赫夫曼树对destCode进行解码 
void DestroyBTree(Btree & t); //销毁一棵二叉排序树 
void DestroyHfmanTree(HuffmanTree & t, int n); //销毁一棵赫夫曼树 

int main() 
{ 
string sourceCode; 
getline(cin, sourceCode, '\n'); 

int n = sourceCode.size(); 
const int MAX = 27; //原码由26个大写字母加空格组成 
Source w = new struct sNode[MAX]; 

//读取各个字母并初始化权重 
w[MAX-1].data = ' '; 
w[MAX-1].weight = 0; 
for (int i=MAX-2; i>=0; i--) 
{ 
w[i].data = 'A' + i; 
w[i].weight = 0; 
} 

//读取各个字母的权重 
for (int i=0; i<n; i++) 
{ 
if (sourceCode[i] == ' ') 
w[26].weight++; 
else 
w[sourceCode[i]-'A'].weight++; 
} 

//获取出现了的大写字母和空格 
n = 0; 
for (int i=0; i<MAX; i++) 
{ 
if (w[i].weight > 0) 
w[n++] = w[i]; 
} 

// //直接输入原码和权重 
// for (int i=0; i<n; i++) 
// { 
// cin >> w[i].weight >> w[i].data; 
// } 

for (int i=0; i<n; i++) 
{ 
cout << w[i].weight << " " << w[i].data << endl; 
} 

HuffmanTree hT = CreateHuffmanTree(w, n);//构造赫夫曼树 

// for (int i=1; i<2*n; i++) 
// cout << hT[i].weight << " "; 
// cout << endl; 

//先序遍历赫夫曼树,并输出结点权重和叶子结点的data 
Preorder(hT, 1); 
cout << endl; 

//后序遍历赫夫曼树,并记录叶子结点编码 
Btree bT = NULL; 
Postorder(bT, hT, n); 

//中序遍历记录了叶子结点编码的排序二叉树 
Inorder(bT); 

//利用记录了叶子结点编码的排序二叉树,对sourceCode进行编码 
string destCode = Coding(sourceCode, bT); 
cout << destCode << endl; 

//利用赫夫曼树对destCode进行解码 
string objCode = Decode(destCode, hT); 
cout << objCode << endl; 

DestroyBTree(bT); //销毁二叉排序树 
//Inorder(bT); //再输出试试看 

DestroyHfmanTree(hT, n); //销毁赫夫曼树 
//Preorder(hT, 1); //再输出试试看 

system("pause"); 
return 0; 
} 

//创建一棵赫夫曼树 
HuffmanTree CreateHuffmanTree(const Source w, int n) 
{ 
HuffmanTree hT = new struct hNode[2*n]; //第一个结点不用 

for (int i=0; i<n; i++) 
{ 
hT[i+1].data = w[i].data; 
hT[i+1].weight = w[i].weight; 
hT[i+1].lc = hT[i+1].rc = 0; 
} 
BuildHeap(hT, n);//构造一个二叉堆;小顶堆 

struct hNode add; 
int left = n; 
int right = n; 
while (left > 1) 
{ 
hT[++right] = hT[1]; 
add.weight = hT[1].weight; 
add.lc = right; //存储左孩子下标 

DeleteMin(hT, left--); 

hT[left+1] = hT[1]; 
add.weight += hT[1].weight; 
add.rc = left+1; //存储右孩子下标 

DeleteMin(hT, left--); 

InsertHfNode(hT, ++left, add); 

//for (int i=1; i<=right; i++) 
// cout << hT[i].weight << " "; 
// cout << endl; 
// system("pause"); 
} 

return hT; 
} 

//构造一个二叉堆;小顶堆 
void BuildHeap(HuffmanTree t, int len) 
{ 
for (int i=len/2+len%2; i>0; i--) 
{ 
PercDown(t, i, len); 
} 
} 

//构造二叉堆的功能子函数 
void PercDown(HuffmanTree t, int pos, int len) 
{ 
int child; 
struct hNode min = t[pos]; 

while (pos * 2 <= len) 
{ 
child = pos * 2; 
if (child != len && t[child+1].weight < t[child].weight) 
child++; 

if (min.weight > t[child].weight) 
t[pos] = t[child]; 
else 
break; 

pos = child; 
} 
t[pos] = min; 
} 

//删除二叉堆的根,并通过上移使得新得到的序列仍为二叉堆 
void DeleteMin(HuffmanTree t, int len) 
{ 
struct hNode last = t[len--];//二叉堆的最后一个元素 
int child, pos = 1; 

while (pos * 2 <= len) //把二叉堆的某些元素往前移,使得新得到的序列仍为二叉堆 
{ 
child = pos * 2; 
if (child != len && t[child+1].weight < t[child].weight) //若i有右儿子,且右儿子小于左儿子,c指向右儿子 
child++; 

if (last.weight > t[child].weight) //若i的小儿子小于二叉堆的最后一个元素,把其移到i的位置 
t[pos] = t[child]; 
else 
break; 

pos = child; 
} 
t[pos] = last; //把二叉堆的最后一个元素放到适当的空位,此时得到的序列仍为二叉堆 
} 

//把x插入到原长度为len的二叉堆 
void InsertHfNode(HuffmanTree t, int len, struct hNode x) 
{ 
int i; 
for (i=len; i/2>0 && t[i/2].weight>x.weight; i/=2) 
t[i] = t[i/2]; 
t[i] = x; 
} 

//后序遍历赫夫曼树,并记录叶子结点编码 
void Postorder(Btree & t, HuffmanTree a, int n) 
{ 
int *stack = new int[n]; 
int *tag = new int[n]; 
char *buf = new char[n]; 
bool flag = true; 
int top = -1; 
int p = 1; 
while (a[p].lc > 0 || top >= 0) 
{ 
while (a[p].lc > 0) //先一直寻找左孩子 
{ 
flag = true; //此时p指向的是新叶子(未输出过的叶子) 
stack[++top] = p; //结点入栈 
p = a[p].lc; 
tag[top] = 0; //表示右孩子没有被访问 
buf[top] = '0'; //左孩子标记'0' 
} 

if (flag) //如果p指向的是新叶子 
{ 
//cout << a[p].data << " : "; //输出叶子结点 
// for (int i=0; i<=top; i++) 
// cout << buf[i]; 
// cout << endl; 

Btree s = new struct cNode; 
s->data = a[p].data; 
for (int i=0; i<=top; i++) 
s->str += buf[i]; 
s->lc = s->rc = NULL; 
if (!(InsertBtNode(t, s))) //插入一个结点s 
delete s; 
} 

if (top >= 0) //所有左孩子处理完毕后 
{ 
if (tag[top] == 0) //如果右孩子没有被访问 
{ 
flag = true; //此时p指向的是新叶子(未输出过的叶子) 
p = stack[top]; //读取栈顶元素,但不退栈 ,因为要先输出其右孩子结点 
p = a[p].rc; 
tag[top] = 1; //表示右孩子被访问,下次直接退栈 
buf[top] = '1'; //右孩子标记'1' 
} 
else //栈顶元素出栈 
{ 
flag = false; //此时p指向的是旧叶子(已输出过的叶子),不再输出 
top--; 
} 
} 
} 
} 

//先序遍历赫夫曼树 
void Preorder(HuffmanTree t, int p) 
{ 
if (t == NULL) 
return; 

if (t[p].lc > 0) 
{ 
cout << t[p].weight << endl; 
Preorder(t, t[p].lc); //遍历左子树 
Preorder(t, t[p].rc); //遍历右子树 
} 
else 
cout << t[p].weight << " " << t[p].data << endl; 
} 

//向一个二叉排序树t中插入一个结点s 
bool InsertBtNode(Btree & t, Btree s) 
{ 
if (t == NULL) 
{ 
t = s; 
return true; 
} 
else if (t->data > s->data) //把s所指结点插入到左子树中 
return InsertBtNode(t->lc, s); 
else if (t->data < s->data) //把s所指结点插入到右子树中 
return InsertBtNode(t->rc, s); 
else //若s->data等于b的根结点的数据域之值,则什么也不做 
return false; 
} 

//中序遍历二叉排序树 
void Inorder(Btree t) 
{ 
if (t) 
{ 
Inorder(t->lc); //遍历左子树 
cout << t->data << " : " << t->str << endl; //输出该结点 
Inorder(t->rc); //遍历右子树 
} 
} 

//查找值为data的结点的递归算法 
Btree Search(Btree p, ElemType data) 
{ 
if (p == NULL || p->data == data) //空树或找到结点 
return p; 

if (p->data > data) 
return Search(p->lc, data); //在左孩子中寻找 
else 
return Search(p->rc, data); //在右孩子中寻找 
} 

//利用记录了叶子结点编码的排序二叉树,对sourceCode进行编码,返回编码后的字符串 
string Coding(string s, Btree t) 
{ 
Btree p = NULL; 
string dest; 
for (int i=0; i<s.size(); i++) 
{ 
p = Search(t, s[i]); 
if (p != NULL) 
{ 
dest += p->str; 
//dest += ' '; 
} 
} 
return dest; 
} 

//利用赫夫曼树对destCode进行解码 
string Decode(string s, HuffmanTree hT) 
{ 
string dest; 
int p = 1; 
int i = 0; 
while (i < s.size()) 
{ 
while (hT[p].lc > 0)//非叶子结点 
{ 
if (s[i++] == '0') 
p = hT[p].lc; //向左结点前进 
else 
p = hT[p].rc; //向右结点前进 
} 
dest += hT[p].data; //存储叶子结点 
p = 1; 
} 
return dest; 
} 

//销毁一棵二叉排序树 
void DestroyBTree(Btree & t) 
{ 
if (t != NULL) 
{ 
DestroyBTree(t->lc); 
DestroyBTree(t->rc); 
delete t; 
t = NULL; 
} 
} 

//销毁一棵赫夫曼树 
void DestroyHfmanTree(HuffmanTree & t, int n) 
{ 
for (int i=n-1; i>=0; i--) 
{ 
delete &t[i]; 
} 
t = NULL; 
}  
 

 

分享到:
评论

相关推荐

    数据结构 赫夫曼编码 C实现

    赫夫曼编码是数据结构中一种常用的编码方法,它可以对数据进行无损压缩,尤其是在文本压缩、图像压缩等领域中具有广泛的应用。本文将从赫夫曼编码的定义、实现原理、C语言实现等方面进行详细的介绍。 一、赫夫曼...

    赫哈曼编码的应用对输入的一串字符实现赫夫曼编码,再对赫夫曼编码生成的代码串进行译码,输出电文字符串

    赫夫曼编码是一种高效的数据压缩方法,其基本思想是通过构建赫夫曼树来为字符分配最短的二进制编码。在赫夫曼编码的过程中,频繁出现的字符会被赋予较短的编码,而不常出现的字符则会有较长的编码,从而在整体上达到...

    赫夫曼编码译码算法(数据结构)

    赫夫曼编码是一种高效的数据压缩方法,源自于1952年由David A. Huffman提出,因此得名。在数据结构领域,它被视为一种特殊的树结构——赫夫曼树(也称为最优二叉树),用于创建一种变长的、可逆的前缀编码,以最小化...

    《数据结构课程设计》赫夫曼编码实验报告

    《数据结构课程设计》赫夫曼编码实验报告 在数据结构的学习中,赫夫曼编码是一种重要的数据压缩方法,它基于最优二叉树(也称为赫夫曼树或最小带权路径长度树)来实现。这份实验报告将详细介绍赫夫曼编码的原理、...

    赫夫曼树的构建及赫夫曼编码

    它的构建基于赫夫曼编码,这是一种变长前缀编码方法,旨在高效地表示具有不同频率的数据元素。在赫夫曼编码中,频率较高的字符通常会被赋予较短的编码,而频率较低的字符则有较长的编码,这样可以使得在传输或存储...

    赫夫曼编码压缩也解压文件

    赫夫曼编码是一种高效的数据压缩方法,主要用于文本和图像数据的压缩。在C语言中实现赫夫曼编码,需要理解数据结构,特别是树结构以及位操作。本项目是基于C语言的数据结构课程设计,旨在让学生掌握赫夫曼编码的原理...

    赫夫曼编码上机实验报告

    【赫夫曼编码详解】 赫夫曼编码是一种用于数据压缩的有效算法,由大卫·赫夫曼在1952年提出。它基于一种被称为赫夫曼树的数据结构,也称作最优二叉树或最小带权路径长度树。在信息安全领域,赫夫曼编码被广泛应用于...

    数据结构 严蔚敏 赫夫曼编码

    赫夫曼编码是一种高效的数据压缩方法,主要用于无损数据压缩,是数据结构中重要的概念之一。这个主题与著名计算机科学家严蔚敏教授有关,他在数据结构领域的教学和研究上有着深厚的影响力。赫夫曼编码的基本思想是...

    赫夫曼树构建过程及赫夫曼编码的实现

    赫夫曼树是一种特殊的二叉树,用于解决数据的压缩问题,它的构建过程与赫夫曼编码是数据压缩领域的核心概念。在这个过程中,我们将详细探讨赫夫曼树的构建、赫夫曼编码的实现,以及如何使用C语言来动态演示这些操作...

    赫夫曼编码的应用

    赫夫曼编码是一种高效的数据压缩方法,主要用于减少数据的存储空间和提高传输效率。它基于一种特殊的二叉树——赫夫曼树(也称为最优二叉树),在该树中,频率较高的字符对应的路径较短,而频率较低的字符路径较长。...

    数据结构算法之赫夫曼编码系统

    利用赫夫曼树的编码思想,构造一个完整的赫夫曼编码系统。源代码还附赠了详细的PPT讲解。 ①从键盘读入字符集大小n,以及n个字符和n个权值,建立赫夫曼树,然后对赫夫曼树进行编码,输出结果。 ②使用上述字符集创建...

    字母赫夫曼编码01序列解码

    问题描述:对任意输入的一段英文,为每个字符编制其相应的赫夫曼编码;并利用该编码为任意输入的0、1序列进行解码. 基本要求:一个完整的系统应具有以下功能: (1)初始化 从终端读入一段英文字符,统计每个字符...

    赫夫曼编码的实现

    赫夫曼编码是一种高效的数据压缩方法,主要用于减少数据存储空间,尤其在文本文件压缩中表现突出。它的核心思想是为每个出现频率不同的字符分配不同长度的二进制编码,频率越高的字符编码越短,反之越长。这样,频繁...

    赫夫曼编码,控制台画图

    赫夫曼编码是一种高效的数据压缩方法,由大卫·赫夫曼在1952年提出。它是基于一种称为赫夫曼树(又称最优二叉树)的数据结构。在这个实验中,我们将探讨如何在控制台上使用VC++实现赫夫曼编码和解码的过程,并通过...

    赫夫曼编码译码器

    赫夫曼编码是一种高效的数据压缩方法,由美国计算机科学家大卫·赫夫曼在1952年提出。这种编码方式是基于频率的变字长编码,适用于无损数据压缩,尤其在文本、图像和音频数据中表现优异。赫夫曼编码的核心思想是将...

    赫夫曼编码与译码

    ### 赫夫曼编码与译码 #### 一、赫夫曼编码的基本概念 赫夫曼编码(Huffman Coding)是一种广泛应用于数据压缩领域的编码方法,尤其适用于无损数据压缩。它通过构建赫夫曼树来实现最优的前缀编码,即编码中的任意...

    根据赫夫曼树求赫夫曼编码

    //算法5.11 根据赫夫曼树求赫夫曼编码 #include using namespace std; typedef struct { int weight; int parent,lchild,rchild; }HTNode,*HuffmanTree; typedef char **HuffmanCode; void Select(HuffmanTree HT...

    对任意输入的一段英文,为每个字符编制其相应的赫夫曼编码;并利用该编码为任意输入的0、1序列进行解码.

    根据给定文件的信息,本文将详细探讨如何针对一段任意输入的英文文本,构建赫夫曼编码,并基于此编码实现解码的功能。 ### 赫夫曼编码基础 赫夫曼编码是一种广泛应用于数据压缩领域的算法,它通过为不同字符分配...

    赫夫曼编码的算法实现

    赫夫曼编码是一种高效的数据压缩方法,主要用于无损数据压缩,由美国计算机科学家戴维·赫夫曼在1952年提出。它的核心思想是根据字符出现的频率来构造一棵特殊的二叉树——赫夫曼树(也称为最优二叉树或最小带权路径...

Global site tag (gtag.js) - Google Analytics