我们考虑一下一个离散的随机变量x,当我们观察到它的一个值,能给我们带来多少信息呢?这个信息量可以看做是我们观察到x的这个值带来的惊讶程度。我们被告知一个不太可能发生的事发生了要比告知一个非常可能发生的事发生,我们获得信息要多。
所以信息量的多少依赖于概率分布p(x),所以我们可以用关于p(x)的一个函数来建模信息量h(x).那什么函数模型适合表达呢?
我们观察两个相互独立的事件x,y,我们观察它得到的信息量,要和单独观察他们得到的信息量之和相等。即
h(x,y) = h(x) + h(y)
而两个独立的时间x,y的概率关系:
p(x,y) = p(x) p(y)
基于上面的观察,信息量必须和p(x)的log函数相关。
所以我们得到:
加上负号,可以保证信息量大于等于0。注意一个小概率事件,具有更高的信息量。
log的底数选择并没有限制。信息论中大多都采用2,传输这些信息量需要的2进制位数。
如果我们想传输这个随机变量的值,我们传输的平均信息量,可以表示为关于分布
p(x)的期望:
这个表达式被称为信息熵。
在机器学习中,采用比较多的是自然对数形式,
这样
对x=0的情况,由于
所以我们让p(x)ln(x) = 0
如果对这些信息进行编码传输,我们希望概率大的使用较长的编码,概率小的我们采用较长的编码。最大熵能够达到最小长度的编码,关于熵和最短编码长度的关系,可以参考shannon的Noiseless coding theorem。
熵用来描述指定随机变量的状态,所需要的平均信息。
如果我们想最大化熵,我们利用拉格朗日乘子:
我们可以得
取得最大值,其中M是x状态数。
如果我们有一个联合分布p(x,y),如果x已经知道,那么指定y的值还需要的信息量,
可以通过-ln p(y|x)来描述,所以平均还需要的信息量,可以表示为:
被称为条件熵。我们利用乘法规则,可以得到:
相对熵和互信息:
考虑一个未知的分布p(x),假设我们使用了一个近似的分布q(x)来建模它,
如果我们使用q(x)来构建一个编码模式,用来传输x的值。那么额外需要多指定的信息:
这个式子被称为相对熵或者Kullback-Leibler divergence
相对熵描述了p(x)和q(x)两个分布的差异程度。注意:
我们考虑联合分布p(x,y),如果x,y相互独立,那么p(x,y)=p(x)p(y)
如果他们不相互独立,那么我们想知道他们的相关程度,我们可以使用KL divergence来度量:
这个表达式被称为变量x,y的互信息。从KL divergence的属性我们知道I(x,y)>= 0
当且仅当x和y相互独立时,等号成立。
我们使用加法和乘法规则得到互信息是相对于条件熵的:
分享到:
相关推荐
在"信息论----课程总结"中,我们可以深入探讨以下几个关键知识点: 首先,我们要理解基本概念。信号是物理系统中用于传递信息的载体,可以是电信号、光信号或任何形式的波动。消息是包含有意义信息的信号序列,它...
### 信息论——总结与复习 #### 一、信息论基础概述 信息论是一门研究信息传输、存储和处理的科学。...希望这份总结能够帮助读者更好地复习信息论的核心知识点,为后续的学习和实践打下坚实的基础。
《信息论——基础理论与应用》是傅祖芸编著的一本专著,主要面向信息与计算机信号领域的初学者。信息论是通信工程、计算机科学、统计学等多个领域的重要基石,它研究的是如何有效地编码、传输和处理信息,以及如何...
### 信息论基础第二版_答案_托马斯科弗 #### 介绍 《信息论基础》第二版是由...无论是对于从事信息理论研究的专业人士还是希望深入了解该领域基础知识的学生来说,《信息论基础》第二版都是一本不可或缺的参考书。
《信息论与编码》课后习题答案是 Information Theory 和编码的基础知识点的总结,涵盖了信息熵、马尔科夫链、自信息量、平均信息量、熵和条件熵、状态图等内容。通过学习这些知识点,我们可以更好地理解信息论和编码...
### 信息论基础习题解答知识点总结 #### 标题:信息论基础习题解答 - **信息论**是一门研究信息传输、处理与存储的学科,它涉及到概率论、统计学、编码理论等多个领域。本题目旨在通过一系列习题解答帮助学习者...
信息论与编码理论是现代通信技术的基础理论之一,它涉及信息的量化、信息的传输、信息的接收、信息的加密等方面。本复习小结内容主要针对信息论与编码课程的期末复习,涵盖了绪论部分和信源与信息熵两个重要章节的...
通过以上内容可以看出,《应用信息论基础》这门课程旨在为学生提供全面的信息论基础知识体系,并通过理论学习和实践应用,帮助学生理解和掌握信息论的核心概念和技术,从而具备解决实际问题的能力。
《信息论与编码学习辅导及习题详解》是针对《信息论理论基础与应用》这本教材的一个重要辅助资料,旨在帮助学生深入理解和掌握信息论的基本概念、原理和方法。以下是对该书主要内容的详细阐述: 一、信息论基础 ...
【信息论基础理论】是研究信息的量化、传输和处理的学科,主要涉及概率论、统计学和数学等基础知识。傅祖芸的《信息论基础理论》第二版是一本深入探讨这一领域的教材,包含了丰富的理论知识和习题解答,帮助读者理解...
《信息论基础》(原书第2版)是信息论领域中一本简明易懂的教材。主要内容包括:熵、信源、信道容量、率失真、数据压缩与编码理论和复杂度...统计学以及电信方面的高年级本科生和研究生学习信息论基础课程的理想教材。
2至5章是信息论与编码的基础部分,涵盖了以下几个关键知识点: 1. **信息量与熵**:信息量衡量了消息的不确定性,熵是随机变量不确定性度量的平均信息量,它是信息论的核心概念之一。第2章可能涉及熵的基本定义、...
机器学习作为人工智能的重要分支,其核心是通过数据学习建立模型来预测或决策,而支撑机器学习模型建立的基础之一便是数学知识。特别是在数学基础方面,有四个关键领域必须掌握:线性代数、概率论、优化和信息论。...
### 信息论讲义知识点详解 #### 一、信息论概览 **1.1 信息论** 信息论是一门应用数理统计方法研究信息的传输、存储和处理的学科,其研究的重点在于可能性和存在性问题。与之相对的是信息技术,主要关注于如何...
信息学奥赛基础知识小总结,是对计算机科学领域中基础理论与实践技能的提炼与概括,旨在为参赛者提供系统性的复习材料与学习指导。以下是对标题、描述以及部分知识点的详细解析,希望能够深入理解信息学奥赛的核心...