1.概述
熵(entropy)指的是体系的混乱的程度,它在控制论、概率论、数论、天体物理、生命科学等领域都有重要应用,在不同的学科中也有引申出的更为具体的定义,是各领域十分重要的参量。熵由鲁道夫·克劳修斯(Rudolf Clausius)提出,并应用在热力学中。后来在,克劳德·艾尔伍德·香农(Claude Elwood Shannon)第一次将熵的概念引入到信息论中来。
2.科学哲学
科学技术上泛指某些物质系统状态的一种量(liàng)度,某些物质系统状态可能出现的程度。亦被社会科学用以借喻人类社会某些状态的程度。熵是不能再被转化做功的能量的总和的测定单位。这个名称是由德国物理学家鲁道尔夫·克劳修斯〔鲁道尔夫·克劳修斯(1822—1888)〕德国物理学家,热力学的奠基人之一。于1868年第一次造出来的。但是年轻的法国军官沙迪·迦诺〔沙迪·迦诺(1796—1832)〕一般译作“卡诺”,法国物理学家、工程师,在研究热机效率的过程中,提出了“卡诺循环”定理。却比克劳修斯早41年发现了熵的原理。迦诺在研究蒸汽机工作原理时发现,蒸汽机之所以能做功,是因为蒸汽机系统里的一部分很冷,而另一部分却很热。换一句话说,要把能量转化为功,一个系统的不同部分之间就必须有能量集中程度的差异(即温差)。当能量从一个较高的集中程度转化到一个较低的集中程度(或由较高温度变为较低温度)时,它就做了功。更重要的是每一次能量从一个水平转化到另一个水平,都意味着下一次能再做功的能量就减少了。比如河水越过水坝流入湖泊。当河水下落时,它可被用来发电,驱动水轮,或做其他形式的功。然而水一旦落到坝底,就处于不能再做功的状态了。在水平面上没有任何势能的水是连最小的轮子也带不动的。这两种不同的能量状态分别被称为“有效的”或“自由的”能量,和“无效的”或“封闭的”能量。
熵的增加就意味着有效能量的减少。每当自然界发生任何事情,一定的能量就被转化成了不能再做功的无效能量。被转化成了无效状态的能量构成了我们所说的污染。许多人以为污染是生产的副产品,但实际上它只是世界上转化成无效能量的全部有效能量的总和。耗散了的能量就是污染。既然根据热力学第一定律,能量既不能被产生又不能被消灭,而根据热力学第二定律,能量只能沿着一个方向——即耗散的方向——转化,那么污染就是熵的同义词。它是某一系统中存在的一定单位的无效能量。
3.信息论
在信息论中,熵表示的是不确定性的量度。信息论的创始人香农在其著作《通信的数学理论》中提出了建立在概率统计模型上的信息度量。他把信息定义为“用来消除不确定性的东西”。
熵在信息论中的定义如下:
如果有一个系统S内存在多个事件S = {E1,...,En}, 每个事件的机率分布 P = {p1, ..., pn},则每个事件本身的讯息为
(对数以2为底,单位是位元(bit))
(对数以e为底,单位是纳特/nats)
如英语有26个字母,假如每个字母在文章中出现次数平均的话,每个字母的讯息量为
;而汉字常用的有2500个,假如每个汉字在文章中出现次数平均的话,每个汉字的信息量为
整个系统的平均消息量为
这个平均消息量就是消息熵。因为和热力学中描述热力学熵的玻耳兹曼公式形式一样,所以也称为“熵”。
如果两个系统具有同样大的消息量,如一篇用不同文字写的同一文章,由于是所有元素消息量的加和,那么中文文章应用的汉字就比英文文章使用的字母要少。所以汉字印刷的文章要比其他应用总体数量少的字母印刷的文章要短。即使一个汉字占用两个字母的空间,汉字印刷的文章也要比英文字母印刷的用纸少。
实际上每个字母和每个汉字在文章中出现的次数并不平均,因此实际数值并不如同上述,但上述计算是一个总体概念。使用书写单元越多的文字,每个单元所包含的讯息量越大。
I(A)度量事件A发生所提供的信息量,称之为事件A的自信息,P(A)为事件A发生的概率。如果一个随机试验有N个可能的结果或一个随机消息有N个可能值,若它们出现的概率分别为p1,p2,…,pN,则这些事件的自信息的和:[H=-SUM(pi*log(pi)),i=1,2…N]称为熵。
4.基本特性
·熵均大于等于零,即,。
·设N是系统S内的事件总数,则熵。当且仅当p1=p2=...=pn时,等号成立,此时熵最大。
·联合熵:,当且仅当X,Y在统计学上相互独立时等号成立。
·条件熵:,当且仅当X,Y在统计学上相互独立时等号成立。
·社会学意义:从宏观上表示世界和社会在进化过程中的混乱程度。
分享到:
相关推荐
在描述一个系统或事件时,信息熵可以衡量我们对这个系统状态的知识程度。较低的熵表示较高的确定性,而较高的熵则表示较大的不确定性。 熵在许多领域都有应用,包括通信、数据压缩、机器学习、图像处理、决策分析等...
标签“粒度熵”直接指向了本文的核心概念之一,即在知识约简算法中,如何使用粒度熵来指导属性的选择过程,以此来减少知识系统的复杂度并提高其处理效率。 从给定的文件内容中可以得知,粒度计算(Granular ...
以下是关于熵权法、信息熵以及Py熵权法代码的相关知识点: 1. **熵的概念**: - 熵是信息论中的一个基本概念,最初由克劳德·香农提出,用来度量信息的不确定性和信息的混乱程度。在信息熵的计算中,熵值越大,...
文档还可能包括了具体的示例,帮助读者更好地理解这个过程,并提供了一些实际应用的背景知识。 总的来说,通过学习和实践使用Matlab计算信源熵,不仅可以加深对信息熵的理解,还能提升编程技能,为今后的信息处理、...
- 当数据分布均匀时,熵权法可能会导致所有因素的权重接近,这可能不完全符合实际情况,需要结合专业知识调整。 - 虽然熵权法较为客观,但仍然依赖于初始数据的质量,因此数据收集和预处理至关重要。 总的来说,这...
下面我们将详细探讨熵值法的基本原理、在R语言中的实现步骤以及相关知识点。 首先,熵值法的基础是信息熵,它度量了随机变量的不确定性。在多属性决策问题中,每个属性的熵值表示了该属性对总决策的影响程度。当...
本文将深入探讨这两个概念及其相关算法,结合提供的压缩包文件"matlab.zip",我们将重点讨论它们在风力发电控制系统中的应用。 首先,均方误差(MSE)是一种衡量预测值与实际值之间差异的统计指标。它通过计算所有...
在计算机科学领域,尤其是图像处理和数据分析中,信息熵是一个重要的概念。它是衡量信息不确定性的...这个过程涉及到概率统计、图像处理和数值计算等多个方面的知识,对于深入理解图像数据和开发相关应用具有重要意义。
在IT领域,尤其是在信号处理和数据分析中,"CEEMD-样本熵_CEEMD_样本熵CEEMD_相关峭度_提取熵_"这个标题所涉及的知识点是至关重要的。让我们详细探讨一下这些概念。 首先,CEEMD,全称为Complete Ensemble ...
以下是关于焓熵表Easyquery2及其涉及的热力性质相关知识点的详细介绍: 1. **焓熵概念**: - **焓**(H)是热力学中表示系统能量的一个状态函数,它等于内能U加上系统的势能与动能之和,通常表示为系统的总热内容...
知识点: 1. 信源熵的计算公式:H(X) = -∑ip(xi)log p(xi) 2. 文件中的字符总个数统计 3. 每个字符出现的概率计算 4. 信源熵的计算 5. C语言实现信源熵的计算 相关概念: 1. 信息论 2. 信源熵 3. 概率论 4. ...
在这个"排列熵.zip"压缩包中,包含了一系列与熵计算相关的资源,特别是针对多尺度和排列熵的MATLAB实现。下面我们将详细探讨这些知识点。 首先,我们来理解“熵”这个概念。在信息论中,熵由克劳德·香农提出,通常...
6. **使用示例**:在`EntropyCaculate`这个压缩包文件中,可能包含了`EntropyCalculator`类的源代码,你可以导入到你的JAVA项目中,通过调用相关方法进行熵计算。例如: ```java EntropyCalculator entropyCalc = ...
本文的主要知识点涉及以下几个方面: 1. **非刚性配准(Non-rigid Registration)**:这是医学成像领域中的一个基本问题,尤其在制作脑图(atlas)和疾病分类表示时非常重要。例如,在基于模型的图像分割中,构建一...
在IT领域,尤其是在数据分析和信号处理中,"CEEMD分解-imf分量相关系数-信息熵特征"是一个重要的概念组合。这个实验涉及到几个关键的技术点,我们将逐一深入探讨。 首先,CEEMD(Complete Ensemble Empirical Mode ...
本篇将详细讲解图像熵的相关知识,包括一阶熵、二阶熵和差分熵,并结合给定的MATLAB程序进行解析。 1. **一阶熵**: 一阶熵,也称为灰度直方图熵,是基于图像像素灰度级分布的熵计算。它考虑了每个灰度级出现的概率...
VBA宏编程是一种在Microsoft Office应用程序中实现自动化和自定义功能的强大工具,尤其适用于处理大量数据和执行重复...通过深入学习VBA和区位熵的相关知识,你将进一步提升自己的IT能力,为未来的工作带来更大的便利。