`
deepfuture
  • 浏览: 4412631 次
  • 性别: Icon_minigender_1
  • 来自: 湛江
博客专栏
073ec2a9-85b7-3ebf-a3bb-c6361e6c6f64
SQLite源码剖析
浏览量:80134
1591c4b8-62f1-3d3e-9551-25c77465da96
WIN32汇编语言学习应用...
浏览量:70355
F5390db6-59dd-338f-ba18-4e93943ff06a
神奇的perl
浏览量:103602
Dac44363-8a80-3836-99aa-f7b7780fa6e2
lucene等搜索引擎解析...
浏览量:286588
Ec49a563-4109-3c69-9c83-8f6d068ba113
深入lucene3.5源码...
浏览量:15056
9b99bfc2-19c2-3346-9100-7f8879c731ce
VB.NET并行与分布式编...
浏览量:67800
B1db2af3-06b3-35bb-ac08-59ff2d1324b4
silverlight 5...
浏览量:32292
4a56b548-ab3d-35af-a984-e0781d142c23
算法下午茶系列
浏览量:46075
社区版块
存档分类
最新评论

最大似然估计

 
阅读更多

一、基本概念

给定一个概率分布D,假定其概率密度函数(连续分布)或概率聚集函数(离散分布)为f_D,以及一个分布参数\theta,我们可以从这个分布中抽出一个具有n个值的采样X_1, X_2,\ldots, X_n,通过利用f_D,我们就能计算出其概率:

\mathbb{P}(x_1,x_2,\dots,x_n) = f_D(x_1,\dots,x_n \mid \theta)

但是,我们可能不知道\theta的值,尽管我们知道这些采样数据来自于分布D。那么我们如何才能估计出\theta呢?一个自然的想法是从这个分布中抽出一个具有n个值的采样X_1, X_2, ..., X_n,然后用这些采样数据来估计\theta.

一旦我们获得X_1, X_2,\ldots, X_n,我们就能从中找到一个关于\theta的估计。最大似然估计会寻找关于\theta的最可能的值(即,在所有可能的\theta取值中,寻找一个值使这个采样的“可能性”最大化)。这种方法正好同一些其他的估计方法不同,如\theta的非偏估计,非偏估计未必会输出一个最可能的值,而是会输出一个既不高估也不低估的\theta值。

要在数学上实现最大似然估计法,我们首先要定义似然函数:

\mbox{lik}(\theta) = f_D(x_1,\dots,x_n \mid \theta)

什么是似然函数?

在这种意义上,似然函数可以理解为条件概率的逆反。在已知某个参数B时,事件A会发生的概率写作\mathbb{P}(A \mid B)

P(A \mid B) = \frac{P(A , B)}{P(B)} \!

利用贝叶斯定理,

P(B \mid A) = \frac{P(A \mid B)\;P(B)}{P(A)} \!


因此,我们可以反过来构造表示似然性的方法:已知有事件A发生,运用似然函数\mathbb{L}(B \mid A),我们估计参数B的可能性。形式上,似然函数也是一种条件概率函数,但我们关注的变量改变了:

b\mapsto P(A \mid B=b)  \!

注意到这里并不要求似然函数满足归一性:\sum_{b \in \mathcal{B}}P(A \mid B=b) = 1。一个似然函数乘以一个正的常数之后仍然是似然函数。对所有\alpha > 0,都可以有似然函数:

L(b \mid A) = \alpha \; P(A \mid B=b) \!

并且在\theta的所有取值上,使这个函数最大化。这个使可能性最大的\widehat{\theta}值即被称为\theta最大似然估计

 

二、基本应用理解

离散分布,离散有限参数空间

考虑一个抛硬币的例子。假设这个硬币正面跟反面轻重不同。我们把这个硬币抛80次(即,我们获取一个采样x_1=\mbox{H}, x_2=\mbox{T}, \ldots, x_{80}=\mbox{T}并把正面的次数记下来,正面记为H,反面记为T)。并把抛出一个正面的概率记为p,抛出一个反面的概率记为1-p(因此,这里的p即相当于上边的\theta)。假设我们抛出了49个正面,31个反面,即49次H,31次T。假设这个硬币是我们从一个装了三个硬币的盒子里头取出的。这三个硬币抛出正面的概率分别为p=1/3, p=1/2, p=2/3.这些硬币没有标记,所以我们无法知道哪个是哪个。使用最大似然估计,通过这些试验数据(即采样数据),我们可以计算出哪个硬币的可能性最大。这个似然函数取以下三个值中的一个:

\begin{matrix}
\mathbb{P}(\mbox{H=49, T=31 }\mid p=1/3) & = & \binom{80}{49}(1/3)^{49}(1-1/3)^{31} \approx 0.000 \\
&&\\
\mathbb{P}(\mbox{H=49, T=31 }\mid p=1/2) & = & \binom{80}{49}(1/2)^{49}(1-1/2)^{31} \approx 0.012 \\
&&\\
\mathbb{P}(\mbox{H=49, T=31 }\mid p=2/3) & = & \binom{80}{49}(2/3)^{49}(1-2/3)^{31} \approx 0.054 \\
\end{matrix}

我们可以看到当\widehat{p}=2/3时,似然函数取得最大值。这就是p的最大似然估计。

 

 

 

离散分布,连续参数空间

现在假设例子1中的盒子中有无数个硬币,对于0\leq p \leq 1中的任何一个p, 都有一个抛出正面概率为p的硬币对应,我们来求其似然函数的最大值:

\begin{matrix}
\mbox{lik}(\theta) & = & f_D(\mbox{H=49,T=80-49}\mid p) = \binom{80}{49} p^{49}(1-p)^{31} \\
\end{matrix}

其中0\leq p \leq 1. 我们可以使用微分法来求最值。方程两边同时对p取微分,并使其为零。

\begin{matrix}
0 & = & \frac{d}{dp} \left( \binom{80}{49} p^{49}(1-p)^{31} \right) \\
  &   & \\
  & \propto & 49p^{48}(1-p)^{31} - 31p^{49}(1-p)^{30} \\
  &   & \\
  & = & p^{48}(1-p)^{30}\left[ 49(1-p) - 31p \right] \\
\end{matrix}
在不同比例参数值下一个二项式过程的可能性曲线t = 3, n = 10;其最大似然估计值发生在其众数并在曲线的最大值处。

其解为p=0, p=1,以及p=49/80.使可能性最大的解显然是p=49/80(因为p=0p=1这两个解会使可能性为零)。因此我们说最大似然估计值\widehat{p}=49/80.

这个结果很容易一般化。只需要用一个字母t代替49用以表达伯努利试验中的被观察数据(即样本)的“成功”次数,用另一个字母n代表伯努利试验的次数即可。使用完全同样的方法即可以得到最大似然估计值:

\widehat{p}=\frac{t}{n}

对于任何成功次数为t,试验总数为n的伯努利试验

 

 

 

 

 

连续分布,连续参数空间

最常见的连续概率分布是正态分布,其概率密度函数如下:

f(x\mid \mu,\sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}

现在有n个正态随机变量的采样点,要求的是一个这样的正态分布,这些采样点分布到这个正态分布可能性最大(也就是概率密度积最大,每个点更靠近中心点),其n个正态随机变量的采样的对应密度函数(假设其独立并服从同一分布)为:

f(x_1,\ldots,x_n \mid \mu,\sigma^2) = \left( \frac{1}{2\pi\sigma^2} \right)^\frac{n}{2} e^{-\frac{ \sum_{i=1}^{n}(x_i-\mu)^2}{2\sigma^2}}

或:

f(x_1,\ldots,x_n \mid \mu,\sigma^2) = \left( \frac{1}{2\pi\sigma^2} \right)^{n/2} \exp\left(-\frac{ \sum_{i=1}^{n}(x_i-\bar{x})^2+n(\bar{x}-\mu)^2}{2\sigma^2}\right),

这个分布有两个参数:\mu,\sigma^2.有人可能会担心两个参数与上边的讨论的例子不同,上边的例子都只是在一个参数上对可能性进行最大化。实际上,在两个参数上的求最大值的方法也差不多:只需要分别把可能性\mbox{lik}(\mu,\sigma) = f(x_1,,\ldots,x_n \mid \mu, \sigma^2)在两个参数上最大化即可。当然这比一个参数麻烦一些,但是一点也不复杂。使用上边例子同样的符号,我们有\theta=(\mu,\sigma^2).

最大化一个似然函数同最大化它的自然对数是等价的。因为自然对数log是一个连续且在似然函数的值域内严格递增的上凸函数。[注意:可能性函数(似然函数)的自然对数跟信息熵以及Fisher信息联系紧密。]求对数通常能够一定程度上简化运算,比如在这个例子中可以看到:

\begin{matrix}
0 & = & \frac{\partial}{\partial \mu} \log \left( \left( \frac{1}{2\pi\sigma^2} \right)^\frac{n}{2} e^{-\frac{ \sum_{i=1}^{n}(x_i-\bar{x})^2+n(\bar{x}-\mu)^2}{2\sigma^2}} \right) \\
  & = & \frac{\partial}{\partial \mu} \left( \log\left( \frac{1}{2\pi\sigma^2} \right)^\frac{n}{2} - \frac{ \sum_{i=1}^{n}(x_i-\bar{x})^2+n(\bar{x}-\mu)^2}{2\sigma^2} \right) \\
  & = & 0 - \frac{-2n(\bar{x}-\mu)}{2\sigma^2} \\
\end{matrix}

这个方程的解是\widehat{\mu} = \bar{x} = \sum^{n}_{i=1}x_i/n .这的确是这个函数的最大值,因为它是\mu里头惟一的一阶导数等于零的点并且二阶导数严格小于零。

同理,我们对\sigma求导,并使其为零。

\begin{matrix}
0 & = & \frac{\partial}{\partial \sigma} \log \left( \left( \frac{1}{2\pi\sigma^2} \right)^\frac{n}{2} e^{-\frac{ \sum_{i=1}^{n}(x_i-\bar{x})^2+n(\bar{x}-\mu)^2}{2\sigma^2}} \right) \\
  & = & \frac{\partial}{\partial \sigma} \left( \frac{n}{2}\log\left( \frac{1}{2\pi\sigma^2} \right) - \frac{ \sum_{i=1}^{n}(x_i-\bar{x})^2+n(\bar{x}-\mu)^2}{2\sigma^2} \right) \\
  & = & -\frac{n}{\sigma} + \frac{ \sum_{i=1}^{n}(x_i-\bar{x})^2+n(\bar{x}-\mu)^2}{\sigma^3}
\\
\end{matrix}

这个方程的解是\widehat{\sigma}^2 = \sum_{i=1}^n(x_i-\widehat{\mu})^2/n.

因此,其关于\theta=(\mu,\sigma^2)最大似然估计为:

\widehat{\theta}=(\widehat{\mu},\widehat{\sigma}^2) = (\bar{x},\sum_{i=1}^n(x_i-\bar{x})^2/n)
分享到:
评论

相关推荐

    极大似然估计matlab代码

    极大似然估计(Maximum Likelihood Estimation, MLE)是一种在统计学中广泛使用的参数估计方法,它通过寻找使得数据出现概率最大的参数值来进行估计。在这个"极大似然估计matlab代码"中,我们看到作者使用MATLAB这一...

    正态分布下的最大似然估计_正态分布的最大似然估计_

    解这两个方程,我们可以得到μ和σ的极大似然估计: μMLE = Σ(xi) / n (样本均值) σ²MLE = ∑(xi - μMLE)^2 / (n - 1) (样本方差,注意除以n-1得到无偏估计) 这里,μMLE是所有样本值的平均,而σ²MLE是...

    stata中极大似然估计方法

    在介绍sta中极大似然估计(MLE)方法之前,有必要了解一些统计学中关于极大似然估计的基础知识。 极大似然估计是一种用于参数估计的方法。其核心思想是在一组参数下,假定观测到的数据的概率分布最有可能出现。在...

    Desktop_蒙特卡洛仿真_蒙特卡洛_极大似然估计_极大似然_似然估计

    当我们有一组观测数据,并且有一个包含未知参数的模型时,极大似然估计就是找出使数据出现概率最大的参数值。这个最大概率被称为“似然函数”,而找到的参数估计就是“极大似然估计”。这种方法在许多领域都有应用,...

    R语言-极大似然估计

    极大似然估计方法(Maximum Likelihood Estimate,MLE)也称为最大概似估计或最大似然估计,是求估计的另一种方法,最大概似1821年首先由德国数学家C. F. Gauss提出,但是这个方法通常被归功于英国的统计学家R. A. ...

    正态分布数据的极大似然估计MATLAB实现

    极大似然估计(Maximum Likelihood Estimation, MLE)是确定模型参数的一种常用方法,它通过最大化观测数据出现的概率来估计未知参数。在这个主题中,我们将深入探讨如何在MATLAB环境中使用极大似然估计来估计正态...

    高斯分布参数的极大似然估计,EM算法

    ### 高斯分布参数的极大似然估计与EM算法 #### 一、高斯分布参数的极大似然估计 在统计学中,极大似然估计(Maximum Likelihood Estimation, MLE)是一种常用的方法,用于从给定的数据集中估计模型参数。当我们...

    最大似然估计与最大验后估计

    最大似然估计与最大后验估计 最大似然估计(Maximum Likelihood Estimation,MLE)是一种统计学方法,用于估计模型参数。它的基本思想是:给定观察数据,找出使该数据出现的概率最大的模型参数。MLE 方法的优点是...

    威布尔分布的极大似然估计的精度分析 (2006年)

    运用区间估计的思想,提出了一种解决上述问题的评价和判断的方法,并应用此方法对完全样本情况下,形状参数的极大似然估计量的精度进行了讨论。工程上,可以依据文中提供的结论定量分析威布尔分布形状参数极大似然...

    copula 的极大似然估计_copula_matlab_极大似然值_copulamatlab_

    假设我们有一组观测数据,极大似然估计的目标是找到一组参数,使得这组数据出现的概率最大。 在MATLAB中实现Copula的极大似然估计,首先需要对数据进行预处理,包括确定边际分布类型(如正态、指数、对数正态等)并...

    5. 逻辑回归(logistic regression)的本质——极大似然估计 - zjuPeco的博客 - CSDN博客1

    《逻辑回归(logistic regression)的本质——极大似然估计》 逻辑回归是一种广泛应用的分类方法,它虽然名字中含有“回归”,但实际上是解决分类问题的一种有效工具。逻辑回归的核心思想是通过引入Sigmoid函数,将...

    基于极大似然估计的三维定位算法

    2. **求解似然函数的最大值**:接下来,我们求解似然函数的最大值,这可以通过求导数并令其等于零来实现,得到的解就是极大似然估计。对于非线性问题,可能需要使用迭代方法,如梯度上升或牛顿法。 3. **解算系统...

    copula极大似然估计matlab

    Copula极大似然估计是统计学中用于估计联合分布的一种方法,特别是在处理多元随机变量的依赖关系时非常有用。在金融和经济领域,数据往往具有复杂的依赖结构,Copula模型可以有效地刻画这种依赖,而极大似然估计则是...

    极大似然估计程序代码

    极大似然估计程序代码

    极大似然估计方法

    极大似然估计的目标是找到一个参数估计值\( \hat{\theta} \),使得该参数下观察到的样本出现的概率最大。即求解以下问题: \[ \hat{\theta} = \arg\max_{\theta} L(\theta | X) \] 其中,\( L(\theta | X) \)称为...

    最大似然估计matlab

    最大似然估计matlab代码

    MLE_参数辨识_参数估计_系统辨识极大似然估计法_

    本文将深入探讨“系统辨识极大似然估计法”这一核心方法,以及如何在实际应用中使用它。 系统辨识是研究和构建动态系统数学模型的过程。这些模型可以用于预测系统的未来行为、控制器设计、故障诊断等。在系统辨识中...

    MLE估计(极大似然估计)Stata示例代码

    MLE(极大似然估计)是一种在统计学中广泛使用的参数估计方法,用于估计模型中的未知参数。这种方法基于最大似然原则,即寻找使样本数据出现概率最大的参数值。在Stata软件中,我们可以利用其内置的功能进行MLE估计...

    极大似然估计.pdf

    极大似然估计(MLE)就是选择参数值θ,使得对数似然函数达到最大值。这一参数值通常记作^θn。根据样本数据来估计模型参数的基本要求是估计量应具备一定的优良性质,极大似然估计就具有以下性质: 1. 相合性...

    统计信号处理作业牛顿法求最大似然估计matlab

    统计信号处理作业牛顿法求最大似然估计matlab,题目为xn = sign(b*sn +wn), sn、xn已知,wn为高斯白噪声,求b的最大似然估计,不喜勿喷

Global site tag (gtag.js) - Google Analytics