`
wbj0110
  • 浏览: 1611387 次
  • 性别: Icon_minigender_1
  • 来自: 上海
文章分类
社区版块
存档分类
最新评论

贝叶斯方法的m-估计

阅读更多

为什么要有m-估计?

当我们通过在全部事件的基础上观察某事件出现的比例来估计概率时,例如:P=nc/n.,其中nc为该类别中的样本数量,n为总样本数量。若n=5,当P=0.6时,则nc3。多数情况下该比例是对概率的一个良好的估计。但当nc很小时估计会较差,例如:P=0.08,样本中同样有5个样例,那么对于nc最可能的取值只有0,。这会导致两个问题:

1、nc/n产生了一个有偏的过低估计概率。

2、当此概率估计为0时,将来的查询此概率项将会在贝叶斯分类器中占统治地位。原因是贝叶斯公式中计算得量其他所有概率项都将乘以此0值。

为了避免此问题,所以需要采用一种估计概率,即如下定义的m-估计:

 

其中nc为该类别中的样本数量,n为总样本数量,p为将要确定的概率的先验估计,m为等效样本大小的常量

 

 

为什么m-估计的公式是这样的?

首先,请思考问题出现的根本原因,问题出现的根本原因是样本数量过小。所以为了避免此问题,最好的方法是等效的扩大样本的数量,即在为观察样本添加m等效的样本,所以要在该类别中增加的等效的类别的数量就是等效样本数m乘以先验估计p。

 

为什么在贝叶斯应用(如mahout)中使用的公式如下呢?

 

其中nk为单词W出现的次数,n为所有单词出现的次数。

 

其实,这只是m的取值的关系,当等效样本数m为词汇表中的单词数时,自然取统一的先验概率p的值就是1/|vocabulary|咯。

http://blog.csdn.net/cyningsun/article/details/8671975

分享到:
评论

相关推荐

    kenqui.zip_贝叶斯 预测_贝叶斯估计_贝叶斯分析

    在IT领域,特别是数据分析和机器学习中,"kenqui.zip_贝叶斯 预测_贝叶斯估计_贝叶斯分析"这个压缩包文件显然聚焦于贝叶斯统计方法的应用,包括贝叶斯预测、贝叶斯估计以及贝叶斯分析。这些概念在现代数据科学中扮演...

    统计信号处理基础--估计与检测理论(中文版).pdf

    第一卷详细介绍了经典估计理论和贝叶斯估计,总结了各种估计方法,考虑了维纳滤波和卡尔曼滤波,并介绍了对复数据和参数的估计方法。本卷给出了100多个应用实例,范围包括高分辨率谱分析、系统辨识、数字滤波器设计...

    最大似然估计和贝叶斯参数估计

    最大似然估计和贝叶斯参数估计是两种常用的参数估计方法。本文将详细介绍这两种方法的原理、代码实现和比较结果。 一、最大似然估计 最大似然估计是一种经典的参数估计方法,其假设待估参数 θ 是确定的未知量。...

    kun-rs46.zip_M M 估计

    M-M估计,全称为最小均方误差(Minimum Mean Square Error,简称MMSE)估计,是统计信号处理领域中的一种重要估计方法。在MATLAB环境中,M-M估计被广泛应用于谱估计,以获取信号频谱信息,从而进行信号分析和解调。...

    统计信号处理基础-估计与检测理论_统计处理基础_信号检测与估计理论.zip_统计信号处理_

    4. **估计理论**:最小二乘估计、最大似然估计、贝叶斯估计,以及Cramer-Rao下界等理论。 5. **检测理论**:wald检验、likelhood ratio test(LRT)、 Neyman-Pearson准则,以及误警率和漏检率的概念。 6. **决策...

    L-M 优化算法和贝叶斯正则化算法训练BP网络

    贝叶斯正则化通过引入先验概率分布,将模型参数视为随机变量,然后通过后验概率最大化来估计参数,这样可以在保持模型预测能力的同时,限制参数的自由度,减少过拟合现象。 **BP神经网络** 反向传播...

    贝叶斯方法matlab画图GUI界面

    贝叶斯方法在AI中的应用主要体现在概率模型的建立和参数估计上,例如朴素贝叶斯分类器就是一种常用的人工智能算法,它利用贝叶斯定理进行预测。在这个MATLAB GUI程序中,可能展示了如何使用贝叶斯方法处理AI相关问题...

    基于贝叶斯估计的最大后验点估计.pdf

    本文主要探讨的是基于贝叶斯估计框架下的最大后验概率(Maximum A Posteriori, MAP)估计方法,并通过具体的数学公式和推理过程,展示了MAP估计在解决实际问题中的应用。 #### 贝叶斯估计基础 在理解MAP估计之前,...

    用matlab贝叶斯方法实现神经网络算法

    在神经网络领域,贝叶斯方法可以用来估计神经网络参数的概率分布,进而进行不确定性建模。这对于解决过拟合问题、提高模型泛化能力具有重要意义。 ### 在MATLAB中实现神经网络算法 #### 初始化网络 在MATLAB中...

    mplus 8 用户手册 Chapter11 缺少数据建模和贝叶斯估计视图示例.pdf

    第11章:缺少数据建模和贝叶斯估计视图示例 第12章:蒙特卡洛模拟研究查看示例 第13章:示例:特殊功能 第14章:特殊建模问题 第 15 章:标题、数据、变量和定义命令 第16章:分析命令 第17章:MODEL命令 第 ...

    稀疏贝叶斯算法.zip

    文件“稀疏贝叶斯算法.m”可能包含了整个算法的实现过程,包括数据读取、模型定义、优化求解和结果展示等部分。 总结,稀疏贝叶斯算法利用MATLAB进行实现,为理解和应用压缩感知提供了一种有效途径。通过对模型参数...

    统计参数估计:1。 最大似然估计 2. 贝叶斯参数估计-matlab开发

    这个过程通常分为两种主要方法:最大似然估计和贝叶斯参数估计。在MATLAB环境中,这两种方法都有广泛的应用,可以用来处理各种数据集并估计其背后的参数。下面我们将深入探讨这两种方法及其在MATLAB中的实现。 1. *...

    Bayes统计学与MCMC方法——Metropolis-Hastings(M-H)算法的Matlab程序实现.zip

    总的来说,"Bayes统计学与MCMC方法——Metropolis-Hastings(M-H)算法的Matlab程序实现"这个资料包提供了理解和应用贝叶斯统计、MCMC以及M-H算法的基础,特别是通过Matlab编程来实践这些概念,这对于学习者来说是一...

    贝叶斯(bayes)参数估计

    贝叶斯参数估计是一种统计学方法,用于确定模型参数的最可能值,它基于先验知识和观测数据。在概率论框架下,贝叶斯定理提供了更新我们对未知参数信念的方法。MATLAB作为一种强大的数值计算环境,是实现贝叶斯参数...

    HDDM-0.8.0-cp36-cp36m-win_amd64.whl.zip

    此外,HDDM支持各种拟合方法,包括最大似然估计(MLE)和贝叶斯推断,用户可以根据自己的研究需求选择合适的拟合策略。在分析数据时,理解如何设定模型参数、解读模型结果以及验证模型假设是非常关键的。 总的来说...

    贝叶斯代码和验证

    贝叶斯统计方法是概率论的一个分支,它基于贝叶斯定理来更新假设(或模型参数)的概率,随着新数据的引入。这种方法在处理不确定性问题时特别有用,如分类、预测和特征选择。下面我们将深入探讨贝叶斯理论及其在编程...

    GARCH.zip_Bayesian_GARCH模型MCMC估计_garch_garch估计_贝叶斯估计

    压缩包中的“GARCH.m”文件很可能是一个MATLAB代码,用于实现贝叶斯GARCH模型的MCMC估计。该代码可能包括以下几个步骤: 1. 定义GARCH模型的先验分布,如对 \( \omega \), \( \alpha \), 和 \( \beta \) 分配正态或...

    matlab贝叶斯阈值代码-psybayes:贝叶斯心理刺激函数的自适应刺激位置

    psybayes.m实现了Kontsevich和Tyler(1999)的贝叶斯自适应Ψ方法,通过最大化信息增益(包括失误;参见Prins 2012)来估计心理测验函数的参数。 它还支持Prins(2013)的marginal-Ψ方法。 有关文档和有效的使用示例...

    bayes.rar_Bayes估计例题_bayes估计_clays2k_贝叶斯估计

    在信息技术领域,贝叶斯估计是一种重要的统计推断方法,尤其在信号处理、机器学习和数据分析中扮演着核心角色。本资料包"bayes.rar"包含了几个贝叶斯估计的实例,旨在帮助初学者理解和应用这一理论。以下是对这些...

Global site tag (gtag.js) - Google Analytics