`

EM算法小结

 
阅读更多

 

描述

EM是一种基于模型的聚类算法,假设样本符合高斯混合模型,算法的目的是确定各个高斯部件之间的参数,充分拟合给定数据,并得到一个模糊聚类,即每个样本以不同概率属于每个高斯分布,概率数值将由以上个参数获得

       混合模型的定义是几个模型的线性加和,也就是说给每一个模型加上一个权重,几个模型都乘以一个权重数,权重的和是1。因此上述高斯混合模型就是多个高斯模型的加和,并给每一个模型都赋予一个权重值。

        E过程是求期望的过程,为什么要求期望呢,原因就是为了让似然函数中的参数变得只有一个,就是要要估计的参数,然后才可以在M过程中求似然函数的极大值,得到新的参数估计值。这样不断的进行迭代。也就是说E过程加上M过程即使一个不断的修正参数的过程,直到算法收敛。

 

延伸

很多算法都是EM算法,比如隐马尔科夫模型的训练方法Baum-Welch算法以及最大熵模型的训练方法GIS算法。 最后,还要讨论EM算法是否一定能保证获得全局最优解? 如果我们的优化目标函数是一个凸函数,那么一定能保证得到全局最优解。熵函数,N维空间以欧式距离做度量,聚类中我们试图优化的两个函数也是凸函数。而对于其他很多情况,包括文本分类中的余弦距离都不保证是凸函数,因此有可能EM算法给出的是局部最优解,而不是全局最优解。

 

1
3
分享到:
评论

相关推荐

    EM算法的一篇IEEE文献,需要的话下来看看

    ### 小结 本文通过对传输层析成像中EM算法及其与其他两种算法(基于凸性的算法和启发式梯度算法)的比较,详细介绍了各种算法的特点、优势和局限性。研究结果表明,在确保图像重建质量的同时,选择合适的算法能够...

    em算法matlab代码-Transfer-PEP:第一组PEP估计算法

    em算法matlab代码传递后验误差概率估计以进行肽鉴定 传输PEP是第一个分组的PEP估计算法,提出该算法是为了对小群肽段鉴定进行质量控制。 转移PEP通过与合并的零分布的经验关系得出组零分布,并使用迭代半参数方法...

    SparkML算法详解(关于DataFrame的API操作)--数据挖掘(Scala与Java版)

    - **EM算法**:期望最大化算法,用于估计概率模型的参数。 - **DBSCAN算法**:密度基聚类算法。 - **梯度下降法**:一种优化算法,用于最小化损失函数。 以上概述了 Spark MLlib 在机器学习领域的广泛应用和技术...

    实用语音识别基础

    2 参数调整算法--em算法  10. 7 小结  参考文献  第三部分 语音识别中关键处理技术  第11章 说话人自适应和说话人归一化技术  11. 1 概述  11. 2 自适应方式的分类  11. 3 MLLR算法介绍  ...

    语音识别技术文章.rar

    10.6.2 参数调整算法--EM算法 10.7 小结 参考文献 第三部分 语音识别中关键处理技术 第11章 说话人自适应和说话人归一化技术 11.1 概述 11.2 自适应方式的分类 11.3 MLLR算法介绍 11.3.1 语音特征空间的...

    数值图像处理之刚性变换匹配源代码(opencv)

    ### 小结 通过对该段源代码的解析可以看出,这段代码实现了一个基于 OpenCV 的刚性变换匹配算法,利用了 EM 算法来估计最佳的刚体变换参数,从而实现两幅图像之间的配准。此算法不仅适用于图像配准,在其他领域如...

    实用语音识别基础电子版

    2 参数调整算法--em算法  10. 7 小结  参考文献  第三部分 语音识别中关键处理技术  第11章 说话人自适应和说话人归一化技术  11. 1 概述  11. 2 自适应方式的分类  11. 3 MLLR算法介绍  ...

    基于量子条件主方程的隐马尔可夫模型.docx

    文献[24]提出了一种基于EM算法的矩阵形式Kraus算符估计方法,尽管在小规模问题上有效,但存在陷入局部最优的风险。文献[25]则提出了一种新的优化算法,解决了这个问题。 量子隐马尔可夫模型与量子开放系统密切相关...

    编写email邮件的HTML页面原则小结

    毫无疑问,JS代码是被严格过滤掉的,包括所有的事件监听属性,如onclick、onmouseover,这是...我本人没有做过邮件系统,况且各大邮箱后台的过滤算法也不是那么容易可以让外人知道的。所以,我们只能 通过前端展现,

    CSS小结:一行内文本超出指定宽度溢出的处理

    /* 只有定义了表格的布局算法为fixed,下面td的定义才能起作用。 */ } td { width: 100%; word-break: keep-all; /* 不换行 */ white-space: nowrap; /* 不换行 */ overflow: hidden; /* 内容超出宽度时隐藏...

    S7-200手册

    ### 小结 S7-200CN 可编程控制器系列以其卓越的性能、灵活性和广泛的应用场景,在工业自动化领域占有重要地位。无论是从基本的逻辑控制到复杂的运动控制,还是从简单的数据采集到高级的通信集成,S7-200CN 都能够...

    TMS320F2812 DSP寄存器速查手册

    #### 小结 本文主要介绍了TMS320F2812 DSP中事件管理器的相关寄存器及其作用。这些寄存器对于实现精密的电机控制非常重要。开发者需要根据具体的应用场景来合理配置这些寄存器,以实现高效的控制策略。此外,本文还...

    数据挖掘概念与技术 CHAPTER7聚类分析.ppt

    小结 聚类分析是一种强大的人工智能技术,可以应用于各种领域。选择合适的聚类方法和参数对聚类结果的质量有很大的影响。 数据挖掘对聚类的要求 数据挖掘对聚类的要求包括可伸缩性、高维性、处理噪声数据和孤立点的...

    html+css基础

    ### 小结 通过本文的介绍,我们不仅了解了 CSS 中与字体相关的各种属性,还深入探讨了颜色与背景、文本排版以及表格布局等方面的知识点。这些基本概念和操作技巧对于初学者来说至关重要,能够帮助他们快速入门并掌握...

Global site tag (gtag.js) - Google Analytics