`
highsky
  • 浏览: 276236 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

模式分类笔记 -- 最小二乘法

阅读更多

根据解的存在情况,线性方程 Ax=b 可以分为恰定方程组 (有唯一解),超定方程组 (解不存在), 和欠定方程组 (有无穷多解)。这个问题从线性空间的角度去分析,可以看成矢量b在A张成的线性空间的投影问题。 一个形象的解释是,已知不重合的两个点,要求过这两点的一条直线,那么我们可以唯一的确定这条直线。如果给定三个点,且这三个点正好在一个直线上,这条直线仍然可以唯一确定,如果三点不在同一直线,这就是超定问题。最后,如果只给定一个点,显然是欠定问题。在实验数据处理和曲线拟合(curve fitting)问题中,求解超定方程组非常普遍。比较常用的方法是最小二乘法(least squares)。形象点,就是在无法完全满足给定的这些条件的情况下,求一个最接近的解。

 

天文学从古代到18世纪是应用数学中最发达的领域,观测和数学天文学给出了建立数学模型及数据拟合的最初例子,在此种意义下,天文学家就是最初的数理统计学家。天文学的问题逐渐引导到算术平均,以及参数模型中的种种估计方法,已最小二乘法为顶峰。这段话可以看出一丝数学发展的脉络,有源之水,才不断流动。

 

A.M.Legendre(勒让德)在考虑误差整体上平衡的基础上,从解方程的角度发明了最小二乘法,先前的前辈们都致力于找出几个方程(个数等于未知数个数)再去求解。从某种意义讲,最小二乘法是一个处理观测值的纯粹代数方法。要将其应用于统计推断问题就需要考虑观测值的误差,确定误差分布的函数形式 。(在这里还是纯粹代数方法)。勒让德的推导过程比较好找也比较好理解,就不写在这里了。

 

 

高斯的最小二乘法理论发表与他导出正态误差分布时,其实现在看来最小二乘法很平常,但是当时天文学家可能并不相信统计平均,maybe一个更“合理”的观测值更有意义。

 

其实我对于高斯如何导出误差正态分布(把正态分布引入到误差分布)更有兴趣,经过多方的查找,更新了下以前的一篇文章,写在那里更合标题吧。

 

 

 

 

分享到:
评论
1 楼 doudoulong2002ok 2008-11-29  
豆豆龙飘过!

相关推荐

    斯坦福机器学习公开课笔记1-5

    - 最小二乘法:通过最小化预测值与实际值之间的平方误差来优化参数。 - 正则化:防止过拟合,通过添加惩罚项控制模型复杂度。 3. **逻辑回归** - 从线性回归扩展到分类问题,输出在0和1之间,代表概率。 - 激活...

    《统计学习方法》python笔记

    - **线性回归**:通过最小二乘法求解最佳拟合直线,解决连续变量预测问题。 - **逻辑回归**:用于分类问题,通过sigmoid函数将线性回归的连续输出转化为0或1的概率。 - **支持向量机(SVM)**:寻找最大间隔的超...

    中国科技大学模式识别课程的课件 (0 到 4)

    这里可能涵盖参数估计方法,如极大似然估计和最小二乘法,以及过拟合和欠拟合的概念。学习理论部分可能涉及VC维、泛化能力和学习算法的复杂性分析。 **Lec4 - 最优化方法** 这部分会介绍最优化在模式识别中的角色,...

    最新《机器学习最优化》课程笔记

    对于导数和梯度部分,笔记详细解释了梯度的概念、一阶条件(First Order Conditions)、最小二乘法(Least Squares)、主成分分析(PCA)和分类问题中梯度的使用。梯度下降算法部分则介绍了最速下降方向(Steepest ...

    吴恩达机器学习笔记~斯坦福公开课笔记!

    代价函数用于量化模型预测与实际数据之间的差异,通常会采用最小二乘法来定义这个代价函数。梯度下降是一种优化算法,它通过迭代的方式来最小化代价函数。 多变量线性回归处理的是存在多个输入变量的情况,它能够...

    PRML笔记Notes_on_Pattern_Recognition_and_Machine_Learning

    笔记详细解释了线性回归的原理,包括最小二乘法、正规方程和梯度下降等优化技术。同时,还讨论了贝叶斯线性回归,这是一种在估计参数时考虑不确定性的重要方法。 ### 四、线性模型分类 线性模型同样可以用于分类...

    Spark笔记1

    Apache Spark提供了矩阵分解库(MLlib)中的交替最小二乘法(Alternating Least Squares, ALS),用于构建推荐系统。如果需要实现其他类型的推荐算法,如User-CF或Item-CF,则可能需要结合使用Apache Mahout。 **...

    Mplus培训笔记.pdf

    - 包括最大似然估计(ML)、稳健最大似然估计(MLM、MLR)、加权最小二乘法估计(WLSMV)等。 - WLSMV常用于处理类别响应变量,采用对角加权矩阵和均值-方差校正的卡方检验。 6. **模型定义**: - `MODEL`命令...

    吴恩达机器学习课程参考笔记及作业

    - 线性最小二乘法(LMS):一种简单直接的线性回归方法。 - 逻辑回归:一种广泛应用于分类问题的统计模型。 - 感知器:一种简单的二分类模型,属于神经网络的前身。 - 指数族:一种描述概率分布的通用方式,许多...

    常用机器学习算法实践笔记,持续更新!.zip

    它通过最小二乘法来求解模型参数,适用于连续数值型数据的预测。在实践中,可以使用Python的Scikit-learn库进行实现。 2. **逻辑回归**:虽然名字里有“回归”,但逻辑回归实际上是一种分类算法,尤其适合二分类...

    Python机器学习模型公式推导 笔记

    参数估计通常使用最大似然估计,损失函数则常使用均方误差,优化方法则包括最小二乘法和梯度下降法。 最小二乘法是通过最小化误差的平方和来寻找数据的最佳函数匹配。梯度下降法则是一个迭代优化算法,它通过计算...

    机器学习笔记及工程源代码

    理解线性回归的基本原理,如梯度下降法和最小二乘法,以及如何评估模型性能(如R²分数)是必不可少的。 其次,逻辑回归虽然名字中带有“回归”,但实际上是一种分类算法,常用于二分类问题。它通过sigmoid函数将...

    fluent学习笔记

    - **Least-Squares Cell-Based**:最小二乘法单元基梯度计算,适用于高精度的需求。 #### 多相模型 多相流模拟在工程应用中非常常见,Fluent 提供了多种模型来处理这类问题。 - **Volume of Fluid (VOF)**:用于...

    检测与转换技术复习笔记

    最小二乘法是一种常用的数据拟合方法,用于找到一条直线,使得所有数据点到该直线的垂直距离平方和最小。在传感器的线性化过程中,这种方法能提供最佳的经验公式。 电桥是测量电阻、电容、电感等阻抗的常用工具。...

    PRML-完整文档资料

    - **统计模式识别**:介绍如何用统计方法来识别数据中的模式,如最大似然估计、最小二乘法等。 - **贝叶斯网络**:讨论了如何使用贝叶斯方法进行不确定性推理,以及如何构建和学习贝叶斯网络。 - **信息论**:讲解...

    机器学习深度学习及计算机视觉入门基础.docx

    - **最小二乘法**:这是一种常用的求解线性回归问题的方法,其目的是最小化预测值与实际值之间的平方误差之和。 - **梯度下降法**:这是一种迭代优化算法,用于找到函数的局部最小值,适用于求解各种回归问题。 ###...

    斯坦福大学机器学习课程个人笔记完整版

    16. 偏最小二乘法回归(PLS):一种结合了特征提取的回归技术。它在进行线性回归之前,先对预测变量和响应变量进行降维,通过寻找成分,既考虑了预测变量的信息,又考虑了响应变量的信息。 学习者在斯坦福大学的CS...

    R语言与函数估计学习笔记

    4. **函数估计理论**:探索函数估计的统计原理,包括最小二乘法、最大似然估计和贝叶斯方法。 5. **非参数函数估计**:学习核密度估计、局部平均和局部回归等非参数方法,并用R实现这些方法。 6. **参数函数估计**...

    斯坦福大学机器学习课程学习笔记课程讲义

    8. **偏最小二乘法回归(Partial Least Squares Regression, PLSR)**:PLSR是一种回归分析技术,结合了主成分分析和多元线性回归。它在处理多响应变量和多重共线性问题时特别有用,常见于化学、生物和工程学中的建模...

Global site tag (gtag.js) - Google Analytics