回到回归的正题,回归问题是机器学习领域中应用的比较广的一种方法,不过我觉得大部分的回归模型都是广义线性模型,在Andrew NG的课程中,对广义线性模型做了比较详细的推导,这篇文章的内容是,线性回归、局部加权回归、岭回归以及前向逐步回归,除了前向逐步回归之外,其他的都是广义线性回归模型,基本思路都是 1,确定损失函数 2,使用梯度下降(或者梯度上升)求解权重参数,算是套路,而这两种套路使用Python都比较容易实现,就是使用了矩阵运算,代码量也不大,所以这篇文章就简单说说各种回归,而不实现代码,代码和之前的logistic回归计算过程都是一样的
言归正传
一、线性回归
线性回归方式很简单,公式如下:
z=w0+w1*x1+w2*x2+...+wn*xn
损失函数: h=(1/2)*(z-y)^2 其中h是训练数据的真正结果值
方法:梯度下降法
二、局部加权回归
线性回归有一些问题,就是如果训练数据如果有些数据偏差特别大,这回造成最后训练的模型可能对整体数据都不具备很好的准确性,因此又提出了一种新的回归模型,也就是局部加权回归(LWR),局部加权回归实质上是对于需要预测的点,只是根据其附近的点进行训练,其他的没有改变,只是改变了其损失函数,对于比如对于点P(x0,y0)的预测:
z=w0+w1*x1+w2*x2+...+wn*xn
损失函数: h=exp(|x-x0|/(-2k^2)) * (1/2)*(z-y)^2 其中h是训练数据的真正结果值
方法:梯度下降法
说道为什么局部加权回归能够达到其效果,可以从损失函数前面加的exp(|x-x0|/(-2k^2)) 函数看出,如果训练数据点距离需要预测的点比较远,那么该值就会趋向于0,那么也就是说,在最后进行梯度下降的时候其对权重的变化就影响很少,相当于可以说,只有预测点周边的训练数据才会对最后的权重产生重要的影响
但是其实局部加权回归容易出现过拟合现象,过拟合现象很明显:太关注局部的训练数据,忽略了全局数据,如果预测点在出现偏差的训练数据附近,那么预测值会偏差很大,但是局部加权回归还是对训练数据拟合的比较好,这也是局部加权回归的优点,只是容易出现过拟合现象
三、岭回归
岭回归着手解决的是训练数据少于预测数据的问题,其实对于之前的回归,有一个前提条件就是矩阵X是列满秩矩阵,如果训练数据比较少,那么就容易出现X是非列满秩矩阵,导致的问题是xTx是一个奇异矩阵,因此需要加入一个单位矩阵进行变换成非奇异矩阵,具体的来说,公式如下:
z=w0+w1*x1+w2*x2+...+wn*xn
损失函数:
其中,I是一个单位矩阵,通常该矩阵会加个lambda参数来调节,单位矩阵I的秩是训练参数的长度
方法:梯度下降法
四、前向逐步回归
前向逐步回归其实很简单,就是对于初始化的权重,在每一次迭代中,都略微增加或者减少一些值,然后计算整个损失函数的值,如果损失函数变小了的话,就将权重更新,如果没有减小,就继续下一次迭代
前向逐步回归其实说白了就是去一步一步尝试,这种方法可能达到局部最优但是很难达到全局最优,看过一些书说是关于凸函数的问题,这点我不太明白,所以就不详述
相关推荐
在这个“MLA Review之三:朴素贝叶斯分类”的主题中,我们将会深入探讨朴素贝叶斯的工作原理、优缺点以及实际应用。 首先,朴素贝叶斯分类器的核心是贝叶斯定理,该定理表示了在已知某些证据的情况下,某一假设发生...
标题《MLA Handbook 第8版,PDF》和描述“PDF格式适配KINDLE的版本”,以及标签“MLA 英语写作”明确指向了该文档的性质和内容,即这是关于MLA(现代语言协会)格式的使用手册的PDF版本,它适配于KINDLE阅读器。MLA...
matlab匹配滤波代码MLA2_Tracking 这是用于记录,跟踪和分析MLA2实验动物位置的代码。 要在新实验中使用此代码,请从Github存储库中派生或下载并从那里开始使用新数据。 工作流程大纲 盆景: Video_Acquisition....
乳胶-mla-模板 用于生成 mla 格式论文的基本模板。 先决条件 make 一些最新的 LaTeX 发行版(TeXLive、MacTeX、MiKTeX 等) 安装和使用 $ git clone https://github.com/trotod/latex-mla-template <project> $ cd...
6. **无作者文献**:如果文献没有明确的作者,则将文献的标题(如果标题较短则全部列出,如果较长则列出前三到五个单词)和页码放在括号内。例如:“The group issued an apology a short time later (‘Satire Lost...
MLA 格式参考文献示例 MLA 格式参考文献示例文档提供了一些常见的文献类型的引用格式,包括期刊文章、专著、编撰书籍等。下面是对这些文献类型的详细解释和示例。 期刊文章 在 MLA 格式中,期刊文章的引用格式...
MLA(Modern Language Association)格式是一种广泛应用于人文科学领域的引用规范,主要用于撰写文学论文。MLA格式要求在论文中正确引用他人的观点和内容,确保学术诚信。以下是关于MLA格式的一些关键要点: 1. **...
MLA JIL 文本数据 该存储库包含从 MLA 工作信息列表中挖掘的文本数据语料库。 这是一个正在进行的项目,旨在提供 (1) 供其他学者分析的纯文本数据资源,以及 (2) 分析用于修辞和写作研究的 MLA JIL 数据。 该项目的...
首先,我们可以确定这份文件是关于MLA系列贴片电容的选型手册。MLA系列贴片电容是指特定型号的电容器,这类电容器通常被广泛应用于各种电子设备中,用以稳定电源电压、滤波、耦合和去耦等。选型手册的作用是在众多的...
在这个主题中,我们将深入探讨P2到P7的过程审核元素以及MLA(制造过程能力)的解读,结合实际的审核表格和案例分析,以帮助理解和应用这些概念。 P2-P7是VDA 6.3过程审核的核心部分,它们分别代表: 1. P2 - 过程...
MLA(Modern Language Association)引用格式是人文科学领域内最常用的文献引用风格之一,适用于文学、语言学、文化研究等学科的研究论文。本指南将详细介绍MLA第七版的基本引用规则,涵盖常见的书籍、电子资源及...
"pa.mla.unit.addon:mla unit addon mod" 是一个针对特定游戏或模拟平台的扩展模组,主要由Python编程语言编写。这个模块可能是为了增强游戏中的单位(unit)功能,提供更多的自定义选项或者引入新的游戏机制。在...
MLA正文引用+参考文献.pdf 本文将详细介绍MLA格式的正文引用和参考文献的撰写要求。MLA格式是由美国现代语言学会(Modern Language Association)提出的,主要应用于人文学科、社会科学和自然科学等领域。 MLA格式...
《mla数据重建:Python库解析与应用》 在当今数据驱动的时代,高效的数据处理工具是科学研究和技术开发的重要支柱。本文将深入探讨“mla-data-reconstruction”这一Python库,它专为解析、重建和转换MLA(多光子...
《美硕 MLA 双稳态继电器产品说明书》是一份详细阐述美硕品牌MLA系列双稳态继电器技术规格、工作原理、安装与使用的参考资料。这份说明书的重要性在于,它为使用者提供了全面了解和安全操作该产品的关键信息。 首先...
在MLA格式中,论文的基本结构包括:Introduction、Literature Review、Methodology、Results、Discussions和Conclusion等部分。Introduction是指论文的引言部分,包括研究的背景、意义和预期解决的问题。Literature ...
监督学习是机器学习中最常见的一种形式,它依赖于带有标签的数据集进行训练,例如在分类或回归问题中。会议中可能涉及的算法有支持向量机(SVM)、决策树、随机森林和神经网络等。这些模型在图像分类、文本分类、...
五、匿名作者 当作者匿名时,书目信息格式为:书名。出版地:出版社,出版年份。 例如: The New York Times Atlas of the World. New York: New York Times Books, 1980. 六、同一作者两本以上著作 当同一作者有...
《VDA Band 成熟度等级保障 - 针对新部件的3版2022年英文MLA》 该文档是2022年6月第三版修订的VDA(德国汽车工业协会)质量管理体系在供应链中的联合质量管理,特别关注新部件的成熟度等级保证。VDA-QMC(质量管理...