现实生活中充满着预测问题,即对未知世界的大胆猜测。我们基于什么根据来推测呢?最多的当然是已有的经验,即之前所做的一些已知结果的推测,这就是所谓的“有监督的学习”。
这里,我举一个最简单的例子,就是公务员考试中那种最常见的数字推理题:1,4,9,16,?
当然,你一眼就看出了这是一个平方序列,下一个数字一定是25,但是,这是唯一的答案吗?
应该说,平方序列只是一个模型,比方说,我们可以假定这样一个多项式模型,
引用
a * x * x * x + b * x * x + c * x + d
其中a、b、c、d为未知数,而x分别为1、2、3、4,采用初中数学所学的待定系数法,就可以算得abcd的值,从而得到符合上述规律一个模型。对于上面我给出的多项式模型,由于我们有四个未知数和四个方程,因此解是唯一的。但是如果我们变换模型的样式(比如说采用更高阶或低阶或是指数或是对数的模型),总的来说,其解是无限的。
如果上述例子还不够有说服力的话,请看下面的例子:
这是一个回归的例子,即根据已有的数据点得出合理的模型,并预测新数据点的问题。由上图看出,我们可以使用sin函数完美拟合所有的已知点,但是,得出的模型却和真实函数大相径庭,预测出来的结果也肯定是有问题的。
那么,既然存在着多种可能的解释,我们如何来确保,所选用的模型一定是正确的呢?很遗憾,不存在一定的答案,除非模型是已知的,但如果是这样的话,有何必需要预测呢?
两个可能的努力方向,一是提高样本数量,这是显而易见的,可供训练的数量越多,模型一定是越可靠。另一点是降低模型的复杂度(VC维),这一点或许比较难以理解,但是我们可以这样去思考,越是复杂的模型或者分类器,输入的变化引起输出的波动也就越大。
下面再来细谈一下VC维。考虑平面内的N个点,需要进行简单的“是或否”的分类,总共会有2的N次方种划分方式。对于任何一种分类模型来说,其N的最大值就是该模型的VC维。例如对于直线来说,其VC维等于3,可以如下证明:假设平面内有四个点,而直线无法将处于对角的点两两分开。
接下来谈谈SVM,通常来说,它采用直线模型将数据分类,并且只有处于分界线附近的支撑向量才会对最后的分类结果又贡献,因此特别适合于处理高维向量分类问题(比如说文本分类等等)。
但是,现实生活中,许多复杂的问题并不是线性可分的。为了解决这类问题,SVM引入了核函数(kernal)的理念,将输入集映射到更高维度的另一个空间。在原始空间不可分的问题,总会存在另一个空间其实线性可分的,如图所示:
此外,在SVM的学习过程中,会遇到惩罚因子这个参数,通常是用来处理噪声问题的。现实的数据当中,往往会存在少量的噪声问题,我们与其寻找一个相当复杂的kernal,不如在训练过程中允许一定的误差,这样往往会简化问题的处理。
最后,这里给出一个使用OPENCV-SVM实现平面点预测的例子:
其中白色圈圈是支撑向量,十字点为训练数据,着色区域为训练器计算出来的区域。
- 大小: 39.2 KB
- 大小: 35.4 KB
- 大小: 31.8 KB
- 大小: 58.1 KB
分享到:
相关推荐
支持向量机(Support Vector Machine,SVM)是一种在机器学习领域广泛应用的监督学习模型,尤其在分类和回归分析中表现出色。SVM的核心思想是找到一个最优的超平面,使得不同类别的样本尽可能地被分隔开来,同时保持...
在本资源中,主题聚焦于MATLAB编程与支持向量机(SVM)的应用,具体是利用SVM进行上证指数开盘指数的回归预测分析。MATLAB是一款强大的数学计算软件,广泛应用于科研和工程领域,而SVM则是一种监督学习模型,常用于...
总的来说,这个项目结合了机器学习中的两种强大工具——最小二乘支持向量机和混沌粒子群优化算法,以解决非线性问题,特别是沉降预测这类工程问题。通过这种优化方法,模型能够更好地适应复杂的数据模式,提供更准确...
### 支持向量机(SVM)通俗导论 #### 第一层:了解SVM **1.1 什么是SVM** 支持向量机(Support Vector Machine, SVM)是一种广泛应用于统计分类与回归分析领域的机器学习算法。其核心思想是找到一个最佳的决策边界...
支持向量机(Support Vector Machine, SVM)是一种广泛应用于机器学习领域的监督学习模型,尤其在分类和回归问题中表现出色。在本项目中,我们关注的是SVM在混凝土抗压强度预测中的应用,这是一个典型的回归问题。...
10. **支持向量机**(31、支持向量机(数学建模).pdf):支持向量机是一种监督学习模型,主要用于分类和回归分析。它通过构造最大间隔超平面进行分类,对小样本和高维数据有良好表现,广泛应用于模式识别和机器学习。...
数学建模——工作岗位的挑选决策 数学建模是指使用数学技术和方法来解决实际问题的过程。在本文中,我们使用数学建模来解决工作岗位的挑选决策问题。即如何帮助一位即将毕业的学生选择合适的工作岗位。 数学建模的...
[只读].pdf"、"第3讲 分类与判别 [只读].pdf"显然是系列讲座的笔记,可能涵盖各种预测模型(如ARIMA、指数平滑法)、综合评价方法(如层次分析法、模糊综合评价)以及分类算法(如决策树、支持向量机)。 "数学中国...
### 统计学习理论的本质——支持向量机学习者经典教材 #### 一、书籍简介与作者背景 《统计学习理论的本质》是一本由Vapnik博士编写的关于支持向量机(Support Vector Machine, SVM)的经典教材。Vapnik博士作为支持...
在本项目中,“基于matlab与支持向量机的回归拟合混凝土抗压强度预测系统设计与实现”是一项利用先进的机器学习技术来预测混凝土抗压强度的研究。MATLAB是一种广泛应用于数学计算、数据分析和算法开发的编程环境,而...
在数学建模领域,MATLAB(Matrix Laboratory)是一款不可或缺的工具,它为用户提供了丰富的功能,使得复杂的数学问题可以通过编程的方式进行求解。MATLAB不仅仅是一个编程环境,更是一个强大的数学计算平台,尤其...
标题中的“【lssvm预测】基于麻雀算法优化最小二乘支持向量机实现风电功率预测(多输入单输出)含Matlab源码”揭示了这个压缩包内容的核心,它是一个采用Matlab编程实现的预测模型,专门针对风电功率预测。...
在2021年的MathorCup高校数学建模挑战赛中,大数据竞赛的一个核心问题集中在A题目——同城转转二手车价格预测。这个比赛旨在利用数学建模和大数据分析技术,预测二手车在同城交易平台上的合理售价,从而为买卖双方...
为了预测大型水泵在运行中的性能,采用了统计学习理论中的核心算法——支持向量机。针对某一全调节轴流水泵,建立了水泵扬程计算模型和效率计算模型,并绘制出了不同叶片角度时的性能曲线。结果表明,基于支持向量机...
在本资源中,我们主要探讨的是使用MATLAB进行神经网络的43个案例分析,特别是聚焦于基于支持向量机(SVM)的回归预测分析,以预测上证指数的开盘指数。MATLAB是一款强大的数学计算软件,它提供了丰富的工具箱,包括...
最小二乘支持向量机(Least Squares Support Vector Machine, LSSVM)是一种在机器学习领域广泛应用的分类和回归模型,它是由瑞典皇家理工学院的Alexandros G. Drakos和C. J. C. Burges在1999年提出的。LSSVM是传统...
4. **模型构建**:选择合适的建模算法(如线性模型、决策树、随机森林、支持向量机等),使用sklearn等库实现模型训练。 5. **模型评估**:理解并应用各种评估指标(如R^2、均方误差、决定系数等)来评估模型的性能...
### 机器学习经典算法——支持向量机(Support Vector Machine, SVM) #### 一、引言 支持向量机(SVM, Support Vector Machine)是一种非常强大的机器学习算法,广泛应用于分类与回归任务中。其核心思想是寻找一个...
论文部分可能会详细介绍他们所采用的建模方法,比如线性回归、决策树、随机森林、支持向量机或者更先进的深度学习模型如神经网络。团队可能还对比了不同模型的预测性能,通过交叉验证和评估指标(如均方误差、平均...