`
javasogo
  • 浏览: 1834804 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

SVM(支持向量机)综述

阅读更多

第一部分 引言

基于数据的机器学习是现代智能技术中的重要方面, 研究从观测数据(样本) 出发寻找规律, 利用这些规律对未来数据或无法观测的数据进行预测. 包括模式识别、神经网络等在内, 现有机器学习方法共同的重要理论基础之一是统计学. 传统统计学研究的是样本数目趋于无穷大时的渐近理论, 现有学习方法也多是基于此假设. 但在实际问题中, 样本数往往是有限的, 因此一些理论上很优秀的学习方法实际中表现却可能不尽人意.与传统统计学相比, 统计学习理论(Statistical Learning Theory,SLT) 是一种专门研究小样本情况下机器学习规律的理论. Vapnik 等人从六、七十年代开始致力于此方面研究, 到九十年代中期, 随着其理论的不断发展和成熟, 也由于神经网络等学习方法在理论上缺乏实质性进展, 统计学习理论开始受到越来越广泛的重视.统计学习理论是建立在一套较坚实的理论基础之上的, 为解决有限样本学习问题提供了一个统一的框架. 它能将很多现有方法纳入其中, 有望帮助解决许多原来难以解决的问题(比如神经网络结构选择问题、局部极小点问题等) ; 同时, 在这一理论基础上发展了一种新的通用学习方法——支持向量机(Support Vector Machine,SVM ) , 它已初步表现出很多优于已有方法的性能. 一些学者认为, SLT和SVM 正在成为继神经网络研究之后新的研究热点, 并将有力地推动机器学习理论和技术的发展

我国早在八十年代末就有学者注意到统计学习理论的基础成果, 但之后较少研究,目前只有少部分学者认识到这个重要的研究方向. 本文重点研究的多分类支持向量机至今还没有突破性进展。

第二部分 数据挖掘常用分类技术、算法

1、分类数据挖掘常用技术

 

分类作为数据挖掘中一项非常重要的任务,目前在商业上应用最多。分类的目的是学会一个分类函数或分类模型(也常常称作分类器),该模型能把数据库中的数据项映射到给定类别中的某一个,从而可以用于预测。目前,分类方法的研究成果较多,判别方法的好坏可以从三个方面进行:1)预测准确度(对非样本数据的判别准确度);2)计算复杂度(方法实现时对时间和空间的复杂度);3)模式的简洁度(在同样效果情况下,希望决策树小或规则少)。

近年来,对数据挖掘中分类算法的研究是该领域中一个热点,对不同分类方法都有许多对比研究成果。没有一个分类方法在对所有数据集上进行分类学习均是最优的。目前在数据挖掘软件中运用的最早也是最多的分类算法是神经网络,它具有对非线性数据快速建模的能力,通过对训练集的反复学习来调节自身的网络结构和连接权值,并对未知的数据进行分类和预测。但是,神经网络从某种意义上说是一种启发式的学习机,本身有很大经验的成分,为了克服传统神经网络方面不可避免的难题,Vapnik提出了一种新的神经网络――支持向量机,并随后提出了基于结构风险最小化思想的统计学习理论,正式奠定了SVM的理论基础,鉴于SVM扎实的理论基础

2、数据挖掘分类算法

(1)、判别分析

线性判别,KNN,Bayes判别,多元回归分析,Rocchio法,距离函数法,支持向量机,势函数法

(2)、机器学习

ID3决策树,AQ11算法,Rough Sets

(3)、神经网络

(4)、支持向量机

第三部分 支持向量机

1、支持向量机概述

V. Vapnik提出的支持向量机理论因其坚实的理论基础和诸多良好特性在近年获得了广泛的关注。已经有许多事实证明,作为支持向量机最基本思想之一的结构化风险最小化原则(Structural Risk Minimization, SRM )要优于传统的经验风险最小化原则(Empirical Risk Minimization, ERM)。不同于ERM试图最小化训练集上的误差的做法,SRM试图最小化VC维的上界,从而使其学习机获得了更好的推广性能,这恰恰是统计学习理论最重要的目标之一。支持向量机的主要应用领域有模式识别、函数逼近和概率密度估计等等,本文的讨论重点是使用支持向量机进行多分类的问题。

2、支持向量机相关讨论:

(1)SVM的优势:

由于支持向量机方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力(Generalizatin Ability)。支持向量机方法的几个主要优点是

可以解决小样本情况下的机器学习问题

可以提高泛化性能

可以解决高维问题

可以解决非线性问题

可以避免神经网络结构选择和局部极小点问题

(2)SVM的研究热点

目前,SVM算法在很多领域都有应用。例如,在模式识别方面,对于手写数字识别、语音识别、人脸图像识别、文章分类等问题,SVM算法在精度上已经超过传统的学习算法或与之不相上下。SVM主要有如下几个研究热点:

模式识别

回归估计

概率密度估计

(3)SVM的主要核函数

多项式核: (gamma*u’*v + coef0)^degree

径向基核(RBF): exp(-gamma*|u-v|^2)

Sigmoid 核: tanh(gamma*u’*v + coef0)

(4)SVM的应用

文本分类,人脸识别

三维物体识别,遥感图像分析

函数逼近,时间序列预测

数据压缩,优化SVM算法

SVM改进方法(多分类扩展,用于多现实中的多分类问题)

SVM硬件实现

(5)SVM的难点

如何在非监督模式识别问题中应用统计学习理论(SLT)

如何用理论或实验的方法计算VC维

经验风险和实际风险之间的关系称之为推广性的界,但是当(h/n)>0.37时(h—VC维,n—样本数),推广性的界是松弛的,如何寻找一个更好地反映学习机器能力的参数和得到更紧的界

实现结构风险最小化(SRM)时,如何选择函数子集结构

(6)应用中的问题

用支持向量机进行数据挖掘,除了上面讨论的一些关键点之外,主要需要解决下面的一些问题:

(1)传统支持向量机是做二元分类的,如何扩展为多类分类,比如预测金融风险,如果风险级别为高和低两类,用传统SVM可以很好地解决,但如果加一个或者几个风险级别,那么就需要扩展成多分类支持向量机,这方面的研究做了很多,应用还很少

(2)海量数据的计算性能问题,这是很多数据挖掘算法都会面临的问题,SVM目前在这方面要做的研究还很多。


本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/chl033/archive/2008/07/29/2729495.aspx

分享到:
评论

相关推荐

    基于支持向量机的目标检测算法综述

    目标探测算法;标检测的目的在于从静态图片或视频中检测... 对此, 从支持向量机原理、目标特征模型构建、学习训练和目标检测框确定等角度, 综述了基于支持向量机的目标检测算法的研究现状, 并就进一步的发展进行了展望.

    基于贝叶斯理论的支持向量机综述

    ### 基于贝叶斯理论的支持向量机综述 #### 1. 支持向量机(SVM)简介 支持向量机(Support Vector Machine, SVM)是一种广泛应用于分类与回归任务的监督学习模型。它基于统计学习理论中的VC维理论和结构风险最小化...

    股市中支持向量机的应用综述.pdf

    股市中支持向量机的应用综述 支持向量机(SVM)是一种广泛应用于机器学习和数据挖掘的算法,近年来在股市领域也获得了广泛应用。本文旨在对股市中SVM的应用进行综述,总结国内外研究现状,并对SVM在股市中的应用...

    支持向量机理论与算法研究综述

    统计学习理论(statistical learning theory,SLT)是一种小样本...该文系统介绍了支持向量机的理论基础,综述了传统支持向量机的主流训练算法以及一些新型的学习模型和算法,最后指出了支持向量机的研究方向与发展前景。

    支持向量机及其应用研究综述.pdf

    支持向量机(Support Vector Machine,简称SVM)是一种监督学习模型,主要应用于分类和回归分析。SVM的核心思想是通过最大化分类间隔(Margin),找到一个能够最好地将不同类别数据分离的决策边界,以此提高预测的...

    支持向量机训练算法综述.docx

    "支持向量机训练算法综述" 支持向量机(SVM)是一种广泛应用于数据挖掘和机器学习领域的监督学习算法,通过学习一个最优的超平面,将不同类别的样本分隔开来。支持向量机的主要特点是它只依赖于输入样本之间的内积...

    支持向量机理论与算法研究综述.pdf

    支持向量机理论与算法研究综述 支持向量机(Support Vector Machine,SVM)是一种基于统计学习理论(Statistical Learning Theory,SLT)的新型机器学习方法。统计学习理论是一种小样本统计理论,着重研究在小样本...

    支持向量机理论与算法研究综述_丁世飞1

    "支持向量机理论与算法研究综述" 支持向量机(Support Vector Machine,SVM)是一种基于统计学习理论(Statistical Learning Theory,SLT)的新型机器学习方法。统计学习理论是一种小样本统计理论,着重研究在小...

    支持向量机理论与算法研究综述.docx

    支持向量机(SVM)是一种广泛应用于模式识别、数据分类和回归分析等领域的机器学习算法。其基本思想是在高维空间中找到一个最优超平面,将不同类别的样本分隔开来。这个最优超平面是根据训练样本所构成的向量空间来...

    基于GPU的并行支持向量机的设计与实现

    标题《基于GPU的并行支持向量机的设计与实现》揭示了文档主要关注点在于利用图形处理单元(GPU)这一高性能计算平台来实现支持向量机(SVM)算法的并行化,以提高大规模数据处理的效率和速度。文章围绕该主题,从多...

    人脸识别分类中常用方法——支持向量机算法综述

    ### 人脸识别分类中常用方法——支持向量机算法综述 #### 1. 支持向量机(SVM)理论基础 支持向量机(SVM)是一种强大的机器学习方法,广泛应用于分类和回归任务中。其核心思想是通过寻找一个超平面来最大化不同...

    多类支持向量机算法综述.pdf

    ### 多类支持向量机算法综述 #### 引言 随着计算机科学与人工智能的发展,机器学习成为了处理大量数据并从中发现模式的关键技术之一。支持向量机(Support Vector Machine, SVM)作为一类强大的监督学习模型,在...

    SVM支持向量预选取方法综述

    ### SVM支持向量预选取方法综述 #### 摘要 支持向量机(Support Vector Machine, SVM)因其卓越的分类性能与泛化能力,在众多领域如图像识别、疾病诊断、电力负荷预测及文本分类等方面获得了广泛应用。然而,面对大...

Global site tag (gtag.js) - Google Analytics