`

海森矩阵(Hessian matrix)

 
阅读更多

转自:http://hi.baidu.com/imheaventian/item/c8591b19907bd816e2f98612

 

在数学中,海森矩阵(Hessian matrix 或 Hessian)是一个自变量为向量的实值函数的二阶偏导数组成的方块矩阵,此函数如下:

f(x_1, x_2, \dots, x_n),

如果 f 所有的二阶导数都存在,那么 f 的海森矩阵即:


H(f)ij(x) = DiDjf(x)

其中 x = (x_1, x_2, \dots, x_n),即

H(f) = \begin{bmatrix}\frac{\partial^2 f}{\partial x_1^2} & \frac{\partial^2 f}{\partial x_1\,\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_1\,\partial x_n} \\  \\\frac{\partial^2 f}{\partial x_2\,\partial x_1} & \frac{\partial^2 f}{\partial x_2^2} & \cdots & \frac{\partial^2 f}{\partial x_2\,\partial x_n} \\  \\\vdots & \vdots & \ddots & \vdots \\  \\\frac{\partial^2 f}{\partial x_n\,\partial x_1} & \frac{\partial^2 f}{\partial x_n\,\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_n^2}\end{bmatrix}

可见,多元函数的二阶导数就是一个海森矩阵
 海森矩阵被应用于牛顿法解决的大规模优化问题。

 

混合偏导数和海森矩阵的对称性

海森矩阵的混合偏导数是海森矩阵非主对角线上的元素。假如他们是连续的,那么求导顺序没有区别,即

\frac {\partial}{\partial x} \left( \frac { \partial f }{ \partial y} \right) =       \frac {\partial}{\partial y} \left( \frac { \partial f }{ \partial x} \right)

上式也可写为

f_{xy} = f_{yx} \,

在正式写法中,如果 f 函数在区域 D 内连续并处处存在二阶导数,那么 f的海森矩阵在 D 区域内为对称矩阵。


 

给定二阶导数连续的函数,海森矩阵的行列式,可用于分辨 f 的临界点是属于鞍点还是极值点。

对于 f 的临界点 (x0,y0) 一点,有  \frac{\partial f(x_0, y_0)}{\partial x} = \frac{\partial f(x_0, y_0)}{\partial y} = 0,然而凭一阶导数不能判断它是鞍点、局部极大点还是局部极小点。海森矩阵可能解答这个问题。

H = \begin{vmatrix}\frac{\partial^2 f}{\partial x^2} & \frac{\partial^2 f}{\partial x\,\partial y} \\ \\\frac{\partial^2 f}{\partial y\,\partial x} & \frac{\partial^2 f}{\partial y^2} \end{vmatrix} = \frac{\partial^2 f}{\partial x^2} \frac{\partial^2 f}{\partial y^2} - (\frac{\partial^2 f}{\partial y\,\partial x})^2

    H > 0 :若\frac{\partial^2 f}{\partial x^2} > 0,则(x0,y0)是局部极小点;若\frac{\partial^2 f}{\partial x^2} < 0,则(x0,y0)是局部极大点。
    H < 0 :(x0,y0)是鞍点。
    H = 0 :二阶导数无法判断该临界点的性质,得从更高阶的导数以泰勒公式考虑。

 

MATLAB中获得Hessian矩阵:

The Hessian of a scalar valued function f:Rn

分享到:
评论

相关推荐

    机器视觉-opencv-图像增强(海森矩阵)

    本主题将聚焦于图像增强的一个特定方面——海森矩阵(Hessian Matrix),这是一种在图像处理中用于检测图像特征,尤其是边缘和纹理的重要工具。 海森矩阵来源于微分几何,它表示一个函数的二阶偏导数。在二维图像上...

    海森矩阵行列式值源码

    海森矩阵(Hessian Matrix)在图像处理和计算机视觉领域中扮演着重要角色,尤其在特征检测、边缘检测和纹理分析等任务中。海森矩阵是二阶偏导数的矩阵表示,它提供了函数在某一点处的曲率信息。在本话题中,我们将...

    【Math】常见的几种最优化方法.pdf

    **牛顿法**(Newton's Method)是一种更高级的最优化方法,它利用了二阶导数的信息(即海森矩阵Hessian Matrix)。牛顿法的基本思想是在每一步都使用二次逼近,相比于仅使用一阶导数信息的梯度下降法,牛顿法通常...

    Hessian矩阵与多元函数极值Second-order sufficient optimality conditions.pdf

    一、海森矩阵(Hessian Matrix)的概念 海森矩阵是多元函数二阶偏导数所构成的方阵,是多元函数微分学中非常重要的工具。对于一个定义在实数域R^n上的二次可微函数f: R^n → R,函数在某点x处的海森矩阵H(x)由以下...

    基于图像增强的改进多尺度Hessian矩阵用于冠状动脉造影

    在这篇文章中,作者探讨了改进的多尺度Hessian矩阵在冠状动脉造影图像增强方面的应用。冠状动脉造影是一种用于诊断冠状动脉粥样硬化性心脏病(CHD)的有效方法,在临床中被广泛使用,被认为是诊断冠心病的“金标准”...

    quasi-Newton-BFGS.rar_Quasi-Newton_optimization_quasi newton _re

    牛顿法利用目标函数的二阶导数,即海森矩阵(Hessian matrix),来迭代寻找极小值点。然而,计算海森矩阵在高维问题中可能非常耗时且计算量大。拟牛顿法则通过构建一个近似海森矩阵来简化这个过程,使得我们不需要...

    Matrix Calculus Operations矩阵微分

    在矩阵微分的背景下,泰勒展开可以帮助我们以矩阵形式表达函数在某点的导数,包括梯度和海森矩阵(Hessian matrix,即多元函数的二阶导数)。梯度是一个向量,其分量为函数相对于各个变量的偏导数;海森矩阵是一个...

    feixianxingfangchengzujiesuan.rar_拟牛顿迭代法_数值计算方法_牛顿线性迭代_牛顿迭代_牛顿迭代

    拟牛顿法是对经典牛顿迭代法的一种拓展,通过近似海森矩阵(Hessian matrix)来减少计算复杂度,同时保持快速收敛的特性。 "牛顿迭代法"是一种基于切线搜索的迭代方法,用于寻找非线性函数的零点。在每一步迭代中,...

    methods for nonlinear least square problems

    牛顿法是一种更高级的算法,它利用了目标函数的二阶导数信息,即海森矩阵(Hessian matrix),来寻找函数的极小点。与梯度法不同的是,牛顿法不仅考虑了梯度信息,还包括了曲率信息,这使得牛顿法能够在更复杂的优化...

    old and new matrix algebra useful for statistics

    海森矩阵(Hessian matrix)是二阶导数的集合,用于描述函数的曲率,常用于优化问题中的二阶条件判断。 Minka的论文鼓励读者亲手验证每个公式并做实例练习,因为这是高级材料,基础可以参考Searle (1982) 的工作。...

    最优化求二维线形函数极小值的两种方法

    牛顿法是一种二阶优化方法,它不仅考虑梯度,还考虑了函数的海森矩阵(Hessian Matrix)。在给定的代码中,`nwfun.m` 定义了目标函数、梯度和海森矩阵。主程序 `nwfun2.m` 使用牛顿法迭代求解。 - 第一部分 `(i)`,...

    牛顿拉普森_NR、亚像素搜索

    然后,我们计算误差函数的雅可比矩阵(Jacobian matrix)和海森矩阵(Hessian matrix)。 雅可比矩阵\( J \)包含了误差函数对各个变量的一阶偏导数,它描述了误差函数的局部变化情况。海森矩阵\( H \)则是雅可比...

    基于matlab实现的有限记忆算法,用于处理大规模算法,算法原理为把不断迭代的牛顿矩阵分解并部分抵消达到减少运算量的目的.rar

    牛顿法是一种求解非线性方程组的迭代方法,通常涉及计算和求解目标函数的雅可比矩阵(Jacobian Matrix)或海森矩阵(Hessian Matrix)。在大规模问题中,这些矩阵的维度可能非常高,导致计算和存储成本巨大。有限...

    最速下降法和修正牛顿法matlab.zip

    **修正牛顿法** 相比最速下降法,能够更快地收敛,因为它不仅考虑了梯度,还考虑了函数的二阶导数,即海森矩阵(Hessian Matrix)。修正牛顿法的基本思想是通过近似二阶泰勒展开,找出函数的最小值点。在实际应用中...

    opencv激光中心线的提取

    海森矩阵(Hessian矩阵)是图像处理中的一种矩阵,用于描述图像局部的二阶导数信息,即图像的曲率。在边缘检测和特征检测中,海森矩阵常常被用来确定图像的局部最大值和最小值,因为这些点通常对应着图像的边缘或...

    BFGS算法的最优化问题及在MATLAB中的实现.pdf

    拟牛顿法最大的特点在于它能够通过近似计算来避免计算海森矩阵(Hessian matrix),这是一种二阶导数矩阵,对于大规模问题而言,计算代价非常高。 BFGS算法的核心思想是在当前迭代点估计出目标函数的二阶导数(海森...

    最优控制与最优理论考试题

    - 对于具有二阶偏导数的函数 \( f(x) \),其海森矩阵(Hessian matrix)正定是该函数为凸函数的充要条件(选项A)。这意味着函数在局部最小点处的海森矩阵是正定的,而在全局最小点则可能是半正定的。 3. 非线性...

    最速下降法与牛顿法_优化_最速下降法_

    牛顿法(Newton's Method)则更为复杂,它利用了函数的二阶导数信息,即海森矩阵(Hessian Matrix),以提供更精确的搜索方向。牛顿法的迭代公式为: \[\theta_{k+1} = \theta_k - H_k^{-1} \nabla f(\theta_k)\] ...

    最速下降法.docx

    值得注意的是,最速下降法在计算步长 \( \alpha_k \) 时,有时会利用海森矩阵(Hessian Matrix)\( G \) 的信息。海森矩阵是函数的二阶导数矩阵,它包含了函数曲面的曲率信息。如果海森矩阵可用且是正定的,那么可以...

Global site tag (gtag.js) - Google Analytics