`

梯度下降算法变化率曲线

 
阅读更多

为了学习matplotlib 画图,同时也为了看看各种优化算法下变化率曲线

先看最好的RMSprop 算法(350次)

 

import math
import matplotlib  #导入matplotlib库
from numpy import *
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.ticker import MultipleLocator, FuncFormatter

def f(x):
        return x**3-x+x**2

def derivative_f(x):
         return 3*(x**2)+2*x-1


x=0.0
y=0.0
learning_rate = 0.001
gradient=0
e=0.00000001
sum = 0.0

d = 0.9

Egt=0
Edt = 0


delta = 0


xx=[]
dd=[]
gg=[]
yy=[]
for i in range(100000):

    print('x = {:6f}, f(x) = {:6f},gradient={:6f}'.format(x,y,gradient))
    if(abs(gradient)>0.000001 and (abs(gradient)<0.00001)):
        print("break at "+str(i))
        break
    else:
        xx.append(x)

        gradient = derivative_f(x)

        gg.append(gradient)

        Egt = d * Egt + (1-d)*(gradient**2)

        delta = learning_rate*gradient/math.sqrt(Egt + e)

        dd.append(delta)
        x=x-delta

        y=f(x)

        yy.append(y)



fig = plt.figure()

ax1 = fig.add_subplot(111)
ax1.plot(xx,dd, label='YR', color='red')



ax2 = ax1.twinx()  # this is the important function
ax2.plot(xx, gg,label='YL', color='blue')


plt.savefig('latex-rms.png', dpi=75)
plt.show()


 

 

蓝色是导数变化情况,红色的差值的变化率,注意红色的有一段平滑的阶段,刚好是learning_rate

 

 

 

再看看 ADADELTA (760次)



 


红色的是来回的碗口,说明动量的此起彼伏

 

 

再看看ADAGRAD (1454)

 



 

 再看adam(861次)



 

 

最后再看看原生的 (3018次)

 



 

 

  • 大小: 33.1 KB
  • 大小: 41.2 KB
  • 大小: 31.8 KB
  • 大小: 32.7 KB
  • 大小: 26 KB
分享到:
评论

相关推荐

    pytorch深度学习梯度下降算法

    - **梯度的概念**:梯度是指损失函数在某一点的变化率,即损失函数关于参数的偏导数。梯度的方向指示了损失函数增长最快的方向,因此,沿着梯度的负方向更新参数,可以使得损失函数逐渐减小。 - **梯度下降过程**: ...

    梯度下降法matlab程序

    梯度下降法是一种广泛应用在机器学习和优化问题中的数值优化算法,它主要用于寻找函数的局部最小值。在MATLAB环境中,实现梯度下降法可以帮助我们解决各种数学模型的求解问题,例如线性回归、逻辑回归、神经网络的...

    matlab梯度下降法的拟合曲线介绍.docx

    梯度下降法是一种广泛应用于机器学习和数据科学领域的优化算法,主要用于求解最小化问题,尤其是在拟合曲线过程中发挥着重要作用。MATLAB作为一种强大的数值计算软件,提供了灵活多样的工具支持这种算法的应用。本文...

    python梯度下降算法的实现

    梯度是函数在当前点的局部变化率,指向函数增长最快的方向。在Python中,可以使用numpy库中的`gradient`函数或者手动计算偏导数。 3. **批量梯度下降(Batch Gradient Descent)**:在这种方法中,算法使用所有训练...

    path_smoother-master_基于梯度下降法的弯道路径优化_

    标题中的“path_smoother-master_基于梯度下降法的弯道路径优化_”表明我们关注的是一个关于路径平滑优化的项目,它特别针对弯道场景,利用了梯度下降算法来改善路径的质量。这个项目可能是一个开源库或代码实现,...

    《机器学习》算法实例-逻辑回归算法-梯度上升算法

    《机器学习》算法实例——逻辑回归与梯度上升算法 逻辑回归(Logistic Regression)是机器学习中一种广泛应用的分类算法。它虽然名字中含有“回归”,但实际上是一种分类方法,尤其适用于处理二分类问题。在本实例...

    PyTorch: 梯度下降及反向传播的实例详解

    在示例中,通过遍历不同的权重 \( w \),计算对应损失,并绘制损失随权重变化的曲线,可以看出最小损失对应的最优 \( w \) 值。 然而,实际操作中,我们不会像示例那样枚举所有可能的 \( w \) 值。相反,我们采用...

    Matlab 梯度下降softmax回归.zip

    总结来说,"Matlab 梯度下降softmax回归.zip"是一个用于教学的资源包,它涵盖了梯度下降优化算法和Softmax回归模型的实现,适合本科和硕士级别的学生进行教研学习。通过这个包,学习者能够掌握如何在Matlab环境中...

    机器学习 之 梯度下降

    在完成梯度下降的训练后,可以绘制损失函数随迭代次数的变化曲线,以观察算法是否有效收敛。同时,通过绘制线性回归的拟合曲线,可以直观地看到模型对数据的拟合效果。在这个例子中,数据来自文件`linear_regression...

    华为认证HCIP-AI测试卷+答案.docx

    1. **梯度下降算法**:梯度下降是一种优化算法,用于寻找代价函数的最小值。它的收敛点并不直接取决于代价函数本身,而是由初始点、学习率和迭代过程决定。如果代价函数具有多个局部最小值,梯度下降可能会收敛到一...

    BP神经网络算法与拟合曲线

    本篇文章着重探讨如何用C语言实现BP神经网络算法,以替代MATLAB库函数进行曲线拟合,从而提高读者对算法原理的理解。 BP网络由输入层、隐藏层和输出层构成,其中隐藏层可以有多个。每个神经元都具有加权求和和非...

    tidufa.rar_optimal gradient_梯度最优化

    压缩包中的"梯度.fig"文件可能是使用某种图形软件(如MATLAB或Octave)绘制的梯度优化过程的图形表示,可能包含了损失函数随时间变化的曲线,或者是参数更新轨迹图,帮助我们直观理解算法的运行情况。 总的来说,这...

    LMS.rar_LMS算法仿真_LMS算法特性_收敛特性曲线_步长对LMS_误差收敛曲线

    曲线下降得越快,表示收敛性能越好。 - **稳态误差曲线**:表示在算法达到稳定状态后,误差的波动情况。 5. **步长对LMS的影响**: - **步长选择**:步长决定了算法的收敛速度和稳态误差。大步长可能导致快速收敛...

    LMS算法最速下降法,和迭代次数误差分析

    LMS算法采用最速下降法来更新模型参数,每次迭代中,参数更新的方向是目标函数梯度的反方向,步长由学习率控制。学习率的选择至关重要,过大可能导致震荡不收敛,过小则会使得收敛速度变慢。** **在LMS算法的实施...

    优化算法汇总与对比分析.rar

    1. **梯度下降法(Gradient Descent)**:这是最基础的优化算法,通过沿着梯度的反方向更新权重,以减小损失函数。但是,梯度下降法通常需要全局视野,因此在大型数据集上效率较低。 2. **随机梯度下降法...

    17.4.13(多元梯度,特征缩放,学习率调整)1

    在调试梯度下降算法时,我们需要观察损失函数随迭代次数的变化曲线。理想的曲线应该呈现出随着迭代次数增加,损失函数逐渐下降的趋势。如果损失函数不下降或下降过慢,可能是学习率设置不当。过大的学习率可能导致...

    自适应LMS算法仿真 Matlab

    LMS算法基于梯度下降法,目标是使滤波器的输出误差平方和达到最小。它的核心思想是通过迭代更新滤波器的权重向量,以逐步减小预测误差。LMS算法的更新公式为: \[ w(n+1) = w(n) + \mu e(n)x(n)^T \] 这里,\( w(n...

    MATLAB优化算法案例分析与应用 源代码

    同时,这些实例也会教你如何可视化结果,比如绘制迭代路径图和目标函数值的变化曲线,以直观地评估算法的性能。 此外,你还可以通过对比不同优化算法的应用,了解它们在实际问题中的表现差异。例如,非线性规划可能...

Global site tag (gtag.js) - Google Analytics