今天在测试卷积训练程序的时候偶遇到这样的一个错误:
![9470f826de0b017cb09d374c9e221f6fa7a.jpg](https://oscimg.oschina.net/oscnet/9470f826de0b017cb09d374c9e221f6fa7a.jpg)
通过执行的细节我可以发现运行卡在了get_loss这个函数里,而关键在于y 与 y_的张量维度不一致导致的。其中一个是测试训练出来的结果张量,一个是标准答案张量。
究竟是怎么回事呢?我在网上搜索了一番后发现是交叉熵函数的使用有问题
书上的是:
sparse_softmax_croos_entropy_with_logits
该函数要求的是labels的维度应该比logist的维度少一维,但是我这里没有所以报错。
更改呢》因为代码比较冗余,所以没有更改维度,而是发现了一个要求比较宽松的交叉熵函数:
softmax_croos_entropy_with_logits
对,你没有看错,去掉那个sparse之后就没有问题了
![b0f75e58ce1895c3e1a01a0952a45e801ed.jpg](https://oscimg.oschina.net/oscnet/b0f75e58ce1895c3e1a01a0952a45e801ed.jpg)
程序就可以运行了。但是你们会发现为啥会loss突然增加这么多呢?
后来发现是我的学习率设置的过大0.8,而发生了梯度的变化巨大,使得结果非常不理想。最后想学习率改为0.001之后,和hi嘿嘿IE,看看成果:
![4fa960aa8404134e0fdd9fcd821640c84db.jpg](https://oscimg.oschina.net/oscnet/4fa960aa8404134e0fdd9fcd821640c84db.jpg)
单个GPU运行的速度还是比CPU快哦。
后面我们来试试对数据集的预处理再传入训练函数。
转载于:https://my.oschina.net/u/3770644/blog/3044190
分享到:
相关推荐
论文研究-极大熵函数的梯度收敛性.pdf, 本文讨论了极大炕函数的梯度收敛性.
二进熵函数是信息论中的一个基础概念,它在数据压缩、编码理论、通信系统以及机器学习等领域都有着广泛的应用。二进熵函数曲线的绘制可以帮助我们直观地理解这个概念,进一步掌握信息处理中的基本原理。 首先,我们...
绘制二进制熵函数曲线,且包含三进制的熵函数matlab图。
本文提出了信息集,该信息集源于应用Hanman-Anirban熵函数表示不确定性的模糊集。 信息集的每个元素称为信息值,它是信息源值及其隶属函数值的乘积。 修改信息集的Hanman过滤器是通过使用过滤功能得出的。 建立了...
信息论编码作业 绘制二次熵函数曲线.xls
这个压缩包“各种熵函数及其论文.rar”提供了关于熵计算的各种方法的源代码和相关论文,这对于研究和理解这些复杂概念非常有帮助。 1. **近似熵(Approximate Entropy, ApEn)**:近似熵是一种度量序列复杂性和自相似...
- 交叉熵函数和最大似然函数的关系和区别 - HMM、MEMM和CRF的对比 - SVM和逻辑回归的区别 - CRF的损失函数形式以及LSTM+CRF的解释 2. NLP高频问题 - Word2vec和TF-IDF在相似度计算的区别 - Word2vec和NNLM的...
通过广义熵函数最小化的稀疏信号恢复 作者:黄帅,约翰·霍普金斯大学。 电子邮件: Last change: 12/29/2018 Change log: v1.0 (SH) - (03/30/2017) v1.1 (SH) - (01/24/2018) v2.0 (SH) - (12/29/2018) v2.1 (SH) ...
样本熵的matlab代码,函数的形式,调用时对函数参数赋值即可
设{Xi,i≥1}为随机变量序列,f(x)为公共未知的概率密度函数,基于样本X1,X2,…,Xn估计熵函数H(f)=-∫f(x)logf(x)dx,其中x∈Rd。该文在一定条件下获得了H(f)的直方图估计Hn=-∫fn(x)≥anfn(x)logfn(x)dx的强相合...
图像的模糊程度一般用高斯模糊来建模,所以模糊估计的问题就转化为确定高斯点扩散函数(PSF)的问题。 熵函数法认为图像的熵越大,图像越清晰
采用熵函数算法的船舶电力系统脆性评价体系研究.pdf
下面我们将深入探讨MATLAB代码计算模糊熵函数的相关知识。 1. **模糊系统与熵** 模糊系统是用于处理不精确、模糊或部分不确定信息的数学工具。它基于模糊逻辑,可以更好地模拟人类的思考过程。而熵是信息论中的...
信息论与编码实验
画出二进制信息熵函数的图形,由此观察归纳总结数学结论,可验证所学《信息论与编码》理论知识
仅考虑Gibbons-Hawking-York(GHY)曲面项来定义极值近地平线黑洞解的熵函数,可以观察到,该函数的极值化导致了水平熵的精确值。 该分析再次支持先前的说法,即重力作用具有“全息”性质-表面术语包含大量信息。
"信息熵函数的计算" 信息熵函数的计算是信息论的基础概念之一,用于衡量信息的不确定性。该实验报告的主要目的是使用 C 语言编写程序,计算信息熵、条件熵、联合熵,并通过多次运行结果,验证程序的正确性。 一、...
本文应用熵函数定量的对唐山矿西南区9号煤层的构造复杂程度进行了评价,所得的熵值越大,构造越简单;熵值越小,构造越复杂。评价结果与分形分维对比表明:由于对不同类型的断层分别统计和计算,以及添加了褶曲这一重要...
基于优化二维熵函数的快速分割算法是一种高效且精确的图像分割方法。在这个算法中,熵作为信息理论中的一个核心概念,被用来度量图像区域的不确定性或信息含量。优化的二维熵函数能够更好地反映图像的复杂性和边缘...
实验中,使用Matlab编写代码模拟二源信源熵函数曲线,通过改变概率p的值,计算对应的熵h,并绘制曲线。例如: ```matlab p = 0.0000001:0.0001:1; h = -p.*log2(p)-(1-p).*log2(1-p); plot(p,h); xlabel('p'); ...