- 浏览: 230544 次
- 性别:
- 来自: 宝仔的奇幻城堡
文章分类
最新评论
-
HiccupHiccup:
请问楼主 误差计算用的什么方法呢?
BP神经网络的Java实现 -
杀盗非杀人:
运行不了 而且还出现异常
使用C#和DirectX实时监控麦克风输入音量 -
cnmyh:
按照动量算法公式Δx(k+1)=ηΔx(k)+α(1-η)∂E ...
BP神经网络的Java实现 -
cc2012linya:
不错,先研究研究,谢LZ
使用C#和DirectX实时监控麦克风输入音量 -
zhc0822:
Albert_ygy 写道楼主你好,看完你的代码,我有两个疑问 ...
BP神经网络的Java实现
课程作业要求实现一个BPNN。这次尝试使用Java实现了一个。现共享之。版权属于大家。关于BPNN的原理,就不赘述了。
下面是BPNN的实现代码。类名为BP。
package ml; import java.util.Random; /** * BPNN. * * @author RenaQiu * */ public class BP { /** * input vector. */ private final double[] input; /** * hidden layer. */ private final double[] hidden; /** * output layer. */ private final double[] output; /** * target. */ private final double[] target; /** * delta vector of the hidden layer . */ private final double[] hidDelta; /** * output layer of the output layer. */ private final double[] optDelta; /** * learning rate. */ private final double eta; /** * momentum. */ private final double momentum; /** * weight matrix from input layer to hidden layer. */ private final double[][] iptHidWeights; /** * weight matrix from hidden layer to output layer. */ private final double[][] hidOptWeights; /** * previous weight update. */ private final double[][] iptHidPrevUptWeights; /** * previous weight update. */ private final double[][] hidOptPrevUptWeights; public double optErrSum = 0d; public double hidErrSum = 0d; private final Random random; /** * Constructor. * <p> * <strong>Note:</strong> The capacity of each layer will be the parameter * plus 1. The additional unit is used for smoothness. * </p> * * @param inputSize * @param hiddenSize * @param outputSize * @param eta * @param momentum * @param epoch */ public BP(int inputSize, int hiddenSize, int outputSize, double eta, double momentum) { input = new double[inputSize + 1]; hidden = new double[hiddenSize + 1]; output = new double[outputSize + 1]; target = new double[outputSize + 1]; hidDelta = new double[hiddenSize + 1]; optDelta = new double[outputSize + 1]; iptHidWeights = new double[inputSize + 1][hiddenSize + 1]; hidOptWeights = new double[hiddenSize + 1][outputSize + 1]; random = new Random(19881211); randomizeWeights(iptHidWeights); randomizeWeights(hidOptWeights); iptHidPrevUptWeights = new double[inputSize + 1][hiddenSize + 1]; hidOptPrevUptWeights = new double[hiddenSize + 1][outputSize + 1]; this.eta = eta; this.momentum = momentum; } private void randomizeWeights(double[][] matrix) { for (int i = 0, len = matrix.length; i != len; i++) for (int j = 0, len2 = matrix[i].length; j != len2; j++) { double real = random.nextDouble(); matrix[i][j] = random.nextDouble() > 0.5 ? real : -real; } } /** * Constructor with default eta = 0.25 and momentum = 0.3. * * @param inputSize * @param hiddenSize * @param outputSize * @param epoch */ public BP(int inputSize, int hiddenSize, int outputSize) { this(inputSize, hiddenSize, outputSize, 0.25, 0.9); } /** * Entry method. The train data should be a one-dim vector. * * @param trainData * @param target */ public void train(double[] trainData, double[] target) { loadInput(trainData); loadTarget(target); forward(); calculateDelta(); adjustWeight(); } /** * Test the BPNN. * * @param inData * @return */ public double[] test(double[] inData) { if (inData.length != input.length - 1) { throw new IllegalArgumentException("Size Do Not Match."); } System.arraycopy(inData, 0, input, 1, inData.length); forward(); return getNetworkOutput(); } /** * Return the output layer. * * @return */ private double[] getNetworkOutput() { int len = output.length; double[] temp = new double[len - 1]; for (int i = 1; i != len; i++) temp[i - 1] = output[i]; return temp; } /** * Load the target data. * * @param arg */ private void loadTarget(double[] arg) { if (arg.length != target.length - 1) { throw new IllegalArgumentException("Size Do Not Match."); } System.arraycopy(arg, 0, target, 1, arg.length); } /** * Load the training data. * * @param inData */ private void loadInput(double[] inData) { if (inData.length != input.length - 1) { throw new IllegalArgumentException("Size Do Not Match."); } System.arraycopy(inData, 0, input, 1, inData.length); } /** * Forward. * * @param layer0 * @param layer1 * @param weight */ private void forward(double[] layer0, double[] layer1, double[][] weight) { // threshold unit. layer0[0] = 1.0; for (int j = 1, len = layer1.length; j != len; ++j) { double sum = 0; for (int i = 0, len2 = layer0.length; i != len2; ++i) sum += weight[i][j] * layer0[i]; layer1[j] = sigmoid(sum); } } /** * Forward. */ private void forward() { forward(input, hidden, iptHidWeights); forward(hidden, output, hidOptWeights); } /** * Calculate output error. */ private void outputErr() { double errSum = 0; for (int idx = 1, len = optDelta.length; idx != len; ++idx) { double o = output[idx]; optDelta[idx] = o * (1d - o) * (target[idx] - o); errSum += Math.abs(optDelta[idx]); } optErrSum = errSum; } /** * Calculate hidden errors. */ private void hiddenErr() { double errSum = 0; for (int j = 1, len = hidDelta.length; j != len; ++j) { double o = hidden[j]; double sum = 0; for (int k = 1, len2 = optDelta.length; k != len2; ++k) sum += hidOptWeights[j][k] * optDelta[k]; hidDelta[j] = o * (1d - o) * sum; errSum += Math.abs(hidDelta[j]); } hidErrSum = errSum; } /** * Calculate errors of all layers. */ private void calculateDelta() { outputErr(); hiddenErr(); } /** * Adjust the weight matrix. * * @param delta * @param layer * @param weight * @param prevWeight */ private void adjustWeight(double[] delta, double[] layer, double[][] weight, double[][] prevWeight) { layer[0] = 1; for (int i = 1, len = delta.length; i != len; ++i) { for (int j = 0, len2 = layer.length; j != len2; ++j) { double newVal = momentum * prevWeight[j][i] + eta * delta[i] * layer[j]; weight[j][i] += newVal; prevWeight[j][i] = newVal; } } } /** * Adjust all weight matrices. */ private void adjustWeight() { adjustWeight(optDelta, hidden, hidOptWeights, hidOptPrevUptWeights); adjustWeight(hidDelta, input, iptHidWeights, iptHidPrevUptWeights); } /** * Sigmoid. * * @param val * @return */ private double sigmoid(double val) { return 1d / (1d + Math.exp(-val)); } }
为了验证正确性,我写了一个测试用例,目的是对于任意的整数(int型),BPNN在经过训练之后,能够准确地判断出它是奇数还是偶数,正数还是负数。首先对于训练的样本(是随机生成的数字),将它转化为一个32位的向量,向量的每个分量就是其二进制形式对应的位上的0或1。将目标输出视作一个4维的向量,[1,0,0,0]代表正奇数,[0,1,0,0]代表正偶数,[0,0,1,0]代表负奇数,[0,0,0,1]代表负偶数。
训练样本为1000个,学习200次。
package ml; import java.io.IOException; import java.util.ArrayList; import java.util.List; import java.util.Random; public class Test { /** * @param args * @throws IOException */ public static void main(String[] args) throws IOException { BP bp = new BP(32, 15, 4); Random random = new Random(); List<Integer> list = new ArrayList<Integer>(); for (int i = 0; i != 1000; i++) { int value = random.nextInt(); list.add(value); } for (int i = 0; i != 200; i++) { for (int value : list) { double[] real = new double[4]; if (value >= 0) if ((value & 1) == 1) real[0] = 1; else real[1] = 1; else if ((value & 1) == 1) real[2] = 1; else real[3] = 1; double[] binary = new double[32]; int index = 31; do { binary[index--] = (value & 1); value >>>= 1; } while (value != 0); bp.train(binary, real); } } System.out.println("训练完毕,下面请输入一个任意数字,神经网络将自动判断它是正数还是复数,奇数还是偶数。"); while (true) { byte[] input = new byte[10]; System.in.read(input); Integer value = Integer.parseInt(new String(input).trim()); int rawVal = value; double[] binary = new double[32]; int index = 31; do { binary[index--] = (value & 1); value >>>= 1; } while (value != 0); double[] result = bp.test(binary); double max = -Integer.MIN_VALUE; int idx = -1; for (int i = 0; i != result.length; i++) { if (result[i] > max) { max = result[i]; idx = i; } } switch (idx) { case 0: System.out.format("%d是一个正奇数\n", rawVal); break; case 1: System.out.format("%d是一个正偶数\n", rawVal); break; case 2: System.out.format("%d是一个负奇数\n", rawVal); break; case 3: System.out.format("%d是一个负偶数\n", rawVal); break; } } } }
运行结果截图如下:
这个测试的例子非常简单。大家可以根据自己的需要去使用BP这个类。
评论
17 楼
zhc0822
2012-10-28
fantaosong 写道
fantaosong 写道
zhc0822 写道
wondery 写道
fantaosong 写道
对算法中的两个函数不解,outputErr();hiddenErr();他们是不是做一个错误反馈处理?o * (1d - o) * (target[idx] - o),为什么这个处理要这样做?对forward中的for循环最后一句不解,为什么还要做一个处理呢?新手,望赐教!
for里面最后那句可以删掉,这两个函数的最后那句也可以删掉,没用上。
forward中for最后的语句是不能删除的亲。outputErr和hiddenErr最后设置的值可以用于打印查看,最好保留。
我想做一个计算得分的程序:我有几个参数,但是这几个参数在得分中的权重不确定,然后我想得到这些参数,用神经网络可以实现吗?
貌似forward中for最后的语句是不能删,但是如果数比较大的情况下都变成1了,我把你的程序改了一下用到我要解决的问题上就不行了,哎,晕死了!!!
用决策树就行了。
16 楼
fantaosong
2012-10-26
fantaosong 写道
zhc0822 写道
wondery 写道
fantaosong 写道
对算法中的两个函数不解,outputErr();hiddenErr();他们是不是做一个错误反馈处理?o * (1d - o) * (target[idx] - o),为什么这个处理要这样做?对forward中的for循环最后一句不解,为什么还要做一个处理呢?新手,望赐教!
for里面最后那句可以删掉,这两个函数的最后那句也可以删掉,没用上。
forward中for最后的语句是不能删除的亲。outputErr和hiddenErr最后设置的值可以用于打印查看,最好保留。
我想做一个计算得分的程序:我有几个参数,但是这几个参数在得分中的权重不确定,然后我想得到这些参数,用神经网络可以实现吗?
貌似forward中for最后的语句是不能删,但是如果数比较大的情况下都变成1了,我把你的程序改了一下用到我要解决的问题上就不行了,哎,晕死了!!!
15 楼
fantaosong
2012-10-26
zhc0822 写道
wondery 写道
fantaosong 写道
对算法中的两个函数不解,outputErr();hiddenErr();他们是不是做一个错误反馈处理?o * (1d - o) * (target[idx] - o),为什么这个处理要这样做?对forward中的for循环最后一句不解,为什么还要做一个处理呢?新手,望赐教!
for里面最后那句可以删掉,这两个函数的最后那句也可以删掉,没用上。
forward中for最后的语句是不能删除的亲。outputErr和hiddenErr最后设置的值可以用于打印查看,最好保留。
我想做一个计算得分的程序:我有几个参数,但是这几个参数在得分中的权重不确定,然后我想得到这些参数,用神经网络可以实现吗?
14 楼
zhc0822
2012-10-23
wondery 写道
fantaosong 写道
对算法中的两个函数不解,outputErr();hiddenErr();他们是不是做一个错误反馈处理?o * (1d - o) * (target[idx] - o),为什么这个处理要这样做?对forward中的for循环最后一句不解,为什么还要做一个处理呢?新手,望赐教!
for里面最后那句可以删掉,这两个函数的最后那句也可以删掉,没用上。
forward中for最后的语句是不能删除的亲。outputErr和hiddenErr最后设置的值可以用于打印查看,最好保留。
13 楼
wondery
2012-10-23
fantaosong 写道
对算法中的两个函数不解,outputErr();hiddenErr();他们是不是做一个错误反馈处理?o * (1d - o) * (target[idx] - o),为什么这个处理要这样做?对forward中的for循环最后一句不解,为什么还要做一个处理呢?新手,望赐教!
for里面最后那句可以删掉,这两个函数的最后那句也可以删掉,没用上。
12 楼
zhc0822
2012-10-22
fantaosong 写道
对算法中的两个函数不解,outputErr();hiddenErr();他们是不是做一个错误反馈处理?o * (1d - o) * (target[idx] - o),为什么这个处理要这样做?对forward中的for循环最后一句不解,为什么还要做一个处理呢?新手,望赐教!
建议看一下BP神经网络的原理。
11 楼
fantaosong
2012-10-22
对算法中的两个函数不解,outputErr();hiddenErr();他们是不是做一个错误反馈处理?o * (1d - o) * (target[idx] - o),为什么这个处理要这样做?对forward中的for循环最后一句不解,为什么还要做一个处理呢?新手,望赐教!
10 楼
独爱Java
2012-05-08
楼主有没有对Hopfield神经网络的java实现代码呢。嘿嘿
9 楼
zhc0822
2012-04-15
yangliuy 写道
在不?你在帮女朋友做文本聚类那个作业不?特征向量矩阵的降维你用什么算法做的?选了多少个特征词?
他自己做的。
8 楼
yangliuy
2012-04-13
在不?你在帮女朋友做文本聚类那个作业不?特征向量矩阵的降维你用什么算法做的?选了多少个特征词?
7 楼
zhc0822
2012-03-30
yangliuy 写道
yangliuy 写道
zhc0822 写道
yangliuy 写道
zhc0822 写道
yangliuy 写道
是RenaQiu吗?这个bp程序写的不错啊,赞,我在itye看到两个你的博客,http://fantasticinblur.iteye.com/和http://renaqiu.iteye.com/都是你的博客?
renaqiu.iteye是我女朋友的
呵呵,我猜也是,帮女朋友做作业,你这BF当得太称职了。你现在也在软微吗?
BTW 我女朋友也是武大的
我在武大...她在北软...你和她是同学吗?
对啊,我也在北软,你这个BP程序做newsgroup文本分类好用吗?好像准确率有点低啊
在吗?用贝叶斯和KNN都可以做到80%以上,你这个程序的分类准确率只有40%多吧,是预处理的问题还是BP本身不适合文本分类?
BP已经是一种比较古老的模型了。神经网络这十几年来发展得很一般,应用领域有限。
试试KNN和SVM。Bayes的效果这么好倒是出乎我的意料。
刚才吃午饭去了。
6 楼
yangliuy
2012-03-30
yangliuy 写道
zhc0822 写道
yangliuy 写道
zhc0822 写道
yangliuy 写道
是RenaQiu吗?这个bp程序写的不错啊,赞,我在itye看到两个你的博客,http://fantasticinblur.iteye.com/和http://renaqiu.iteye.com/都是你的博客?
renaqiu.iteye是我女朋友的
呵呵,我猜也是,帮女朋友做作业,你这BF当得太称职了。你现在也在软微吗?
BTW 我女朋友也是武大的
我在武大...她在北软...你和她是同学吗?
对啊,我也在北软,你这个BP程序做newsgroup文本分类好用吗?好像准确率有点低啊
在吗?用贝叶斯和KNN都可以做到80%以上,你这个程序的分类准确率只有40%多吧,是预处理的问题还是BP本身不适合文本分类?
5 楼
yangliuy
2012-03-30
zhc0822 写道
yangliuy 写道
zhc0822 写道
yangliuy 写道
是RenaQiu吗?这个bp程序写的不错啊,赞,我在itye看到两个你的博客,http://fantasticinblur.iteye.com/和http://renaqiu.iteye.com/都是你的博客?
renaqiu.iteye是我女朋友的
呵呵,我猜也是,帮女朋友做作业,你这BF当得太称职了。你现在也在软微吗?
BTW 我女朋友也是武大的
我在武大...她在北软...你和她是同学吗?
对啊,我也在北软,你这个BP程序做newsgroup文本分类好用吗?好像准确率有点低啊
4 楼
zhc0822
2012-03-30
yangliuy 写道
zhc0822 写道
yangliuy 写道
是RenaQiu吗?这个bp程序写的不错啊,赞,我在itye看到两个你的博客,http://fantasticinblur.iteye.com/和http://renaqiu.iteye.com/都是你的博客?
renaqiu.iteye是我女朋友的
呵呵,我猜也是,帮女朋友做作业,你这BF当得太称职了。你现在也在软微吗?
BTW 我女朋友也是武大的
我在武大...她在北软...你和她是同学吗?
3 楼
yangliuy
2012-03-30
zhc0822 写道
yangliuy 写道
是RenaQiu吗?这个bp程序写的不错啊,赞,我在itye看到两个你的博客,http://fantasticinblur.iteye.com/和http://renaqiu.iteye.com/都是你的博客?
renaqiu.iteye是我女朋友的
呵呵,我猜也是,帮女朋友做作业,你这BF当得太称职了。你现在也在软微吗?
BTW 我女朋友也是武大的
2 楼
zhc0822
2012-03-30
yangliuy 写道
是RenaQiu吗?这个bp程序写的不错啊,赞,我在itye看到两个你的博客,http://fantasticinblur.iteye.com/和http://renaqiu.iteye.com/都是你的博客?
renaqiu.iteye是我女朋友的
1 楼
yangliuy
2012-03-30
是RenaQiu吗?这个bp程序写的不错啊,赞,我在itye看到两个你的博客,http://fantasticinblur.iteye.com/和http://renaqiu.iteye.com/都是你的博客?
相关推荐
在Java中实现BP神经网络,我们需要了解以下几个关键概念和技术: 1. **神经元模型**:神经元是神经网络的基本构建单元,它接收输入信号,通过加权求和并加上偏置后,通过激活函数转化为输出信号。在BP网络中,常用...
总的来说,这个BP神经网络Java实现为理解和实践预测算法提供了一个基础平台,对于学习和研究神经网络算法的开发者来说,是一个有价值的资源。通过深入研究源代码,我们可以更深入地理解BP算法的工作原理,以及如何在...
总的来说,这个资源为理解BP神经网络的JAVA实现提供了一个完整的实例,包括数据读取、预处理、网络训练、模型保存和测试等关键步骤。通过阅读和运行这些代码,开发者不仅可以掌握BP神经网络的基本工作原理,还能了解...
**Java实现BP神经网络** 在Java中实现BP神经网络,你需要创建以下组件: 1. **神经元类(Neuron)** 表示单个神经元,包括权重、偏置和激活函数。 2. **层类(Layer)** 代表输入层、隐藏层和输出层,包含多个...
标题中的“JAVA实现bp神经网络”意味着我们将讨论如何使用Java编程语言来构建和应用一种称为反向传播(Backpropagation, BP)的神经网络模型。BP神经网络是一种经典的多层前馈神经网络,广泛用于非线性问题的建模和...
总之,BP神经网络的Java实现涉及神经网络结构的构建、数据的前向传播、误差的反向传播以及权重的更新。理解和实现这个过程需要扎实的数学基础,特别是微积分和概率论。同时,良好的编程技巧和调试能力也是必不可少的...
### 二、BP神经网络Java实现关键步骤 #### 1. 初始化网络结构 在BP神经网络中,需要定义网络的结构,包括输入层节点数、隐藏层节点数、输出层节点数以及学习率等参数。例如,在给定代码片段中,定义了输入层节点数...
标题中的"Ann.rar_ANN java实现_BP神经网络_BP神经网络 java_ann java"表明这是一个关于使用Java编程语言实现人工神经网络(Artificial Neural Network,简称ANN)的项目,特别是BP(Backpropagation)神经网络的...
总的来说,Java实现的BP神经网络算法是一个将理论知识转化为代码的过程,通过理解网络的工作原理和训练机制,我们可以创建出能够处理各种复杂问题的模型。在实际应用中,我们还需要考虑网络的泛化能力、过拟合问题...
### BP神经网络算法的Java实现解析 #### 一、引言 BP(Back Propagation)神经网络是一种前馈型神经网络,它通过反向传播算法进行权重调整来优化网络性能。BP神经网络广泛应用于模式识别、分类、预测等多个领域。...
BP神经网络java实现,含有多个类文件,简单易懂
Java编写的BP神经网络是一种基于反向传播算法的深度学习模型,主要用于解决非线性问题。BP,全称为Backpropagation,是人工神经网络中的一种训练方法,它通过不断调整权重来减小预测值与实际值之间的误差,从而提高...
这个Java实现的BP神经网络项目旨在提供一个学习和实践神经网络算法的平台,尤其是在解决非线性问题时表现出强大的能力。通过BP算法,神经网络能够通过不断调整权重来优化其对输入数据的拟合,从而实现对复杂函数的...
这个压缩包提供了一个完整的Java实现的多层BP神经网络示例,对于学习神经网络理论以及Java编程实践都是非常有价值的资源。用户可以通过阅读和运行代码来理解BP神经网络的工作原理,并且可以根据需求调整网络结构和...
BP算法的JAVA实现,BP神经网络的数学原理及其算法实现,实验使用IRIS数据集,BP神经网络,BP即Back Propagation的缩写,也就是反向传播的意思,顾名思义,将什么反向传播?文中将会解答。不仅如此,关于隐层的含义...
随机层BP神经网络的Java实现——BP神经网络
### BP神经网络算法的Java实现解析 #### 一、引言 BP神经网络,全称为反向传播(Back Propagation)神经网络,是多层前馈网络的一种,通过梯度下降法进行权重调整来实现误差的最小化。本文将深入探讨BP神经网络的...
在这个项目中,我们看到一个使用Java语言实现的BP神经网络,用于处理Iris数据集的分类问题。 Iris数据集是机器学习中的经典案例,由生物学家Ronald Fisher在1936年提出,包含了150个鸢尾花样本,每个样本有4个特征...
采用三层前馈BP神经网络实现标准人脸YALE数据库的识别,编程语言为C系列语言。 二、BP神经网络的结构和学习算法 实验中建议采用如下最简单的三层BP神经网络,输入层为 ,有n个神经元节点,输出层具有m个神经元,网络...