import numpy as np
''' 准备创建的BP神经网络一共有三层 第一层:输入层,有3个神经元 第二层:隐藏层,有4个神经元,每个神元有3个权值,因此总共有3*4,共12个权值 第三层:输出层,有1个神经元,有4*1,共4个权值 除输入层外,每一层神经网络都有一个权值矩阵,该层神经网络的上一层的神经元数量 为权值矩阵的行数,本层的神经元数量为权值矩阵的列数 ''' #输入数据 X = np.array([[1,0,0], [1,0,1], [1,1,0], [1,1,1]]) #标签 Y = np.array([[0,1,1,0]]) #权值初始化,取值范围-1到1 V = np.random.random((3,4))*2-1 W = np.random.random((4,1))*2-1 print('隐藏层权值的初始化值为:\n' , V) print('输出层权值的初始化值为:\n' , W) #学习率设置 lr = 0.11 #sigmoid函数 def sigmoid(x): return 1/(1+np.exp(-x)) #sigmoid函数的一阶导 def dsigmoid(x): return x*(1-x) #权值更新函数 def update(): global X,Y,W,V,lr L1 = sigmoid(np.dot(X,V))#隐藏层输出(4,4) L2 = sigmoid(np.dot(L1,W))#输出层输出(4,1) L2_delta = (Y.T - L2)*dsigmoid(L2) L1_delta = L2_delta.dot(W.T)*dsigmoid(L1) #W和V的改变值,即迭代的增量 W_C = lr*L1.T.dot(L2_delta) V_C = lr*X.T.dot(L1_delta) W = W + W_C V = V + V_C
for i in range(20000): update()#更新权值 if i%1000==0: L1 = sigmoid(np.dot(X,V))#隐藏层输出(4,4) L2 = sigmoid(np.dot(L1,W))#输出层输出(4,1) print(i , '次迭代后误差均值为:',np.mean(np.abs(Y.T-L2))) L1 = sigmoid(np.dot(X,V))#隐藏层输出(4,4) L2 = sigmoid(np.dot(L1,W))#输出层输出(4,1) print('迭代完后的输出结果为:\n' , L2) def judge(x): if x>=0.5: return 1 else: return 0 print('最终的预测结果为:') for i in map(judge,L2): print(i)
数据集为sklearn自带的手写数字图片 神经网络训练数据时,可以分批次训练,如要训练10000个数据,可以每次训练100个,总共训练100次
import numpy as np import pylab as pl from matplotlib import pyplot from sklearn.datasets import load_digits from sklearn.preprocessing import LabelBinarizer from sklearn.cross_validation import train_test_split #sigmoid函数 def sigmoid(x): return 1/(1+np.exp(-x)) #sigmoid函数的一阶导 def dsigmoid(x): return x*(1-x) class NeuralNetwork: def __init__(self,layers):#(64,100,10) #权值的初始化,范围-1到1 self.V = np.random.random((layers[0]+1,layers[1]+1))*2-1#加的1为偏置值 self.W = np.random.random((layers[1]+1,layers[2]))*2-1 def train(self,X,y,lr=0.11,epochs=10000): #添加偏置 temp = np.ones([X.shape[0],X.shape[1]+1]) temp[:,0:-1] = X X = temp for n in range(epochs+1): i = np.random.randint(X.shape[0]) #随机选取一个数据 x = [X[i]] x = np.atleast_2d(x)#转为2维数据 L1 = sigmoid(np.dot(x,self.V))#隐层输出 L2 = sigmoid(np.dot(L1,self.W))#输出层输出 L2_delta = (y[i]-L2)*dsigmoid(L2) L1_delta= L2_delta.dot(self.W.T)*dsigmoid(L1) self.W += lr*L1.T.dot(L2_delta) self.V += lr*x.T.dot(L1_delta) #每训练1000次预测一次准确率 if n%1000==0: predictions = [] for j in range(X_test.shape[0]): o = self.predict(X_test[j]) predictions.append(np.argmax(o))#获取预测结果 accuracy = np.mean(np.equal(predictions,y_test)) print('epoch:',n,'accuracy:',accuracy) def predict(self,x): #添加偏置 temp = np.ones(x.shape[0]+1) temp[0:-1] = x x = temp x = np.atleast_2d(x)#转为2维数据 L1 = sigmoid(np.dot(x,self.V))#隐层输出 L2 = sigmoid(np.dot(L1,self.W))#输出层输出 return L2
#查看前30个图像 digits = load_digits()#载入数据集 X = digits.data#数据 y = digits.target#标签 print(digits.data.shape) #pl.gray()#灰度化图片 #pl.matshow(digits.images[1]) #pl.show() rows = 3 cols = 10 fig1 , ax1 = pyplot.subplots(rows ,cols ,figsize=(10 , 5)) # 标签字体 fontdict = {'fontsize': 20,'fontweight' : 6,'verticalalignment': 'baseline','horizontalalignment': 'center'} for j in range(rows): for i in range(cols): ax1[j][i].imshow(digits.images[j*cols+i].reshape(8 , 8)) ax1[j][i].axis('off') ax1[j][i].set_title(y[j*cols+i] , fontdict = fontdict)
''' 数据归一化的解释:如果数据不做归一化,数据本身的数值太大时,如等于100000时, 该值经过激活函数(如sigmoid函数)后,其值将会无限接近于1,其一阶导数即梯度将无限接近于0, 而数据训练时,权值每次迭代的改变量是和负梯度成正比的,当梯度接近于0时, 权值每次改变都非常小,导致权值无法正常调整,从而导致训练结出来的模型效果很差 ''' #输入数据归一化 X -= X.min() X /= X.max() nm = NeuralNetwork([64,100,10])#创建网络 X_train,X_test,y_train,y_test = train_test_split(X,y) #分割数据1/4为测试数据,3/4为训练数据 #二值化是指将数字变成计算机易于处理的0和1的方式,如0->1000000000 3->0001000000 labels_train = LabelBinarizer().fit_transform(y_train)#标签二值化 0,8,6 0->1000000000 3->0001000000 labels_test = LabelBinarizer().fit_transform(y_test)#标签二值化 print('start') nm.train(X_train,labels_train,epochs=20000) print('end')