java66liu
diff --git a/‎LogisticRegression/LogisticRegression.py‎
Lines changed: 1 addition & 1 deletion b/‎LogisticRegression/LogisticRegression.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎LogisticRegression/LogisticRegression_OneVsAll.py‎
Lines changed: 1 addition & 0 deletions b/‎LogisticRegression/LogisticRegression_OneVsAll.py‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎NeuralNetwok/NeuralNetwork.py‎
Lines changed: 207 additions & 0 deletions b/‎NeuralNetwok/NeuralNetwork.py‎
Lines changed: 207 additions & 0 deletions
diff --git a/‎NeuralNetwok/data_digits.mat‎
7.16 MB b/‎NeuralNetwok/data_digits.mat‎
7.16 MB
@@ -20,7 +20,7 @@ def LogisticRegression():
     J = costFunction(initial_theta,X,y,initial_lambda)  #计算一下给定初始化的theta和lambda求出的代价J
 
     print J  #输出一下计算的值，应该为0.693147
-    # result = optimize.fmin(costFunction, initial_theta, args=(X,y,initial_lambda))    #直接使用最小化的方法，效果不好
+    #result = optimize.fmin(costFunction, initial_theta, args=(X,y,initial_lambda))    #直接使用最小化的方法，效果不好
     '''调用scipy中的优化算法fmin_bfgs（拟牛顿法Broyden-Fletcher-Goldfarb-Shanno）
     - costFunction是自己实现的一个求代价的函数，
     - initial_theta表示初始化的值,
 
@@ -70,6 +70,7 @@ def oneVsAll(X,y,num_labels,Lambda):
 
     '''遍历每个分类，计算对应的theta值'''
     for i in range(num_labels):
+        #optimize.fmin_cg
         result = optimize.fmin_bfgs(costFunction, initial_theta, fprime=gradient, args=(X,class_y[:,i],Lambda)) # 调用梯度下降的优化方法
         all_theta[:,i] = result.reshape(1,-1)   # 放入all_theta中
 
 
@@ -0,0 +1,207 @@
+#-*- coding: utf-8 -*-
+import numpy as np
+from scipy import io as spio
+from matplotlib import pyplot as plt
+from scipy import optimize
+from matplotlib.font_manager import FontProperties
+font = FontProperties(fname=r"c:\windows\fonts\simsun.ttc", size=14)    # 解决windows环境下画图汉字乱码问题
+
+from sklearn import datasets
+from sklearn.preprocessing import StandardScaler
+
+def neuralNetwork(input_layer_size,hidden_layer_size,out_put_layer):
+    data_img = loadmat_data("data_digits.mat")
+    #data_weights = loadmat_data("weights.mat")
+    X = data_img['X']
+    y = data_img['y']
+    #Theta1 = data_weights['Theta1'] 
+    #Theta2 = data_weights['Theta2']
+    
+    
+    #y = np.ravel(y)
+    m,n = X.shape
+    """digits = datasets.load_digits()
+    X = digits.data
+    y = digits.target
+    m,n = X.shape
+    
+    scaler = StandardScaler()
+    scaler.fit(X)
+    X = scaler.transform(X)"""
+    
+    ##　随机显示几行数据
+    rand_indices = [t for t in [np.random.randint(x-x, m) for x in range(100)]]  # 生成100个0-m的随机数
+    display_data(X[rand_indices,:])     # 显示100个数字    
+    
+    #nn_params = np.vstack((Theta1.reshape(-1,1),Theta2.reshape(-1,1)))
+    
+    Lambda = 1
+
+    initial_Theta1 = randInitializeWeights(input_layer_size,hidden_layer_size); 
+    initial_Theta2 = randInitializeWeights(hidden_layer_size,out_put_layer)
+    
+    initial_nn_params = np.vstack((initial_Theta1.reshape(-1,1),initial_Theta2.reshape(-1,1)))  #展开theta    
+    result = optimize.fmin_cg(nnCostFunction, initial_nn_params, fprime=nnGradient, args=(input_layer_size,hidden_layer_size,out_put_layer,X,y,Lambda))
+    print result
+    '''可视化 Theta1'''
+    length = result.shape[0]
+    Theta1 = result[0:hidden_layer_size*(input_layer_size+1)].reshape(hidden_layer_size,input_layer_size+1)
+    Theta2 = result[hidden_layer_size*(input_layer_size+1):length].reshape(out_put_layer,hidden_layer_size+1)    
+    display_data(Theta1[:,1:length])
+    '''预测'''
+    p = predict(Theta1,Theta2,X)
+    print u"预测准确度为：%f%%"%np.mean(np.float64(p == y.reshape(-1,1))*100)    
+    res = np.hstack((p,y.reshape(-1,1)))
+    np.savetxt("predict.csv", res, delimiter=',')
+    
+
+# 加载mat文件
+def loadmat_data(fileName):
+    return spio.loadmat(fileName)
+
+# 显示100个数字
+def display_data(imgData):
+    sum = 0
+    '''
+    显示100个数（若是一个一个绘制将会非常慢，可以将要画的数字整理好，放到一个矩阵中，显示这个矩阵即可）
+    - 初始化一个二维数组
+    - 将每行的数据调整成图像的矩阵，放进二维数组
+    - 显示即可
+    '''
+    m,n = imgData.shape
+    width = np.int32(np.round(np.sqrt(n)))
+    height = np.int32(n/width);
+    rows_count = np.int32(np.floor(np.sqrt(m)))
+    cols_count = np.int32(np.ceil(m/rows_count))
+    pad = 1
+    display_array = -np.ones((pad+rows_count*(height+pad),pad+cols_count*(width+pad)))
+    for i in range(rows_count):
+        for j in range(cols_count):
+            display_array[pad+i*(height+pad):pad+i*(height+pad)+height,pad+j*(width+pad):pad+j*(width+pad)+width] = imgData[sum,:].reshape(height,width,order="F")    # order=F指定以列优先，在matlab中是这样的，python中需要指定，默认以行
+            sum += 1
+            
+    plt.imshow(display_array,cmap='gray')   #显示灰度图像
+    plt.axis('off')
+    plt.show()
+
+# 代价函数
+def nnCostFunction(nn_params,input_layer_size,hidden_layer_size,num_labels,X,y,Lambda):
+    length = nn_params.shape[0]
+    Theta1 = nn_params[0:hidden_layer_size*(input_layer_size+1)].reshape(hidden_layer_size,input_layer_size+1)
+    Theta2 = nn_params[hidden_layer_size*(input_layer_size+1):length].reshape(num_labels,hidden_layer_size+1)
+    
+    # np.savetxt("Theta1.csv",Theta1,delimiter=',')
+    
+    m = X.shape[0]
+    class_y = np.zeros((m,num_labels))      # 数据的y对应0-9，需要映射为0/1的关系
+    # 映射y
+    for i in range(num_labels):
+        class_y[:,i] = np.int32(y==i).reshape(1,-1) # 注意reshape(1,-1)才可以赋值
+     
+        
+    Theta1_colCount = Theta1.shape[1]    
+    Theta1_x = Theta1[:,1:Theta1_colCount]
+    Theta2_colCount = Theta2.shape[1]    
+    Theta2_x = Theta2[:,1:Theta2_colCount]
+    
+    term = np.dot(np.transpose(np.vstack((Theta1_x.reshape(-1,1),Theta2_x.reshape(-1,1)))),np.vstack((Theta1_x.reshape(-1,1),Theta2_x.reshape(-1,1))))
+    
+    '''正向传播'''
+    a1 = np.hstack((np.ones((m,1)),X))
+    z2 = np.dot(a1,np.transpose(Theta1))
+    a2 = sigmoid(z2)
+    a2 = np.hstack((np.ones((m,1)),a2))
+    z3 = np.dot(a2,np.transpose(Theta2))
+    h  = sigmoid(z3)    
+    '''代价'''    
+    J = -(np.dot(np.transpose(class_y.reshape(-1,1)),np.log(h.reshape(-1,1)))+np.dot(np.transpose(1-class_y.reshape(-1,1)),np.log(1-h.reshape(-1,1)))-Lambda*term/2)/m   
+    
+    return np.ravel(J)
+
+# 梯度
+def nnGradient(nn_params,input_layer_size,hidden_layer_size,num_labels,X,y,Lambda):
+    length = nn_params.shape[0]
+    Theta1 = nn_params[0:hidden_layer_size*(input_layer_size+1)].reshape(hidden_layer_size,input_layer_size+1)
+    Theta2 = nn_params[hidden_layer_size*(input_layer_size+1):length].reshape(num_labels,hidden_layer_size+1)
+    m = X.shape[0]
+    class_y = np.zeros((m,num_labels))      # 数据的y对应0-9，需要映射为0/1的关系    
+    # 映射y
+    for i in range(num_labels):
+        class_y[:,i] = np.int32(y==i).reshape(1,-1) # 注意reshape(1,-1)才可以赋值
+     
+        
+    Theta1_colCount = Theta1.shape[1]    
+    Theta1_x = Theta1[:,1:Theta1_colCount]
+    Theta2_colCount = Theta2.shape[1]    
+    Theta2_x = Theta2[:,1:Theta2_colCount]
+    
+    Theta1_grad = np.zeros((Theta1.shape))
+    Theta2_grad = np.zeros((Theta2.shape))
+    
+    Theta1[:,0] = 0;
+    Theta2[:,0] = 0;
+    '''正向传播'''
+    a1 = np.hstack((np.ones((m,1)),X))
+    z2 = np.dot(a1,np.transpose(Theta1))
+    a2 = sigmoid(z2)
+    a2 = np.hstack((np.ones((m,1)),a2))
+    z3 = np.dot(a2,np.transpose(Theta2))
+    h  = sigmoid(z3)
+    
+    '''反向传播'''
+    delta3 = np.zeros((m,num_labels))
+    delta2 = np.zeros((m,hidden_layer_size))
+    for i in range(m):
+        delta3[i,:] = h[i,:]-class_y[i,:]
+        Theta2_grad = Theta2_grad+np.dot(np.transpose(delta3[i,:].reshape(1,-1)),a2[i,:].reshape(1,-1))
+        delta2[i,:] = np.dot(delta3[i,:].reshape(1,-1),Theta2_x)*sigmoidGradient(z2[i,:])
+        Theta1_grad = Theta1_grad+np.dot(np.transpose(delta2[i,:].reshape(1,-1)),a1[i,:].reshape(1,-1))
+    
+    '''梯度'''
+    grad = (np.vstack((Theta1_grad.reshape(-1,1),Theta2_grad.reshape(-1,1)))+Lambda*np.vstack((Theta1.reshape(-1,1),Theta2.reshape(-1,1))))/m
+    return np.ravel(grad)
+
+# S型函数    
+def sigmoid(z):
+    h = np.zeros((len(z),1))    # 初始化，与z的长度一致
+    
+    h = 1.0/(1.0+np.exp(-z))
+    return h
+
+# S型函数导数
+def sigmoidGradient(z):
+    g = sigmoid(z)*(1-sigmoid(z))
+    return g
+
+# 随机初始化权重theta
+def randInitializeWeights(L_in,L_out):
+    W = np.zeros((L_out,1+L_in))
+    epsilon_init = (6/(L_out+L_in))**0.5
+    W = np.random.rand(L_out,1+L_in)*2*epsilon_init-epsilon_init
+    return W
+
+# 预测
+def predict(Theta1,Theta2,X):
+    m = X.shape[0]
+    num_labels = Theta2.shape[0]
+    #p = np.zeros((m,1))
+    X = np.hstack((np.ones((m,1)),X))
+    h1 = sigmoid(np.dot(X,np.transpose(Theta1)))
+    h1 = np.hstack((np.ones((m,1)),h1))
+    h2 = sigmoid(np.dot(h1,np.transpose(Theta2)))
+    
+    
+    '''
+    返回h中每一行最大值所在的列号
+    - np.max(h, axis=1)返回h中每一行的最大值（是某个数字的最大概率）
+    - 最后where找到的最大概率所在的列号（列号即是对应的数字）
+    '''
+    #np.savetxt("h2.csv",h2,delimiter=',')
+    p = np.array(np.where(h2[0,:] == np.max(h2, axis=1)[0]))  
+    for i in np.arange(1, m):
+        t = np.array(np.where(h2[i,:] == np.max(h2, axis=1)[i]))
+        p = np.vstack((p,t))
+    return p    
+
+if __name__ == "__main__":
+    neuralNetwork(400, 25, 10)