In [19]:
import numpy as np # 加载numpy工具库并给它取个别名为np，后面就可以通过np来调用numpy工具库里面的函数了。numpy是python的一个科学计算工具库，
                    # 除了前面文章中提到的它可以用来进行向量化之外，它还有很多常用的功能。非常非常常用的一个工具库！
import matplotlib.pyplot as plt # 这个库是用来画图的

import h5py # 这个库是用来加载训练数据集的。我们数据集的保存格式是HDF。Hierarchical Data Format(HDF)是一种针对大量数据进行组织和存储的
            #  文件格式,大数据行业和人工智能行业都用它来保存数据。
import skimage.transform as tf # 这里我们用它来缩放图片

#这是jupyter notebook里的命令, 意思是将那些用matplotlib绘制的图显示在页面里而不是弹出一个窗口
%matplotlib inline 

def load_data():
    train_data_set = h5py.File("datasets/train_catvnoncat.h5","r") #加载需要训练的数据
    train_set_x_orig = np.array(train_data_set["train_set_x"][:])#加载训练数据x对应的样本特征数据
    train_set_y_orig = np.array(train_data_set["train_set_y"][:]) #载训练数据对应样本的y 标签数据
    
    test_data_set = h5py.File("datasets/test_catvnoncat.h5","r")#加载测试的数据
    test_set_x_orig = np.array(test_data_set["test_set_x"][:])#加载测试数据x对应的特征数据
    test_set_y_orig = np.array(test_data_set["test_set_y"][:])#加载测试数据y对应的标签数据
    
    
    classnames = np.array(test_data_set["list_classes"][:])#加载标签类别数据，这里的类别只有两种，1代表有猫，0代表无猫
    

    train_set_y_orig = train_set_y_orig.reshape(1 ,train_set_y_orig.shape[0])#重新组织数组的维度 从（209,）变为 （1，209）1*209的维度
    test_set_y_orig =  test_set_y_orig.reshape(1 ,test_set_y_orig.shape[0])#重新组织数组的维度 从（50,）变为 （1，50）1*50的维度 方便计算
    
#     print (train_set_x_orig.shape)
#     print (train_set_y_orig.shape)
#     print (test_set_x_orig.shape)
#     print (test_set_y_orig.shape)
    
    return train_set_x_orig,train_set_y_orig,test_set_x_orig,test_set_y_orig,classnames
train_set_x_orig,train_set_y_orig,test_set_x_orig,test_set_y_orig,classnames = load_data()
# index=30
# plt.imshow(train_set_x_orig[index])    
# print ("这张图片的标签为" + str (train_set_y_orig[:, index]) + ", 这是一个'" + classnames[np.squeeze(train_set_y_orig[:, index])].decode("utf-8") +  "' 图片.")

m_train = train_set_x_orig.shape[0]
m_test = test_set_x_orig.shape[0]
num_px = test_set_x_orig.shape[1] # 由于我们的图片是正方形的，所以长宽相等

print ("训练样本数: m_train = " + str(m_train))
print ("测试样本数: m_test = " + str(m_test))
print ("每张图片的宽/高: num_px = " + str(num_px))

train_set_x_flatten = train_set_x_orig.reshape(train_set_x_orig.shape[0],-1).T #矩阵转换 按照 209行 -1代表不知道多少列进行重组 然后再转置.T
test_set_x_flatten = test_set_x_orig.reshape(test_set_x_orig.shape[0],-1).T #同理转置
# print(train_set_x_flatten)
# print(train_set_x_flatten.shape)
#处理后的矩阵数据 结构不会发生变化
train_set_x = train_set_x_flatten/255 #下面我们对特征数据进行了简单的标准化处理（除以255，使所有值都在[0，1]范围内） 为社么除以255 因为色值最大255 
test_set_x = test_set_x_flatten/255

#下面开始准备工具函数
def sigmoid(z) :
    #x一个数值 或者一组数据、
    # 返回值 s 经过计算后 0-1 的值
    s = 1 / (1 + np.exp(-z))   #激活函数
    return s;
# 按照之前学习的编写函数进行 正向传播和反向传播计算 dw 和db
def program(w,b,X,Y):
    
    #w 表述特征的权重值
    #b 表示阈值或者理解为偏移量
    m = X.shape[1]# 样本数量
    #前向传播
    Z = np.dot(w.T,X) + b
    A = sigmoid(Z)
    # 成本
    cost = - np.sum(Y * np.log(A) + (1 - Y) * np.log(1-A))/m
    #反向传播
    dZ = A - Y
    dw = np.dot(X,dZ.T)/m # 平均
    db = np.sum(dZ)/m
    
    chars = {"dw" :dw,"db":db}
    
    return chars,cost
def init_parameter(dim):
    
    w = np.zeros((dim,1))#dim 代表特征输入的权重  即train_set_x.shape[0] 或其他参数X.shape[0] 本例中即 12288个特征权重
    b = 0
    return w,b

def tdown(w,b,X,Y,t_number,learning_rate,print_cost=False):
    #t_number 表述梯度下降的次数
    #learning_rate 表示 学习的步进 
    #print_cost 表示打印cost成本函数  成本越小 表示参数 w b 越优
    costs = []
    for i in range (t_number):
        chars ,cost = program (w,b,X,Y)
#         print(cost)
        dw = chars["dw"]
        db = chars["db"]
        w = w - learning_rate * dw
        b = b - learning_rate * db
        
        if i% 100 ==0:
            costs.append(cost)
            if print_cost:
                print ("优化%i次后成本是: %f" %(i, cost))          
    params = {"w":w,"b":b}
    return params , costs

def predict (w,b,X):
    #各参数如上面
    
    #预测值组装 X.shape[1] 209 或者50  传入哪个代表哪个的维度 应该是可以组装成其他的维度 看情况 按照学习教程走
    Y_predict = np.zeros((1,X.shape[1]))
    
    A = sigmoid(np.dot(w.T,X)+ b)# 训练的损失函数0-1之间的值越小越准确
     
    # 上面得出的预测结果是小数的形式，为了方便后面显示，我们将其转换成0和1的形式（大于等于0.5就是1/有猫，小于0.5就是0/无猫）
    for i in range (A.shape[1]):
        if A[0,i] > 0.5 :
            Y_predict[0,i] = 1
    
    return Y_predict
def model(train_x,train_y,test_x,test_y,t_number=2000,learning_rate=0.5,print_cost=False):
    
    w,b = init_parameter(train_x.shape[0])# 样本数据
    
    chars ,costs = tdown(w,b,train_x,train_y,t_number,learning_rate,print_cost);
    
    w = chars ["w"]
    b = chars ["b"]
    
    Y_train_predict = predict(w,b,train_set_x);#训练数据的预测结果
    Y_test_predict = predict(w,b,test_set_x)#测试数据的预测结果
    
    print("对训练图片的预测准准确率 ：{}%".format(100 - np.mean(np.abs(Y_train_predict - train_y))*100))
    print("对测试图片的预测准准确率 ：{}%".format(100 - np.mean(np.abs(Y_test_predict - test_y))*100))
    
    md = {"Y_train_predict" : Y_train_predict,"Y_test_predict" : Y_test_predict, "costs" :costs, "w" : w,"b" :b,"learning_rate" : learning_rate,"t_number" :t_number }
    return md
d = model(train_set_x,train_set_y_orig,test_set_x,test_set_y_orig,t_number=2000,learning_rate=0.005,print_cost=False);
# index = 49
# plt.imshow(test_set_x[:,index].reshape((num_px,num_px,3)))
# print("这张图片的标签为"+ str(test_set_y_orig[0,index])+" 预测结果是" + str(int(d["Y_test_predict"][0,index])))
# costs = np.squeeze(d["costs"])
# plt.plot(costs)
# plt.ylabel("costs")
# plt.xlabel("t_number")
# plt.title("learning_rate=" + str(d["learning_rate"]))
# plt.show()
# learning_rates = [0.01,0.001,0.0001]
# models = {}
# for i in learning_rates:
#     print ("学习率为: " + str(i) + "时")
#     models[str(i)] = model(train_set_x,train_set_y_orig,test_set_x,test_set_y_orig,t_number=2000,learning_rate=i,print_cost=False)
#     print(models[str(i)]['w'])
#     print(models[str(i)]['b'])
#     print ('\n' + "-------------------------------------------------------" + '\n')
# for i in learning_rates:
#     plt.plot(np.squeeze(models[str(i)]["costs"]), label= str(models[str(i)]["learning_rate"]))
    
# plt.ylabel("costs")
# plt.xlabel("ssss")
# plt.title("learning_rate" )
# legend = plt.legend(loc='upper center', shadow=True)
# frame = legend.get_frame()
# frame.set_facecolor('0.90')
# plt.show()

my_image="images/e_car.jpg"
image = np.array(plt.imread(my_image));
# print(image)
image_shape = tf.resize(image,(num_px,num_px),mode='reflect').reshape((1,num_px*num_px*3)).T
Y_image = predict (d['w'],d['b'],image_shape)
plt.imshow(image)
print("预测结果：" + str(int(np.squeeze(Y_image))))

训练样本数: m_train = 209
测试样本数: m_test = 50
每张图片的宽/高: num_px = 64


NameError: name 'cost' is not defined