In [1]:
import numpy as np
import h5py
import testCases 
from dnn_utils import sigmoid, sigmoid_backward, relu, relu_backward 
import lr_utils 

np.random.seed(1)
def initialize_parameters(n_x,n_h,n_y):
    
#     此函数是为了初始化两层网络参数而使用的函数。
#     参数：
#         n_x - 输入层节点数量
#         n_h - 隐藏层节点数量
#         n_y - 输出层节点数量
    
#     返回：
#         parameters - 包含你的参数的python字典：
#             W1 - 权重矩阵,维度为（n_h，n_x）
#             b1 - 偏向量，维度为（n_h，1）
#             W2 - 权重矩阵，维度为（n_y，n_h）
#             b2 - 偏向量，维度为（n_y，1）
    
    W1 = np.random.randn(n_h, n_x) * 0.01
    b1 = np.zeros((n_h, 1))
    W2 = np.random.randn(n_y, n_h) * 0.01
    b2 = np.zeros((n_y, 1))
    
    #使用断言确保我的数据格式是正确的
    assert(W1.shape == (n_h, n_x))
    assert(b1.shape == (n_h, 1))
    assert(W2.shape == (n_y, n_h))
    assert(b2.shape == (n_y, 1))
    
    parameters = {"W1": W1,
                  "b1": b1,
                  "W2": W2,
                  "b2": b2}
    
    return parameters  

In [15]:
print("==============测试initialize_parameters==============")
parameters = initialize_parameters(3,2,1)
print("W1 = " + str(parameters["W1"]))
print("b1 = " + str(parameters["b1"]))
print("W2 = " + str(parameters["W2"]))
print("b2 = " + str(parameters["b2"]))

W1 = [[ 0.01624345 -0.00611756 -0.00528172]
 [-0.01072969  0.00865408 -0.02301539]]
b1 = [[0.]
 [0.]]
W2 = [[ 0.01744812 -0.00761207]]
b2 = [[0.]]


In [16]:
def linear_forward(A,W,b):
#     """
#     实现前向传播的线性部分。

#     参数：
#         A - 来自上一层（或输入数据）的激活，维度为(上一层的节点数量，示例的数量）
#         W - 权重矩阵，numpy数组，维度为（当前图层的节点数量，前一图层的节点数量）
#         b - 偏向量，numpy向量，维度为（当前图层节点数量，1）

#     返回：
#          Z - 激活功能的输入，也称为预激活参数
#          cache - 一个包含“A”，“W”和“b”的字典，存储这些变量以有效地计算后向传递
#     """
    Z = np.dot(W,A) + b
    assert(Z.shape == (W.shape[0],A.shape[1]))
    cache = (A,W,b)
    return Z,cache
print("==============测试linear_forward==============")
A,W,b = testCases.linear_forward_test_case()
Z,linear_cache = linear_forward(A,W,b)
print("Z = " + str(Z))

Z = [[ 3.26295337 -1.23429987]]


In [17]:
def linear_activation_forward(A_prev,W,b,activation):
#     """
#     实现LINEAR-> ACTIVATION 这一层的前向传播

#     参数：
#         A_prev - 来自上一层（或输入层）的激活，维度为(上一层的节点数量，示例数）
#         W - 权重矩阵，numpy数组，维度为（当前层的节点数量，前一层的大小）
#         b - 偏向量，numpy阵列，维度为（当前层的节点数量，1）
#         activation - 选择在此层中使用的激活函数名，字符串类型，【"sigmoid" | "relu"】

#     返回：
#         A - 激活函数的输出，也称为激活后的值
#         cache - 一个包含“linear_cache”和“activation_cache”的字典，我们需要存储它以有效地计算后向传递
#     """
    
    if activation == "sigmoid":
        Z, linear_cache = linear_forward(A_prev, W, b)
        A, activation_cache = sigmoid(Z)
    elif activation == "relu":
        Z, linear_cache = linear_forward(A_prev, W, b)
        A, activation_cache = relu(Z)
    
    assert(A.shape == (W.shape[0],A_prev.shape[1]))
    cache = (linear_cache,activation_cache)
    
    return A,cache
print("==============测试linear_activation_forward==============")
A_prev, W,b = testCases.linear_activation_forward_test_case()

A, linear_activation_cache = linear_activation_forward(A_prev, W, b, activation = "sigmoid")
print("sigmoid，A = " + str(A))

A, linear_activation_cache = linear_activation_forward(A_prev, W, b, activation = "relu")
print("ReLU，A = " + str(A))

sigmoid，A = [[0.96890023 0.11013289]]
ReLU，A = [[3.43896131 0.        ]]
