In [3]:
# Xavier's Initialization

import numpy as np


def initialize_parameters(network_structure):
    
    '''
    Parametros de entrada:
    network_structure: vector que describe la estructura de
                       la red neuronal de la siguiente manera:
                       
                       primera posición: numero de entradas de la red neuronal (para este ejemplo será de 12288)
                       ultima posición: capa de salida (para este ejemplo será  1)
                       posiciones intermedias: cada posicion es una capa oculta y el valor indica cuantas
                                               neuronas componen cada capa
  
    Retorna un arreglo con dos diccionarios, en la primera posición esta W y en la segunda esta b  
    '''    

    parametersW={}
    parametersb={}
    
    for i in range(1, len(network_structure)): #Ciclo que inicializa los parametros W y b de la red neuronal
        W = np.random.randn(network_structure[i], network_structure[i-1]) * np.sqrt(2./float(network_structure[i-1] + network_structure[i]))
        b = np.zeros([network_structure[i], 1])
        parametersW["W" + str(i)] = W
        parametersb["b" + str(i)] = b

    return parametersW, parametersb

def linear_activation(W, b, X):
    '''
    Returns linear activation for W, b and X
    '''
    z = np.dot(W, X) + b    
    return z

def sigmoid(z):
    '''
    Returns sigmoid activation for array z
    '''
    a = 1. / (1. + np.exp(-z)) 
    
    return a 

def tanh(z):
    '''
    Returns hiperbolic tangent activation for array z
    '''
    a = (np.exp(z)- np.exp(-z))/(np.exp(z)+ np.exp(-z))
    return a


def forward_propagation(parametersW, parametersb, activate_functions, X):
    
    '''
    Parametros de entrada:
    
    Esta funcion recibe 4 parametros de entrada los cuales constan de:
    
    paremetersW: es un diccionario que contiene todos los parametros de inicialización de W  de la red neuronal
                esta almacenado en la posición 0 del arreglo que retorna la funcion initialize_parameters
                
    paremetersb: es un diccionario que contiene todos los parametros de inicialización de b  de la red neuronal
                esta almacenado en la posición 1 del arreglo que retorna la funcion initialize_parameters    
    
    activate_functions: es un vector de caracteres que determina, para cada capa, cual es su funcion de activacion
                        su estructura es la siguiente:
                        su tamaño debe coincidir con el numero de componentes del diccionario W o diccionario b
                        cada posicion del vector sera una letra mayuscula (S para sigmoide, T para tangente hiperbolica)
                        la ultima capa, para este ejemplo siempre será una funcion de activación sigmoide
    
    '''

    
    
    layers = len(parametersW)
    number_of_activate_functions = len(activate_functions)    
    resultsA={}
    resultsZ={}
    

    
    if (layers != number_of_activate_functions): #se verifica que cada capa tenga su funcion de activacion
        print "hiden layers and activate functions don't match"
        return 0    
    
    for i in range(layers):
        if (i==0):
            Z = linear_activation(parametersW["W"+str(i+1)], parametersb["b"+str(i+1)], X)
            resultsZ["Z" + str(i+1)] = Z
        else:
            Z = linear_activation(parametersW["W"+str(i+1)], parametersb["b"+str(i+1)],  resultsZ["Z" + str(i)])
            resultsZ["Z" + str(i+1)] = Z
        if (activate_functions[i] == "S"):
            A = sigmoid(Z)
            resultsA["A" + str(i+1)] = A
        elif (activate_functions[i] == "T"):
            A = tanh(Z)
            resultsA["A" + str(i+1)] = A
     
    
    return resultsZ, resultsA

In [10]:
Red_Neuronal = np.array([12288,2,3,1])
Funciones_Activacion = np.array(["S","T","S"])
X = np.random.rand(12288,1)

parameters = initialize_parameters(Red_Neuronal)
fw_prop = forward_propagation(parameters[0], parameters[1],Funciones_Activacion,X)

print parameters
print fw_prop

({'W3': array([[-0.37628328, -0.43167428,  0.28596595]]), 'W2': array([[-0.9397524 , -0.00410522],
       [-0.21589459,  1.01616539],
       [-0.3117487 ,  0.35241137]]), 'W1': array([[ 0.01251963,  0.02245265,  0.01396418, ...,  0.01141745,
         0.01260991,  0.01470833],
       [-0.00296206, -0.00789279, -0.02148552, ..., -0.01272004,
         0.00249015, -0.00071411]])}, {'b1': array([[ 0.],
       [ 0.]]), 'b2': array([[ 0.],
       [ 0.],
       [ 0.]]), 'b3': array([[ 0.]])})
({'Z1': array([[ 1.06600517],
       [-0.97645576]]), 'Z2': array([[-0.99777235],
       [-1.22238529],
       [-0.67643984]]), 'Z3': array([[ 0.70967858]])}, {'A1': array([[ 0.74383647],
       [ 0.27359561]]), 'A3': array([[ 0.67033013]]), 'A2': array([[-0.76065701],
       [-0.84035638],
       [-0.58920004]])})


In [7]:
initialize_parameters?