# **Generar vector de pesos aleatorios**
Las predicciones del perceptrón se obtienen mediante una combinación lineal de características y pesos. Esta es la salida de la función de agregación  lineal. Es una práctica común comenzar con un vector de pequeños pesos aleatorios que luego se actualizarían mediante la regla de aprendizaje del perceptrón.


In [None]:
#Freddy Alejandro Florez Bohorquez
#codigo:100105999

#libreria para manejar arreglos 
import numpy as np

def random_weights(X, random_state: int):
    '''create vector of random weights
    Parameters
    ----------
    X: 2-dimensional array, shape = [n_samples, n_features]
    Returns
    -------
    w: array, shape = [w_bias + n_features]'''
    rand = np.random.RandomState(random_state)
    w = rand.normal(loc=0.0, scale=0.01, size=1 + X.shape[1])
    return w

#**Calcular entrada neta: función de agregación lineal**
Aquí pasamos la matriz de características y el vector de pesos aleatorios generado previamente para calcular su producto interno. Recuerde que necesitamos agregar un valor de peso para el término de sesgo al comienzo del vector ( w[0])


In [None]:
def net_input(X, w):
    '''Compute net input as dot product'''
    return np.dot(X, w[1:]) + w[0]

# **Calcular predicciones: función de umbral**
Este método implementa la función de umbral que toma el valor neto del producto interno y genera un 1 si el valor predicho es >= 0 y -1 en caso contrario.



In [None]:
def predict(X, w):
    '''Return class label after unit step'''
    return np.where(net_input(X, w) >= 0.0, 1, -1)

# **Bucle de entrenamiento - Procedimiento de aprendizaje**
Examinemos el método de ajuste que implementa la regla de aprendizaje:

* cree un vector de pesos aleatorios utilizando la random_weightsfunción con una dimensionalidad igual al número de columnas en la matriz de características.
* bucle sobre cada fila de la matriz de características confor exemplar in range(n_iter)
* calcule el producto interno entre el vector de características para la fila I y el vector de peso usando la predict(xi, w)función
* calcule la diferencia entre el valor predicho y el valor objetivo multiplicado por la tasa de aprendizaje condelta = eta * (target - predict(xi, w))
* actualizar los pesos por w[1:] += delta * xiyw[0] += delta
* también guardamos los errores para trazar máserrors.append(error)




In [None]:
def fit(X, y, eta=0.001, n_iter=100):
    '''loop over exemplars and update weights'''
    errors = []
    w = random_weights(X, random_state=1)
    for exemplar in range(n_iter):
        error = 0
        for xi, target in zip(X, y):
            delta = eta * (target - predict(xi, w))
            w[1:] += delta * xi
            w[0] += delta
            error += int(delta != 0.0)
        errors.append(error)
    return w, errors

# Generar conjunto de datos 
Primero creemos una función para generar nuestros datos sintéticos

In [None]:
def species_generator(mu1, sigma1, mu2, sigma2, n_samples, target, seed):
    '''creates [n_samples, 2] array
    
    Parameters
    ----------
    mu1, sigma1: int, shape = [n_samples, 2]
        mean feature-1, standar-dev feature-1
    mu2, sigma2: int, shape = [n_samples, 2]
        mean feature-2, standar-dev feature-2
    n_samples: int, shape= [n_samples, 1]
        number of sample cases
    target: int, shape = [1]
        target value
    seed: int
        random seed for reproducibility
    
    Return
    ------
    X: ndim-array, shape = [n_samples, 2]
        matrix of feature vectors
    y: 1d-vector, shape = [n_samples, 1]
        target vector
    ------
    X'''
    rand = np.random.RandomState(seed)
    f1 = rand.normal(mu1, sigma1, n_samples)
    f2 = rand.normal(mu2, sigma2, n_samples)
    X = np.array([f1, f2])
    X = X.transpose()
    y = np.full((n_samples), target)
    return X, y

Según Wikipedia, el peso medio del albatros errante es de unos 9 kg (19,8 libras), y su envergadura media es de unos 3 m (9,8 pies). Generaré una muestra aleatoria de 100 albatros con los valores medios indicados más alguna varianza.

In [None]:
albatross_weight_mean = 9000 # in grams
albatross_weight_variance =  800 # in grams
albatross_wingspan_mean = 300 # in cm
albatross_wingspan_variance = 20 # in cm 
n_samples = 100
target = 1
seed = 100

# aX: feature matrix (weight, wingspan)
# ay: target value (1)
aX, ay = species_generator(albatross_weight_mean, albatross_weight_variance,
                           albatross_wingspan_mean, albatross_wingspan_variance,
                           n_samples,target,seed )

In [None]:
import pandas as pd

albatross_dic = {'weight-(gm)': aX[:,0],
                 'wingspan-(cm)': aX[:,1], 
                 'species': ay,
                 'url': "https://raw.githubusercontent.com/pabloinsente/nn-mod-cog/master/notebooks/images/albatross.png"}

# put values in a relational table (pandas dataframe)
albatross_df = pd.DataFrame(albatross_dic)

Según Wikipedia, el peso medio del búho cornudo es de alrededor de 1,2 kg (2,7 libras), y su envergadura media es de alrededor de 1,2 m (3,9 pies). Nuevamente, generaré una muestra aleatoria de 100 búhos con los valores medios indicados más alguna varianza.

In [None]:
owl_weight_mean = 1000 # in grams
owl_weight_variance =  200 # in grams
owl_wingspan_mean = 100 # in cm
owl_wingspan_variance = 15 # in cm
n_samples = 100
target = -1
seed = 100

# oX: feature matrix (weight, wingspan)
# oy: target value (1)
oX, oy = species_generator(owl_weight_mean, owl_weight_variance,
                           owl_wingspan_mean, owl_wingspan_variance,
                           n_samples,target,seed )

In [None]:
owl_dic = {'weight-(gm)': oX[:,0],
             'wingspan-(cm)': oX[:,1], 
             'species': oy,
             'url': "https://raw.githubusercontent.com/pabloinsente/nn-mod-cog/master/notebooks/images/owl.png"}

# put values in a relational table (pandas dataframe)
owl_df = pd.DataFrame(owl_dic)

Ahora, concatenamos los conjuntos de datos en un solo marco de datos.

In [None]:
df = albatross_df.append(owl_df, ignore_index=True)

# Trazar conjunto de datos sintéticos 
Para apreciar la diferencia de peso y envergadura entre albatros y águilas, podemos generar un gráfico en 2D.

In [None]:
import altair as alt

alt.Chart(df).mark_image(
    width=20,
    height=20
).encode(
    x="weight-(gm)",
    y="wingspan-(cm)",
    url="url"
).properties(
    title='Chart 1'
)

Del **gráfico 1** queda claro que el albatros es considerablemente más grande que los búhos, por lo que el perceptrón debería poder encontrar un plano para separar los datos relativamente rápido.


# Entrenamiento de perceptrón
Tenemos todas las piezas en su lugar para probar el perceptrón. Antes de pasar los datos por el perceptrón, barajaremos las filas en el conjunto de datos. Esto no es técnicamente necesario, pero ayudaría al perceptrón a converger más rápido.

In [None]:
df_shuffle = df.sample(frac=1, random_state=1).reset_index(drop=True)
X = df_shuffle[['weight-(gm)','wingspan-(cm)']].to_numpy()
y = df_shuffle['species'].to_numpy()

Usamos la función de ajuste, con una tasa de aprendizaje o η de 0.01, lo que significa que actualizaría los pesos en un 1% del error total en cada paso de tiempo. Ejecutaremos 200 iteraciones del algoritmo. En cada iteración, el algoritmo pasa todo el conjunto de datos una vez.

In [None]:
w, errors = fit(X, y, eta=0.01, n_iter=200)

El perceptrón ha aprendido un conjunto de pesos para separar los datos. Calculemos la precisión de la clasificación dividiendo el número de predicciones correctas por los objetivos esperados.

In [None]:
y_pred = predict(X, w)
num_correct_predictions = (y_pred == y).sum()
accuracy = (num_correct_predictions / y.shape[0]) * 100
print('Perceptron accuracy: %.2f%%' % accuracy)

Perceptron accuracy: 99.50%


Después de 200 ejecuciones, el perceptrón ha alcanzado una precisión del 99,5 %, lo que significa que en este punto está clasificando erróneamente un solo caso. ¿Por qué no 100% de precisión? Si sigue "ajustando" el η parámetro y ejecutando más iteraciones, el perceptrón eventualmente encontrará el conjunto de pesos para obtener el 100% de precisión. Ahora, veamos la reducción de errores en las iteraciones.

In [None]:
error_df = pd.DataFrame({'error':errors, 'time-step': np.arange(0, len(errors))})

alt.Chart(error_df).mark_line().encode(
    x="time-step", y="error"
).properties(
    title='Chart 2'
)

Como muestra el gráfico 2 , cuantas más iteraciones, menor es el error. Después de alrededor de 80 pasos de tiempo, la reducción de errores comienza a  oscilar alrededor de la misma banda en lugar de disminuir. Esto no  significa  que   el perceptrón no vaya a seguir aprendiendo con  más iteraciones. El comportamiento del perceptrón, y de las  redes  neuronales en general, tiende a  ser  un  poco impredecible. El perceptrón puede "atascarse" durante un largo período de tiempo hasta que de repente encuentra mejores pesos y el error disminuye. Ajustando el η a menudo es necesario para alcanzar la convergencia absoluta. En realidad, el η El parámetro es parcialmente responsable del comportamiento oscilante del error en cada paso de tiempo. En general, cuanto más pequeño es el η , cuanto menor sea la oscilación, y viceversa. Menor η los valores generalmente tienen el costo de ralentizar los procesos de aprendizaje. Hay muchas cosas que decir sobre el papel de la tasa de aprendizaje en la convergencia de redes neuronales, que no cubriré en este punto para evitar una sobrecarga conceptual. Hablaré más al respecto en capítulos posteriores.