<a href="https://colab.research.google.com/github/RodolfoFerro/curso-ai-basics/blob/main/notebooks/session_05.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Funcionamiento de neuronas artificiales 🧠

## Contenido

### Sección I

1. Brief histórico
2. Unidad Umbralización Lineal (TLU)
3. Activación y bias – El perceptrón

### Sección II

4. Aprendizaje de neuronas
5. Entrenamiento de una neurona
6. Predicciones

### Sección III – ¡Reto!

7. El dataset a utilizar
8. Preparación de los datos
9. Creación del modelo
10. Entrenamiento del modelo
11. Evaluación y predicción


## **Sección I**

### **Historia de las redes neuronales**

Podríamos decir que la historia se remonta a dar un inicio con el modelo neuronal de McCulloch y Pitts de 1943, la **Threshold Logic Unit (TLU)**, o **Linear Threshold Unit**,​ que fue el primer modelo neuronal moderno, y ha servido de inspiración para el desarrollo de otros modelos neuronales. (Puedes leer más [aquí](https://es.wikipedia.org/wiki/Neurona_de_McCulloch-Pitts).)

Posterior a los TLU, se la historia se complementa con el desarrollo de un tipo de neurona artificial con una **función de activación**, llamada **perceptrón**. Ésta fue desarrollada entre 1950 y 1960 por el científico **Frank Rosenblatt**.

### **Entonces, ¿qué es una neurona artificial?**

Una neurona artificial es una función matemática que concevida como un modelo de neuronas biológicas. (Puedes leer un poco más [aquí](https://en.wikipedia.org/wiki/Artificial_neuron).)

El modelo general de una **neurona artificial** toma varias **entradas** $x_1, x_2,..., x_n $ y produce una **salida**. Se propuso que las entradas tuviesen **pesos** asciados $w_1, w_2, ..., w_n$, siendo éstos números reales que podemos interpretar como una expressión de la importancia respectiva para cada entrada de información para el cálculo del valor de salida de la neurona. La salida de la neurona, $0$ o $1$, está determinada con base en que la suma ponderada,

$$\displaystyle\sum_{j}w_jx_j,$$

<!-- $\textbf{w}_{Layer}\cdot\textbf{x} =
\begin{bmatrix}
w_{1, 1} & w_{1, 2} & \cdots & w_{1, n}\\
w_{2, 1} & w_{2, 2} & \cdots & w_{2, n}\\
\vdots & \vdots & \ddots & \vdots\\
w_{m, 1} & w_{m, 2} & \cdots & w_{m, n}\\
\end{bmatrix} \cdot
\begin{bmatrix}
x_1\\
x_2\\
\vdots\\
x_n
\end{bmatrix}$ -->

(para $j \in \{1, 2, ..., n\}$ ) sea menor o mayor que un **valor límite** que por ahora llamaremos **umbral**. (Aquí comenzamos con la formalización de lo que es un TLU y cómo funciona.)

Visto de otro modo, una neurona artificial puede interpretarse como un sistema que toma decisiones con base en la evidencia presentada.

#### **Implementemos una TLU**

In [None]:
import numpy as np


# Primero creamos nuestra clase TLU
class TLU():
    def __init__(self, inputs, weights):
        """Class constructor.

        Parameters
        ----------
        inputs : list
            List of input values.
        weights : list
            List of weight values.
        """

        self.inputs = None # TODO: np.array <- inputs
        self.weights = None # TODO: np.array <- weights

    def decide(self, treshold):
        """Function that operates inputs @ weights.

        Parameters
        ----------
        treshold : int
            Threshold value for decision.
        """

        # TODO: Inner product of data
        pass

In [None]:
# Now, we need to set inputs and weights
inputs, weights = [], []

questions = [
    "· ¿Cuál es la velocidad? ",
    "· ¿Ritmo cardiaco? ",
    "· ¿Respiración? "
]

for question in questions:
    i = int(input(question))
    w = int(input("· Y su peso asociado es... "))
    inputs.append(i)
    weights.append(w)
    print()

treshold = int(input("· Y nuestro umbral/límite será: "))

In [None]:
artificial_neuron = TLU() # TODO Instantiate Perceptron
artificial_neuron.decide(treshold) # TODO Apply decision function with threshold

### **Bias y funciones de activación – El perceptrón**

_Antes de continuar, introduciremos otro conceptos, el **bias** y la **función de activación**._

La operación matemática que realiza la neurona para la decisión de umbralización se puede escribir como:

$$ f(\textbf{x}) =
  \begin{cases}
    0 & \text{si $\displaystyle\sum_{j}w_jx_j <$ umbral o treshold} \\
    1 & \text{si $\displaystyle\sum_{j}w_jx_j \geq$ umbral o treshold} \\
  \end{cases},$$

donde $j \in \{1, 2, ..., n\}$, y así, $\textbf{x} = (x_1, x_2, ..., x_n)$.

De lo anterior, podemos despejar el umbral y escribirlo como $b$, obteniendo:

$$ f(\textbf{x}) =
  \begin{cases}
    0 & \text{si $\displaystyle\sum_{j}w_jx_j + b < 0$} \\
    1 & \text{si $\displaystyle\sum_{j}w_jx_j + b > 0$} \\
  \end{cases},$$

donde $\textbf{x} = (x_1, x_2, ..., x_n)$ y $j \in \{1, 2, ..., n\}$.

Esto que escribimos como $b$, también se le conoce como **bias**, y describe *qué tan susceptible la red es a __dispararse__*.

Curiosamente, esta descripción matemática encaja con una función de salto o de escalón (función [_Heaviside_](https://es.wikipedia.org/wiki/Funci%C3%B3n_escal%C3%B3n_de_Heaviside)), que es una **función de activación**. Esto es, una función que permite el paso de información de acuerdo a la entrada y los pesos, permitiendo el disparo del lo procesado hacia la salida. La función de salto se ve como sigue:

<center>
    <img src="https://upload.wikimedia.org/wikipedia/commons/4/4a/Funci%C3%B3n_Cu_H.svg" width="40%" alt="Función escalón de Heaviside">
</center>

Sin embargo, podemos hacer a una neurona aún más susceptible con respecto a los datos de la misma (entradas, pesos, bias) añadiendo una función [sigmoide](https://es.wikipedia.org/wiki/Funci%C3%B3n_sigmoide). Esta fue una de las agregaciones de Rosenblatt al momento del desarrollo de su propuesta de perceptrón. La función sigmoide se ve como a continuación:

<center>
    <img src="https://upload.wikimedia.org/wikipedia/commons/6/66/Funci%C3%B3n_sigmoide_01.svg" width="40%" alt="Función sigmoide">
</center>

Esta función es suave, y por lo tanto tiene una diferente "sensibililad" a los cambios abruptos de valores. También, sus entradas en lugar de solo ser $1$'s o $0$'s, pueden ser valores en todos los números reales. La función sigmoide es descrita por la siguiente expresión matemática:

$$f(z) = \dfrac{1}{1+e^{-z}}$$

O escrito en términos de entradas, pesos y bias:

$$f(z) = \dfrac{1}{1+\exp{\left\{-\left(\displaystyle\sum_{j}w_jx_j +b\right)\right\}}}$$

#### **Volviendo al ejemplo**

In [None]:
# Modificamos para añadir la función de activación
class Perceptron():
    def __init__(self, inputs, weights):
        """Class constructor.

        Parameters
        ----------
        inputs : list
            List of input values.
        weights : list
            List of weight values.
        """

        self.inputs = None # TODO: np.array <- inputs
        self.weights = None # TODO: np.array <- weights

    def decide(self, bias):
        """Function that operates inputs @ weights.

        Parameters
        ----------
        bias : int
            The bias value for operation.
        """

        # TODO: Inner product of data + bias
        # TODO: Apply sigmoid function f(z) = 1 / (1 + e^(-z))
        pass

In [None]:
bias = int(input("· El nuevo bias será: "))
perceptron = Perceptron(inputs, weights)
perceptron.decide(bias)

> Esta es la neurona que usaremos para los siguientes tópicos.

<center>
    *********
</center>

## **Sección II**

### Aprendizaje de neuronas

Veamos cómo se puede entrenar una sola neurona para hacer una predicción.

Para este problema construiremos un perceptrón simple, como el propuesto por McCulloch & Pitts, usando la función sigmoide.

#### **Planteamiento del problema:**

Queremos mostrarle a una neurona simple un conjunto de ejemplos para que pueda aprender cómo se comporta una función. El conjunto de ejemplos es el siguiente:

- `(1, 0)` debería devolver `1`.
- `(0, 1)` debe devolver `1`.
- `(0, 0)` debería devolver `0`.

Entonces, si ingresamos a la neurona el valor de `(1, 1)`, debería poder predecir el número `1`.

> ¿Puedes adivinar la función?

#### ¿Que necesitamos hacer?

Programar y entrenar una neurona para hacer predicciones.

En concreto, vamos a hacer lo siguiente:

- Construir la clase y su constructor.
- Definir la función sigmoide y su derivada
- Definir el número de épocas para el entrenamiento.
- Resolver el problema y predecir el valor de la entrada deseada


In [None]:
import numpy as np


class TrainableNeuron():
    def __init__(self, n):
        """Class constructor.

        Parameters
        ----------
        n : int
            Input size.
        """

        np.random.seed(123)
        self.synaptic_weights = None # TODO. Use np.random.random((n, 1)) to gen values in (-1, 1)

    def __sigmoid(self, x):
        """Sigmoid function.

        Parameters
        ----------
        x : float
            Input value to sigmoid function.
        """

        # TODO: Return result of sigmoid function f(z) = 1 / (1 + e^(-z))
        return None

    def __sigmoid_derivative(self, x):
        """Derivative of the Sigmoid function.

        Parameters
        ----------
        x : float
            Input value to evaluated sigmoid function."""

        # TODO: Return the derivate of sigmoid function x * (1 - x)
        return None

    def train(self, training_inputs, training_output, iterations):
        """Training function.

        Parameters
        ----------
        training_inputs : list
            List of features for training.
        training_outputs : list
            List of labels for training.
        iterations : int
            Number of iterations for training.

        Returns
        -------
        history : list
            A list containing the training history.
        """

        history = []

        for iteration in range(iterations):
            output = self.predict(training_inputs)
            error = training_output.reshape((len(training_inputs), 1)) - output
            #error = - training_output.reshape((len(training_inputs), 1)) * np.log(output) \
            #        - (1 - training_output.reshape((len(training_inputs), 1))) * output
            #error /= len(output)
            adjustment = np.dot(training_inputs.T, error *
                                self.__sigmoid_derivative(output))
            self.synaptic_weights += adjustment

            history.append(np.linalg.norm(error))

        return history

    def predict(self, inputs):
        """Prediction function. Applies input function to inputs tensor.

        Parameters
        ----------
        inputs : list
            List of inputs to apply sigmoid function.
        """
        # TODO: Apply self.__sigmoid to np.dot of (inputs, self.synaptic_weights)
        return None

### Generando las muestras

Ahora podemos generar una lista de ejemplos basados en la descripción del problema.

In [None]:
# Training samples:
input_values = [(0, 1), (1, 0), (0, 0)]   # TODO. Define the input values as a list of tuples
output_values = [1, 1, 0]  # TODO. Define the desired outputs

training_inputs = np.array(input_values)
training_output = np.array(output_values).T.reshape((3, 1))

### Entrenando la neurona

Para hacer el entrenamiento, primero definiremos una neurona. De forma predeterminada, contendrá pesos aleatorios (ya que aún no se ha entrenado):

In [None]:
# Initialize Sigmoid Neuron:
neuron = TrainableNeuron(2)
print("Initial random weights:")
neuron.synaptic_weights

In [None]:
# TODO.
# We can modify the number of epochs to see how it performs.
epochs = 10000

# We train the neuron a number of epochs:
history = neuron.train(training_inputs, training_output, epochs)
print("New synaptic weights after training: ")
neuron.synaptic_weights

Podemos evaluar el entrenamiento de la neurona.

In [None]:
import matplotlib.pyplot as plt
plt.style.use('seaborn')

x = np.arange(len(history))
y = history

plt.plot(x, y)

### Realizando predicciones

In [None]:
# We predict to verify the performance:
one_one = np.array((1, 1))
print("Prediction for (1, 1): ")
neuron.predict(one_one)

<center>
    *********
</center>

## **Sección III – ¡Reto!**

### El dataset a utilizar: Naranjas vs. Manzanas

El dataset ha sido una adaptación de datos encontrados en [Kaggle](https://www.kaggle.com/datasets/theblackmamba31/apple-orange). Dicho dataset está compuesto por conjuntos de imágenes de naranjas y manzanas que serán un utilizados para entrenar una neurona artificial.

Para cargar los datos, primero los descargaremos de un repositorio donde previamente los preparé para ustedes.

Puedes explorar directamente los archivos fuente del [repositorio en GitHub – `apple-orange-dataset`](https://github.com/RodolfoFerro/apple-orange-dataset).

Puedes también explorar el [script]() que he utilizado para la preparación de los mismos.

In [None]:
!wget https://raw.githubusercontent.com/RodolfoFerro/apple-orange-dataset/main/training_data.csv
!wget https://raw.githubusercontent.com/RodolfoFerro/apple-orange-dataset/main/testing_data.csv

### Preparación de los datos


In [None]:
import pandas as pd


training_df = pd.read_csv('training_data.csv')
testing_df = pd.read_csv('testing_data.csv')

training_df

In [None]:
R, G, B = [], [], []

for color in training_df['color']:
    rgb = color[1:-1].split(', ')
    r, g, b = [int(value) for value in rgb]
    R.append(r)
    G.append(g)
    B.append(b)

training_df['r'] = R
training_df['g'] = G
training_df['b'] = B
training_df['class_str'] = training_df['class'].astype('str')
training_df

### Exploración de los datos

In [None]:
import plotly.express as px


fig = px.scatter_3d(training_df, x='r', y='g', z='b',
                    color='class_str', symbol='class_str',
                    opacity=0.5)
fig.show()

### Creación de una neurona artificial


In [None]:
neuron = None #TODO: Create a neuron instance
neuron.synaptic_weights

### Entrenamiento del modelo

Para entrenar el modelo, simplemente utilizamos el método `.train()` del modelo.

In [None]:
training_inputs = training_df[['r', 'g', 'b']].values / 255.
training_output = training_df['class'].values

training_inputs, training_output

In [None]:
history = None #TODO: Train a neuron

### Evaluación y predicción

Podemos evaluar el entrenamiento de la neurona.

In [None]:
import matplotlib.pyplot as plt
plt.style.use('seaborn')

x = np.arange(len(history))
y = history

plt.plot(x, y)

Para predecir un color de ejemplo:

In [None]:
neuron.predict([0.73333333, 0.19215686, 0.15294118])

O utilizar funciones de scikit-learn para la evaluación de resultados en el conjunto de pruebas. (Utilizar [`sklearn.metrics.accuracy_score`](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.accuracy_score.html#sklearn.metrics.accuracy_score))

<center>
    *********
</center>

In [None]:
R, G, B = [], [], []

for color in testing_df['color']:
    rgb = color[1:-1].split(', ')
    r, g, b = [int(value) for value in rgb]
    R.append(r)
    G.append(g)
    B.append(b)

testing_df['r'] = R
testing_df['g'] = G
testing_df['b'] = B
testing_df['class_str'] = testing_df['class'].astype('str')


fig = px.scatter_3d(testing_df, x='r', y='g', z='b',
                    color='class_str', symbol='class_str',
                    opacity=0.5)
fig.show()

In [None]:
testing_inputs = testing_df[['r', 'g', 'b']].values / 255.
testing_output = testing_df['class'].values

predictions = []
for test_input in testing_inputs:
    if neuron.predict(test_input)[0] <= 0.5:
        prediction = 0
    else:
        prediction = 1
    predictions.append(prediction)
predictions = np.array(predictions)

predictions

In [None]:
 from sklearn.metrics import accuracy_score


 accuracy_score(testing_output, predictions)

> **Puedes explorar:**
> - Utilizar 1 a 3 variables (de las dadas).
> - Investigar e implementar una nueva funci.ón para estimar el error.
> - Realizar transformaciones en los datos.
> - Entrenar por más épocas.
> - Mover el umbral para definir la clase.
> - Explorar otras funciones de activación.
> - Generar tu nuevo dataset de datos a partir de las imágenes originales.

--------

> Contenido creado por **Rodolfo Ferro** (2024). <br>
> **Contacto:** [@rodo_ferro](https://www.instagram.com/rodo_ferro/)