# Introducción a las neuronas artificiales 🧠

1. Brief histórico
2. Unidad Umbralización Lineal (TLU)
3. Activación y bias – El perceptrón

### **Historia de las redes neuronales**

Podríamos decir que la historia se remonta a dar un inicio con el modelo neuronal de McCulloch y Pitts de 1943, la **Threshold Logic Unit (TLU)**, o **Linear Threshold Unit**,​ que fue el primer modelo neuronal moderno, y ha servido de inspiración para el desarrollo de otros modelos neuronales. (Puedes leer más [aquí](https://es.wikipedia.org/wiki/Neurona_de_McCulloch-Pitts).)

Posterior a los TLU, se la historia se complementa con el desarrollo de un tipo de neurona artificial con una **función de activación**, llamada **perceptrón**. Ésta fue desarrollada entre 1950 y 1960 por el científico **Frank Rosenblatt**.

### **Entonces, ¿qué es una neurona artificial?**

Una neurona artificial es una función matemática que concevida como un modelo de neuronas biológicas. (Puedes leer un poco más [aquí](https://en.wikipedia.org/wiki/Artificial_neuron).)

El modelo general de una **neurona artificial** toma varias **entradas** $x_1, x_2,..., x_n $ y produce una **salida**. Se propuso que las entradas tuviesen **pesos** asciados $w_1, w_2, ..., w_n$, siendo éstos números reales que podemos interpretar como una expressión de la importancia respectiva para cada entrada de información para el cálculo del valor de salida de la neurona. La salida de la neurona, $0$ o $1$, está determinada con base en que la suma ponderada,

$$\displaystyle\sum_{j}w_jx_j,$$

<!-- $\textbf{w}_{Layer}\cdot\textbf{x} =
\begin{bmatrix}
w_{1, 1} & w_{1, 2} & \cdots & w_{1, n}\\
w_{2, 1} & w_{2, 2} & \cdots & w_{2, n}\\
\vdots & \vdots & \ddots & \vdots\\
w_{m, 1} & w_{m, 2} & \cdots & w_{m, n}\\
\end{bmatrix} \cdot
\begin{bmatrix}
x_1\\
x_2\\
\vdots\\
x_n
\end{bmatrix}$ -->

(para $j \in \{1, 2, ..., n\}$ ) sea menor o mayor que un **valor límite** que por ahora llamaremos **umbral**. (Aquí comenzamos con la formalización de lo que es un TLU y cómo funciona.)

Visto de otro modo, una neurona artificial puede interpretarse como un sistema que toma decisiones con base en la evidencia presentada.

#### **Implementemos una TLU**

In [20]:
import numpy as np


# Primero creamos nuestra clase TLU
class TLU():
    def __init__(self, inputs, weights):
        """Class constructor.

        Parameters
        ----------
        inputs : list
            List of input values.
        weights : list
            List of weight values.
        """

        self.inputs = None # TODO: np.array <- inputs
        self.weights = None # TODO: np.array <- weights

    def decide(self, treshold):
        """Function that operates inputs @ weights.

        Parameters
        ----------
        treshold : int
            Threshold value for decision.
        """

        # TODO: Inner product of data
        pass

En la siguiente celada, tome en cuenta que el valor de output será 1 si la suma ponderada de los inputs es mayor o igual que el umbral, y 0 en caso contrario.

Por ejemplo, si la velocidad es de 10 km/h, el ritmo cardíaco es de 120 bpm y la respiración es de 20 rpm, y los pesos asociados son 0.5, 0.3 y 0.2, y el umbral es de 0.7, entonces la salida del perceptron será 1. Esto significa que el perceptron predice que la persona está haciendo ejercicio.

In [21]:
21# Now, we need to set inputs and weights

inputs, weights = [], []

questions = [
    "· ¿Cuál es la velocidad? ",
    "· ¿Ritmo cardiaco? ",
    "· ¿Respiración? "
]

for question in questions:
    i = int(input(question))
    w = float(input("· Y su peso asociado es... "))
    inputs.append(i)
    weights.append(w)
    print()


treshold = float(input("· Y nuestro umbral/límite será: "))

· ¿Cuál es la velocidad? 10
· Y su peso asociado es... 0.5

· ¿Ritmo cardiaco? 120
· Y su peso asociado es... 0.3

· ¿Respiración? 20
· Y su peso asociado es... 0.2

· Y nuestro umbral/límite será: 0.7


In [22]:
artificial_neuron = TLU(inputs, weights) # TODO Instantiate Perceptron
artificial_neuron.decide(treshold) # TODO Apply decision function with threshold

### **Bias y funciones de activación – El perceptrón**

_Antes de continuar, introduciremos otro conceptos, el **bias** y la **función de activación**._

La operación matemática que realiza la neurona para la decisión de umbralización se puede escribir como:

$$ f(\textbf{x}) =
  \begin{cases}
    0 & \text{si $\displaystyle\sum_{j}w_jx_j <$ umbral o treshold} \\
    1 & \text{si $\displaystyle\sum_{j}w_jx_j \geq$ umbral o treshold} \\
  \end{cases},$$

donde $j \in \{1, 2, ..., n\}$, y así, $\textbf{x} = (x_1, x_2, ..., x_n)$.

De lo anterior, podemos despejar el umbral y escribirlo como $b$, obteniendo:

$$ f(\textbf{x}) =
  \begin{cases}
    0 & \text{si $\displaystyle\sum_{j}w_jx_j + b < 0$} \\
    1 & \text{si $\displaystyle\sum_{j}w_jx_j + b > 0$} \\
  \end{cases},$$

donde $\textbf{x} = (x_1, x_2, ..., x_n)$ y $j \in \{1, 2, ..., n\}$.

Esto que escribimos como $b$, también se le conoce como **bias**, y describe *qué tan susceptible la red es a __dispararse__*.

Curiosamente, esta descripción matemática encaja con una función de salto o de escalón (función [_Heaviside_](https://es.wikipedia.org/wiki/Funci%C3%B3n_escal%C3%B3n_de_Heaviside)), que es una **función de activación**. Esto es, una función que permite el paso de información de acuerdo a la entrada y los pesos, permitiendo el disparo del lo procesado hacia la salida. La función de salto se ve como sigue:

<center>
    <img src="https://upload.wikimedia.org/wikipedia/commons/4/4a/Funci%C3%B3n_Cu_H.svg" width="40%" alt="Función escalón de Heaviside">
</center>

Sin embargo, podemos hacer a una neurona aún más susceptible con respecto a los datos de la misma (entradas, pesos, bias) añadiendo una función [sigmoide](https://es.wikipedia.org/wiki/Funci%C3%B3n_sigmoide). Esta fue una de las agregaciones de Rosenblatt al momento del desarrollo de su propuesta de perceptrón. La función sigmoide se ve como a continuación:

<center>
    <img src="https://upload.wikimedia.org/wikipedia/commons/6/66/Funci%C3%B3n_sigmoide_01.svg" width="40%" alt="Función sigmoide">
</center>

Esta función es suave, y por lo tanto tiene una diferente "sensibililad" a los cambios abruptos de valores. También, sus entradas en lugar de solo ser $1$'s o $0$'s, pueden ser valores en todos los números reales. La función sigmoide es descrita por la siguiente expresión matemática:

$$f(z) = \dfrac{1}{1+e^{-z}}$$

O escrito en términos de entradas, pesos y bias:

$$f(z) = \dfrac{1}{1+\exp{\left\{-\left(\displaystyle\sum_{j}w_jx_j +b\right)\right\}}}$$

#### **Volviendo al ejemplo**

In [23]:
# Modificamos para añadir la función de activación
class Perceptron():
    def __init__(self, inputs, weights):
        """Class constructor.

        Parameters
        ----------
        inputs : list
            List of input values.
        weights : list
            List of weight values.
        """

        self.inputs = None # TODO: np.array <- inputs
        self.weights = None # TODO: np.array <- weights

    def decide(self, bias):
        """Function that operates inputs @ weights.

        Parameters
        ----------
        bias : int
            The bias value for operation.
        """

        # TODO: Inner product of data + bias
        # TODO: Apply sigmoid function f(z) = 1 / (1 + e^(-z))
        pass

En la siguiente celda considere que el valor de output será 1 si la suma ponderada de los inputs más el bias es mayor o igual que el umbral, y 0 en caso contrario.

Por ejemplo, si el bias es de 0.5, y el resto de los valores son los mismos que en el ejemplo anterior, entonces la salida del perceptron será 1

Esto significa que el perceptron predice que la persona está haciendo ejercicio, incluso con un bias más alto.

Un valor más alto para el bias hará que el perceptron sea más sensible a los inputs. Esto significa que el perceptron será más probable que prediga 1, incluso si la suma ponderada de los inputs es solo ligeramente mayor que el umbral.

Un valor más bajo para el bias hará que el perceptron sea menos sensible a los inputs. Esto significa que el perceptron será menos probable que prediga 1, incluso si la suma ponderada de los inputs es mucho mayor que el umbral.

In [24]:
bias = float(input("· El nuevo bias será: "))
perceptron = Perceptron(inputs, weights)
perceptron.decide(bias)

· El nuevo bias será: 0.5
