# Introducci√≥n a las neuronas artificiales üß†

1. Brief hist√≥rico
2. Unidad Umbralizaci√≥n Lineal (TLU)
3. Activaci√≥n y bias ‚Äì El perceptr√≥n

### **Historia de las redes neuronales**

Podr√≠amos decir que la historia se remonta a dar un inicio con el modelo neuronal de McCulloch y Pitts de 1943, la **Threshold Logic Unit (TLU)**, o **Linear Threshold Unit**,‚Äã que fue el primer modelo neuronal moderno, y ha servido de inspiraci√≥n para el desarrollo de otros modelos neuronales. (Puedes leer m√°s [aqu√≠](https://es.wikipedia.org/wiki/Neurona_de_McCulloch-Pitts).)

Posterior a los TLU, se la historia se complementa con el desarrollo de un tipo de neurona artificial con una **funci√≥n de activaci√≥n**, llamada **perceptr√≥n**. √âsta fue desarrollada entre 1950 y 1960 por el cient√≠fico **Frank Rosenblatt**.

### **Entonces, ¬øqu√© es una neurona artificial?**

Una neurona artificial es una funci√≥n matem√°tica que concevida como un modelo de neuronas biol√≥gicas. (Puedes leer un poco m√°s [aqu√≠](https://en.wikipedia.org/wiki/Artificial_neuron).)

El modelo general de una **neurona artificial** toma varias **entradas** $x_1, x_2,..., x_n $ y produce una **salida**. Se propuso que las entradas tuviesen **pesos** asciados $w_1, w_2, ..., w_n$, siendo √©stos n√∫meros reales que podemos interpretar como una expressi√≥n de la importancia respectiva para cada entrada de informaci√≥n para el c√°lculo del valor de salida de la neurona. La salida de la neurona, $0$ o $1$, est√° determinada con base en que la suma ponderada,

$$\displaystyle\sum_{j}w_jx_j,$$

<!-- $\textbf{w}_{Layer}\cdot\textbf{x} =
\begin{bmatrix}
w_{1, 1} & w_{1, 2} & \cdots & w_{1, n}\\
w_{2, 1} & w_{2, 2} & \cdots & w_{2, n}\\
\vdots & \vdots & \ddots & \vdots\\
w_{m, 1} & w_{m, 2} & \cdots & w_{m, n}\\
\end{bmatrix} \cdot
\begin{bmatrix}
x_1\\
x_2\\
\vdots\\
x_n
\end{bmatrix}$ -->

(para $j \in \{1, 2, ..., n\}$ ) sea menor o mayor que un **valor l√≠mite** que por ahora llamaremos **umbral**. (Aqu√≠ comenzamos con la formalizaci√≥n de lo que es un TLU y c√≥mo funciona.)

Visto de otro modo, una neurona artificial puede interpretarse como un sistema que toma decisiones con base en la evidencia presentada.

#### **Implementemos una TLU**

In [20]:
import numpy as np


# Primero creamos nuestra clase TLU
class TLU():
    def __init__(self, inputs, weights):
        """Class constructor.

        Parameters
        ----------
        inputs : list
            List of input values.
        weights : list
            List of weight values.
        """

        self.inputs = None # TODO: np.array <- inputs
        self.weights = None # TODO: np.array <- weights

    def decide(self, treshold):
        """Function that operates inputs @ weights.

        Parameters
        ----------
        treshold : int
            Threshold value for decision.
        """

        # TODO: Inner product of data
        pass

En la siguiente celada, tome en cuenta que el valor de output ser√° 1 si la suma ponderada de los inputs es mayor o igual que el umbral, y 0 en caso contrario.

Por ejemplo, si la velocidad es de 10 km/h, el ritmo card√≠aco es de 120 bpm y la respiraci√≥n es de 20 rpm, y los pesos asociados son 0.5, 0.3 y 0.2, y el umbral es de 0.7, entonces la salida del perceptron ser√° 1. Esto significa que el perceptron predice que la persona est√° haciendo ejercicio.

In [21]:
21# Now, we need to set inputs and weights

inputs, weights = [], []

questions = [
    "¬∑ ¬øCu√°l es la velocidad? ",
    "¬∑ ¬øRitmo cardiaco? ",
    "¬∑ ¬øRespiraci√≥n? "
]

for question in questions:
    i = int(input(question))
    w = float(input("¬∑ Y su peso asociado es... "))
    inputs.append(i)
    weights.append(w)
    print()


treshold = float(input("¬∑ Y nuestro umbral/l√≠mite ser√°: "))

¬∑ ¬øCu√°l es la velocidad? 10
¬∑ Y su peso asociado es... 0.5

¬∑ ¬øRitmo cardiaco? 120
¬∑ Y su peso asociado es... 0.3

¬∑ ¬øRespiraci√≥n? 20
¬∑ Y su peso asociado es... 0.2

¬∑ Y nuestro umbral/l√≠mite ser√°: 0.7


In [22]:
artificial_neuron = TLU(inputs, weights) # TODO Instantiate Perceptron
artificial_neuron.decide(treshold) # TODO Apply decision function with threshold

### **Bias y funciones de activaci√≥n ‚Äì El perceptr√≥n**

_Antes de continuar, introduciremos otro conceptos, el **bias** y la **funci√≥n de activaci√≥n**._

La operaci√≥n matem√°tica que realiza la neurona para la decisi√≥n de umbralizaci√≥n se puede escribir como:

$$ f(\textbf{x}) =
  \begin{cases}
    0 & \text{si $\displaystyle\sum_{j}w_jx_j <$ umbral o treshold} \\
    1 & \text{si $\displaystyle\sum_{j}w_jx_j \geq$ umbral o treshold} \\
  \end{cases},$$

donde $j \in \{1, 2, ..., n\}$, y as√≠, $\textbf{x} = (x_1, x_2, ..., x_n)$.

De lo anterior, podemos despejar el umbral y escribirlo como $b$, obteniendo:

$$ f(\textbf{x}) =
  \begin{cases}
    0 & \text{si $\displaystyle\sum_{j}w_jx_j + b < 0$} \\
    1 & \text{si $\displaystyle\sum_{j}w_jx_j + b > 0$} \\
  \end{cases},$$

donde $\textbf{x} = (x_1, x_2, ..., x_n)$ y $j \in \{1, 2, ..., n\}$.

Esto que escribimos como $b$, tambi√©n se le conoce como **bias**, y describe *qu√© tan susceptible la red es a __dispararse__*.

Curiosamente, esta descripci√≥n matem√°tica encaja con una funci√≥n de salto o de escal√≥n (funci√≥n [_Heaviside_](https://es.wikipedia.org/wiki/Funci%C3%B3n_escal%C3%B3n_de_Heaviside)), que es una **funci√≥n de activaci√≥n**. Esto es, una funci√≥n que permite el paso de informaci√≥n de acuerdo a la entrada y los pesos, permitiendo el disparo del lo procesado hacia la salida. La funci√≥n de salto se ve como sigue:

<center>
    <img src="https://upload.wikimedia.org/wikipedia/commons/4/4a/Funci%C3%B3n_Cu_H.svg" width="40%" alt="Funci√≥n escal√≥n de Heaviside">
</center>

Sin embargo, podemos hacer a una neurona a√∫n m√°s susceptible con respecto a los datos de la misma (entradas, pesos, bias) a√±adiendo una funci√≥n [sigmoide](https://es.wikipedia.org/wiki/Funci%C3%B3n_sigmoide). Esta fue una de las agregaciones de Rosenblatt al momento del desarrollo de su propuesta de perceptr√≥n. La funci√≥n sigmoide se ve como a continuaci√≥n:

<center>
    <img src="https://upload.wikimedia.org/wikipedia/commons/6/66/Funci%C3%B3n_sigmoide_01.svg" width="40%" alt="Funci√≥n sigmoide">
</center>

Esta funci√≥n es suave, y por lo tanto tiene una diferente "sensibililad" a los cambios abruptos de valores. Tambi√©n, sus entradas en lugar de solo ser $1$'s o $0$'s, pueden ser valores en todos los n√∫meros reales. La funci√≥n sigmoide es descrita por la siguiente expresi√≥n matem√°tica:

$$f(z) = \dfrac{1}{1+e^{-z}}$$

O escrito en t√©rminos de entradas, pesos y bias:

$$f(z) = \dfrac{1}{1+\exp{\left\{-\left(\displaystyle\sum_{j}w_jx_j +b\right)\right\}}}$$

#### **Volviendo al ejemplo**

In [23]:
# Modificamos para a√±adir la funci√≥n de activaci√≥n
class Perceptron():
    def __init__(self, inputs, weights):
        """Class constructor.

        Parameters
        ----------
        inputs : list
            List of input values.
        weights : list
            List of weight values.
        """

        self.inputs = None # TODO: np.array <- inputs
        self.weights = None # TODO: np.array <- weights

    def decide(self, bias):
        """Function that operates inputs @ weights.

        Parameters
        ----------
        bias : int
            The bias value for operation.
        """

        # TODO: Inner product of data + bias
        # TODO: Apply sigmoid function f(z) = 1 / (1 + e^(-z))
        pass

En la siguiente celda considere que el valor de output ser√° 1 si la suma ponderada de los inputs m√°s el bias es mayor o igual que el umbral, y 0 en caso contrario.

Por ejemplo, si el bias es de 0.5, y el resto de los valores son los mismos que en el ejemplo anterior, entonces la salida del perceptron ser√° 1

Esto significa que el perceptron predice que la persona est√° haciendo ejercicio, incluso con un bias m√°s alto.

Un valor m√°s alto para el bias har√° que el perceptron sea m√°s sensible a los inputs. Esto significa que el perceptron ser√° m√°s probable que prediga 1, incluso si la suma ponderada de los inputs es solo ligeramente mayor que el umbral.

Un valor m√°s bajo para el bias har√° que el perceptron sea menos sensible a los inputs. Esto significa que el perceptron ser√° menos probable que prediga 1, incluso si la suma ponderada de los inputs es mucho mayor que el umbral.

In [24]:
bias = float(input("¬∑ El nuevo bias ser√°: "))
perceptron = Perceptron(inputs, weights)
perceptron.decide(bias)

¬∑ El nuevo bias ser√°: 0.5
