# Modelo de Perceptrón

El perceptrón es uno de los modelos más básicos y fundamentales en el campo del aprendizaje automático, particularmente en redes neuronales. Es un modelo lineal de clasificación que sirve como un bloque de construcción para redes neuronales más complejas. Fue introducido por Frank Rosenblatt en 1958 y es capaz de resolver problemas de clasificación binaria.

## Estructura del Modelo de Perceptrón

El perceptrón simula una neurona en la cual se reciben múltiples entradas (features), se ponderan por medio de pesos asociados, y se realiza una suma ponderada que es luego pasada a través de una función de activación para tomar una decisión de clasificación.

### Ecuación del Modelo

El modelo de perceptrón se define como:

$$
y = \phi \left( \sum_{i=1}^{n} w_i x_i + b \right)
$$

donde:
- $y$ es la salida del perceptrón (clasificación).
- $x_i$ es la $i$-ésima entrada (feature).
- $w_i$ es el peso asociado con la entrada $x_i$.
- $b$ es el sesgo o bias del modelo.
- $\phi(\cdot)$ es la función de activación, generalmente una función escalón (Heaviside) que devuelve 1 si la suma ponderada es mayor que un umbral, y 0 en caso contrario.

$$
\phi(z) = 
\begin{cases} 
1 & \text{si } z \geq 0 \\
0 & \text{si } z < 0 
\end{cases}
$$

El propósito del perceptrón es clasificar las entradas en dos clases diferentes (clasificación binaria) aprendiendo una frontera de decisión lineal entre las clases. Este modelo es adecuado para problemas linealmente separables, donde se puede trazar una línea recta (en dos dimensiones) o un hiperplano (en dimensiones superiores) que divida perfectamente las clases.

## Entrenamiento del Modelo

El perceptrón se entrena utilizando un algoritmo iterativo que ajusta los pesos y el sesgo para minimizar el error de clasificación. El algoritmo de entrenamiento se basa en la regla de actualización de los pesos:

1. Inicializar los pesos $w_i$ y el sesgo $b$ con valores pequeños, generalmente aleatorios.
2. Para cada muestra de entrenamiento $(x_i, y_i)$:
   - Calcular la salida predicha: $\hat{y} = \phi \left( \sum_{i=1}^{n} w_i x_i + b \right)$
   - Actualizar los pesos y el sesgo:
   $$
   w_i \leftarrow w_i + \eta (y_i - \hat{y}) x_i
   $$
   $$
   b \leftarrow b + \eta (y_i - \hat{y})
   $$
      donde $\eta$ es la tasa de aprendizaje (learning rate).
3. Repetir el proceso hasta que los errores se reduzcan a cero o hasta que se alcance un número máximo de iteraciones.

## Supuestos

Los supuestos principales del perceptrón son:
1. **Linealidad**: Las clases deben ser linealmente separables para que el perceptrón pueda encontrar una solución óptima.
2. **Determinismo**: Dado un conjunto de pesos y bias, el perceptrón siempre produce la misma salida para una entrada dada.
3. **No Probabilístico**: El perceptrón no proporciona probabilidades para las clases, sino una decisión determinista.

## Ejemplo de Aplicación

Supongamos que deseamos clasificar puntos en un plano (2D) en dos clases distintas (0 y 1) basándonos en sus coordenadas $x_1$ y $x_2$.

### Datos de Ejemplo:

$$
\begin{array}{ccc}
x_1 & x_2 & y \\
2.0 & 3.0 & 1 \\
1.0 & 1.0 & 0 \\
2.5 & 1.5 & 1 \\
1.0 & 0.5 & 0 \\
3.0 & 2.5 & 1 \\
\end{array}
$$


In [1]:
import numpy as np

# Datos de ejemplo
X = np.array([[2.0, 3.0], [1.0, 1.0], [2.5, 1.5], [1.0, 0.5], [3.0, 2.5]])
y = np.array([1, 0, 1, 0, 1])

# Inicialización de pesos y sesgo
weights = np.zeros(X.shape[1])
bias = 0
learning_rate = 0.1
max_iterations = 100

# Entrenamiento del perceptrón
for _ in range(max_iterations):
    for i in range(len(X)):
        linear_output = np.dot(X[i], weights) + bias
        y_pred = 1 if linear_output >= 0 else 0
        
        # Actualización de pesos y sesgo
        update = learning_rate * (y[i] - y_pred)
        weights += update * X[i]
        bias += update

# Resultados
print("Pesos finales:", weights)
print("Sesgo final:", bias)

# Prueba con un nuevo punto
new_point = np.array([2.0, 2.0])
result = np.dot(new_point, weights) + bias
print("Clasificación del nuevo punto:", 1 if result >= 0 else 0)


Pesos finales: [5.00000000e-02 1.38777878e-17]
Sesgo final: -0.1
Clasificación del nuevo punto: 1


## Interpretación

- **Pesos $w_1, w_2$**: Los pesos indican la importancia de cada característica ($x_1$ y $x_2$) en la clasificación. Sin embargo, hay que tener en contexto el problema a resolver, ya que puede no tener una interpretacion directa sobre la relevancia de las caracteristicas.
- **Sesgo $b$**: El sesgo ajusta el umbral de decisión de la función de activación.
- **Salida $y$**: La salida es la clasificación binaria del perceptrón.

## Evaluación del Modelo

La evaluación del perceptrón se puede realizar mediante:

1. **Exactitud (Accuracy)**: Proporción de clasificaciones correctas.

In [None]:
from sklearn.metrics import accuracy_score
y_pred = np.array([1 if np.dot(x, weights) + bias >= 0 else 0 for x in X])
accuracy = accuracy_score(y, y_pred)
print("Exactitud:", accuracy)

2. **Matriz de Confusión**: Para evaluar el rendimiento en cada clase.

In [None]:
from sklearn.metrics import confusion_matrix
print("Matriz de Confusión:\n", confusion_matrix(y, y_pred))
