<a href="https://colab.research.google.com/github/mbraulio/Clasificacion-Inteligente-de-Datos-CID-2025B/blob/main/Hands-On%201%20%3A%20Perceptron%20Tutorial/HO1_Perceptron.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Hands-on 1: Perceptron Notebook (Tutorial)**


# **1.1 Fundamentos de la t√©cnica.**

El Perceptr√≥n es el modelo de neurona artificial m√°s simple y el primer algoritmo de aprendizaje supervisado que se desarroll√≥ para clasificaci√≥n binaria.
Fue propuesto en 1958 por Frank Rosenblatt, y representa el origen de lo que hoy conocemos como redes neuronales.

Sus componentes principales se basan en entradas, pesos, sesgo y la funci√≥n de activaci√≥n; Las entradas,  son las variables o caracter√≠sticas del problema (por ejemplo: edad, horas de estudio, temperatura, etc.); Los pesos, son coeficientes que indican la importancia de cada entrada en la decisi√≥n; El sesgo (bias), permite ajustar la posici√≥n de la frontera, act√∫a como un desplazamiento; Y la funci√≥n de activaci√≥n, decide si el perceptr√≥n ‚Äúse activa‚Äù (1) o ‚Äúno se activa‚Äù (0).

Su proceso de entrenamiento se define por las siguientes etapas:
1. **Inicializaci√≥n:**
Pesos y bias se establecen en valores peque√±os o aleatorios.

2. **C√°lculo de salida:**
Se calcula la salida del perceptr√≥n para cada patr√≥n de entrenamiento.

3. **Comparaci√≥n:**
Se mide la diferencia entre la salida real y la esperada.

4. **Actualizaci√≥n:**
Se ajustan los pesos seg√∫n la regla de aprendizaje.

5. **Iteraci√≥n:**
Se repite el proceso durante varias √©pocas (pasadas completas al conjunto de datos).

6. **Convergencia:**
Cuando todos los patrones se clasifican correctamente o el cambio en los pesos es muy peque√±o, se detiene.

Solo funciona correctamente con datos linealmente separables (como AND, OR, NOT).

+ No puede resolver problemas no lineales, como XOR.

+ Es sensible a la elecci√≥n de la tasa de aprendizaje.

+ Puede tardar en converger o no hacerlo si los datos est√°n mal distribuidos.

#**1.2  Modelo Matem√°tico del Perceptr√≥n.**

El perceptr√≥n busca aprender una frontera de decisi√≥n lineal que separe dos clases (por ejemplo, 0 y 1).
Esa frontera es una recta (en 2D) o un plano (en 3D o m√°s dimensiones).

Matem√°ticamente, el perceptr√≥n calcula una combinaci√≥n lineal de las entradas:
$$z = w_0 + w_1x_1 + w_2x_2 + \ldots + w_nx_n$$
Donde:

$z =$ combinaci√≥n lineal (resultado antes de aplicar la funci√≥n de activaci√≥n).

$w_0 =$ sesgo o bias.

$x_1, x_2 =$ entradas.

$w_1, w_2 =$ pesos asociados a esas entradas.

Y luego se aplica la funci√≥n de activaci√≥n:
$$
y = f(z) =
\begin{cases}
1, & \text{si } z > 0 \\
0, & \text{si } z \le 0
\end{cases}
$$

Si el resultado es 1, el perceptr√≥n ‚Äúactiva‚Äù la salida;
si es 0, la ‚Äúdesactiva‚Äù.


El perceptr√≥n aprende ajustando sus pesos seg√∫n los errores que comete durante el entrenamiento.

1. Se inicia con pesos aleatorios o en cero.

2. Para cada ejemplo $(ùë•,ùë°)$:

   + Calcula la salida $y=f(w‚ãÖx)$

   + Compara con la salida deseada $t$

   + Si se equivoc√≥, actualiza los pesos:

$$w_i = w_i + Œ∑ (t-y)x_i$$

Donde:

$Œ∑ =$ tasa de aprendizaje (learning rate).

$t =$ salida esperada (target).

$y =$ salida predicha.

$x_i =$ entrada correspondiente.

Este ajuste mueve la frontera de decisi√≥n ligeramente hacia la direcci√≥n correcta.


#**1.3  Descripci√≥n de la librer√≠a, clases, funciones (python) empleadas en programar el Perceptr√≥n**

**sklearn.linear_model import Perceptron**

Esta clase implementa el Perceptr√≥n de Rosenblatt (el original), es decir, una neurona artificial que:

+ ajusta sus pesos y bias,

+ utiliza la regla de aprendizaje del perceptr√≥n,

+ y clasifica datos linealmente separables.

**sklearn.metrics import accuracy_score**

+ Compara las etiquetas reales (verdaderas) con las predichas por el modelo

+ Y calcula la propocion de aciertos de la siguiente manera:

$$\textit {Accuracy} = \frac{\text{n√∫mero de predicciones correctas}}{\text{n√∫mero total de ejemplos}}$$

**Numpy as np**
Librer√≠a fundamental de Python para el c√°lculo num√©rico y cient√≠fico que nos permite implementar el uso de arreglos.

**Perceptron(max_iter=1000, eta0=1.0, random_state=0)**

Donde:

+ max_iter=1000 : n√∫mero m√°ximo de iteraciones (√©pocas) para entrenar.

+ eta0=1.0 : tasa de aprendizaje (qu√© tanto cambian los pesos en cada error).

+ random_state=0 : asegura resultados reproducibles (para que no cambie cada vez que lo ejecutes).

+ Repite hasta que no haya errores o se alcance el n√∫mero m√°ximo de iteraciones.

**print()**

Imprime los resultados en consola.

#**1.4. Pipeline  (una subsecci√≥n en el notebook por cada una las siguientes etapas):**

+ Feature Engineering (... describir las variables (se√±ales i/o) por emplear)

**Variables de entrada y salida**

X = np.array([[0,0],[0,1],[1,0],[1,1]])

y = np.array([0,1,1,1])

Donde: X contiene todos los pares posibles de 0 y 1 como en una compuerta l√≥gica. Por otro lado Y contiene los resultados esperados del operador OR (0 unicamente si ambos pares son 0, y 1 si minimo uno de los dos es 1).


+ **Modelo Selection (... describir las razones formales del por qu√© emplear un clasificador lineal)**

El clasificador lineal, como el Perceptr√≥n, se utiliza porque ofrece una soluci√≥n simple, eficiente e interpretativa para problemas de clasificaci√≥n donde las clases pueden separarse mediante una frontera recta o un plano.

Su funcionamiento se basa en una combinaci√≥n lineal de las variables de entrada ponderadas por coeficientes (pesos), lo que genera una funci√≥n de decisi√≥n lineal del tipo:

$$ùë§_0+ùë§_1ùë•_1+ùë§_2 ùë•_2+‚Ä¶+ùë§_ùëõ ùë•_ùëõ = 0 $$


Esta simplicidad permite representar el proceso de clasificaci√≥n de forma geom√©trica y anal√≠tica, garantizando convergencia cuando los datos son linealmente separables, seg√∫n el teorema del perceptr√≥n.

A nivel computacional, es un modelo ligero y r√°pido de entrenar, ya que solo requiere operaciones b√°sicas, lo que lo hace ideal para conjuntos de datos grandes o para usarse como modelo base de comparaci√≥n.

Adem√°s, sus par√°metros son f√°cilmente interpretables: los pesos indican la importancia de cada caracter√≠stica y el sesgo (bias) ajusta el desplazamiento de la frontera de decisi√≥n.

Los clasificadores lineales tienen un valor conceptual fundamental, ya que constituyen la base te√≥rica de modelos m√°s avanzados como la regresi√≥n log√≠stica, las m√°quinas de soporte vectorial (SVM) y las redes neuronales multicapa.

En conjunto, se emplean porque combinan solidez te√≥rica, eficiencia pr√°ctica e interpretabilidad, ofreciendo una representaci√≥n clara del proceso de decisi√≥n y un punto de partida esencial para el aprendizaje autom√°tico moderno.

+ **Model Training (... l√≠neas de c√≥digo respectivas para entrenar al perceptr√≥n (fit)).**

**model.fit(X, y)**

Aqu√≠ el modelo:

+ Calcula salidas.

+ Compara con las esperadas.

+ Ajusta los pesos con la regla:

$$w_i = w_i + Œ∑ (t-y)x_i$$

+ Prediction (... crear una funci√≥n para probar que cada patr√≥n de entrada es clasificado de manera correcta).

```python
def probar_patrones(modelo, X, y_verdad):
    print("Prueba de patrones:\n")
    todos_bien = True #bandera que se√±ala si el modelo acert√≥ todos los casos.
    
    for x, t in zip(X, y_verdad): #une las entradas con sus respectivas salidas
        y_pred = modelo.predict([x])[0]   # [x] porque predict espera 2D y [0] ya que predict nos devuelve un array por lo tanto solo queremos el valor para compararlo
        correcto = (y_pred == t) #al comparar el valor predecido con el valor real obtenderemos true o false  
        if not correcto:
            todos_bien = False
        
        print(f"Entrada: {x}  ‚Üí  Esperado: {t}  |  Predicho: {y_pred}  |  Correcto: {correcto}")
    
    if todos_bien:
        print("\n Todos los patrones fueron clasificados correctamente.")
    else:
        print("\n Hay patrones mal clasificados.")
```


+ **Model Evaluation (... l√≠neas de c√≥digo fuente para calcula la M√©trica Accuracy con una breve explicaci√≥n de los resultados).**
```python
accuracy = accuracy_score(y, y_pred)
print(f"Exactitud (Accuracy): {accuracy*100:.2f}%")
```
El porcentaje sera reflejo del valor de accuracy, si la metrica es del 100% significa que el perceptron clasific√≥ correctamente todos los patrones de entrada, es decir, que las predicciones coincidieron con las salidas reales en todos los casos.

#**2.0. Cerciorarse de que el notebook se puedan interpretar y ejecutar, sin errores, en Jupyter y/o Google Colab.**

```python
from sklearn.linear_model import Perceptron
from sklearn.metrics import accuracy_score
import numpy as np

#Entradas y salidas
X = np.array([[0,0],[0,1],[1,0],[1,1]])
y = np.array([0,1,1,1])

# Entrenamiento del modelo
model = Perceptron(max_iter=1000, eta0=1.0, random_state=0)
model.fit(X, y)

# Predicciones

y_pred = model.predict(X)

# Funci√≥n para comprobar predicciones

def probar_patrones(modelo, X, y_verdad):
    print("\nPrueba de patrones:\n")
     todos_bien = True #bandera que indica si el modelo acert√≥ todos los casos.
    
    for x, t in zip(X, y_verdad):
        y_pred = modelo.predict([x])[0]  # [x] porque predict espera 2D y [0] ya que predict nos devuelve un array por lo tanto solo queremos el valor para compararlo con y_pred
        correcto = (y_pred == t)
        if not correcto:
            todos_bien = False
        
        print(f"Entrada: {x}  ‚Üí  Esperado: {t}  |  Predicho: {y_pred}  |  Correcto: {correcto}")
    
    if todos_bien:
        print("\n Todos los patrones fueron clasificados correctamente.")
    else:
        print("\n  Hay patrones mal clasificados.")


# Prueba de clasificaci√≥n patr√≥n por patr√≥n
probar_patrones(model, X, y)

# Precision
accuracy = accuracy_score(y, y_pred)

print("Salidas esperadas:", y)
print("Salidas predichas:", y_pred)
print(f"Exactitud (Accuracy): {accuracy*100:.2f}%")

```

#**3. Referencias bibliogr√°ficas.**
* Daniel. (2023, October 30). Perceptr√≥n: ¬øqu√© es y para qu√© sirve? DataScientest. https://datascientest.com/es/perceptron-que-es-y-para-que-sirve
* Alex Hay | Computing Logic Funcitons using Perceptrons. (n.d.). https://alexanderhay2020.github.io/blog/2019/perceptrons/
* NeuralNinja. (2023, 26 julio). Perceptron Learning Algorithm: Feedforward and Weight Update. Medium. https://arafique906.medium.com/perceptron-learning-algorithm-feedforward-and-weight-update-e2ba1a9bca12


In [None]:
from sklearn.linear_model import Perceptron
from sklearn.metrics import accuracy_score
import numpy as np

# Entradas y salidas
X = np.array([[0,0],[0,1],[1,0],[1,1]])
y = np.array([0,1,1,1])

# Entrenamiento del modelo
model = Perceptron(max_iter=1000, eta0=1.0, random_state=0)
model.fit(X, y)

# Predicciones

y_pred = model.predict(X)

# Funci√≥n para comprobar predicciones

def probar_patrones(modelo, X, y_verdad):
    print("\nPrueba de patrones:\n")
    todos_bien = True #bandera que indica si el modelo acert√≥ todos los casos.

    for x, t in zip(X, y_verdad):
        y_pred = modelo.predict([x])[0]  # [x] porque predict espera 2D y [0] ya que predict nos devuelve un array por lo tanto solo queremos el valor para compararlo con y_pred
        correcto = (y_pred == t)
        if not correcto:
            todos_bien = False

        print(f"Entrada: {x}  ‚Üí  Esperado: {t}  |  Predicho: {y_pred}  |  Correcto: {correcto}")

    if todos_bien:
        print("\n Todos los patrones fueron clasificados correctamente.")
    else:
        print("\n  Hay patrones mal clasificados.")


# Prueba de clasificaci√≥n patr√≥n por patr√≥n
probar_patrones(model, X, y)

# Precision
accuracy = accuracy_score(y, y_pred)

print("Salidas esperadas:", y)
print("Salidas predichas:", y_pred)
print(f"Exactitud (Accuracy): {accuracy*100:.2f}%")


Prueba de patrones:

Entrada: [0 0]  ‚Üí  Esperado: 0  |  Predicho: 0  |  Correcto: True
Entrada: [0 1]  ‚Üí  Esperado: 1  |  Predicho: 1  |  Correcto: True
Entrada: [1 0]  ‚Üí  Esperado: 1  |  Predicho: 1  |  Correcto: True
Entrada: [1 1]  ‚Üí  Esperado: 1  |  Predicho: 1  |  Correcto: True

 Todos los patrones fueron clasificados correctamente.
Salidas esperadas: [0 1 1 1]
Salidas predichas: [0 1 1 1]
Exactitud (Accuracy): 100.00%
