<a href="https://colab.research.google.com/github/AdrianOjeda/clasificacion-inteligente-de-datos/blob/main/PerceptonNotebook.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **1.1 Fundamentos de la Técnica**

El Perceptrón es uno de los algoritmos más antiguos de aprendizaje supervisado. Fue propuesto por Frank Rosenblatt en 1958 y se utiliza para problemas de clasificación binaria. Su funcionamiento se basa en ajustar pesos para minimizar errores en la clasificación de patrones de entrada, usando una función de activación escalón. El Perceptrón es el punto de partida de las redes neuronales artificiales y un modelo clave en el aprendizaje supervisado para clasificación binaria. Su simplicidad lo convierte en una herramienta ideal para entender cómo funcionan los clasificadores lineales.

# **1.2 Modelo Matemático del Perceptrón**

El modelo se define como:

$y = f(\mathbf{w} \cdot \mathbf{x} + b)$

Donde:
- $\mathbf{x}$ es el vector de entrada
- $\mathbf{w}$ son los pesos
- b es el sesgo
- f es la función escalón: $f(z)=1$ si $z\geq 0, 0$ en otro caso
El algoritmo ajusta los pesos usando la regla de actualización:
$\mathbf{w}\leftarrow \mathbf{w}+\eta (y_{\mathrm{true}}-y_{\mathrm{pred}})\mathbf{x}$



# **1.3. Librerías, Clases y Funciones**



Usaremos scikit-learn, una librería muy popular en Python para machine learning. En particular:
- **sklearn.linear_model.Perceptron**: clase que implementa el algoritmo
- **fit(X, y)**: entrena el modelo
- **predict(X)**: realiza predicciones
- **accuracy_score(y_true, y_pred)**: calcula la métrica de precisión


Para poder hacer uso de dichas features debemos importar la siguiente libreria:
```
from sklearn.linear_model import Perceptron

from sklearn.metrics import accuracy_score

from sklearn.datasets import make_classification

from sklearn.model_selection import train_test_split
```



# **1.4 Pipeline**

## 1.4.1 Feature engineering

Para esta pipeline el dataset que usaré será el dataset de iris ya que las caracteristicas ya estan bien definidas, lo que facilita su implementación. El dataset contiene 150 muestras de flores de 3 especies:

- Iris setosa
- Iris versicolor
- Iris virginica

Cada muestra tiene 4 características numéricas:

| Índice | Característica        | Descripción             | Unidad       |
|--------|-----------------------|--------------------------|--------------|
| 0      | `sepal length (cm)`   | Longitud del sépalo      | centímetros  |
| 1      | `sepal width (cm)`    | Ancho del sépalo         | centímetros  |
| 2      | `petal length (cm)`   | Longitud del pétalo      | centímetros  |
| 3      | `petal width (cm)`    | Ancho del pétalo         | centímetros  |

**Señales I/O:**

Las señales de entrada son las características numéricas que describen cada flor. En el dataset Iris, cada muestra tiene 4 variables de entrada:

| Variable               | Descripción              | Tipo de dato | Rango típico |
|------------------------|---------------------------|--------------|--------------|
| `sepal length (cm)`    | Longitud del sépalo       | float        | 4.3 – 7.9    |
| `sepal width (cm)`     | Ancho del sépalo          | float        | 2.0 – 4.4    |
| `petal length (cm)`    | Longitud del pétalo       | float        | 1.0 – 6.9    |
| `petal width (cm)`     | Ancho del pétalo          | float        | 0.1 – 2.5    |

Estas variables se representan como un vector de características $\mathbf{x} \in \mathbb{R}^4$.

La señal de salida es la **etiqueta de clase** que indica la especie de la flor. Para el Perceptrón, que es un clasificador binario, seleccionamos solo dos clases:

| Clase | Especie            | Valor |
|-------|---------------------|-------|
| 0     | Iris setosa       | 0     |
| 1     | Iris versicolor   | 1     |

La variable de salida se representa como $y \in \{0, 1\}$, donde cada valor indica la clase asignada por el modelo.


# 1.4.2 Model Selection


El Perceptrón es un clasificador lineal que funciona bien cuando los datos son linealmente separables. En el caso del dataset Iris para las clases Setosa y Versicolor, las características permiten una separación clara entre clases. Las razones para elegir este modelo son:

- Es computacionalmente eficiente.
- Tiene una implementación sencilla.
- Permite entender los fundamentos del aprendizaje supervisado.
- Es adecuado para problemas binarios con fronteras lineales.


# 1.4.3 Model Training

Ahora para entrenar el modelo primero debemos cargar del dataset:

In [11]:
from sklearn.datasets import load_iris

iris = load_iris()
X = iris.data
y = iris.target


Ya que el perceptrón básico no maneja multiples clases de manera directa, debemos de filtrar dos clases, en mi caso yo usaré las clases setosa y versicolor.

In [12]:
import numpy as np

X_binary = X[y != 2]
y_binary = y[y != 2]


In [15]:
#Dividimos entre entrenamiento y prueba para evaluar el rendimiento del modelo
#La funcion train_test_split nos permite dividir el dataset de forma aleatoria
#Ademas esta funcion tambien recibe como parametro el tamaño de la muestra que le vamos a dedicar a las pruebas
#En mi caso yo puse que el 0.3 de los datos serán dedicados a las pruebas.
X_train, X_test, y_train, y_test = train_test_split(X_binary, y_binary, test_size=0.3, random_state=42)


In [17]:
from sklearn.linear_model import Perceptron

#Creamos y entrenamos el modelo
#Definimos el numero de iteraciones a 1000
#Definimos la taza de aprendizaje inicial a 1.0
model = Perceptron(max_iter=1000, eta0=1.0, random_state=42)
model.fit(X_train, y_train)


## 1.4.4 Prediction

Ahora creamos una función para clasificar nuevos patrones de entrada.

In [18]:
# Creamos nuestra función test_prediction que recibe como parametros el modelo creado anteriormente y X_test
# que son las caracteristicas de las muestras de prueba que dividimos anteriormente.
def test_prediction(model, X):
    return model.predict(X)

# Llamamos a la funcion que acabamos de crear
y_pred = test_prediction(model, X_test)


# 1.4.5 Model Evaluation

In [19]:
from sklearn.metrics import accuracy_score

# Calculamos la precision
accuracy = accuracy_score(y_test, y_pred)

# Mostramos el resultado
print(f"Accuracy del modelo: {accuracy:.2f}")


Accuracy del modelo: 1.00


La métrica Accuracy mide qué tan bien el modelo clasificó correctamente las muestras de prueba. Se calcula como:

$\mathrm{Accuracy}=\frac{\mathrm{Numero\  de\  predicciones\  correctas}}{\mathrm{Número\  total\  de\  muestras}}$

- Un valor cercano a 1.0 (o 100%) indica que el modelo tiene un buen desempeño.
- Si el valor es bajo, puede significar que el modelo no está generalizando bien y necesita ajustes (más datos, mejor preprocesamiento, etc.).


# Referencias Bibliográficas


- Scikit-learn developers. (2024). *sklearn.linear_model.Perceptron*. Scikit-learn. https://scikit-learn.org/1.6/modules/generated/sklearn.linear_model.Perceptron.html

- Kantor, J. C. (2020). *Getting Started with Python and Jupyter Notebooks* [Notebook]. Google Colab. https://colab.research.google.com/github/jckantor/CBE30338/blob/master/docs/01.01-Getting-Started-with-Python-and-Jupyter-Notebooks.ipynb

- Rafique, A. (2021, February 6). *Perceptron Learning Algorithm: Feedforward and Weight Update*. Medium. https://arafique906.medium.com/perceptron-learning-algorithm-feedforward-and-weight-update-e2ba1a9bca12