# Hands-on 1: Percepton Notebook (Tutorial)
**Nombre:** Katia Alejandra Avalos Garcia  
**Profesor:** Jose Antonio Aviña Mendez<br>
**Materia:** Clasificacion inteligente de datos

# 1.1  Fundamentos de la técnica: 
El perceptrón es un modelo matemático utilizado en deep learning que simula el funcionamiento de una red neuronal artificial. Su objetivo principal es clasificar datos en dos categorías, actuando como un clasificador binario.

Funciona identificando las entradas, asignándoles pesos, y produciendo una salida que puede ser verdadera o falsa, nunca las dos al mismo tiempo.

# 1.2  Modelo Matemático del Perceptrón.

$$y = f \left( \sum_{i=1}^{n} (x_i w_i) + b \right)$$

+ **X1, X2, X3:** Son las entradas, aquellos valores empleados en el modelo<br>
+ **W1, W2, W3:** Son los pesos asociados a cada entrada<br>
+ **Sumatoria:** Realiza la sumotaroia ponderada de todas las entrada.

Es necesario mencionar que el **bias**  tiene la funcionalidad de:
    desplazar el límite de decisión: Permite mover la línea o hiperplano que separa las clases, en lugar de que siempre pase por el origen.

# 1.3  Descripción de la librería, clases, funciones
- **pandas:** Se usa para cargar, limpiar y explorar el dataset.
     + Funciones: read_csv(), fillna(), head()
- **scikit-learn (sklearn):** Empleado en construir y entrenar el perceptron
- **matplotlib:** Se visualizan los datos en graficas

In [17]:
import pandas as pd
import numpy as np
# Separa dos clases 0=no diabetes | 1=diabetes
from sklearn.linear_model import Perceptron
# Divide los conjunto de entrenamiento (70%) y prueba (30%) 
from sklearn.model_selection import train_test_split
#Mide precicion del modelo
from sklearn.metrics import accuracy_score

# 1.4. Pipeline

***Feature Engineering***

In [18]:

# Cargar dataset
diabetes = pd.read_csv('diabetes.csv', na_values=['?'])

# # Reemplazar valores faltantes por la media para preservar todas las filas de datos y usar un valor neutral que no sesgue la distribución
diabetes.fillna(diabetes.mean(), inplace=True)

# Seleccionar solo dos variables para la gráfica: Glucose y BMI
X = diabetes[['Glucose', 'BMI']]
y = diabetes['Outcome']  # 0=no diabetes, 1=diabetes

# Verificar primeras filas
X.head()


Unnamed: 0,Glucose,BMI
0,148,33.6
1,85,26.6
2,183,23.3
3,89,28.1
4,137,43.1


  ***Modelo Selection***

Se emplea el Perceptrón porque es un clasificador lineal enfocado en predecir si un paciente tiene diabetes o no. Es fácil de entrenar y permite tanto interpretar como visualizar los resultados.
Además, el modelo asigna pesos a cada variable, lo que ayuda a comprender la influencia de factores como el nivel de glucosa o el índice de masa corporal (BMI) en la probabilidad de que un paciente presente diabetes.

 ***Model Training***


NOTA: El modelo pasa por los datos de entrenamiento calculando con la formula una prediccoon, para despues evaluar el error haciendo esa comparativa con el resultado real, para asi ir ajustando los pesos y el sesgo para mejorar la precisión futura.

In [19]:

# Dividir datos en 70% entrenamiento y 30% prueba train_test_split: Divide
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=42
)

# Crear el modelo Perceptrón
model = Perceptron(max_iter=1000, eta0=0.1, random_state=42)


# Entrenamiento
model.fit(X_train, y_train)

# Mostrar pesos y bias
print("Pesos aprendidos:", model.coef_)
print("Bias:", model.intercept_)


Pesos aprendidos: [[  4.4  -20.92]]
Bias: [-18.3]


Para explicar: los pesos y el sesgo (bias) son los parámetros aprendidos del Perceptrón: los pesos le dicen al modelo cuán importante e influyente es cada factor (como la glucosa o el BMI) para predecir la diabetes, mientras que el sesgo actúa como un ajuste que mueve la línea de decisión para optimizar la separación de las clases. Ambos se ajustan repetidamente durante el entrenamiento (función .fit)

***Prediction***
Primero se hace una funcion con 3 parametros, tomando los datos de entrada (inputs), los datos reales(label), haciendo una prediccion, iterando en las primeras 5 filas.

In [20]:
# Función para probar predicciones
def test_predictions(model, X, y):
    predictions = model.predict(X)
    for inputs, label, prediction in zip(X.values, y.values, predictions):
        print(f"Datos de entrada: {inputs} | Real: {label}, Prediccion: {prediction}")

# Probar primeras 5 predicciones y comparacion
test_predictions(model, X_test.head(10), y_test.head(10))


Datos de entrada: [98. 34.] | Real: 0, Prediccion: 0
Datos de entrada: [112.   35.7] | Real: 0, Prediccion: 0
Datos de entrada: [108.   30.8] | Real: 0, Prediccion: 0
Datos de entrada: [107.   24.6] | Real: 0, Prediccion: 0
Datos de entrada: [136.   29.9] | Real: 0, Prediccion: 0
Datos de entrada: [103.   37.7] | Real: 0, Prediccion: 0
Datos de entrada: [71.  20.4] | Real: 0, Prediccion: 0
Datos de entrada: [117.   33.8] | Real: 0, Prediccion: 0
Datos de entrada: [154.   31.3] | Real: 0, Prediccion: 1
Datos de entrada: [147.   33.7] | Real: 0, Prediccion: 0


***Model Evaluation***
Imaginando hace dos listas, los valores reales y el de las predicciones, para evaluar los aciertos

In [23]:


# Predicciones sobre el conjunto de prueba completo
y_pred = model.predict(X_test)

# Calcular Accuracy
accuracy = accuracy_score(y_test, y_pred)
print(f"\nAsertividad del perceptron: {accuracy*100:.2f}%")



Asertividad del perceptron: 62.77%


# Ejemplo de entrenamiento
Asigno los datos que tomo paara la prediccion y mando a llamar mi modelo

In [28]:
# Predecir para nuevos datos

nuevo_paciente = pd.DataFrame([[109, 25]], columns=['Glucose', 'BMI'])  # [Glucose, BMI]
prediccion = model.predict(nuevo_paciente)

print("Predicción:", prediccion)


Predicción: [0]


In [29]:
# Predicciones para el 30% de prueba
y_pred = model.predict(X_test)

# Comparar con los valores reales
resultados = X_test.copy()
resultados['Real'] = y_test
resultados['Predicho'] = y_pred
resultados.head(6)  # muestra las primeras 6 filas


Unnamed: 0,Glucose,BMI,Real,Predicho
668,98,34.0,0,0
324,112,35.7,0,0
624,108,30.8,0,0
690,107,24.6,0,0
473,136,29.9,0,0
204,103,37.7,0,0


# Referencias Biliograficas:
**AprendeIA con Ligdi Gonzalez. (2021, 5 octubre). ¿QUÉ ES EL PERCEPTRÓN? PERCEPTRÓN SIMPLE y MULTICAPA | 10 Inteligencia Artificial 101 | AprendeIA [Vídeo]. YouTube. https://www.youtube.com/watch?v=IpMQLh_WYMo**

**Daniel. (2023, 30 octubre). Perceptrón: ¿qué es y para qué sirve? DataScientest. https://datascientest.com/es/perceptron-que-es-y-para-que-sirve**

**Redacción, & Redacción. (2020, 11 diciembre). El Perceptron es un algoritmo de aprendizaje de máquina lineal para tareas. Top Big Data. https://topbigdata.es/algoritmo-de-perceptron-para-la-clasificacion-en-python/**

**Alex Hay | Computing Logic Funcitons using Perceptrons. (s. f.). https://alexanderhay2020.github.io/blog/2019/perceptrons/**