<a href="https://colab.research.google.com/github/BorisMejiasII/Proyecto-MachineLearning/blob/main/Proyecto_de_Machine_Learning_BorisMej%C3%ADas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## ** Proyecto: Clasificación de Ritmo Cardíaco (Normal vs AFib)**

 **Objetivo:**
Desarrollar un modelo de Machine Learning capaz de clasificar señales ECG como Ritmo Normal o Fibrilación Auricular (AFib), utilizando características estadísticas de los intervalos RR.



In [3]:
#======================================
#  Carga de datos y exploración inicial
#======================================

#Link a todo lo importante: https://archive.physionet.org/physiobank/database/challenge/2017/training/

import pandas as pd

# Cargar dataset
df = pd.read_csv("ecg_rr_features_curado.csv")
df.head()


FileNotFoundError: [Errno 2] No such file or directory: 'ecg_rr_features_curado.csv'

In [None]:
# Información general
df.info()
df.describe()

# Conteo de clases
df['label'].value_counts()


In [None]:
#====================================================
#  Visualización y análisis de distribución por clase
#====================================================

import matplotlib.pyplot as plt
import seaborn as sns

# Boxplots por clase
features = ['mean_rr', 'std_rr', 'skew_rr', 'kurt_rr']

for col in features:
    plt.figure(figsize=(6, 4))
    sns.boxplot(x='label', y=col, data=df)
    plt.title(f'{col} por clase')
    plt.show()

# Correlaciones
sns.pairplot(df, hue="label", corner=True)

In [None]:
#====================================================
#  Preparación del modelo de Machine Learning
#====================================================

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Variables
X = df[features]
y = df['label']

# Separar en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42, stratify=y)

# Escalar características
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)


In [None]:
#====================================================
#  Entrenamiento y evaluación del modelo
#====================================================

#Opción 1: Regresión Logística
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, confusion_matrix, ConfusionMatrixDisplay

model_lr = LogisticRegression()
model_lr.fit(X_train_scaled, y_train)
y_pred_lr = model_lr.predict(X_test_scaled)

# Evaluación
acc_lr = accuracy_score(y_test, y_pred_lr)
print(f'Accuracy: {acc_lr:.2f}')

# Matriz de confusión
ConfusionMatrixDisplay.from_estimator(model_lr, X_test_scaled, y_test)
plt.title("Matriz de Confusión - Logistic Regression")
plt.show()

#Opción 2: Random Forest

from sklearn.ensemble import RandomForestClassifier

model_rf = RandomForestClassifier(random_state=42)
model_rf.fit(X_train, y_train)
y_pred_rf = model_rf.predict(X_test)

# Evaluación
acc_rf = accuracy_score(y_test, y_pred_rf)
print(f'Accuracy: {acc_rf:.2f}')

# Matriz de confusión
ConfusionMatrixDisplay.from_estimator(model_rf, X_test, y_test)
plt.title("Matriz de Confusión - Random Forest")
plt.show()


In [None]:
#====================================================
#  Análisis de errores
#====================================================

# Ver ejemplos mal clasificados por Random Forest
misclassified = (y_test != y_pred_rf)
X_test_errors = X_test[misclassified]
print("Errores de clasificación:")
print(X_test_errors)


# **Espacio para preguntas o algo así**

# **Conclusiones y mejoras posibles**
Se logró un modelo con una precisión de aproximadamente X%.

Las características estadísticas como std_rr y mean_rr parecen ser las más informativas.

Se podrían considerar mejoras como:

Usar más datos o señales originales.

Aplicar técnicas de selección de características.

Probar modelos más complejos como SVM o redes neuronales.

