# Red Neuronal Artificial para la predicción de enfermedades cardíacas

![Logo](https://enlinea.tecmm.mx/moodle/pluginfile.php/1/theme_roshnilite/logo/1756935571/tecjalisco%20azul.png)

- **Autor:** _Eduardo Efrain Garcia Sarez_

  > **27/11/2025**

- **Institución:** **Instituto Tecnológico Superior de Jalisco (TSJ)**.  
- **Carrera:** **Ingeniería en Sistemas Computacionales**

En este notebook nos centraremos en implementar una **FNN** (Feedforward Neural Network) capaz de aprender el patrones dentro de un dataset de enfermedades cardiacas. Los temas son los siguientes:

1. Descripción de las Características del Dataset
   - 1.1 Variables Clínicas

2. Descripción de Librerías, Clases y Funciones
   - 2.1 Pandas
   - 2.2 TensorFlow/Keras
   - 2.3 Scikit-learn
   - 2.4 NumPy

3. Pipeline de Desarrollo
   - 3.1 Model Selection
     - Razones para emplear una Red Neuronal Profunda
     - Razones para emplear la API de Keras
     - Código: Carga y preparación de datos
   - 3.2 Model Training
     - Construcción del modelo
     - Compilación del modelo
     - Entrenamiento del modelo
   - 3.3 Prediction
     - Ejemplo de uso con un paciente
     - Predicciones para múltiples pacientes

4. Model Evaluation
   - 4.1 Descripción de Métricas
     - Accuracy (Exactitud)
     - Confusion Matrix (Matriz de Confusión)
     - Visualización de Confusion Matrix
     - Visualización de curvas de entrenamiento

## 1. Descripción de las características del Dataset

El dataset utilizado para este ejemplo fue tomado del artículo: [**“Build Your First Neural Network with TensorFlow: A Step-by-Step Guide”**](https://drlee.io/build-your-first-neural-network-with-tensorflow-a-step-by-step-guide-1dd3e6652cf1).
Sin embargo, este dataset también se encuentra disponible en la librería de datos públicos del **UC Irvine Machine Learning Repository** ([https://github.com/uci-ml-repo/ucimlrepo](https://github.com/uci-ml-repo/ucimlrepo)), la cual cuenta con más estudios y datasets disponibles en su sitio web oficial: [https://archive.ics.uci.edu/datasets](https://archive.ics.uci.edu/datasets). 

A continuación se muestra su composición.

### Variables Clínicas

- **age**: Edad del paciente (en años)
- **sex**: Sexo del paciente (1 = masculino, 0 = femenino)
- **cp**: Tipo de dolor torácico
  - 0: Angina típica
  - 1: Angina atípica
  - 2: Dolor no anginoso
  - 3: Asintomático
- **trestbps**: Presión arterial en reposo (mm Hg)
- **chol**: Colesterol sérico (mg/dl)
- **fbs**: Glucosa en ayunas > 120 mg/dl (1 = verdadero, 0 = falso)
- **restecg**: Resultados del electrocardiograma en reposo
  - 0: Normal
  - 1: Anormalidad en onda ST-T
  - 2: Hipertrofia ventricular izquierda
- **thalach**: Frecuencia cardíaca máxima alcanzada
- **exang**: Angina inducida por ejercicio (1 = sí, 0 = no)
- **oldpeak**: Depresión del ST inducida por ejercicio
- **slope**: Pendiente del segmento ST durante ejercicio máximo
  - 0: Ascendente
  - 1: Plana
  - 2: Descendente
- **ca**: Número de vasos principales coloreados por fluoroscopia (0-3)
- **thal**: Talasemia
  - 1: Normal
  - 2: Defecto fijo
  - 3: Defecto reversible
- **target**: Variable objetivo (1 = presencia de enfermedad cardíaca, 0 = ausencia)

## 2. Descripción de Librerías, Clases y Funciones

### 2.1 Pandas

**Librería**: Manipulación y análisis de datos

**Funciones empleadas**:

- `pd.read_csv()`: Carga datos desde archivo CSV
  - Parámetros: `filepath` (ruta del archivo)
- `df.head()`: Muestra las primeras 5 filas del DataFrame
- `df.columns`: Retorna nombres de columnas
- `df.drop()`: Elimina columnas especificadas
  - Parámetros: `columns` (lista de columnas), `axis=1` (eje de columnas)
- `df.values`: Convierte DataFrame a array NumPy

### 2.2 TensorFlow/Keras

**Librería**: Construcción y entrenamiento de redes neuronales

**Clases y funciones**:

- `Sequential()`: Crea modelo secuencial de capas apiladas
- `Dense()`: Capa totalmente conectada
  - Parámetros: `units` (número de neuronas), `activation` (función de activación), `input_shape` (forma de entrada)
- `model.compile()`: Configura el proceso de aprendizaje
  - Parámetros: `optimizer` (algoritmo de optimización), `loss` (función de pérdida), `metrics` (métricas a monitorear)
- `model.fit()`: Entrena el modelo
  - Parámetros: `x` (datos de entrada), `y` (etiquetas), `epochs` (iteraciones), `batch_size` (tamaño de lote), `validation_split` (porcentaje para validación)
- `model.predict()`: Genera predicciones
  - Parámetros: `x` (datos de entrada)
- `model.evaluate()`: Evalúa el modelo
  - Parámetros: `x` (datos de prueba), `y` (etiquetas de prueba)

### 2.3 Scikit-learn

**Librería**: Herramientas de machine learning

**Funciones empleadas**:

- `train_test_split()`: Divide datos en conjuntos de entrenamiento y prueba
  - Parámetros: `X`, `y`, `test_size` (proporción de prueba), `random_state` (semilla aleatoria)
- `confusion_matrix()`: Calcula matriz de confusión
  - Parámetros: `y_true` (valores reales), `y_pred` (predicciones)

### 2.4 NumPy

**Librería**: Operaciones numéricas con arrays

**Funciones empleadas**:

- `np.round()`: Redondea valores
- `np.array()`: Crea arrays NumPy

## 3. Pipeline de Desarrollo

### 3.1 Model Selection

El uso de una **FFNN (FeedForward Neural Network)** se justifica dado que nos enfrentamos a un problema de **clasificación múltiple**, en el cual, a partir de un conjunto de características, se espera obtener una salida específica. En este caso particular, las posibles salidas son **positiva** o **negativa**.

Además, se cuenta con un conjunto de datos previamente **etiquetados**, lo que permite adoptar un enfoque de **entrenamiento supervisado**, escenario en el que este tipo de redes neuronales demuestra un desempeño destacado.

**Arquitectura seleccionada**:

- Red neuronal feedforward con múltiples capas densas
- Función de activación ReLU en capas ocultas (introduce no linealidad)
- Función de activación Sigmoid en capa de salida (clasificación binaria)
- Optimizador Adam (adaptativo, convergencia rápida)
- Binary Crossentropy como función de pérdida (estándar para clasificación binaria)

Se optó por utilizar **`TensorFlow`** debido a que constituye uno de los principales referentes en el ámbito del *Deep Learning*. En contraste con **`Scikit-Learn`**, TensorFlow es una biblioteca más completa y robusta, ya que permite **entrenar y ejecutar modelos tanto en CPU como en GPU**, lo que proporciona un rendimiento significativamente superior. Asimismo, su arquitectura **multiplataforma** resulta altamente adecuada para diversos entornos de desarrollo y producción.

De igual manera, se decidió emplear la API **`Keras`**, integrada de forma nativa en `TensorFlow`, por las siguientes razones:

- **Simplicidad y claridad sintáctica**: Keras ofrece una interfaz de alto nivel que facilita la construcción de redes neuronales mediante un código más legible y estructurado.
- **Flexibilidad operativa**: La API *Sequential* permite definir modelos de manera lineal, lo cual resulta apropiado para arquitecturas *feedforward* y prototipos iniciales.
- **Integración nativa con TensorFlow**: Al ser la API oficial de alto nivel de TensorFlow, Keras aprovecha de forma directa las optimizaciones del backend, incluyendo aceleración por hardware.
- **Agilidad en el prototipado**: Su diseño promueve la rápida experimentación, ajuste de hiperparámetros y validación de modelos, reduciendo significativamente los tiempos de desarrollo.

Empezemos con la demostracion en codigo:


In [1]:
# IMPORTACIONES NECESARIAS
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# Cargar dataset
df = pd.read_csv('https://raw.githubusercontent.com/fenago/deep-learning-essentials/main/HeartDiseaseTrain-Test.csv')

# Separar características y variable objetivo
X = df.drop('target', axis=1).values
y = df['target'].values

# Dividir en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

print(f"Forma de datos de entrenamiento: {X_train.shape}")
print(f"Forma de datos de prueba: {X_test.shape}")

ModuleNotFoundError: No module named 'tensorflow'