# Decision Tree 

## Comentarios y Descripción del Código Python para el Diagnóstico de Gripe

Este script de Python, arbol_decision_gripe.py, ilustra un caso simple de diagnóstico médico usando un árbol de decisión. El objetivo es predecir si un paciente tiene gripe basándose en la presencia o ausencia de ciertos síntomas. 

A continuación, una descripción detallada de cada línea:


In [2]:
# arbol_decision_gripe.py
import pandas as pd

Esta línea importa la librería pandas, que es fundamental para el manejo y análisis de datos en Python. Se le asigna el alias pd por convención para facilitar su uso.

In [4]:
from sklearn.tree import DecisionTreeClassifier

Aquí se importa la clase DecisionTreeClassifier del módulo tree de la librería scikit-learn (sklearn). Esta clase es la que se utiliza para construir y entrenar modelos de árboles de decisión para tareas de clasificación.

In [5]:
from sklearn import tree

Se importa el módulo completo tree de sklearn. Esto es necesario para usar funciones como plot_tree, que permite visualizar el árbol de decisión entrenado.

In [6]:
# Datos de ejemplo
data = pd.DataFrame({
    'fiebre': [1, 0, 1, 1, 0],
    'dolor_cabeza': [1, 0, 1, 0, 0],
    'tos': [1, 0, 1, 1, 0],
    'gripe': [1, 0, 1, 1, 0]
})

En esta sección, creamos un DataFrame de pandas llamado data. Contiene un conjunto de datos de ejemplo que simula registros de pacientes:

- 'fiebre': Indica si el paciente tiene fiebre (1) o no (0).
- 'dolor_cabeza': Indica si el paciente tiene dolor de cabeza (1) o no (0).
- 'tos': Indica si el paciente tiene tos (1) o no (0).
- 'gripe': Es nuestra variable objetivo; indica si el paciente fue diagnosticado con gripe (1) o no (0).

In [7]:
X = data[['fiebre', 'dolor_cabeza', 'tos']]

Aquí definimos X, que representa las características de entrada (o variables predictoras) que el modelo usará para hacer su predicción. Seleccionamos las columnas 'fiebre', 'dolor_cabeza' y 'tos' de nuestro DataFrame data.

In [8]:
y = data['gripe']

Esta línea define y, que es nuestra variable objetivo (o variable dependiente) que el modelo intentará predecir. En este caso, es la columna 'gripe'.

In [9]:
modelo = DecisionTreeClassifier()

Se crea una instancia del clasificador de árbol de decisión DecisionTreeClassifier. Este objeto vacío está listo para ser entrenado con nuestros datos.

In [10]:
modelo.fit(X, y)

DecisionTreeClassifier()

Esta es la etapa de entrenamiento del modelo. El método fit() toma las características de entrada (X) y la variable objetivo (y) y construye el árbol de decisión, aprendiendo los patrones y reglas que relacionan los síntomas con el diagnóstico de gripe.

In [11]:
paciente = [[1, 1, 0]]  # Tiene fiebre y dolor de cabeza, pero no tos

Se prepara un nuevo punto de datos para realizar una predicción. paciente es una lista de listas que representa a un nuevo paciente con síntomas específicos: tiene fiebre (1), dolor de cabeza (1), pero no tiene tos (0).

In [12]:
prediccion = modelo.predict(paciente)

El método predict() del modelo entrenado se utiliza para realizar una predicción sobre el paciente nuevo. El resultado será un array (en este caso, de un solo elemento) indicando si el modelo predice gripe (1) o no gripe (0) para este paciente.

In [13]:
print("¿El paciente tiene gripe?:", "Sí" if prediccion[0] == 1 else "No")

¿El paciente tiene gripe?: Sí


Finalmente, esta línea imprime el resultado de la predicción de una manera fácil de entender. Utiliza un operador ternario para mostrar "Sí" si la predicción es 1 (gripe) y "No" si es 0 (no gripe).

Este ejemplo simple ilustra cómo un árbol de decisión puede ser una herramienta efectiva para clasificar datos, incluso con un conjunto de datos pequeño, y es una excelente introducción a los conceptos de aprendizaje automático.