In [3]:
import math
# Definición de datos de entrenamiento
# Formato: [Clima, Temperatura, Jugar Tenis]
data = [
    ["Soleado", "Caliente", "Sí"],
    ["Soleado", "Caluroso", "No"],
    ["Nublado", "Caluroso", "Sí"],
    ["Lluvioso", "Suave", "Sí"],
    ["Lluvioso", "Frío", "No"],
    ["Lluvioso", "Frío", "No"],
    ["Nublado", "Frío", "Sí"],
    ["Soleado", "Suave", "No"],
    ["Soleado", "Frío", "Sí"],
    ["Lluvioso", "Suave", "Sí"]
]



In [4]:
# Función para calcular la entropía
def calcular_entropia(data):
    etiquetas = [item[-1] for item in data]
    etiqueta_conteo = {}
    
    for etiqueta in etiquetas:
        if etiqueta in etiqueta_conteo:
            etiqueta_conteo[etiqueta] += 1
        else:
            etiqueta_conteo[etiqueta] = 1
    
    entropia = 0
    total_muestras = len(data)
    
    for etiqueta in etiqueta_conteo:
        probabilidad = etiqueta_conteo[etiqueta] / total_muestras
        entropia -= probabilidad * (probabilidad and math.log(probabilidad, 2))
    
    return entropia



In [5]:
# Función para dividir los datos
def dividir_datos(data, atributo, valor):
    datos_divididos = []
    
    for registro in data:
        if registro[atributo] == valor:
            datos_divididos.append(registro)
    
    return datos_divididos



In [6]:
# Función para encontrar el mejor atributo para dividir
def encontrar_mejor_atributo(data):
    entropia_inicial = calcular_entropia(data)
    mejor_ganancia_informacion = 0
    mejor_atributo = None
    atributos = len(data[0]) - 1
    
    for i in range(atributos):
        valores_atributo = [registro[i] for registro in data]
        valores_atributo = list(set(valores_atributo))
        
        ganancia_informacion = 0
        
        for valor in valores_atributo:
            datos_divididos = dividir_datos(data, i, valor)
            probabilidad = len(datos_divididos) / float(len(data))
            ganancia_informacion += probabilidad * calcular_entropia(datos_divididos)
        
        ganancia_informacion = entropia_inicial - ganancia_informacion
        
        if ganancia_informacion > mejor_ganancia_informacion:
            mejor_ganancia_informacion = ganancia_informacion
            mejor_atributo = i
    
    return mejor_atributo



In [7]:
# Función para definir la clase (Sí o No)
def definir_clase(data):
    etiquetas = [registro[-1] for registro in data]
    etiqueta_conteo = {}
    
    for etiqueta in etiquetas:
        if etiqueta in etiqueta_conteo:
            etiqueta_conteo[etiqueta] += 1
        else:
            etiqueta_conteo[etiqueta] = 1
    
    etiqueta_ordenada = sorted(etiqueta_conteo.items(), key=lambda x: x[1], reverse=True)
    return etiqueta_ordenada[0][0]


In [8]:

# Función recursiva para construir el árbol de decisión
def construir_arbol(data, atributos):
    etiquetas = [registro[-1] for registro in data]
    
    if len(set(etiquetas)) == 1:
        return etiquetas[0]
    
    if len(data[0]) == 1 or not atributos:
        return definir_clase(data)
    
    mejor_atributo = encontrar_mejor_atributo(data)
    arbol = {mejor_atributo: {}}
    atributos.remove(mejor_atributo)
    valores_atributo = [registro[mejor_atributo] for registro in data]
    valores_atributo = list(set(valores_atributo))
    
    for valor in valores_atributo:
        datos_divididos = dividir_datos(data, mejor_atributo, valor)
        arbol[mejor_atributo][valor] = construir_arbol(datos_divididos, atributos[:])
    
    return arbol



In [11]:
# Función para imprimir el árbol de decisión
def imprimir_arbol(arbol, espacio=""):
    if type(arbol) == dict:
        atributo = list(arbol.keys())[0]
        sub_arbol = arbol[atributo]
        print(str(espacio) +str(atributo))
        for valor in sub_arbol:
            print(str(espacio) + "  |__" + str(valor))
            imprimir_arbol(sub_arbol[valor], espacio + "   ")



In [12]:
# Datos de prueba
atributos = [0, 1]
arbol_decision = construir_arbol(data, atributos)
print("Árbol de Decisión:")
imprimir_arbol(arbol_decision)

Árbol de Decisión:
0
  |__Soleado
   1
     |__Suave
     |__Frío
     |__Caliente
     |__Caluroso
  |__Nublado
  |__Lluvioso
   1
     |__Frío
     |__Suave
