In [6]:
import pandas as pd
import math

df = pd.read_csv('mamiferos.csv')

In [7]:
# Función para calcular la entropía
def calcular_entropia(data, target):
    classes = data[target].unique()
    entropia = 0
    total = len(data)
    for c in classes:
        prob = len(data[data[target] == c]) / total
        entropia += -prob * math.log2(prob)
    return entropia

In [8]:
# Función para calcular la entropía de una partición basada en un feature
def calcular_entropia_particion(data, feature, target):
    unique_values = data[feature].unique()
    entropia_total = 0
    total = len(data)
    for value in unique_values:
        subset = data[data[feature] == value]
        prob = len(subset) / total
        entropia = calcular_entropia(subset, target)
        entropia_total += prob * entropia
    return entropia_total

In [9]:
# Calcular entropía para cada feature
features = ['vuela', 'ponehuevos', 'nada']
entropias = {}
for feature in features:
    entropia = calcular_entropia_particion(df, feature, 'mamifero')
    entropias[feature] = entropia

In [10]:
# Seleccionar el feature con mínima entropía
min_entropia_feature = min(entropias, key=entropias.get)
min_entropia = entropias[min_entropia_feature]


print("Entropía para cada feature:")
for feature, entropia in entropias.items():
    print(f"{feature}: {entropia}")

print(f"\nEl feature con mínima entropía es '{min_entropia_feature}' con una entropía de aproximadamente {min_entropia}.")


Entropía para cada feature:
vuela: 0.9792504246104775
ponehuevos: 0.46358749969093305
nada: 0.9792504246104775

El feature con mínima entropía es 'ponehuevos' con una entropía de aproximadamente 0.46358749969093305.
