# Entropia de Shannon

A Entropia de Shannon, em teoria da informação, é uma medida da **incerteza** ou **imprevisibilidade** associada a uma variável aleatória. Intuitivamente, ela nos diz a quantidade média de "informação" ou "surpresa" que obtemos ao observar um resultado.

A fórmula é:

$$ H(X) = -\sum_{i=1}^{n} P(x_i) \log_b P(x_i) $$

Onde:
- $P(x_i)$ é a probabilidade do i-ésimo resultado.
- $b$ é a base do logaritmo. Geralmente usamos $b=2$, e a unidade de entropia é **bits**.

- **Entropia Alta**: Muita incerteza (ex: um dado justo).
- **Entropia Baixa**: Pouca incerteza (ex: um dado viciado que quase sempre cai no 6).

In [1]:
import numpy as np

In [2]:
def shannon_entropy(probabilities):
    """Calcula a Entropia de Shannon para uma lista de probabilidades."""
    # Filtra probabilidades que são zero para evitar log(0)
    probs = np.array([p for p in probabilities if p > 0])
    if not np.isclose(np.sum(probs), 1.0):
        raise ValueError("As probabilidades devem somar 1.")
    
    return -np.sum(probs * np.log2(probs))

In [3]:
# Exemplo 1: Moeda Justa (Incerteza Máxima)
prob_moeda_justa = [0.5, 0.5] # Cara, Coroa
entropia1 = shannon_entropy(prob_moeda_justa)
print(f"Entropia de uma moeda justa: {entropia1:.4f} bits")

Entropia de uma moeda justa: 1.0000 bits


In [4]:
# Exemplo 2: Moeda Viciada (Menos Incerteza)
prob_moeda_viciada = [0.9, 0.1]
entropia2 = shannon_entropy(prob_moeda_viciada)
print(f"Entropia de uma moeda viciada (90/10): {entropia2:.4f} bits")

Entropia de uma moeda viciada (90/10): 0.4690 bits


In [5]:
# Exemplo 3: Moeda de Duas Caras (Nenhuma Incerteza)
prob_moeda_certeza = [1.0, 0.0]
entropia3 = shannon_entropy(prob_moeda_certeza)
print(f"Entropia de uma moeda com resultado certo: {entropia3:.4f} bits")

Entropia de uma moeda com resultado certo: -0.0000 bits


In [6]:
# Exemplo 4: Dado Justo de 6 lados
prob_dado_justo = [1/6] * 6
entropia4 = shannon_entropy(prob_dado_justo)
print(f"Entropia de um dado justo de 6 lados: {entropia4:.4f} bits")

Entropia de um dado justo de 6 lados: 2.5850 bits


### Observações

- A entropia é máxima (1.0 bit) para o caso da moeda justa, pois há total incerteza sobre o resultado.
- À medida que a moeda se torna mais viciada, a incerteza diminui, e a entropia também.
- Quando o resultado é certo, não há "surpresa", e a entropia é 0.
- A entropia é crucial em Árvores de Decisão, onde o algoritmo busca dividir os dados de forma a maximizar o **Ganho de Informação**, que é uma redução na entropia.