In [28]:
import numpy as np
import math
from scipy.stats import entropy
from scipy.stats import yulesimon
import matplotlib.pyplot as plt

In [25]:
def informational_divergence_optimal_quantization(t, M):
    """
    Algoritmo para a quantização ótima de divergência de informação (página 5).

    Encontra a distribuição M-tipo T_id (p) que minimiza a divergência de informação
    D(p || t).

    Args:
        t (np.ndarray): Um array NumPy representando a distribuição de
                        probabilidade discreta alvo. A soma de t deve ser 1.
        M (int): O inteiro M que define o número total de unidades de massa
                 (a soma dos elementos de c deve ser M).

    Returns:
        np.ndarray: A distribuição M-tipo T_id que é a melhor aproximação de t
                    em termos de divergência de informação.
    """
    
    t = np.sort(t)[::-1]  # Ordena a probabilidade de entrada do maior para o menor
    n = len(t)
    c = np.zeros(n, dtype=int)  # Inicializa o vetor de contagem c com zeros 

    def delta(k, t_val):
        if k - 1 == 0:
            return k * math.log(k) + math.log(1/t_val)
        else:
            return k * math.log(k) - (k - 1) * math.log(k - 1) + math.log(1/t_val)

    for _ in range(M):
        min_delta = float('inf')
        min_delta_index = -1
        
        for i in range(n):
            current_delta = delta(c[i] + 1, t[i])
            if current_delta < min_delta:
                min_delta = current_delta
                min_delta_index = i
        
        c[min_delta_index] += 1
    
    t_id = c / M
    return t_id, c

In [26]:
t_exemplo = np.array([4/5, 1/5])
M_exemplo = 2

t_resultante, c_resultante = informational_divergence_optimal_quantization(t_exemplo, M_exemplo)

print(f"Distribuição de probabilidade alvo t: {t_exemplo}")
print(f"Precisão M: {M_exemplo}")
print(f"Vetor de contagem c final: {c_resultante}")
print(f"Aproximação M-tipo ótima Q: {t_resultante}")
print(f"Divergência informacional: {entropy(t_resultante, t_exemplo)}")

Distribuição de probabilidade alvo t: [0.8 0.2]
Precisão M: 2
Vetor de contagem c final: [2 0]
Aproximação M-tipo ótima Q: [1. 0.]
Divergência informacional: 0.2231435513142097
