Il Likelihood Ratio è un metodo statistico utilizzato per confrontare due ipotesi o modelli basati sulla probabilità (likelihood) dei dati osservati. Di seguito ti spiego in poche parole come funziona in ciascuno dei casi che hai menzionato:

Entrambe le likelihood sono funzioni teoriche:

Il Likelihood Ratio confronta due modelli teorici calcolando il rapporto tra le loro likelihoods. Si calcola la likelihood per ogni modello dato lo stesso insieme di dati, e si prende il rapporto tra di esse. Questo rapporto indica quale modello è più supportato dai dati.
Una delle likelihood è un istogramma ricavato dai dati mentre l'altra è una funzione teorica:

In questo caso, la likelihood derivata dai dati viene confrontata con la likelihood teorica. Si calcola la likelihood teorica per ogni dato, e si usa l'istogramma per approssimare la distribuzione dei dati osservati. Il Likelihood Ratio sarà il rapporto tra la probabilità stimata dai dati (attraverso l'istogramma) e quella teorica.
Entrambe le likelihood sono istogrammi con lo stesso binning e range:

Con istogrammi con lo stesso binning e range, si confrontano direttamente i valori di frequenza per ogni bin. Il Likelihood Ratio è il rapporto delle frequenze nei bin corrispondenti tra i due istogrammi.
Entrambe le likelihood sono istogrammi ma hanno binning e range diversi:

In questo caso, prima di calcolare il Likelihood Ratio, è necessario uniformare il binning e il range dei due istogrammi. Questo può richiedere interpolazione o altre tecniche per rendere comparabili i due istogrammi. Una volta uniformati, si può calcolare il rapporto delle frequenze per ogni bin corrispondente.
In tutti questi casi, il Likelihood Ratio aiuta a valutare quale delle due ipotesi o modelli è più plausibile dato il set di dati osservati.

In [4]:
# 1. Entrambe le likelihood sono funzioni teoriche

import math

# Likelihood per il modello normale
def likelihood_normal(data, mu, sigma):
    likelihood = 1
    for x in data:
        likelihood *= (1 / (math.sqrt(2 * math.pi) * sigma)) * math.exp(-0.5 * ((x - mu) / sigma) ** 2)
    return likelihood

# Likelihood per il modello esponenziale
def likelihood_exponential(data, lambd):
    likelihood = 1
    for x in data:
        likelihood *= lambd * math.exp(-lambd * x)
    return likelihood

# Dati osservati
data = [1.2, 1.8, 1.4, 2.0, 1.6]

# Calcolo della likelihood per ciascun modello
likelihood_normal_value = likelihood_normal(data, mu=1.5, sigma=0.5)
likelihood_exponential_value = likelihood_exponential(data, lambd=1.0)

# Likelihood ratio
likelihood_ratio = likelihood_normal_value / likelihood_exponential_value
likelihood_ratio


391.91431698409707

In [5]:
# 2. Una delle likelihood è un istogramma ricavato dai dati mentre l'altra è una funzione teorica

# Istogramma dei dati (frequenze osservate)
histogram = {1: 2, 2: 3, 3: 1}

# Funzione teorica normale
def normal_pdf(x, mu, sigma):
    return (1 / (math.sqrt(2 * math.pi) * sigma)) * math.exp(-0.5 * ((x - mu) / sigma) ** 2)

# Calcolo della likelihood per la funzione teorica
likelihood_theory = 1
for x, freq in histogram.items():
    likelihood_theory *= (normal_pdf(x, mu=2, sigma=0.5) ** freq)

# Likelihood dal dato osservato (istogramma)
likelihood_histogram = 1
total_count = sum(histogram.values())
for x, freq in histogram.items():
    likelihood_histogram *= (freq / total_count) ** freq

# Likelihood ratio
likelihood_ratio = likelihood_histogram / likelihood_theory
likelihood_ratio


3.619451618007892

In [6]:
# 3. Entrambe le likelihood sono istogrammi con lo stesso binning e range

# Due istogrammi con lo stesso binning
histogram1 = {1: 2, 2: 3, 3: 1}
histogram2 = {1: 3, 2: 2, 3: 2}

# Calcolo della likelihood per ciascun istogramma
likelihood1 = 1
likelihood2 = 1
for x in histogram1.keys():
    likelihood1 *= (histogram1[x]) ** histogram1[x]
    likelihood2 *= (histogram2[x]) ** histogram1[x]

# Likelihood ratio
likelihood_ratio = likelihood1 / likelihood2
likelihood_ratio


0.75

In [7]:
# 4. Entrambe le likelihood sono istogrammi ma hanno binning e range diversi

# Due istogrammi con binning diverso
histogram1 = {1: 4, 2: 6}
histogram2 = {1: 3, 2: 3, 3: 2}

# Uniformiamo il binning creando un bin comune
common_bins = set(histogram1.keys()).union(set(histogram2.keys()))

# Calcoliamo le likelihood sui bin comuni
likelihood1 = 1
likelihood2 = 1

for bin in common_bins:
    count1 = histogram1.get(bin, 0)
    count2 = histogram2.get(bin, 0)
    likelihood1 *= count1 ** count1
    likelihood2 *= count2 ** count1  # Usando count1 per normalizzare

# Likelihood ratio
likelihood_ratio = likelihood1 / likelihood2
likelihood_ratio


202.2716049382716

rendere il logaritmo della likelihood (log-likelihood) è una pratica comune in statistica e ha diversi vantaggi:

Facilità di calcolo:

Le likelihood sono prodotti di molte probabilità (o densità di probabilità), che possono essere numeri molto piccoli. Moltiplicare numeri molto piccoli può portare a valori estremamente piccoli, causando problemi di precisione numerica o addirittura "underflow" (il risultato diventa zero nel computer). Il logaritmo trasforma la moltiplicazione in somma, il che riduce significativamente il rischio di underflow.
Somme al posto di prodotti:

Come detto, il logaritmo trasforma un prodotto di probabilità in una somma di logaritmi. Le somme sono più facili da gestire e interpretare rispetto ai prodotti, soprattutto quando si lavora con un grande numero di dati o variabili.
Convessità:

La funzione log-likelihood tende ad essere concava, il che è utile per i metodi di ottimizzazione. Funzioni concave (o convesse) hanno un unico massimo (o minimo), il che rende più semplice trovare il punto ottimale. La concavità aiuta gli algoritmi di ottimizzazione (come il metodo del gradiente) a convergere più facilmente e rapidamente verso il massimo della likelihood.
Interpretazione statistica:

Lavorare con la log-likelihood è utile per interpretazioni e analisi statistiche. Ad esempio, i test statistici come il test del rapporto di verosimiglianza (Likelihood Ratio Test) utilizzano la differenza tra log-likelihood di due modelli. Inoltre, derivare la log-likelihood facilita il calcolo di stimatori come il massimo della verosimiglianza (Maximum Likelihood Estimation, MLE).
Stabilità numerica:

Lavorare con la log-likelihood tende a essere più stabile dal punto di vista numerico. I calcoli su numeri piccoli (come le probabilità) possono facilmente diventare imprecisi. Il logaritmo rende le operazioni numericamente più stabili poiché converte numeri piccoli in numeri più grandi e gestibili.

In [8]:
import math

# Dati
data = [0.1, 0.3, 0.2, 0.5, 0.4]

# Calcolo della likelihood di una distribuzione esponenziale con lambda=1
likelihood = 1
log_likelihood = 0

for x in data:
    prob = math.exp(-x)
    likelihood *= prob
    log_likelihood += math.log(prob)

print("Likelihood:", likelihood)
print("Log-Likelihood:", log_likelihood)


Likelihood: 0.22313016014842985
Log-Likelihood: -1.5


In [9]:
import math

# Log-Likelihood per il modello normale
def log_likelihood_normal(data, mu, sigma):
    log_likelihood = 0
    for x in data:
        log_likelihood += math.log(1 / (math.sqrt(2 * math.pi) * sigma)) - 0.5 * ((x - mu) / sigma) ** 2
    return log_likelihood

# Log-Likelihood per il modello esponenziale
def log_likelihood_exponential(data, lambd):
    log_likelihood = 0
    for x in data:
        log_likelihood += math.log(lambd) - lambd * x
    return log_likelihood

# Dati osservati
data = [1.2, 1.8, 1.4, 2.0, 1.6]

# Calcolo della log-likelihood per ciascun modello
log_likelihood_normal_value = log_likelihood_normal(data, mu=1.5, sigma=0.5)
log_likelihood_exponential_value = log_likelihood_exponential(data, lambd=1.0)

# Log-Likelihood ratio
log_likelihood_ratio = log_likelihood_normal_value - log_likelihood_exponential_value
log_likelihood_ratio


5.971043236776363

In [10]:
# Istogramma dei dati (frequenze osservate)
histogram = {1: 2, 2: 3, 3: 1}

# Funzione teorica normale
def normal_pdf(x, mu, sigma):
    return (1 / (math.sqrt(2 * math.pi) * sigma)) * math.exp(-0.5 * ((x - mu) / sigma) ** 2)

# Calcolo della log-likelihood per la funzione teorica
log_likelihood_theory = 0
for x, freq in histogram.items():
    log_likelihood_theory += freq * math.log(normal_pdf(x, mu=2, sigma=0.5))

# Log-Likelihood dal dato osservato (istogramma)
log_likelihood_histogram = 0
total_count = sum(histogram.values())
for x, freq in histogram.items():
    log_likelihood_histogram += freq * math.log(freq / total_count)

# Log-Likelihood ratio
log_likelihood_ratio = log_likelihood_histogram - log_likelihood_theory
log_likelihood_ratio


1.2863225276242538

In [11]:
# Due istogrammi con lo stesso binning
histogram1 = {1: 2, 2: 3, 3: 1}
histogram2 = {1: 3, 2: 2, 3: 2}

# Calcolo della log-likelihood per ciascun istogramma
log_likelihood1 = 0
log_likelihood2 = 0
for x in histogram1.keys():
    log_likelihood1 += histogram1[x] * math.log(histogram1[x])
    log_likelihood2 += histogram1[x] * math.log(histogram2[x])

# Log-Likelihood ratio
log_likelihood_ratio = log_likelihood1 - log_likelihood2
log_likelihood_ratio


-0.2876820724517808

In [12]:
# Due istogrammi con binning diverso
histogram1 = {1: 4, 2: 6}
histogram2 = {1: 3, 2: 3, 3: 2}

# Uniformiamo il binning creando un bin comune
common_bins = set(histogram1.keys()).union(set(histogram2.keys()))

# Calcoliamo le log-likelihood sui bin comuni
log_likelihood1 = 0
log_likelihood2 = 0

for bin in common_bins:
    count1 = histogram1.get(bin, 0)
    count2 = histogram2.get(bin, 0)
    if count1 > 0:
        log_likelihood1 += count1 * math.log(count1)
    if count2 > 0:
        log_likelihood2 += count1 * math.log(count2)  # Usando count1 per normalizzare

# Log-Likelihood ratio
log_likelihood_ratio = log_likelihood1 - log_likelihood2
log_likelihood_ratio


5.3096113731667955