## Intervalos de confianza

In [1]:
import scipy.stats as stats
import numpy as np

In [2]:
n = 100  # tamaño de la muestra
theta = 3  # Valor real del parámetro. Lo necesitamos para saber si el intervalo lo cubre
sigma2 = 4  # Varianza
sigma = np.sqrt(sigma2)  # Desviación estándar

# Muestra aleatoria de una distribución normal con media=theta, desviacion_estándar=sigma
# Tamaño de muestra size=n
random_sample = stats.norm.rvs(loc= theta, scale=sigma, size=n)

In [3]:
type(random_sample)

numpy.ndarray

In [4]:
def L_U(X):
    """ Función que, dada la muestra aleatoria {@param:X}, calcula los extremos del intervalo
    :param X: Muestra aleatoria.
    :return: (L, U) con L el extremo inferior y U el extremo superior del intervalo.
    """
    
    x_mean = X.mean()  # Media de la muestra aleatoria
    
    # Coeficiente. Este depende tanto del tamaño de la muestra como del nivel de confianza.
    aux = (1.96) * (sigma / np.sqrt(n))
    
    # Extremos
    L = x_mean - aux
    U = x_mean + aux
    
    return L, U


In [5]:
L_U(random_sample)

(2.547800930417474, 3.3318009304174736)

In [6]:
def experiment(N = 10000):
    """ Función para simular {@param:N} veces la construcción del intervalo de confianza.
    Imprime el nivel de confianza dado por:
        Veces que el intervalo construido cubre al valor real / veces totales que se corrió el experimento
    
    :param N: La cantidad de veces que se repetirá el experimento.
    :return: None.
    """
    
    # Variable para contar cuántas veces el intervalo cubre al valor real.
    succ = 0
    
    
    for _ in range(N):
        # Muestra aleatoria de tamaño n
        random_sample = stats.norm.rvs(loc=theta, scale=sigma, size=n)
        # Construimos el intervalo
        L, U = L_U(random_sample)
        # Verificamos si el valor real está en el intervalo.
        if L < theta < U:
            # Si el valor real está en el intervalo, incrementamos nuestra variable
            succ += 1
            
    # Imprimos la frecuencia con la que el intervalo cubre al valor real.
    # Este valor coincide (véase probabilidad frecuentista), para {@param:N} suficientemente
    # grande, con la probabilidad de que el parámetro caiga en el intervalo.
    print(succ/N)
    

In [7]:
experiment(100000)


0.95071
