In [32]:
#Importar bibliotecas

import numpy as np
from scipy import stats

In [33]:
# Definir função para gerar números aleatórios

aleatorio = lambda media, desvio_padrao, n_obs: np.random.normal(media, desvio_padrao, n_obs)

In [34]:
# Definir função de cálculo de erros padrão

def erro_padrao(amostra):
    amostra = amostra[~np.isnan(amostra)]

    numerador = np.std(amostra, ddof=1)
    denominador = np.sqrt(len(amostra))
    
    return numerador / denominador

In [35]:
# Calcular erro padrão com amostras de diferentes tamanhos

media = 0
desvio_padrao = 10

for i in [10, 100, 1000, 10000]:
    ep = erro_padrao(aleatorio(media, desvio_padrao, n_obs=i))
    print("n_obs: {}; erro padrão: {:.2f}".format(i, ep))    

n_obs: 10; erro padrão: 3.30
n_obs: 100; erro padrão: 0.90
n_obs: 1000; erro padrão: 0.31
n_obs: 10000; erro padrão: 0.10


In [36]:
# Definir função que calcular estatística-t

def t_stat_media(amostra, valor_corte):
    media = np.mean(amostra)
    numerador = (media - valor_corte)
    denominador = erro_padrao(amostra)  
    t_stat = numerador / denominador

    return t_stat, media

In [37]:
# Calcular estatística-t a diferentes valores de corte

x = aleatorio(0, 100, 1000)

for i in np.linspace(0,25,26):
    est_t, media = t_stat_media(x, i)
    print("Média: {:.2f}; valor de corte: {:.2f}; estatística-t: {:.2f}"
          .format(media, i, est_t))

Média: 1.57; valor de corte: 0.00; estatística-t: 0.51
Média: 1.57; valor de corte: 1.00; estatística-t: 0.18
Média: 1.57; valor de corte: 2.00; estatística-t: -0.14
Média: 1.57; valor de corte: 3.00; estatística-t: -0.47
Média: 1.57; valor de corte: 4.00; estatística-t: -0.79
Média: 1.57; valor de corte: 5.00; estatística-t: -1.12
Média: 1.57; valor de corte: 6.00; estatística-t: -1.44
Média: 1.57; valor de corte: 7.00; estatística-t: -1.77
Média: 1.57; valor de corte: 8.00; estatística-t: -2.10
Média: 1.57; valor de corte: 9.00; estatística-t: -2.42
Média: 1.57; valor de corte: 10.00; estatística-t: -2.75
Média: 1.57; valor de corte: 11.00; estatística-t: -3.07
Média: 1.57; valor de corte: 12.00; estatística-t: -3.40
Média: 1.57; valor de corte: 13.00; estatística-t: -3.72
Média: 1.57; valor de corte: 14.00; estatística-t: -4.05
Média: 1.57; valor de corte: 15.00; estatística-t: -4.38
Média: 1.57; valor de corte: 16.00; estatística-t: -4.70
Média: 1.57; valor de corte: 17.00; estatís

In [38]:
# Definir função que calcular p_valor

def p_valor(amostra, valor_corte):
    amostra = amostra[~np.isnan(amostra)]
  
    t_stat, media = t_stat_media(amostra, valor_corte)
    
    # Calcular p-value
    tt_stat = -1 * np.abs(t_stat)
    p_value = 2 * stats.t.cdf(tt_stat, df=(len(amostra)-1) )
    
    return t_stat, media, p_value

In [39]:
# Calcular p-valor a diferentes valores de corte

for i in np.linspace(0,25,26):
    est_t, media, p_val = p_valor(x, i)
    print("Média: {:.2f}; valor de corte: {:.2f}; estatística-t: {:.2f}; p-valor: {:.4f}"
          .format(media, i, est_t, p_val))

Média: 1.57; valor de corte: 0.00; estatística-t: 0.51; p-valor: 0.6096
Média: 1.57; valor de corte: 1.00; estatística-t: 0.18; p-valor: 0.8533
Média: 1.57; valor de corte: 2.00; estatística-t: -0.14; p-valor: 0.8881
Média: 1.57; valor de corte: 3.00; estatística-t: -0.47; p-valor: 0.6410
Média: 1.57; valor de corte: 4.00; estatística-t: -0.79; p-valor: 0.4284
Média: 1.57; valor de corte: 5.00; estatística-t: -1.12; p-valor: 0.2638
Média: 1.57; valor de corte: 6.00; estatística-t: -1.44; p-valor: 0.1491
Média: 1.57; valor de corte: 7.00; estatística-t: -1.77; p-valor: 0.0771
Média: 1.57; valor de corte: 8.00; estatística-t: -2.10; p-valor: 0.0364
Média: 1.57; valor de corte: 9.00; estatística-t: -2.42; p-valor: 0.0157
Média: 1.57; valor de corte: 10.00; estatística-t: -2.75; p-valor: 0.0061
Média: 1.57; valor de corte: 11.00; estatística-t: -3.07; p-valor: 0.0022
Média: 1.57; valor de corte: 12.00; estatística-t: -3.40; p-valor: 0.0007
Média: 1.57; valor de corte: 13.00; estatística-t:

In [40]:
# Ou, simplesmente, utilizar o scipy

media = np.mean(x)

for i in np.linspace(0,25,26):
    est_t, p_val = stats.ttest_1samp(x, i)
    print("Média: {:.2f}; valor de corte: {:.2f}; estatística-t: {:.2f}; p-valor: {:.4f}"
          .format(media, i, est_t, p_val))

Média: 1.57; valor de corte: 0.00; estatística-t: 0.51; p-valor: 0.6096
Média: 1.57; valor de corte: 1.00; estatística-t: 0.18; p-valor: 0.8533
Média: 1.57; valor de corte: 2.00; estatística-t: -0.14; p-valor: 0.8881
Média: 1.57; valor de corte: 3.00; estatística-t: -0.47; p-valor: 0.6410
Média: 1.57; valor de corte: 4.00; estatística-t: -0.79; p-valor: 0.4284
Média: 1.57; valor de corte: 5.00; estatística-t: -1.12; p-valor: 0.2638
Média: 1.57; valor de corte: 6.00; estatística-t: -1.44; p-valor: 0.1491
Média: 1.57; valor de corte: 7.00; estatística-t: -1.77; p-valor: 0.0771
Média: 1.57; valor de corte: 8.00; estatística-t: -2.10; p-valor: 0.0364
Média: 1.57; valor de corte: 9.00; estatística-t: -2.42; p-valor: 0.0157
Média: 1.57; valor de corte: 10.00; estatística-t: -2.75; p-valor: 0.0061
Média: 1.57; valor de corte: 11.00; estatística-t: -3.07; p-valor: 0.0022
Média: 1.57; valor de corte: 12.00; estatística-t: -3.40; p-valor: 0.0007
Média: 1.57; valor de corte: 13.00; estatística-t: