In [14]:
#Importar bibliotecas

import numpy as np
from scipy import stats

In [15]:
# Definir função para gerar números aleatórios

aleatorio = lambda media, desvio_padrao, n_obs: np.random.normal(media, desvio_padrao, n_obs)

In [16]:
# Definir função de cálculo de erros padrão

def erro_padrao(amostra):
    amostra = amostra[~np.isnan(amostra)]

    numerador = np.std(amostra, ddof=1)
    denominador = np.sqrt(len(amostra))
    
    return numerador / denominador

In [17]:
# Calcular erro padrão com amostras de diferentes tamanhos

media = 0
desvio_padrao = 10

for i in [10, 100, 1000, 10000]:
    ep = erro_padrao(aleatorio(media, desvio_padrao, n_obs=i))
    print("n_obs: {}; erro padrão: {:.2f}".format(i, ep))    

n_obs: 10; erro padrão: 3.54
n_obs: 100; erro padrão: 1.10
n_obs: 1000; erro padrão: 0.31
n_obs: 10000; erro padrão: 0.10


In [18]:
# Definir função que calcular estatística-t

def t_stat_media(amostra, valor_corte):
    media = np.mean(amostra)
    numerador = (media - valor_corte)
    denominador = erro_padrao(amostra)  
    t_stat = numerador / denominador

    return t_stat, media

In [19]:
# Calcular estatística-t a diferentes valores de corte

x = aleatorio(0, 100, 1000)

for i in np.linspace(0,25,26):
    est_t, media = t_stat_media(x, i)
    print("Média: {:.2f}; valor de corte: {:.2f}; estatística-t: {:.2f}"
          .format(media, i, est_t))

Média: 2.92; valor de corte: 0.00; estatística-t: 0.94
Média: 2.92; valor de corte: 1.00; estatística-t: 0.62
Média: 2.92; valor de corte: 2.00; estatística-t: 0.30
Média: 2.92; valor de corte: 3.00; estatística-t: -0.03
Média: 2.92; valor de corte: 4.00; estatística-t: -0.35
Média: 2.92; valor de corte: 5.00; estatística-t: -0.67
Média: 2.92; valor de corte: 6.00; estatística-t: -1.00
Média: 2.92; valor de corte: 7.00; estatística-t: -1.32
Média: 2.92; valor de corte: 8.00; estatística-t: -1.64
Média: 2.92; valor de corte: 9.00; estatística-t: -1.97
Média: 2.92; valor de corte: 10.00; estatística-t: -2.29
Média: 2.92; valor de corte: 11.00; estatística-t: -2.61
Média: 2.92; valor de corte: 12.00; estatística-t: -2.94
Média: 2.92; valor de corte: 13.00; estatística-t: -3.26
Média: 2.92; valor de corte: 14.00; estatística-t: -3.59
Média: 2.92; valor de corte: 15.00; estatística-t: -3.91
Média: 2.92; valor de corte: 16.00; estatística-t: -4.23
Média: 2.92; valor de corte: 17.00; estatíst

In [20]:
# Definir função que calcular p_valor

def p_valor(amostra, valor_corte):
    amostra = amostra[~np.isnan(amostra)]
  
    t_stat, media = t_stat_media(amostra, valor_corte)
    
    # Calcular p-value
    tt_stat = -1 * np.abs(t_stat)
    p_value = 2 * stats.t.cdf(tt_stat, df=(len(amostra)-1) )
    
    return t_stat, media, p_value

In [21]:
# Calcular p-valor a diferentes valores de corte

for i in np.linspace(0,25,26):
    est_t, media, p_val = p_valor(x, i)
    print("Média: {:.2f}; valor de corte: {:.2f}; estatística-t: {:.2f}; p-valor: {:.4f}"
          .format(media, i, est_t, p_val))

Média: 2.92; valor de corte: 0.00; estatística-t: 0.94; p-valor: 0.3450
Média: 2.92; valor de corte: 1.00; estatística-t: 0.62; p-valor: 0.5346
Média: 2.92; valor de corte: 2.00; estatística-t: 0.30; p-valor: 0.7661
Média: 2.92; valor de corte: 3.00; estatística-t: -0.03; p-valor: 0.9793
Média: 2.92; valor de corte: 4.00; estatística-t: -0.35; p-valor: 0.7267
Média: 2.92; valor de corte: 5.00; estatística-t: -0.67; p-valor: 0.5010
Média: 2.92; valor de corte: 6.00; estatística-t: -1.00; p-valor: 0.3191
Média: 2.92; valor de corte: 7.00; estatística-t: -1.32; p-valor: 0.1870
Média: 2.92; valor de corte: 8.00; estatística-t: -1.64; p-valor: 0.1005
Média: 2.92; valor de corte: 9.00; estatística-t: -1.97; p-valor: 0.0494
Média: 2.92; valor de corte: 10.00; estatística-t: -2.29; p-valor: 0.0222
Média: 2.92; valor de corte: 11.00; estatística-t: -2.61; p-valor: 0.0091
Média: 2.92; valor de corte: 12.00; estatística-t: -2.94; p-valor: 0.0034
Média: 2.92; valor de corte: 13.00; estatística-t: 