## PCC103 Métodos Científicos - Exercício Intervalos de Confiança #03
Aluno: Marco Aurélio Moura Suriani

In [1]:
# Bibliotecas
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats, special

## 0) Dados para testes

Será criada uma variável:
1. **Variável x:** tipo contínua com distribuição normal, $\mu$ = 10.0, $\sigma$ = 2.0, e n = 15 amostras
 * `random.seed(1)` permite que sempre retorne os mesmos resultados

In [2]:
np.random.seed(1)
x = np.random.normal(10.0, 2.0, 15)

print(x)

[13.24869073  8.77648717  8.9436565   7.85406276 11.73081526  5.39692261
 13.48962353  8.4775862  10.63807819  9.50125925 12.92421587  5.87971858
  9.35516559  9.23189129 12.26753888]


## 1) Funções de Média, Desvio Padrão e da Distribuição t-Student

* Funções estatísticas: `my_mean`, `my_variance` e `my_std_dev`
* Funções t-Student: `my_t_distribution_pdf`, `my_t_distribution_cdf` e `my_t_distribution_cdf2`
* Funções reaproveitadas do exercício anterior

In [3]:
def my_mean(data):
    return sum(data)/len(data)

def my_variance(data):
    xb = sum(data)/len(data)
    return sum([(xi - xb)**2 for xi in data])/(len(data)-1) 

def my_std_dev(data):
    xb = sum(data)/len(data)
    return np.sqrt( sum([(xi - xb)**2 for xi in data])/(len(data)-1) )

def my_t_distribution_pdf(x, v):    
    return pow(1 + (x**2/v), (v+1)/(-2)) * special.gamma((v+1)/2) / (np.sqrt(np.pi * v) * special.gamma(v/2) )

def my_t_distribution_cdf(x, v): 
    aux = special.hyp2f1(0.5, (v+1)/2, 1.5, x**2/(-v)) / (np.sqrt(np.pi * v) * special.gamma(v/2) )
    return 0.5 + x*special.gamma((v+1)/2) * aux

def my_t_distribution_cdf2(x1, x2, v): 
    return my_t_distribution_cdf(x2, v) - my_t_distribution_cdf(x1, v)

## 2) CDF Inversa da Distribuição t-Student

* Função `my_t_distribution_cdf_inverse`
* Usa funções prévias + busca binária, podendo editar o erro (default = 1e-5)

In [4]:
def my_t_distribution_cdf_inverse(p, v, delta = 1e-5): 
    l = -100
    r = 100
    conta = 0
    
    while(True):
        m = (l+r)/2
        dp = my_t_distribution_cdf( m , v) - p
        if abs(dp) < delta: return m
        elif dp > 0: r = m
        else: l = m
        
        conta += 1
        if conta > 10000: return None

In [5]:
# Pequeno teste
p = my_t_distribution_cdf(1, 5)
t = my_t_distribution_cdf_inverse(p, 5)

print(t)
print(abs(my_t_distribution_cdf(t, 5) - p) < 1e-5)

1.0000228881835938
True


## 3) Intervalo de Confiança com Distribuição t-Student

* Função `my_t_distribution_confidence_interval`
* Usa funções prévias + busca binária, podendo editar o erro (default = 1e-5)
* Testa com array x

In [6]:
def my_t_distribution_confidence_interval(data, alpha):
    
    # Tamanho, média e despad
    n = len(data)
    xb = my_mean(data)
    sx = my_std_dev(data)
    
    # Cálculo do valor de t(a/2, n-1)
    p = 1 - alpha/2
    t = my_t_distribution_cdf_inverse(p, n - 1)
    
    return [xb - t*sx/np.sqrt(n), xb + t*sx/np.sqrt(n)]

In [7]:
# Perqueno teste 2
alpha = 0.05
ic = my_t_distribution_confidence_interval(x, alpha)

print('Amostra:')
print(x)
print("\nIC (%.2f" %((1-alpha)*100), "%", "): [ %.4f"%ic[0], " , %.4f" %ic[1], " ]")

Amostra:
[13.24869073  8.77648717  8.9436565   7.85406276 11.73081526  5.39692261
 13.48962353  8.4775862  10.63807819  9.50125925 12.92421587  5.87971858
  9.35516559  9.23189129 12.26753888]

IC (95.00 % ): [ 8.4560  , 11.2394  ]
