In [1]:
import numpy as np
import scipy.stats as st

#### Finding the Z critical value 

In [2]:
alpha = 0.05
confianca = 1 - (alpha/2) # Intervalo Bilateral 

print(st.norm.ppf(confianca).round(3)) # Valor Z - 95% de confiança, alpha = 0.05

1.96


### X ~ N(?, σ)

In [3]:
idade_clientes = [31, 30, 32 , 37 ,30]

media_amostral = np.mean(idade_clientes)
desvio_populacional = 4 
alpha = 0.05 
n = len(idade_clientes)

nivel_confianca = 1 - alpha 


IC_media = st.norm.interval(nivel_confianca, loc=media_amostral, scale=desvio_populacional/np.sqrt(n))

print("O intervalo de ", nivel_confianca*100 ,
      "% confiança para a idade média dos clientes do restaurante é de: ", [round(num,2) for num in IC_media])

O intervalo de  95.0 % confiança para a idade média dos clientes do restaurante é de:  [28.49, 35.51]


In [16]:
media_amostral = 1014
desvio_populacional = 25
alpha = 0.05 
n = 20

nivel_confianca = 1 - alpha 


IC_media = st.norm.interval(nivel_confianca, loc=media_amostral, scale=desvio_populacional/np.sqrt(n))

print("O intervalo de ", nivel_confianca*100 ,
      "% confiança para a idade média dos clientes do restaurante é de: ", [round(num,3) for num in IC_media])

O intervalo de  95.0 % confiança para a idade média dos clientes do restaurante é de:  [1003.043, 1024.957]


### X ~ N(?, ?)

#### If **n < 30** we use the T student distribution + **s** estimator  

#### Finding the T critical value 

In [4]:
alpha = 0.10
confidence = 1 - (alpha/2) # Bilateral
df = 19  

print(st.t.ppf(q=confidence, df=df).round(2))

1.73


In [5]:
media_amostral = 5900
s = 3058
n = 15 
nivel_confianca = 0.95


IC_media95 = st.t.interval(nivel_confianca, df = n-1,  loc=media_amostral, scale=s/np.sqrt(n))

print("O intervalo de ", nivel_confianca*100 ,
          "% confiança para os gastos médios com cartão de crédito das famílias é: ", 
      [round(num,2) for num in IC_media95])

O intervalo de  95.0 % confiança para os gastos médios com cartão de crédito das famílias é:  [4206.54, 7593.46]


In [6]:
amostra_criancas = [1.71, 1.06, 1.68, 2.12, 2.17, 2.71, 1.02, 2.62, 2.15,
                   2.22, 2.1, 1.97, 1.44, 2.48, 1.45, 2.3, 1.73, 1.0, 2.36, 0.8]

nivel_confianca = 0.90

media_amostral = np.mean(amostra_criancas)
desvio_amostral = np.std(amostra_criancas, ddof = 1) #desvio padrão AMOSTRAL 
n = len(amostra_criancas)

IC_media_t = st.t.interval(nivel_confianca, df = n-1,  loc=media_amostral, scale=desvio_amostral/np.sqrt(n))

print("O intervalo de ", nivel_confianca*100 ,
          "% confiança para a idade média ao falar é de: ", [round(num,2) for num in IC_media_t])

O intervalo de  90.0 % confiança para a idade média ao falar é de:  [1.63, 2.08]


#### If **n >= 30** we use the Z distribution + **s** estimator  

In [7]:
media_amostral = 5900
s = 3058
n = 200 
nivel_confianca = 0.95


IC_media95 = st.norm.interval(nivel_confianca, loc=media_amostral, scale=s/np.sqrt(n))

print("O intervalo de ", nivel_confianca*100 ,
          "% confiança para os gastos médios com cartão de crédito das famílias é: ", 
      [round(num,2) for num in IC_media95])

O intervalo de  95.0 % confiança para os gastos médios com cartão de crédito das famílias é:  [5476.19, 6323.81]


### X ~ B(n, ?)

In [8]:
from statsmodels.stats.proportion import proportion_confint   

n = 1500
entrevistados_sim = 1050 # Número de sucessos
p_chapeu = entrevistados_sim/n
nivel_confianca = 0.95


ICp_95 = proportion_confint(entrevistados_sim, n, alpha=1-nivel_confianca)
print("O intervalo de ", nivel_confianca*100 ,
      "% confiança para a proporção de entrevistados que acreditam no aquecimento global é de: ", 
      [round(num,3) for num in ICp_95],"\n")

O intervalo de  95.0 % confiança para a proporção de entrevistados que acreditam no aquecimento global é de:  [0.677, 0.723] 



### X ~ N(u, ?) - Variance Confidence Interval 

#### Finding the qui_square_1 and qui_square_2 critical values 

In [9]:
df = 25
alpha = 0.05

qui_square_1 = st.chi2.ppf((alpha/2), df=df).round(4)
print("qui_square_1:", qui_square_1)

qui_square_2 = st.chi2.ppf(1 - (alpha/2), df=df).round(4)
print("qui_square_2:", qui_square_2)

qui_square_1: 13.1197
qui_square_2: 40.6465


In [10]:
n = 25 
s2 = 2500 
alpha = 0.05

qui_square_1 = st.chi2.ppf((alpha/2), df=n).round(4)
print("qui_square_1:", qui_square_1)

qui_square_2 = st.chi2.ppf(1 - (alpha/2), df=n).round(4)
print("qui_square_2:", qui_square_2)


#IC de 95% de confiança  
lower_bound = (n * s2) / st.chi2.ppf(1 - (alpha/2), n)
upper_bound = (n * s2) / st.chi2.ppf(alpha/2, n)

print(f"Intervalo de Confiança da Variância: ({lower_bound.round(2)}, {upper_bound.round(2)})")

qui_square_1: 13.1197
qui_square_2: 40.6465
Intervalo de Confiança da Variância: (1537.65, 4763.82)


### X ~ N(?, ?) - Variance Confidence Interval 

In [11]:
amostra_parafusos = [2.02, 1.98, 2.08, 1.99, 2.03, 1.94, 2.00, 2.07, 1.95, 
                    2.05, 2.09, 2.03, 1.99, 1.99, 2.01, 1.95, 2.04, 1.96, 1.99, 2.03]

media_amostral = np.mean(amostra_parafusos)
s2 = np.var(amostra_parafusos, ddof=1)
n = len(amostra_parafusos)
df = n - 1

alpha = 0.05

#IC de 95% de confiança  
lower_bound = ((n-1) * s2) / st.chi2.ppf(1 - (alpha/2), df)
upper_bound = ((n-1) * s2) / st.chi2.ppf(alpha/2, df)

print(f"Intervalo 95% de Confiança da Variância: ({lower_bound.round(4)}, {upper_bound.round(4)})")

Intervalo 95% de Confiança da Variância: (0.0011, 0.004)


### Exercícios 

A expectativa média de vida dos moradores de uma cidade é de 78,1 anos. Suponha que essa média foi baseada em uma amostra de 50 pessoas e que o desvio padrão da população é de 4,5 anos.

Construa o intervalo de confiança de 90% para a expectativa de vida média dos habitantes.

In [12]:
media_amostral = 78.1
desvio_populacional = 4.5 
alpha = 0.10
n = 50

nivel_confianca = 1 - alpha 


IC_media = st.norm.interval(nivel_confianca, loc=media_amostral, scale=desvio_populacional/np.sqrt(n))

print("O intervalo de ", nivel_confianca*100 ,
      "% confiança para a idade média dos clientes do restaurante é de: ", [round(num,3) for num in IC_media])

O intervalo de  90.0 % confiança para a idade média dos clientes do restaurante é de:  [77.053, 79.147]


Em uma pesquisa da CNNMoney.com, uma amostra de 5.324 americanos foi questionada sobre o que é mais importante para eles em um lugar para morar. Trinta e sete por cento dos entrevistados acham que as oportunidades de emprego são as mais importantes.

Construa o intervalo de confiança de 90% para a proporção de americanos que acham que as oportunidades de trabalho são mais importantes em um lugar para morar.

In [13]:
n = 5324 
alpha = 0.10


entrevistados_sim = 0.37*n # Número de sucessos
p_chapeu = entrevistados_sim/n 
nivel_confianca = 1 - alpha 


ICp_90 = proportion_confint(entrevistados_sim, n, alpha=alpha)
print("O intervalo de ", nivel_confianca*100 ,
      "% confiança para a proporção de entrevistados que as oportunidades de emprego são as mais importantes: ", 
      [round(num,3) for num in ICp_90],"\n")

O intervalo de  90.0 % confiança para a proporção de entrevistados que as oportunidades de emprego são as mais importantes:  [0.359, 0.381] 

