In [1]:
import numpy as np
import scipy.stats as st

## Cálculo do intervalo de confiança

Utilizando dados brutos com sigma (variância da população) desconhecido

In [2]:
amostra1 = np.array([12, 15, 11, 14, 13, 16, 17, 10, 14, 13])

conf_level  = 0.95

media_amostral = np.mean(amostra1)

n = len(amostra1)
graus_liberdade = n - 1

# Calcular o Erro Padrão da Média (SE)
# st.sem calcula: desvio_padrao_amostral / np.sqrt(n)
erro_padrao = st.sem(amostra1)

# Calcular o Intervalo de Confiança usando t-Student
# Argumentos: 
# - confidence: nível de confiança (alpha)
# - df: graus de liberdade
# - loc: média amostral (localização)
# - scale: erro padrão da média
intervalo_confianca = st.t.interval(
    confidence=conf_level, 
    df=graus_liberdade, 
    loc=media_amostral, 
    scale=erro_padrao
)

# Imprimir os resultados
print(f"Média Amostral: {media_amostral:.2f}")
print(f"Erro Padrão da Média: {erro_padrao:.2f}")
print(f"Graus de Liberdade: {graus_liberdade}")
print(f"Intervalo de Confiança de {conf_level*100}%: {intervalo_confianca}")

Média Amostral: 13.50
Erro Padrão da Média: 0.69
Graus de Liberdade: 9
Intervalo de Confiança de 95.0%: (np.float64(11.94548117930083), np.float64(15.05451882069917))


## Cálculo do intervalo de confiança

Utilizando dados brutos com sigma (variância da população) conhecido

In [3]:
amostra2 = np.array([12, 15, 11, 14, 13, 16, 17, 10, 14, 13])

desvio_padrao_populacional = 3.0 # Sigma conhecido

nivel_confianca = 0.95

media_amostral = np.mean(amostra2)

n = len(amostra2)

# Calcular o Erro Padrão da Média
# Formula: sigma / sqrt(n)
erro_padrao_pop = desvio_padrao_populacional / np.sqrt(n)

# Calcular o Intervalo de Confiança usando a Distribuição Normal (Z)
# Argumentos: 
# - confidence: nível de confiança
# - loc: média amostral (localização)
# - scale: erro padrão (baseado no sigma conhecido)
intervalo_confianca_z = st.norm.interval(
    confidence=nivel_confianca, 
    loc=media_amostral, 
    scale=erro_padrao_pop
)

# Imprimir os resultados
print(f"Média Amostral: {media_amostral:.2f}")
print(f"Desvio Padrão Populacional (σ) Conhecido: {desvio_padrao_populacional:.2f}")
print(f"Erro Padrão da Média: {erro_padrao_pop:.2f}")
print(f"Intervalo de Confiança de {nivel_confianca*100}% (Z): {intervalo_confianca_z}")

Média Amostral: 13.50
Desvio Padrão Populacional (σ) Conhecido: 3.00
Erro Padrão da Média: 0.95
Intervalo de Confiança de 95.0% (Z): (np.float64(11.640614903086316), np.float64(15.359385096913684))


## Cálculo do intervalo de confiança para proporção

In [9]:
from statsmodels.stats.proportion import proportion_confint

sucessos = 700  # Número de sucessos (contagem)
total_observacoes = 1000  # Tamanho da amostra (nobs)

# Nível de confiança desejado (95%)
nivel_confianca = 0.95
# Alpha é 1 - Nível de Confiança
alpha = 1 - nivel_confianca  # 0.05

# 1. Calcular a proporção amostral (p̂)
proporcao_amostral = sucessos / total_observacoes

# 2. Calcular o Intervalo de Confiança
# O método padrão ('normal') utiliza a aproximação Z de Wald.
limite_inferior, limite_superior = proportion_confint(
    count=sucessos, 
    nobs=total_observacoes, 
    alpha=alpha, 
    method='normal' 
)

# Imprimir os resultados
print(f"Proporção Amostral (p̂): {proporcao_amostral:.4f} ({proporcao_amostral*100:.2f}%)")
print(f"Intervalo de Confiança de {nivel_confianca*100}% (Z/Normal):")
print(f"Limite Inferior: {limite_inferior:.4f} ({limite_inferior*100:.2f}%)")
print(f"Limite Superior: {limite_superior:.4f} ({limite_superior*100:.2f}%)")

Proporção Amostral (p̂): 0.7000 (70.00%)
Intervalo de Confiança de 95.0% (Z/Normal):
Limite Inferior: 0.6716 (67.16%)
Limite Superior: 0.7284 (72.84%)


---

1. Os residuos industriais jogados nos rios, muitas vezes, absorvem o oxigênio necessário a respiração de peixes e de outras formas de vida aquática. Seis amostras de água retiradas de um rio revelaram os índices: 4,9; 5,1; 4,9; 5,0; 5,0 e 4,7 ppm de oxigênio dissolvido. Construir o intervalo com 95% de confiança para a verdadeira média de oxigênio dissolvido, em ppm e interprete.

In [10]:
amostra = np.array([4.9, 5.1, 4.9, 5, 5, 4.7])

conf_level = 0.95

media_amostral = np.mean(amostra)

n = len(amostra)
graus_liberdade = n - 1

erro_padrao = st.sem(amostra)

intervalo_confianca = st.t.interval(
    confidence=conf_level, 
    df=graus_liberdade, 
    loc=media_amostral, 
    scale=erro_padrao
)

# Imprimir os resultados
print(f"Média Amostral: {media_amostral:.2f}")
print(f"Erro Padrão da Média: {erro_padrao:.2f}")
print(f"Graus de Liberdade: {graus_liberdade}")
print(f"Intervalo de Confiança de {conf_level*100}%: {intervalo_confianca[0]:.4f} - {intervalo_confianca[1]:.4f}")

Média Amostral: 4.93
Erro Padrão da Média: 0.06
Graus de Liberdade: 5
Intervalo de Confiança de 95.0%: 4.7900 - 5.0767


2. Um engenheiro de computação está desenvolvendo um novo sistema para executar certo programa e pretende determinar o tempo médio necessário para a sua realização. Para tanto, executou esse programa por 20 vezes obtendo um tempo médio de 352 segundos e um desvio padrão de 8 segundos. Construa um intervalo de 99% de confiança para o verdadeiro tempo médio para execução desse programa.

In [15]:
conf_level = 0.99

media_amostral = 352

n = 20

s = 8

# ---

erro_padrao = s / np.sqrt(n)

graus_liberdade = n - 1

intervalo_confianca = st.t.interval(
    confidence=conf_level, 
    df=graus_liberdade, 
    loc=media_amostral, 
    scale=erro_padrao
)

# Imprimir os resultados
print(f"Média Amostral: {media_amostral:.2f}")
print(f"Erro Padrão da Média: {erro_padrao:.2f}")
print(f"Graus de Liberdade: {graus_liberdade}")
print(f"Intervalo de Confiança de {conf_level*100}%: {intervalo_confianca[0]:.4f} - {intervalo_confianca[1]:.4f}")

Média Amostral: 352.00
Erro Padrão da Média: 1.79
Graus de Liberdade: 19
Intervalo de Confiança de 99.0%: 346.8822 - 357.1178


3. O sistema gerenciador de um hotel acompanha a porcentagem de reservas feitas pela internet para ajustar sua propaganda e o sistema de reservas pela web. Tais dados são binários: ou a reserva é feita pela internet ou não é. Na semana passada uma amostra aleatória de 25 reservas foi selecionada mostrando que 15 haviam sido realizadas pela web. Encontre e interprete um intervalo de confiança de 85% para a verdadeira proporção de reservas realizadas pela internet.

In [21]:
n = 25

x = 15

conf_level = 0.85

# ---

alpha = 1 - conf_level
p = x /n

limite_inferior, limite_superior = proportion_confint(
    count=x, 
    nobs=n, 
    alpha=alpha, 
    method='normal' 
)

# Imprimir os resultados
print(f"Proporção Amostral (p̂): {p:.4f} ({p*100:.2f}%)")
print(f"Intervalo de Confiança de {conf_level*100}% (Z/Normal):")
print(f"Limite Inferior: {limite_inferior:.4f} ({limite_inferior*100:.2f}%)")
print(f"Limite Superior: {limite_superior:.4f} ({limite_superior*100:.2f}%)")

Proporção Amostral (p̂): 0.6000 (60.00%)
Intervalo de Confiança de 85.0% (Z/Normal):
Limite Inferior: 0.4590 (45.90%)
Limite Superior: 0.7410 (74.10%)
