In [1]:
import numpy as np
import scipy.stats as st
import math
from scipy.stats import norm

Uma companhia americana está cogitando fazer uma concorrência para o serviço telefônico interurbano. Deseja-se fazer uma pesquisa para estimar a percentagem de assinantes que estão satisfeitos com o atual serviço de interurbanos. Queremos ter 90% de confiança em que a percentagem amostral esteja a menos de 2,5 pontos percentuais do verdadeiro valor populacional. Qual deve ser o tamanho da amostra  quando não há qualquer pesquisa anterior sobre o assunto que possa fornecer uma estimativa do percentual de satisfação dos assinantes?

In [None]:
p = 0.5
E = 0.025
conf = 0.9

# ---

Z = round(norm.ppf( (1 + conf) / 2 ), 2)
n = (Z**2 * p * (1 - p)) / (E**2)

print(f'Tamanho da amostra (p = {p}): {math.ceil(n)} ({n:.4f})')

Tamanho da amostra (p = 0.5): 1076 (1075.8400)


O diretor de um comitê de admissão de uma universidade deseja estimar a idade média de todos os estudantes aprovados no momento. Em uma amostra aleatória de 20 estudantes, a idade média encontrada foi de 22,9 anos. A partir de estudos passados, sabe-se que o desvio padrão é de 1,5 anos e que a população está normalmente distribuída. Qual é o intervalo de 90% de confiança da idade média da população? 

In [None]:
conf_level = 0.9
n = 20
s = 1.5
media = 22.9

erro_padrao = s/math.sqrt(n)

graus_liberdade = n - 1

intervalo_confianca = st.norm.interval(
    confidence=conf_level, 
    loc=media, 
    scale=erro_padrao
)

print(f"Intervalo de Confiança de {conf_level*100}%: {intervalo_confianca[0]:.4f} - {intervalo_confianca[1]:.4f}")

Intervalo de Confiança de 90.0%: 22.3483 - 23.4517


Um pesquisador deseja estimar a atual taxa média de juros cobrada por casas hipotecárias. Estudos anteriores indicam que a variância da taxa de juros é de 0,1764%. Qual deveria ser o tamanho amostral a ser estudado para obtermos uma margem de erro de 0,05% e um nível de confiança de 99%? 

In [33]:
s = math.sqrt(0.1764/100)
E = 0.05 /100
conf = 0.99

# ---

Z = norm.ppf( (1 + conf) / 2 )
n = (Z**2 * s**2) / (E**2)

print(f'Tamanho da amostra: {math.ceil(n)} ({n:.4f})')

Tamanho da amostra: 46816 (46815.8304)


Um escritório de contabilidade analisou uma amostra aleatória formada por 180 documentos de uma empresa cliente. Detectou que 18 documentos apresentavam falhas de algum tipo. Empregando um nível de confiança igual a 95%, encontre a estimativa intervalar do percentual de documentos da empresa que mostravam alguma falha. 

In [35]:
from statsmodels.stats.proportion import proportion_confint

conf_level = 0.95
n = 180
x = 18
alpha = 1 - conf_level

proporcao_amostral = x / n

limite_inferior, limite_superior = proportion_confint(
    count=x, 
    nobs=n, 
    alpha=alpha, 
    method='normal' 
)

print(f"Limite Inferior: {limite_inferior:.4f} ({limite_inferior*100:.2f}%)")
print(f"Limite Superior: {limite_superior:.4f} ({limite_superior*100:.2f}%)")

Limite Inferior: 0.0562 (5.62%)
Limite Superior: 0.1438 (14.38%)


Numa tentativa de melhorar o esquema de atendimento, um médico procurou estimar o tempo médio que gasta com cada paciente. Uma amostra aleatória de 29 pacientes, colhida num período de três semanas, acusou uma média de 30 minutos, com desvio padrão de 7 minutos. Construa um intervalo de 95% de confiança para o verdadeiro tempo médio de consulta. 

In [37]:
conf_level = 0.95
s = 7
media = 30
n = 29

graus_liberdade = n -1

erro_padrao = s / math.sqrt(n)

intervalo_confianca = st.t.interval(
    confidence=conf_level, 
    df=graus_liberdade, 
    loc=media, 
    scale=erro_padrao
)

print(f"Intervalo de Confiança de {conf_level*100}%: {intervalo_confianca[0]:.4f} - {intervalo_confianca[1]:.4f}")

Intervalo de Confiança de 95.0%: 27.3373 - 32.6627
