<a href="https://colab.research.google.com/github/lima-breno/sampling_models/blob/main/SM_01_Tamanho_Amostral_reduzido.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Cálculo Tamanho Amostral
## Tamanho amostral para média

Uma pesquisa é planejada para determinar as despesas médicas anuais das famílias dos empregados de uma empresa. A gerência da empresa deseja ter 95% de confiança de que a média da amostra esteja no máximo a uma distância de 50,00 reais média real das despesas médicas familiares. Um estudo-piloto indica que o desvio padrão pode ser considerado como sendo igual a R\$400,00.

Parâmetro a ser estimado: Média das despesas médicas anuais.

Dados do enunciado:

-   Nível de confiança: 0,95

-   Margem de erro: R\$50,00

-   Desvio padrão populacional estimado: R\$400,00

A ) Qual o tamanho de amostra necessário?

In [None]:
import math
from scipy.stats import norm

# Nível de confiança
nivel_confianca = 0.95

# Margem de erro
margem_erro = 50

# Desvio padrão populacional
desvio_padrao = 400

# Z-score correspondente ao nível de confiança
z_score = norm.ppf((1 + nivel_confianca) / 2)

# Tamanho da amostra
tamanho_amostra = (z_score * (desvio_padrao / margem_erro)) ** 2

print(f'O tamanho da amostra necessário é aproximadamente {math.ceil(tamanho_amostra)}.')

O tamanho da amostra necessário é aproximadamente 246.


B)  Se a gerência deseja estar certa em uma margem de erro de R\$25,00, que tamanho de amostra será necessário?

In [None]:
# Nível de confiança
nivel_confianca = 0.95

# Margem de erro
margem_erro = 25

# Desvio padrão populacional
desvio_padrao = 400

# Z-score correspondente ao nível de confiança
z_score = norm.ppf((1 + nivel_confianca) / 2)

# Tamanho da amostra
tamanho_amostra = (z_score * (desvio_padrao / margem_erro)) ** 2

print(f'O tamanho da amostra necessário é aproximadamente {math.ceil(tamanho_amostra)}.')

O tamanho da amostra necessário é aproximadamente 984.


C) Sabe-se que a empresa tem, atualmente, 386 empregados. Qual deve ser o tamanho amostral necessário para termos um nível de 92% de confiança? (Mantendo-se inalteradas as outras informações do enunciado)


Quando o tamanho da população é conhecido e relativamente grande em comparação com o tamanho da amostra, é apropriado usar a correção para a população finita. Nesse caso, a fórmula para calcular o tamanho da amostra é ajustada para levar em consideração o tamanho da população.

A fórmula ajustada para o tamanho da amostra com correção para população finita é:
$$ n = \frac{{Z^2 \cdot \sigma^2 \cdot N}}{{Z^2 \cdot \sigma^2 + (N - 1) \cdot E^2}}
$$

Onde:

- \( n \) é o tamanho da amostra necessário,
- \( Z \) é o escore z correspondente ao nível de confiança,
- \(σ) é o desvio padrão populacional,
- \( N \) é o tamanho da população, e
- \( E \) é a margem de erro.





In [None]:
# Nível de confiança
nivel_confianca = 0.92

# Margem de erro
margem_erro = 50

# Desvio padrão populacional
desvio_padrao = 400

# Tamanho populacional conhecido
n_empregados = 386

# Z-score correspondente ao nível de confiança
z_score = norm.ppf((1 + nivel_confianca) / 2)


# Tamanho da amostra

tamanho_amostra = (z_score**2 * desvio_padrao**2 * n_empregados) / ((z_score**2 * desvio_padrao**2) + ((n_empregados - 1) * margem_erro**2))
print(f'C) O tamanho de amostra necessário para 92% de confiança, considerando a população finita, é aproximadamente {math.ceil(tamanho_amostra)}.')

C) O tamanho de amostra necessário para 92% de confiança, considerando a população finita, é aproximadamente 131.


## Tamanho amostral para Proporção

O reitor de uma universidade deseja estimar com uma margem de erro de 5% e um nível de confiança de 99%, a proporção de estudantes matriculados nos programas de MBA que fizeram graduação em Sistemas de Informação. Sabe-se que, atualmente, há 550 alunos fazendo MBA. Qual tamanho mínimo de amostra deve ser coletado?

A ) Estima-se que a proporção populacional seja de 23%.

In [None]:
# Parâmetros fornecidos
p_estimado = 0.23
E = 0.05
nivel_confianca = 0.99

# Encontrando o valor de Z para o nível de confiança especificado
Z = norm.ppf((1 + nivel_confianca) / 2)

# Calculando o tamanho amostral necessário
n_estimado = ((Z**2) * p_estimado * (1 - p_estimado)) / (E**2)
n_estimado

470.0160752163427

B)  Não há base para estimar o valor aproximado da proporção populacional.

In [None]:
# Parâmetros fornecidos
p_estimado = 0.5
E = 0.05
nivel_confianca = 0.99

# Encontrando o valor de Z para o nível de confiança especificado
Z = norm.ppf((1 + nivel_confianca) / 2)

# Calculando o tamanho amostral necessário
n_estimado = ((Z**2) * p_estimado * (1 - p_estimado)) / (E**2)
n_estimado

663.4896601021212