# Importação das Bibliotecas

In [20]:
import numpy as np
import pandas as pd
import scipy.stats as stats
from scipy import stats
import scipy.stats as st

# Leitura da Base

In [2]:
# Leitura da planilha 
DADOS = r"C:\Users\rodri\OneDrive\Sincronização\Documentos\GitHub\confidence-interval-car-suitability-sweden\data\sample_population_height.xlsx"
df = pd.read_excel(DADOS)

# Visualizar as primeiras linhas da tabela
df.head()

Unnamed: 0,ID,Altura
0,1,1.412
1,2,1.966
2,3,2.666
3,4,2.0
4,5,1.402


# Novo Problema de Negócio

Após a primeira análise da altura média dos suecos, um fabricante de automóveis percebeu que a decisão de adaptar ou não os bancos para exportação exigia um estudo mais preciso. A empresa compreendeu que a amostra inicial, embora útil, poderia não oferecer a acurácia necessária para embasar essa decisão estratégica.

Diante disso, a equipe de engenharia solicitou uma nova análise estatística para garantir um ajuste ergonômico ideal ao consumidor sueco. O objetivo era reduzir a margem de erro dos cálculos e obter maior confiabilidade nos dados antes de modificar o design do veículo.

Desafio de Negócio
A montadora pediu dois cálculos essenciais para aprimorar sua tomada de decisão:

- Margem de erro dos intervalos de confiança já calculados.
- Tamanho necessário da amostra para garantir uma margem de erro inferior a 1 cm, considerando três níveis de confiança: 90%, 95% e 99%.

In [5]:
# Definição da variável da 'amostra'
amostra = df["Altura"].to_numpy()

# Estatísticas básicas
media = np.mean(amostra)
n = len(amostra)
variancia_amostral = np.var(amostra, ddof=1)
erro_padrao = np.sqrt(variancia_amostral / n)

# Exibir os resultados
print(f"Média: {media:.2f}")
print(f"Tamanho da Amostra: {n}")
print(f"Variância Amostral: {variancia_amostral:.2f}")
print(f"Erro Padrão da Média: {erro_padrao:.2f}")

Média: 1.82
Tamanho da Amostra: 50
Variância Amostral: 0.08
Erro Padrão da Média: 0.04


In [30]:
# Nível de confiança de 90%
conf_90 = 0.90

# Nível de confiança de 95%
conf_95 = 0.95

# Nível de confiança de 99%
conf_99 = 0.99

# Função para calcular intervalo de confiança
def intervalo_confianca(conf, media, erro_padrao, n):
    t_critico = abs(stats.t.ppf((1 - conf) / 2, df=n-1))
    limite_inferior = media - t_critico * erro_padrao
    limite_superior = media + t_critico * erro_padrao
    return t_critico, limite_inferior, limite_superior

# Intervalo de confiança de 90%
t_critico_90, limite_inferior_90, limite_superior_90 = intervalo_confianca(conf_90, media, erro_padrao, n)

# Intervalo de confiança de 95%
t_critico_95, limite_inferior_95, limite_superior_95 = intervalo_confianca(conf_95, media, erro_padrao, n)

# Intervalo de confiança de 99%
t_critico_99, limite_inferior_99, limite_superior_99 = intervalo_confianca(conf_99, media, erro_padrao, n)

# Exibir resultados
print("\n Intervalo de Confiança de 90%:")
print(f"T-Crítico: {t_critico_90:.2f}")
print(f"Limite Inferior: {limite_inferior_90:.2f}")
print(f"Limite Superior: {limite_superior_90:.2f}")

# Exibir resultados
print("\n Intervalo de Confiança de 95%:")
print(f"T-Crítico: {t_critico_95:.2f}")
print(f"Limite Inferior: {limite_inferior_95:.2f}")
print(f"Limite Superior: {limite_superior_95:.2f}")

print("\n Intervalo de Confiança de 99%:")
print(f"T-Crítico: {t_critico_99:.2f}")
print(f"Limite Inferior: {limite_inferior_99:.2f}")
print(f"Limite Superior: {limite_superior_99:.2f}")


 Intervalo de Confiança de 90%:
T-Crítico: 1.68
Limite Inferior: 1.75
Limite Superior: 1.89

 Intervalo de Confiança de 95%:
T-Crítico: 2.01
Limite Inferior: 1.74
Limite Superior: 1.90

 Intervalo de Confiança de 99%:
T-Crítico: 2.68
Limite Inferior: 1.71
Limite Superior: 1.92


In [18]:
margem_de_erro_90 = abs((limite_inferior_90 - media).round(2))
margem_de_erro_95 = abs((limite_inferior_95 - media).round(2))
margem_de_erro_99 = abs((limite_inferior_99 - media).round(2))

print("Margem de Erro para um Nível de Confiança de 90%")
print(f"Erro: {margem_de_erro_90}")
print("="*40)
print("Margem de Erro para um Nível de Confiança de 95%")
print(f"Erro: {margem_de_erro_95}")
print("="*40)
print("Margem de Erro para um Nível de Confiança de 99%")
print(f"Erro: {margem_de_erro_99}")

Margem de Erro para um Nível de Confiança de 90%
Erro: 0.07
Margem de Erro para um Nível de Confiança de 95%
Erro: 0.08
Margem de Erro para um Nível de Confiança de 99%
Erro: 0.11


In [27]:
# Parâmetros conhecidos
variancia_amostral = 0.08  # Variância da amostra
margem_de_erro_1cm = 0.01  # Margem de erro desejada (1 cm)

# Lista de níveis de confiança
niveis_confianca = [0.90, 0.95, 0.99]

# Cálculo para cada nível de confiança
for conf in niveis_confianca:
    # Obtendo o valor crítico Z correspondente ao nível de confiança
    z = st.norm.ppf(1 - (1 - conf) / 2)

    # Calculando o novo tamanho da amostra necessário
    novo_n = (variancia_amostral * (z ** 2)) / (margem_de_erro_1cm ** 2)

    # Exibindo os resultados formatados
    print("=" * 50)
    print(f"Nível de Confiança: {int(conf * 100)}%")
    print(f"Valor Crítico Z: {z:.2f}")
    print(f"Novo tamanho da amostra necessário: {round(novo_n)}")
print("=" * 50)

Nível de Confiança: 90%
Valor Crítico Z: 1.64
Novo tamanho da amostra necessário: 2164
Nível de Confiança: 95%
Valor Crítico Z: 1.96
Novo tamanho da amostra necessário: 3073
Nível de Confiança: 99%
Valor Crítico Z: 2.58
Novo tamanho da amostra necessário: 5308
