# Importação das Bibliotecas

In [1]:
import numpy as np
import pandas as pd
import scipy.stats as stats
from scipy import stats

# Leitura e Análise da Base

In [2]:
# Leitura da planilha 
DADOS = r"C:\Users\rodri\OneDrive\Sincronização\Documentos\GitHub\confidence-interval-car-suitability-sweden\data\sample_population_height.xlsx"
df = pd.read_excel(DADOS)

# Visualizar as primeiras linhas da tabela
df.head()

Unnamed: 0,ID,Altura
0,1,1.412
1,2,1.966
2,3,2.666
3,4,2.0
4,5,1.402


In [3]:
# Visualizar as últimas linhas da tabela
df.tail()

Unnamed: 0,ID,Altura
45,46,1.979
46,47,1.76
47,48,1.983
48,49,1.961
49,50,1.648


In [4]:
# Conferir os tipos de dados
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 50 entries, 0 to 49
Data columns (total 2 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   ID      50 non-null     int64  
 1   Altura  50 non-null     float64
dtypes: float64(1), int64(1)
memory usage: 932.0 bytes


# Problema de Negócio

## Contexto

Uma montadora brasileira decidiu expandir sua atuação internacional e exportar um novo modelo de veículo para a Suécia. No entanto, antes de iniciar as exportações, surgiu uma questão crucial: 

- os ajustes dos bancos dianteiros foram desenvolvidos com base na altura média dos brasileiros. Seriam esses ajustes adequados para os consumidores suecos, cuja estatura pode ser diferente?

Para responder a essa pergunta, a empresa contratou uma consultoria estatística para analisar a altura média da população sueca e determinar se seria necessária uma adaptação nos ajustes dos bancos.

## Objetivo
O estudo teve como objetivo calcular:
- A estimativa pontual da altura média da população sueca
- Intervalos de confiança para a altura média com níveis de 90% e 99%
- Análise comparativa com a altura média brasileira (1,73m) para tomada de decisão sobre ajustes nos bancos

# Resolução

In [17]:
# Definição da variável da 'amostra'
amostra = df["Altura"].to_numpy()

In [6]:
# Estatísticas básicas
media = np.mean(amostra)
n = len(amostra)
variancia_amostral = np.var(amostra, ddof=1)
erro_padrao = np.sqrt(variancia_amostral / n)

# Exibir os resultados
print(f"Média: {media:.2f}")
print(f"Tamanho da Amostra: {n}")
print(f"Variância Amostral: {variancia_amostral:.2f}")
print(f"Erro Padrão da Média: {erro_padrao:.2f}")

Média: 1.82
Tamanho da amostra: 50
Variância amostral: 0.08
Erro padrão da média: 0.04


In [23]:
# DataFrame com as medidas básicas
df_resumo = pd.DataFrame({
    "Média": [f"{media:.2f}"],
    "Tamanho da Amostra": [n],
    "Variância Amostral": [f"{variancia_amostral:.2f}"],
    "Erro Padrão da Média": [f"{erro_padrao:.2f}"]   
})

df_resumo

Unnamed: 0,Média,Tamanho da Amostra,Variância Amostral,Erro Padrão da Média
0,1.82,50,0.08,0.04


In [24]:
# Nível de confiança de 90%
conf_90 = 0.90

# Nível de confiança de 95%
conf_95 = 0.95

# Nível de confiança de 99%
conf_99 = 0.99

# Função para calcular intervalo de confiança
def intervalo_confianca(conf, media, erro_padrao, n):
    t_critico = abs(stats.t.ppf((1 - conf) / 2, df=n-1))
    limite_inferior = media - t_critico * erro_padrao
    limite_superior = media + t_critico * erro_padrao
    return t_critico, limite_inferior, limite_superior

# Intervalo de confiança de 90%
t_critico_90, limite_inferior_90, limite_superior_90 = intervalo_confianca(conf_90, media, erro_padrao, n)

# Intervalo de confiança de 95%
t_critico_95, limite_inferior_95, limite_superior_95 = intervalo_confianca(conf_95, media, erro_padrao, n)

# Intervalo de confiança de 99%
t_critico_99, limite_inferior_99, limite_superior_99 = intervalo_confianca(conf_99, media, erro_padrao, n)

# Exibir resultados
print("\n🔹 Intervalo de Confiança de 90%:")
print(f"T-Crítico: {t_critico_90:.2f}")
print(f"Limite Inferior: {limite_inferior_90:.2f}")
print(f"Limite Superior: {limite_superior_90:.2f}")

# Exibir resultados
print("\n🔹 Intervalo de Confiança de 95%:")
print(f"T-Crítico: {t_critico_95:.2f}")
print(f"Limite Inferior: {limite_inferior_95:.2f}")
print(f"Limite Superior: {limite_superior_95:.2f}")

print("\n🔹 Intervalo de Confiança de 99%:")
print(f"T-Crítico: {t_critico_99:.2f}")
print(f"Limite Inferior: {limite_inferior_99:.2f}")
print(f"Limite Superior: {limite_superior_99:.2f}")


🔹 Intervalo de Confiança de 90%:
T-Crítico: 1.68
Limite Inferior: 1.75
Limite Superior: 1.89

🔹 Intervalo de Confiança de 95%:
T-Crítico: 2.01
Limite Inferior: 1.74
Limite Superior: 1.90

🔹 Intervalo de Confiança de 99%:
T-Crítico: 2.68
Limite Inferior: 1.71
Limite Superior: 1.92


#### Estimativa Pontual 
A altura média estimada da população sueca, com base na amostra, foi de 1,82m.

#### Intervalos de Confiança:

- 90% de confiança: [1,75m - 1,89m]
- 95% de confiança: [1,74m - 1,90m]
- 99% de confiança: [1,71m - 1,92m]

#### Interpretação do Resultado
Considerando, por exemplo o intervalo de confiança de 90%: se realizássemos um **grande número de amostras aleatórioas de tamanho n** e calculássemos o **Intervalo de Confiança** para todas elas, 90% desses intervalos conteriam a real média da população.

Sendo assim, os intervalos de confiança representam a faixa de valores na qual, com determinado nível de confiança (90%, 95%, 99%), podemos afirmar que **a verdadeira média da altura da população está contida**. À medida que o coeficiente de confiança aumenta, o intervalo de confiança se expande para garantir maior certeza na estimativa.

#### Comparação com a Altura Média Brasileira
A altura média brasileira é de 1,73m, enquanto a altura média sueca (estimada pela amostra) foi superior. Isso indica que os ajustes dos bancos do carro precisarão ser modificados para garantir conforto e ergonomia aos consumidores suecos.

Ao analisar o intervalo de confiança, temos que 1,73m não está no intervalo de confiança de 90%, mas está no de 99%. O ideal seria ter o intervalo de confiança da altura brasileira, não somente a estimativa pontual da altura média. 

No entanto, para uma melhor decisão sobre a adaptação dos bancos, **não devemos apenas considerar as médias pontuais**. Um **teste de hipóteses (como o teste t de Student)** poderia ser útil para verificar se a diferença nas médias de altura entre brasileiros e suecos é estatisticamente significativa. 