# Intervalo de confiança

Podemos chamar também de IC. É um intervalo de valores que provalmente contém o valor verdadeiro de um parâmetro populacional. Normalmente, esse parâmetro pode ser a média ou a proporção populacional. Importante: Não estamos tentando adivinhar o valor exato, mas sim um intervalo pláusivel

Intervalos de confiança existem pois muitas vezes não temos acesso à população inteira, por isso trabalhamos com amostras. O intervalo de confiança quantifica as incertezas dessa estimativa.

## Interpretação

Quando dizemos "Esse é um intervalo de confiança com 95%", signica que estamos dizendo que se repetíssemos o experimento muitas vezes, 95% dos intervalos conteriam o valor verdadeiro. Isso não significa "Há 95% de chance do valor estar nesse intervalo.

Intervalos utilizam a média, o desvio padrão e a área sobre a curva normal. Quanto maior a confiança, maior o intervalo.

In [2]:
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

# Gerar a amostra. Nesse caso vamos definir uma seed para o gerador de números aleatórios do numpy
np.random.seed(77)
amostra = np.round(np.random.normal(
    loc=170, scale=10, size=100), 1)

# Gerar nosso dataframe
df = pd.DataFrame(amostra, columns=['altura'])

media = df['altura'].mean()
desvio_padrao = df['altura'].std()
n = len(df)

print(f"Média da amostra: {media:.2f}.")
print(f"Desvio Padrão da amostra: {desvio_padrao:.2f}.")
print(f"Tamanho da amostra: {n}.")

Média da amostra: 169.80.
Desvio Padrão da amostra: 9.33.
Tamanho da amostra: 100.
