# Distribuição normal

É uma distribuição de probabilidade contínua que descreve como os valores de uma variável tendem a se concentrar em torno de um valor central. Também é conhecida como

* Curva normal
* Curva de Gauss
* Curva em sino

E qual a idéia central? É que os valores "comuns" ficam mais próximos da média, e os valores "extremos" são cada vez mais raros.

# Distribuição contínua

Uma variável contínua é aquela que:

* Pode assumir infinitos valores dentro de um intervalo
* Não está limitada a números inteiros

Exemplos de variáveis contínuas:
* Altura (170cm, 170.5cm, 170.43985cm)
* Peso
* Tempo
* Temperatura

Isso importa, pois na distribuição normal não falamos em frequência exata, falamos em probabilidades dentro dos intervalos.

In [None]:
import numpy as np

# Vamos gerar uma sequência de 10 valores contínuos entre 0 e 1.
# É importante frisar que os dados gerados não seguem uma distribuição, estamos gerando apenas para mostrar o conceito de continuidade
dados_continuos = np.random.rand(10)

print(dados_continuos)

# Curva em sino

A forma da distribuição normal é um sino simétrico, onde:
* A curva cai suavemente para os lados
* Não existem "quebras"

## Interpretação visual
* O ponto mais alto do sino é a média
* Centro alto -> Muitos valores próximos da média
* Laterais baixas -> Poucos valores extremos

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

# No caso abaixo, camos gerar dados simulados com distribuição normal
# loc corresponde a média da distribuição
# scale corresponde ao desvio padrão ou "largura" da distribuição
# size corresponde a quantidade total de dados
dados = np.round(
    np.random.normal(loc=170, scale=10, size=1000)
)

# Vamos visualizar com um histograma
plt.figure(figsize=(10, 5))
sns.histplot(dados, bins=20, kde=True)

plt.title("Distribuição normal - Curva em formato de sino")
plt.xlabel("Valores")
plt.ylabel("Frequência")

plt.show()