# Aula 07: Gráficos Estatísticos Avançados com Seaborn

## O que é Seaborn?

Seaborn é uma biblioteca de visualização de dados para Python baseada no Matplotlib. Ela fornece uma interface de alto nível para desenhar gráficos estatísticos atraentes e informativos.

Principais vantagens do Seaborn:
- Estilos visuais e paletas de cores bonitas por padrão.
- Funções complexas de visualização com poucas linhas de código.
- Ótima integração com as estruturas de dados do Pandas.

### Instalação e Importação

O Seaborn geralmente é usado junto com pandas e matplotlib.
```bash
pip install seaborn pandas matplotlib
```
A convenção é importar o `seaborn` com o apelido `sns`.

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd

# Definindo um tema estético para todos os gráficos
sns.set_theme(style="whitegrid")

### Carregando Datasets de Exemplo

O Seaborn vem com alguns datasets clássicos para facilitar a prototipação e o aprendizado.

In [None]:
# Carregando o dataset 'tips' (gorjetas em um restaurante)
tips_df = sns.load_dataset("tips")

# Visualizando as primeiras linhas
tips_df.head()

### Gráficos de Relação (`scatterplot`, `lineplot`)

São usados para entender a relação entre duas variáveis numéricas. Com o Seaborn, é fácil adicionar uma terceira variável categórica usando o parâmetro `hue`.

In [None]:
plt.figure(figsize=(10, 6))
sns.scatterplot(data=tips_df, x="total_bill", y="tip", hue="sex")
plt.title('Relação entre Valor da Conta e Gorjeta por Sexo')
plt.xlabel('Valor Total da Conta ($)')
plt.ylabel('Valor da Gorjeta ($)')
plt.show()

### Gráficos de Distribuição (`histplot`, `kdeplot`)

Esses gráficos nos ajudam a entender a distribuição de uma única variável.

In [None]:
# Histograma com uma curva de densidade (KDE)
sns.histplot(data=tips_df, x="total_bill", kde=True)
plt.title('Distribuição do Valor Total da Conta')
plt.show()

### Gráficos Categóricos (`boxplot`, `violinplot`, `barplot`)

São ideais para visualizar a relação entre uma variável numérica e uma ou mais variáveis categóricas.

In [None]:
# Boxplot para comparar a distribuição das gorjetas por dia da semana
plt.figure(figsize=(10, 6))
sns.boxplot(data=tips_df, x="day", y="tip", hue="smoker")
plt.title('Distribuição das Gorjetas por Dia da Semana e se o Cliente é Fumante')
plt.show()

In [None]:
# Barplot mostra a média (por padrão) de uma variável numérica por categoria
plt.figure(figsize=(10, 6))
sns.barplot(data=tips_df, x="day", y="total_bill", hue="time")
plt.title('Média do Valor da Conta por Dia e Período (Almoço/Jantar)')
plt.show()

### Gráficos de Regressão (`lmplot`)

O `lmplot` combina um gráfico de dispersão com uma linha de regressão linear, ajudando a visualizar a tendência entre duas variáveis.

In [None]:
# Cria um gráfico de regressão e separa por categoria (colunas) e cor (hue)
sns.lmplot(data=tips_df, x="total_bill", y="tip", col="time", hue="smoker")
plt.show()

### Gráficos de Matriz (`heatmap`)

Um heatmap é uma representação gráfica de dados onde os valores individuais contidos em uma matriz são representados por cores. É muito útil para visualizar matrizes de correlação.

In [None]:
# Selecionando apenas as colunas numéricas para calcular a correlação
numeric_cols = tips_df.select_dtypes(include=np.number)
correlacao = numeric_cols.corr()

# Criando o heatmap
plt.figure(figsize=(8, 6))
sns.heatmap(correlacao, annot=True, cmap="coolwarm", fmt=".2f")
plt.title('Mapa de Calor da Correlação entre Variáveis Numéricas')
plt.show()

### Conclusão

Seaborn é uma ferramenta poderosa que estende o Matplotlib para criar visualizações estatísticas mais sofisticadas com menos código. Ele se integra perfeitamente com DataFrames do Pandas, tornando-o uma escolha essencial para a análise exploratória de dados em Python.