<a href="https://colab.research.google.com/github/carlosfab/curso_data_science_na_pratica/blob/master/modulo_03/3_12_Conhecendo_o_Seaborn.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Conhecendo o Seaborn

Seaborn é uma biblioteca de visualização do Python baseada no `matplotlib`. Fornecendo uma itnerface de alto nível, permite a construção de gráficos estatísticos mais atraentes e informaticos.

<p align=center><img src="https://raw.githubusercontent.com/carlosfab/curso_data_science_na_pratica/master/modulo_03/seaborn.png"></p>

Para você ter uma noção dos tipos de gráficos que podem ser construídos com a biblioteca `seaborn`, dê uma olhada na [galeria de exemplos](https://seaborn.pydata.org/examples/index.html#example-gallery) ou acompanhe os [tutoriais](https://seaborn.pydata.org/tutorial.html#tutorial) fornecidos na própria documentação do pacote.

Se você está se perguntando o motivo pelo qual você usaria o `seaborn` e não `matplotlib`, eu posso te dar algumas vantagens:

* Matplotlib não é otimizado para o Pandas, uma vez que é mais antigo (veio antes) que ele.
* Matplotlib é baixo nível se comparado ao Seaborn. Ser mais baixo nível significa que você precisa de mais código e mais trabalho para conseguir customizar seus gráficos.
* Deixar um gráfico *sexy* e atraente no Matplotlib pode ser uma tarefá árdua!
* Há vários tipos de gráficos não contemplados no Matplotlib, mas que estão presentes no Seaborn.

## Aplicando o estilo do Seaborn no Matplotlib

O Seaborn fornece uma interface mais *high-level* para criarmos gráficos elaborados, visualmente melhores e mais complexos. É muito comum vermos *notebooks* de *Data Science* usando `seaborn` como biblioteca primária para plotar gráficos.

Entretanto, mesmo quem prefere usar o `matplotlib` consegue tirar proveito do estilo que está por trás do `seaborn`.

In [0]:
# importar pacotes
import numpy as np
import matplotlib.pyplot as plt

In [0]:
# gerar dados aleatórios
x = np.arange(100)
y = np.random.random_integers(-50, 50, 100)

# plotar o gráfico com MATPLOTLIB
fig, ax = plt.subplots(figsize=(8,4))
ax.plot(x, y)

plt.tight_layout()

O gráfico acima é bem no estilo que estamos acostumados até então aqui no curso. Mas veja só o que é possível melhorar apenas importando a biblioteca `seaborn` e chamando o método `sns.set()`.

In [0]:
# importar seaborn
import seaborn as sns
sns.set()

# plotar o gráfico com MATPLOTLIB usando estilo do Seaborn
fig, ax = plt.subplots(figsize=(8,4))
ax.plot(x, y)

plt.tight_layout()

Repare que usamos exatamente a mesma função para plotar o gráfico com o `matplotilib`. No entanto, ele já ganhou um visual bem mais moderno e agradável aos olhos.

## Alguns exemplos do Seaborn

Quando você estiver confortável com o `matplotlib` e quiser dar um passo a mais, comece a ver a sua documentação e faça alguns exemplos dos [tutoriais oficiais](https://seaborn.pydata.org/tutorial.html#tutorial). Lembre-se que esse é um *plus*, mas antes disso você precisa **fortalecer os conceitos e as bases**. Não adianta nada você saber "copiar" gráficos bonitos se não tiver noção do que eles representam. 

Vou apresentar aqui alguns gráficos mais complexos e avançados, só para você ter ideia do mundo de visualização de dados que existe por aí.

In [0]:
# JOINT PLOT
sns.jointplot(x, y, kind='kde')
plt.show()

In [0]:
# DATA + REGRESSÃO LINEAR

# gerar dados aleatórios
a = np.arange(100)
b = 3 * a + 14 + np.random.normal(0, 40, len(a))

sns.regplot(a, b)
plt.show()

In [0]:
# HEATMAP

# importar dataset da UCI
import pandas as pd
dataset_uci = "https://raw.githubusercontent.com/carlosfab/curso_data_science_na_pratica/master/modulo_03/heart-disease-uci.csv"
df_heart = pd.read_csv(dataset_uci)

# heatmap (mapa de calor)
sns.heatmap(df_heart.corr())
plt.show()

In [0]:
# COUNTPLOT

# importar dados do CENIPA
df_cenipa = pd.read_csv("https://raw.githubusercontent.com/carlosfab/curso_data_science_na_pratica/master/modulo_02/ocorrencias_aviacao.csv")

sns.countplot(df_cenipa["ocorrencia_classificacao"])
plt.show()