# Visualização de Dados com Seaborn

In [None]:
# Importar as bibliotecas necessárias

import pandas as pd
pd.plotting.register_matplotlib.converters()
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns

In [None]:
# Caminho do arquivo a ser lido
caminho = "C:\Arquivos\arq.csv"

# Ler o arquivo na variável dados
dados = pd.read_csv(caminho, index_col="Data", parse_dates=True)

In [None]:
# Imprimir as primeiras 5 linhas de dados
dados.head()

# Imprimir as 5 últimas linhas de dados
dados.tail()

# Criar um gráfico de linhas
sns.lineplot(data=dados)

In [None]:
# Ajustar largura e altura da figura a ser plotada
plt.figure(figsize=(14,6))  # 14 polegadas de largura por 6 polegadas de altura.

# Adicionar um título ao gráfico
plt.title("Aqui vai o título do gráfico")

## Imprimir um subconjunto dos dados

In [None]:
# Ver os nomes das colunas no dataset
list(dados.columns)

# Imprimir os dados de uma coluna em particular
sns.lineplot(data=dados['Nome da Coluna'], label="Rótulo (opcional) a ser usado no gráfico")

# Podemos imprimir os dados de mais de uma coluna no mesmo gráfico. Basta repetir o comando anterior:
sns.lineplot(data=dados['Nome da outra Coluna'], label="Outor rótulo a ser usado no gráfico")

# Adicionar rótulo ao eixo x do gráfico
plt.xlabel("Nome do Rótulo")

## Gráficos de Barras

In [None]:
# Ajustar dimensões da figura:
plt.figure(figsize=(10,6))

# Adicionar um título
plt.title("Título do Gráfico")

# Criar gráfico de barras com o pacote Seaborn:
sns.barplot(x=dados.index, y=dados['Nome Campo'])

# Rótulo no eixo vertical
plt.ylabel("Rótulo para o eixo y")

## Mapas de Calor (Heatmaps)

In [None]:
# Ajustar dimensões da figura:
plt.figure(figsize=(10,6))

# Adicionar um título
plt.title("Título do Gráfico")

# Criar heatmap com Seaborn
sns.heatmap(dados=fonte-dos-dados, annot=True) # annot=True mostra os valores no mapa de calor

# Rótulo no eixo horizontal
plt.xlabel("Rótulo para o eixo x")

# Scatterplots

Usamos scatterplots para realçar a relação entre duas variáveis contínuas.

Podemos também adaptar o gráfico para mostrar uma variável categórica em um dos eixos, criando um gráfico de espalhamento categórico, com a função swarmplot.

In [None]:
# Informamos os valores para os eixos x e y do gráfico:
sns.scatterplot(x=dados['coluna'], y=dados['outra_coluna'])

# Adicionar uma linha de regressão (linha que melhor representa os dados):
sns.regplot(x=dados['coluna'], y=dados['outra_coluna'])

# Adicionar outra coluna de dados e colorir os pontos:
sns.regplot(x=dados['coluna'], y=dados['outra_coluna'], hue=dados['coluna_pontos'])

# Plotar duas linhas de regressão:
sns.lmplot(x="coluna1", y="coluna2", hue="coluna_pontos", data=dados) # Basta especificar os nomes das colunas com a função lmplot

# Criar scatterplot categórico:
sns.swarmplot(x=dados['coluna1'], y=dados['coluna2'])


# Histogramas

In [None]:
# Criar um histograma

sns.distplot(a=dados['Nome da coluna'], kde=False) # a = coluna a ser plotada; kde = Kernel Density Estimate

# Histograma com 3 fontes de dados:
sns.distplot(a=dados1['Nome da coluna'], label="Rótulo 01", kde=False)
sns.distplot(a=dados2['Nome da coluna'], label="Rótulo 02", kde=False)
sns.distplot(a=dados3['Nome da coluna'], label="Rótulo 03", kde=False)
plt.title("Título do gráfico")
plt.legend() # Forçar a exibição da legenda com os rótulos.

# Gráfico de Densidade

KDE = Kernel Density Estimate

*"histograma suavizado"*

In [None]:
# Criar gráfico de densidade

sns.kdeplot(data=dados['Nome da Coluna'], shade=True) # shade = sombreamento da área do gráfico

# KDE bidimensional
sns.jointplot(x=dados['Coluna Dados Eixo x'],y=dados['Coluna Dados Eixo y'], kind='kde')



# Temas do Seaborn

O seabornpossui cinco temas diferentes que podem ser usados para alterar a aparência padrão de um gráfico:
- darkgrid
- dark
- whitegrid
- white
- ticks

In [None]:
# Aplicando um tema ao seaborn para mudar seu estilo, como por exemplo o estilo dark

sns.set_style("dark")