<img alt="Colaboratory logo" width="15%" src="https://raw.githubusercontent.com/carlosfab/escola-data-science/master/img/novo_logo_bg_claro.png">

#### **Missão Python do Zero**
*by [sigmoidal.ai](https://sigmoidal.ai)*

---

# SweetViz

<center><img width="45%" src="https://miro.medium.com/max/700/1*jx_ShECen95-F_M5PH9HCA.png"></center>


A análise exploratória é fase essencial em qualquer projeto com dados. Entender bem nossos dados vai nos dar insights valiosos e direcionar nosso trabalho com eles.

Apesar de demandar muito tempo e atenção, existem ferramentas que podem nos auxiliar e agilizar nosso trabalho. Uma delas é o [Sweet Viz](https://pypi.org/project/sweetviz/).

Essa biblioteca é capaz de analisar e criar relatórios sobre nossos dados de forma automatizada, exigindo pouquíssimo código, reduzindo a curva de aprendizado para análises completas, economizando tempo, e nos dando belas visualizações, fáceis de navegar e entender.

## Instalando o Sweet Viz

Por padrão, o Colab não possui essa biblioteca instalada. Portanto, precisamos fazer a instalação manualmente.

In [None]:
# instalando a biblioteca
%pip install sweetviz -q

Uma vez instalado, é só importar e começar a usar!

## Carregando os Dados

Agora que estamos com tudo pronto, é hora de importar os pacotes e iniciar nossa análise de dados.

Para esse notebook, vamos utilizar um conjunto de dados proveniente de um e-commerce brasileiro. Os dados estão disponíveis no [Kaggle](https://www.kaggle.com/olistbr/brazilian-ecommerce).

Originalmente, os dados estão em formato csv, mas organizamos eles em formato de planilha, para emular a realidade da maioria que utiliza planilhas de excel. Os dados organizados podem ser utilizados diretamente pelo link abaixo, e os originais, e mais informações sobre os dados podem ser encontrados [aqui](https://www.kaggle.com/olistbr/brazilian-ecommerce?select=olist_products_dataset.csv).

Vamos utilizar o `pandas` para carregar os dados da mesma forma que vínhamos fazendo anteriormente.

In [None]:
# importando os pacotes necessários
import sweetviz
import pandas as pd

In [None]:
# carregando os dados
dados = pd.read_excel("https://www.dropbox.com/s/6zogl04a1h1sb3d/dados_ecommerce.xlsx?dl=1", sheet_name=None,)

Uma vez carregados, da mesma forma que fizemos anteriormente, precisamos selecionar a aba que iremos trabalhar.

O formato em que eles são recebidos não é "amigável", e não facilita nosso trabalho. Veja abaixo:

In [None]:
# verificando os dados
dados

Aqui estamos lidando com um dicionário, onde cada aba representa uma chave, com seu conteúdo como valores. Para visualizarmos as abas disponíveis, basta usar o comando `.keys()`.

In [None]:
# verificando as abas existentes
dados.keys()

Vamos trabalhar com a aba clientes. Para selecionar uma aba, basta utilizar o código abaixo, com o nome da aba desejada entre aspas (simples ou duplas), dentro de colchetes.

In [None]:
# selecionando a aba
dados['Clientes'].head()

### Criando um Relatório com SweetViz

Com os dados a serem analisados carregados e prontos para uso, é hora de utilizarmos todo o poder do **SweetViz** a nossa favor.

Para criar um relatório, vamos criar uma variável, e associar a ela o resultado da função `analyze()`, que leva como parâmetro o conjunto de dados a ser analisados.

In [None]:
# criando o relatório
relatorio_clientes = sweetviz.analyze(dados['Clientes'])

Uma vez criado, é hora de visualizar o nosso relatório, utilizando o comando `show.html()`, passando como parâmetro o nome do arquivo html a ser criado para o relatório.

Esse arquivo será salvo na nossa pasta de arquivos do Colab, no menu à esquerda, onde pode ser feito o download do mesmo para uso posterior, fora do Colab, sem a necessidade de rodar todo esse notebook novamente.

**Para visualizar o relatório, baixe o arquivo hmtl gerado através da aba à esquerda. Após o download, abra o arquivo. Ele irá abrir uma janela em seu browser, com o relatório.**

In [None]:
# criando o arquivo html e mostrando o relatório
relatorio_clientes.show_html("clientes.html")

Pronto! Agora que já sabemos o caminho, podemos criar análises como essas para cada uma das abas do nosso projeto.

Vamos ver como ficaria o relatório para a aba Pagamentos.

In [None]:
# criando relatório para a aba pagamentos
relatorio_pagamentos = sweetviz.analyze(dados['Pagamentos'])

In [None]:
# criando html e visualizando o relatório da aba pagamentos
relatorio_pagamentos.show_html("pagamentos.html")