# Visualização de Dados

A visualização dos dados é a última etapa do ciclo de passos essenciais em Aprendizado de Máquina. 
É um ciclo porque são passos que se repetem entre si, uma vez que os dados não serão visualizados apenas no final, quando o problema for resolvido, mas, sim, durante todo o processo.

Isso acontece porque computadores são excelentes em fazer cálculos com formas matemáticas e ciclos lógicos bem definidos. Entretanto, quando se trata de analisar um conjunto de dados onde podem haver dados mal calibrados, com ruído ou adquiridos sem a acurácia necessária, a etapa de visualização pode ser prejudicada. Desse modo, é preciso ser extremamente cuidadoso ao se escolher os gráficos a serem utilizados a fim de evitar interpretações equivocadas ou ainda ocultação de informação dada a forma escolhida para representação visual dos dados.


Nesse contexto, além de ser uma linguagem de programação muito versátil e poderosa, Python apresenta diversas bibliotecas para esse processo de visualização dos conjuntos de dados. Dentre as principais estão: 
- [Matplotlib](https://matplotlib.org/)
- [Seaborn](https://seaborn.pydata.org/)

## Pré-requisitos 

Para utilização dessas ferramentas, assume-se Python 3 no sistema Unix, e a preparação é simples:

```bash
sudo pip3 install matplotlib seaborn
```


## Sugestão de estudo

Para estudar sobre a parte de visualização de dados, recomenda-se já ter 
alguma noção de [programação em python][programacao].

Em seguida, é sugerido entender sobre o básico de matplotlib
por meio [deste notebook][matplotlib] e, em seguida, avançar na parte de [gráficos feitos no Seaborn][seaborn].

Finalmente, estão dispostas abaixo mais referências de estudo e documentações. 
Encorajamos os estudantes a submeterem suas próprias contribuições por meio de forks e pull-requests.

[programacao]: ./programacao.ipynb
[seaborn]: ./visualizacao/seaborn.ipynb
[matplotlib]: ./visualizacao/matplotlib.ipynb


## Referências

### Referências gerais

* Uma [coleção](./visualizacao/casos.ipynb) de situações comuns e técnicas para visualização de dados e interpretação de resultados.

### Referências para a matplotlib

**Notebook(s)**

* Um [resumo][matplot-note] das funções mais usadas;
* Algumas [ferramentas][matplot-misc] interessantes para desenhar em cima dos gráficos (annotations);
* [Exemplos de gráficos 3D][matplot-3d].

**Site(s)**

* A própria (e extensa) [documentação][matplot-doc].

### Referências para a seaborn

**Notebook(s)**
> Um [resumo][seaborn-note] das funções mais usadas e outras referências.

**Site(s)**

* A [referência][seaborn-doc] da API, disponível no próprio site;

[matplot-doc]:  https://matplotlib.org/contents.html
[matplot-note]: visualizacao/matplotlib.ipynb
[matplot-3d]:   visualizacao/tridimensionais.ipynb
[matplot-misc]: visualizacao/miscelanea.ipynb
[seaborn-doc]:  https://seaborn.pydata.org/api.html
[seaborn-note]: visualizacao/seaborn.ipynb