# Visualização de Dados com Python

Bem vindo ao curso de visualização de dados com Python, neste curso você vai aprender a manipular informações afim de visualiza-lás, facilitando a interpretação do seus dados, e para isso será usado o módulo Matplotlib.pyplot.

![image.png](attachment:image.png)

No final do curso, é esperado que você saiba como criar um gráfico que nem esse entre outros tipos de gráficos :D

## Importando o módulo

iremos importar o módulo matplotlib como plt

In [None]:
import matplotlib.pyplot as plt 

Nesse módulo há vários tipos de gráficos que podem ser utilizados, nesse curso iremos estudar os seguintes tipos de  gráficos:
* Gráfico de pontos
* Gráfico de linha
* Histograma
* Gráfico setorial


## Gráfico de pontos

Em gráficos 2D temos as coordenadas cartesianas X e Y, então para determinarmos a localização de um ponto, temos que ter o seu par ordenado de coordenadas (x,y)

In [None]:
x = [1,2,3,4] # As coordenadas dos pontos no eixo X
y = [1,2,3,4] # As coordenadas dos pontos no eixo Y
# Então os pontos terão as respectivas coordenadas (1,1),(2,2),(3,3) e (4,4)

In [None]:
plt.scatter(x,y) # Construimos o gráfico de pontos com a lista X sendo referente ao eixo X e a lista Y
# sendo referente ao eixo Y
plt.show() # Abre a imagem do gráfico

Pronto, criamos nosso gráfico de pontos, agora se Y fosse uma função que depende do valor de X? 

Para isso devemos usar a função numpy.array() que está presente no módulo numpy, que nós permite manipular mais facilmente os valores de uma lista

In [None]:
import numpy as np # importamos o módulo numpy como np

In [None]:
x = np.array(x) # Transformamos a nossa lista(x) em um numpy array

In [None]:
y = x**2 # E agora transformamos a nossa lista(y) em um numpy array que tem os valores em função da primeira lista

In [None]:
plt.scatter(x,y) # Construimos o gráfico de y em função de x
plt.show() # Abre a imagem do gráfico

## Gráfico de linhas


O gráfico de linhas é programado da mesma forma que o de pontos, a unica coisa que muda é que iremos usar a função .plot() no lugar do .scatter()

In [None]:
x = [1,2,3,4] # As coordenadas dos pontos no eixo X
y = [1,2,3,4] # As coordenadas dos pontos no eixo Y

In [None]:
plt.plot(x,y) # Gráfico de linha feito com os pares ordenados (x,y)
plt.show() # Abre a imagem do gráfico

In [None]:
x = np.array(x) # Transformamos a nossa lista(x) em um numpy array

In [None]:
y = x**2 # E agora transformamos a nossa lista(y) em um numpy array que tem os valores em função da primeira lista

In [None]:
plt.plot(x,y) # Gráfico de linha feito com os pares de (x,y)
plt.show() # Abre a imagem do gráfico 

Com esse gráfico, percebemos que temos uma curva, mas não uma curva suave, para suavizarmos essa curva devemos diminuir o incremento, por exemplo de "1,2,3..."  ser "1.001,1.002,1.003 ... 2.999, 3.000", ou seja de um elemento para o outro, ao invés e ir de 1 em 1, ir de 0.001 em 0.001

In [None]:
x = np.arange(1,4.001,0.001)

A função np.arange(x,y,z) cria um array que vai de x até y com o incremento de z. (lembre do comando range() usado no for).

In [None]:
y = x**2 # Definimos o valor de y em função de x

In [None]:
plt.plot(x,y) # Montamos o gráfico e linha
plt.show() # Abre a imagem do gráfico

## Histograma

Histogramas, ou popularmente chamados gráficos de coluna. Para criarmos precisamos da função .hist() ou .bar().

Para usarmos a função .hist(), nós precisamos de 1 argumento, que é o array com os dados para serem transformados em histograma

In [None]:
x = np.array([1,2,2,3,3,3,4,4,4,4]) # Um array com alguns números repetidos
                                    # 1 número 1
                                    # 2 números 2
                                    # 3 números 3
                                    # 4 números 4

In [None]:
plt.hist(x) # Montamos o histograma do array X
plt.show() # Mostramos o histograma

Então, com a função .hist() a construção do histograma é feita com os elementos e sua frequência dentro do array.

#### Outro exemplo usando .hist().

In [None]:
fruits = np.array(['banana','melon','banana','banana','apple','apple'  ])

In [None]:
plt.hist(fruits)# Montamos o histograma do array fruits
plt.show()

Agora usando a função .bar(), precisamos de dois argumentos, os nomes e os valores desejado:

In [None]:
names = ['var1','var2','var3','var4'] # Declaramos uma lista comum para receber os nomes

In [None]:
values = [10,5,13,8] # Declaramos uma lista para receber os valores

In [None]:
plt.bar(names,values)#É criado um histograma com a relação names[0] & values[0] names[1] & values[1] names[2] & values[2]
plt.show()# Montamos o gráfico

## Gráfico setorial

Gráfico setoriais, são os gráficos de "pizza" e para produzirmos um, devemos usar a função .pie()

In [None]:
x = [1,2,3,4]

In [None]:
plt.pie(x)# Criamos um gráfico de esfera divido pelos valores da lista
plt.show()

Além do argumento da lista de valores da função pie, há outros argumentos opcionais para facilitar a visualização do gráfico.

In [None]:
y = ['setor 1','setor 2','setor 3','setor 4']

In [None]:
plt.pie(x,labels = y)# Colocamos 'legendas' respectivamente para cada índice do vetor X de valores
plt.show()

In [None]:
plt.pie(x,labels = y,autopct='%1.1f%%')# Adicionamos a porcentagem de cada valor em relação a área da esfera com uma casa decimal
plt.show()

In [None]:
destacar = (0,0,0,0.1) # Selecionamos o 4 elemento para distanciar 1-unidade do resto do gráfico

In [None]:
plt.pie(x,labels = y,autopct='%1.1f%%',explode=destacar)# Destacamos a área que equivale ao valor do 4º índice 
plt.show()

## Estilização de gráficos

Nesse tópicos, vamos ver como adicionar legendas, grades, titulos e entre outros recursos para tornarmos nosso gráfico o mais légivel possível.

### Título

Para adicionarmos um título ao nosso gráfico, devemos usar a função .title() e então teremos um título para o nosso gráfico.

In [None]:
x = np.arange(1,4.001,0.001)
y = x**2
plt.plot(x,y)       
# Recriamos o nosso gráfico de linha
plt.title("Meu primeiro gráfico") # adicionamos um título ao gráfico
plt.show()# Abrimos o gráfico

### Definição dos eixos

Como dar nomes para os nossos eixos x e y, para que não sejam apenas listas numéricas? para isso, iremos usar as funções set_xlabel() e set_ylabel().

In [None]:
x = np.arange(0,4.001,0.001)
y = x**2
fig,graf = plt.subplots()

# Durante a estilização é importante haver essa separação em subplots, sendo 'fig' a imagem por completo e 'graf' apenas
# o gráfico, para podermos manipularmos facilmente cada espaço.

graf.plot(x,y) # Criamos o gráfico 'graf' como um gráfico de linha comum.

# Recriamos o nosso gráfico de linha.

plt.title("Meu primeiro gráfico") # adicionamos um título ao gráfico.

graf.set_xlabel("Valores de X") 
graf.set_ylabel("Valores de Y") # Colocamos as legendas para cada eixo.

plt.show()# Abrimos o gráfico.

### Legendas


Para haver a adição de legendas no gráfico, devemos adicionar mais um argumento em cada .plot() e usar a .legend() para que a legenda aparece para o usuário.

In [None]:
x = np.arange(0,4.001,0.001)
y = x**2
fig,graf = plt.subplots()

# Durante a estilização é importante haver essa separação em subplots, sendo 'fig' a imagem por completo e 'graf' apenas
# o gráfico, para podermos manipularmos facilmente cada espaço.

graf.plot(x,y, label = "f(x) = x²") # Criamos o gráfico 'graf' como um gráfico de linha comum.
                        # Adicionamos o atributo de legenda, de como esse gráfico deve ser chamado

# Recriamos o nosso gráfico de linha.

plt.title("Meu primeiro gráfico") # adicionamos um título ao gráfico.

graf.set_xlabel("Valores de X") 
graf.set_ylabel("Valores de Y") # Colocamos as legendas para cada eixo.

graf.legend() # Ativamos a legenda no gráfico.

plt.show()# Abrimos o gráfico.

Agora se nós tivermos mais de duas funções no mesmo gráfico, fazemos da mesma maneira

In [None]:
x = np.arange(0,4.001,0.001)
y = x**2
fig,graf = plt.subplots()

# Durante a estilização é importante haver essa separação em subplots, sendo 'fig' a imagem por completo e 'graf' apenas
# o gráfico, para podermos manipularmos facilmente cada espaço.

graf.plot(x,y, label = "f(x) = x²") # Criamos o gráfico 'graf' como um gráfico de linha comum.
graf.plot(y,x, label = "f(y) = y²")
                        # Adicionamos o atributo de legenda, de como esse gráfico deve ser chamado

# Recriamos o nosso gráfico de linha.

plt.title("Meu primeiro gráfico") # adicionamos um título ao gráfico.

graf.set_xlabel("Valores de X") 
graf.set_ylabel("Valores de Y") # Colocamos as legendas para cada eixo.

graf.legend() # Ativamos a legenda no gráfico.

plt.show() # Abrimos o gráfico.

A legenda sempre irá priorizar o lado onde não atrapalha na visualização do gráfico automaticamente, porém podemos alterar a sua posição usando o argumento 'loc'.
```python 
graf.legend(loc="center"     #Coloca a legenda no centro
            loc="lower right"#Coloca a legenda no canto inferior direito
            loc="lower left" #Coloca a legenda no canto inferior direito
            loc="upper right"#Coloca a legenda no canto superior direito
            loc="upper left" #Coloca a legenda no canto superior esquerdo
           )
```

### Aplicar grid(Grade)

Para facilitar a visualização de medidas, nós usamos a função .grid()

In [None]:
x = np.arange(0,4.001,0.001)
y = x**2
fig,graf = plt.subplots()

# Durante a estilização é importante haver essa separação em subplots, sendo 'fig' a imagem por completo e 'graf' apenas
# o gráfico, para podermos manipularmos facilmente cada espaço.

graf.plot(x,y, label = "f(x) = x²") # Criamos o gráfico 'graf' como um gráfico de linha comum.
graf.plot(y,x, label = "f(y) = y²")
                        # Adicionamos o atributo de legenda, de como esse gráfico deve ser chamado

# Recriamos o nosso gráfico de linha.

plt.title("Meu primeiro gráfico") # adicionamos um título ao gráfico.

graf.set_xlabel("Valores de X") 
graf.set_ylabel("Valores de Y") # Colocamos as legendas para cada eixo.

graf.legend(loc = "upper right") # Ativamos a legenda no gráfico.

graf.grid() # Ativamos o grid no gráfico.

plt.show() # Abrimos o gráfico.

### Cores

Os gráficos tem suas cores 'default', ou seja não precisamos defini-lás, porém é possível mudar a cor de cada gráfico indivudualmente adicionando o argumento 'color' ao .plot().

```python
    plt.plot(x,y, color = "red")


```

In [None]:
x = np.arange(0,4.001,0.001)
y = x**2
fig,graf = plt.subplots()

# Durante a estilização é importante haver essa separação em subplots, sendo 'fig' a imagem por completo e 'graf' apenas
# o gráfico, para podermos manipularmos facilmente cada espaço.

graf.plot(x,y, label = "f(x) = x²",color="green") # Criamos o gráfico 'graf' como um gráfico de linha comum.
graf.plot(y,x, label = "f(y) = y²",color="red")
                        # Adicionamos o atributo de legenda, de como esse gráfico deve ser chamado
                        # Adicionamos o atributo de cores, tendo como valor a cor em inglês, hexadecimal, RGB entre 
                        # outros formatos de cor.
    
# Recriamos o nosso gráfico de linha.

plt.title("Meu primeiro gráfico") # adicionamos um título ao gráfico.

graf.set_xlabel("Valores de X") 
graf.set_ylabel("Valores de Y") # Colocamos as legendas para cada eixo.

graf.legend(loc = "upper right") # Ativamos a legenda no gráfico.

graf.grid() # Ativamos o grid no gráfico.

plt.show() # Abrimos o gráfico.

## Salvando um gráfico

Além de podermos produzir e estilizar um gráfico do jeito que nós preferirmos, também podemos salvá-los no final do código. Usando a função .savefig()
```python
    fig.savefig("nome_do_arquivo.png")
```
Podemos salver o arquivo de diversas formas além de "png", como, por exemplo, em "pdf"

* o comando .savefig() salva o arquivo do gráfico diretamente na pasta onde o programa foi executado

In [None]:
x = np.arange(0,4.001,0.001)
y = x**2
fig,graf = plt.subplots()

# Durante a estilização é importante haver essa separação em subplots, sendo 'fig' a imagem por completo e 'graf' apenas
# o gráfico, para podermos manipularmos facilmente cada espaço.

graf.plot(x,y, label = "f(x) = x²",color="green") # Criamos o gráfico 'graf' como um gráfico de linha comum.
graf.plot(y,x, label = "f(y) = y²",color="red")
                        # Adicionamos o atributo de legenda, de como esse gráfico deve ser chamado
                        # Adicionamos o atributo de cores, tendo como valor a cor em inglês, hexadecimal, RGB entre 
                        # outros formatos de cor.
    
# Recriamos o nosso gráfico de linha.

plt.title("Meu primeiro gráfico") # adicionamos um título ao gráfico.

graf.set_xlabel("Valores de X") 
graf.set_ylabel("Valores de Y") # Colocamos as legendas para cada eixo.

graf.legend(loc = "upper right") # Ativamos a legenda no gráfico.

graf.grid() # Ativamos o grid no gráfico.

plt.show() # Abrimos o gráfico.

fig.savefig("meu_primeiro_gráfico.png") # Salvamos o nosso gráfico no mesmo local do programa.

**Lembre de sempre importar os módulos usados no seus programas. nesse curso usamos Numpy e Matplotlib.pyplot .**

### Dúvidas e sugestões

Entrar em contato com [Lucas Maia](https://github.com/Lucasmaia435) 