# Vizualisação de Dados com Matplotlib

https://matplotlib.org/

In [None]:
# Instalar bib
# !pip install -q matplotlib

In [None]:
import matplotlib as mpl

mpl.__version__

## pyplot

``pyplot`` é um módulo dentro da biblioteca ``matplotlib`` que fornece uma interface de estilo de procedimento para criar visualizações de dados em Python. Ele oferece funções semelhantes às encontradas no MATLAB, permitindo que você crie rapidamente gráficos simples com comandos simples.

In [None]:
import matplotlib.pyplot as plt

%matplotlib inline 

Grafico de linha:

In [None]:
# Plotando o gráfico de linha
plt.plot([1, 2, 3, 4, 5], [2, 3, 5, 7, 11])

# Exibindo o gráfico
plt.show()

In [None]:
x = [1,2,3]
y = [1,4,9]
plt.plot(x, y)
plt.xlabel('x')
plt.ylabel('y')
plt.title("Plot Teste")
plt.show()

In [None]:
plt.plot(x, y, label = "legenda do grafico")
plt.legend() # vomando para mostrar a legenda
plt.show()

### Grafico de Barras:

A função `plt.bar()` é usada para criar um gráfico de barras em Matplotlib. Ela representa dados categóricos como barras retangulares, onde a altura de cada barra é proporcional ao valor que ela representa.

Principais parâmetros:
- `x`: As coordenadas x das barras. Pode ser uma sequência de números ou nomes de categoria.
- `height`: As alturas das barras.
- `width`: A largura das barras. O padrão é 0.8.
- `bottom`: A base das barras (opcional). Pode ser usado para empilhar barras.
- `align`: O alinhamento das barras em relação às coordenadas x.
- `color`: A cor das barras.
- `edgecolor`: A cor da borda das barras.
- `linewidth`: A largura da borda das barras.
- `label`: Uma etiqueta para a legenda do gráfico.

In [None]:
# Dados
categorias = ['A', 'B', 'C', 'D', 'E']
valores = [10, 20, 15, 25, 30]

# Criando o gráfico de barras
plt.bar(x = categorias, height = valores, color = 'red')

# Adicionando rótulos aos eixos
plt.xlabel('Categorias')
plt.ylabel('Valores')

# Adicionando título ao gráfico
plt.title('Gráfico de Barras')

# Exibindo o gráfico
plt.show()

Ao plotar dois graficos, o mataplotlib coloca um em cima do outro:

In [None]:
valores = [10, 20, 15, 40, 30]
valores2 = [5, 10, 10, 30, 25]

plt.bar(range(1, len(valores) + 1), valores, label = "Valores 1", color = "red")
plt.bar(range(1, len(valores2) + 1), valores2, label = "Valores 2", color = "green")

plt.legend()
plt.xlabel('Índice')
plt.ylabel('Valores')
plt.title('Gráfico de Barras')

# Exibindo o gráfico
plt.show()

### Histograma

A função `plt.hist()` é usada para criar um histograma a partir de dados numéricos. Ela conta o número de ocorrências de valores dentro de intervalos de dados, chamados de "bins", e os representa graficamente como barras.

Principais parâmetros da função `plt.hist()`:
- `x`: Os dados que serão utilizados para criar o histograma.
- `bins`: Especifica o número de intervalos ou os limites dos intervalos dos bins. Pode ser um número ou uma sequência de números.
- `range`: Especifica o intervalo de valores a ser considerado. Valores fora desse intervalo serão ignorados.
- `density`: Se `True`, a área total do histograma será normalizada para 1, fazendo com que a altura das barras represente a densidade de probabilidade. Se `False`, a altura das barras representa o número de ocorrências.
- `color`: A cor das barras do histograma.
- `edgecolor`: A cor das bordas das barras.
- `alpha`: A transparência das barras (0 significa totalmente transparente e 1 significa totalmente opaco).

In [None]:
import numpy as np

# Gerando dados aleatórios com uma distribuição normal
dados = np.random.randn(1000)

# Criando o histograma
plt.hist(dados, bins=50, edgecolor='black')

plt.xlabel('Valores')
plt.ylabel('Frequência')
plt.title('Histograma da Distribuição Normal')

plt.show()

`rwidth` especifica a largura da linha do histograma

In [None]:
bins = [-3, -2, -1, 0, 1, 2, 3]

# Criando o histograma com a lista de bins
plt.hist(dados, bins=bins, histtype = 'bar', rwidth = 0.2)
plt.show()

In [None]:
plt.hist(dados, bins=bins, histtype = 'stepfilled', rwidth = 0.2)
plt.show()

### Grafico de Dispersão (scatter plot)

O gráfico de dispersão, é uma representação visual de dados onde cada ponto no gráfico representa um par de valores. Ele é particularmente útil para visualizar a relação entre duas variáveis quantitativas, permitindo identificar padrões, tendências e correlações nos dados.

Principais parâmetros:

- **x, y**: Os dados que serão plotados no eixo x e no eixo y, respectivamente. São obrigatórios.

- **s**: Tamanho dos pontos no scatter plot. Pode ser um único valor para todos os pontos ou uma lista/array com tamanhos individuais para cada ponto.

- **c**: Cor dos pontos. Pode ser uma única cor para todos os pontos ou uma lista/array com cores individuais para cada ponto. Também pode ser uma sequência de números que será mapeada para uma paleta de cores.

- **marker**: Tipo de marcador usado para representar os pontos. Pode ser uma string que define um marcador padrão (por exemplo, 'o' para círculos, 's' para quadrados, '^' para triângulos) ou um marcador personalizado.

- **alpha**: Transparência dos pontos, variando de 0 (totalmente transparente) a 1 (totalmente opaco).

- **linewidths**: Largura da borda dos pontos.

- **edgecolors**: Cor da borda dos pontos.

- **label**: Rótulo para a legenda do gráfico.



In [None]:
# Dados
x = [1, 2, 3, 4, 5, 7, 8, 3]
y = [2, 3, 4, 5, 6, 6, 8, 3]

# Criando o scatter plot
plt.scatter(x, y, label = "Pontos", color = 'black', marker = 'o')
plt.legend()
plt.show()

### Gráfico de Area empilhada (Stack plot)

In [None]:
dias = [1,2,3,4,5]
serie1 = [1, 2, 3, 4, 5]
serie2 = [2, 3, 4, 5, 6]
serie3 = [3, 4, 5, 6, 7]

# Criando o stack plot
plt.stackplot(dias, serie1, serie2, serie3, 
              labels=['Série 1', 'Série 2', 'Série 3'],
              colors = ['r','y','g'])

# Adicionando rótulos aos eixos
plt.xlabel('Tempo')
plt.ylabel('Valor')
plt.title('Exemplo de Stack Plot')

plt.legend()
plt.show()

### Gráfico de pizza

In [None]:
fatias = [2, 8, 8, 1, 1, 4]
atividades = ['livre', 'dormir', 'trabalhar', 'tarefas domésticas', 'transito', 'faculdade']

plt.pie(fatias, labels = atividades, startangle=90, autopct='%1.1f%%', explode= [0,0,0,0,0.2,0])
plt.title("Divisão do dia")
plt.plot()

## Graficos customizados com Pylab

Pylab é um módulo fornecido pelo Matplotlib que combina funcionalidades dos pacotes NumPy e pyplot. 

In [None]:
from pylab import *

%matplotlib inline

Exemplo de criação do grafico:


In [None]:
# Array x e y 
x = linspace(0, 5, 10)
y = x ** 2

# Cria a figura
fig = plt.figure()

# Define a escala dos eixos
axes = fig.add_axes([0, 0, 0.8, 0.8])

# Cria o plot
axes.plot(x, y, 'red')

# Labels e título
axes.set_xlabel('x')
axes.set_ylabel('y')
axes.set_title('Gráfico de Linha');


#### Com figuras sobrepostas:

In [None]:
# Cria a figura
fig = plt.figure()

# Cria os eixos
axes1 = fig.add_axes([0.1, 0.1, 0.8, 0.8]) # eixos da figura principal
axes2 = fig.add_axes([0.2, 0.5, 0.4, 0.3]) # eixos da figura secundária

# Figura principal
axes1.plot(x, y, 'r')
axes1.set_xlabel('x')
axes1.set_ylabel('y')
axes1.set_title('Figura Principal')

# Figura secundária
axes2.plot(y, x, 'g')
axes2.set_xlabel('y')
axes2.set_ylabel('x')
axes2.set_title('Figura Secundária');

obs: `;` é adicionado ao fim da llinha para ocultar a saída do set_title

#### Graficos um ao lado do outro

In [None]:
# Dados
x = linspace(0, 5, 10)
y = x ** 2

# Divide a área de plotagem em dois subplots
fig, axes = plt.subplots(nrows = 1, ncols = 2)

# Loop pelos eixos para criar cada plot
for ax in axes:
    ax.plot(x, y, 'r')
    ax.set_xlabel('x')
    ax.set_ylabel('y')
    ax.set_title('Título')
    
# Ajusta o layout
fig.tight_layout()

In [None]:
# Gráficos de linha com diferentes escalas

# Dados
x = linspace(0, 5, 10)
y = x ** 2

# Cria os subplots
fig, axes = plt.subplots(1, 2, figsize = (10,4))
      
# Cria o plot1
axes[0].plot(x, x**2, x, exp(x))
axes[0].set_title("Escala Padrão")

# Cria o plot2
axes[1].plot(x, x**2, x, exp(x))
axes[1].set_yscale("log")
axes[1].set_title("Escala Logaritmica (y)");

In [None]:
# Grid

# Dados
x = linspace(0, 5, 10)
y = x ** 2

# Cria os subplots
fig, axes = plt.subplots(1, 2, figsize = (10,3))

# Grid padrão
axes[0].plot(x, x**2, x, x**3, lw = 2)
axes[0].grid(True)

# Grid customizado
axes[1].plot(x, x**2, x, x**3, lw = 2)
axes[1].grid(color = 'b', alpha = 0.7, linestyle = 'dashed', linewidth = 0.8)

In [None]:
# Diferentes estilos de Plots

# Dados
xx = np.linspace(-0.75, 1., 100)
n = np.array([0,1,2,3,4,5])

# Subplots
fig, axes = plt.subplots(1, 4, figsize = (12,3))

# Plot 1
axes[0].scatter(xx, xx + 0.25 * randn(len(xx)), color = "purple")
axes[0].set_title("scatter")

# Plot 2
axes[1].step(n, n * 2, lw = 2, color = "black")
axes[1].set_title("step")

# Plot 3
axes[2].bar(n, n * 2, align = "center", width = 0.5, alpha = 0.5, color = "blue")
axes[2].set_title("bar")

# Plot 4
axes[3].fill_between(x, x ** 2, x ** 3, alpha = 0.5, color = "magenta");
axes[3].set_title("fill_between");

#### Histogramas 

In [None]:
# Gerar dados aleatorios de distribuição normal
n = np.random.randn(1000)

# Cria os subplots
fig, axes = plt.subplots(1, 2, figsize = (12,4))

# Padrao
axes[0].hist(n, bins = 50)
axes[0].set_title("Histograma Padrão")
axes[0].set_xlim((min(n), max(n)))

# Acumulado
axes[1].hist(n, cumulative = True, bins = 50)
axes[1].set_title("Histograma Cumulativo")
axes[1].set_xlim((min(n), max(n)));

Lista de cores no Matplotlib:

https://matplotlib.org/stable/gallery/color/named_colors