Visualização de dados com Matplotlib

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

Gráficos de linhas

In [None]:
np.random.seed(7)
# vetor com npumeros inteiros aleatorios entre 1,1500, com 10 amostras
y = np.random.randint(low=1, high = 1500, size = 10)

In [None]:
y

In [None]:
plt.plot(y)

In [None]:
# insere a primeira linha no plot
plt.plot(y,color='#749187', marker = 'o', ms=5, mec= 'k',
         markerfacecolor = 'w', ls = '-.')
# marker: marcador / ms: tamanho do marcador / cor da linha do marcador
# markerfacecolor: mudar cor da face do marcador / ls: estilo da linha
#------------------------------------------------------------------------
# insere a segunda linha no plot
plt.plot(y*2, marker ='+', color = 'k', ms=5) 
#marker: o marcador / color: cor da linha / ms: tamanho do carcador
#------------------------------------------------------------------------
# rótulos
plt.xlabel('Eixo X', color = 'red', size = 12) # título do eixo X
# color: cor do título / # size: tamanho da fonte
plt.ylabel('Eixo Y') # título do eixo Y
plt.title('Título', loc='left') # Título e sua localização
#------------------------------------------------------------------------
#grindlines
plt.grid(axis = 'y', color = 'gray', 
         linestyle = '--', linewidth=1,
         alpha=0.8)
# axis: grade de linhas - eixos ('both','x','y') / color: cor da linha
# linestyle: estilo da linha / linewidth: espessura da linha / alpha: opacidade

plt.show()
         

Subplots

In [None]:
# criar números para os gráficos
np.random.seed(6)
x = np.arange(1,11)
y1 = np.random.randint(1,400,10)
y2 = np.random.randint(150,500,10)
y3 = np.random.randint(200,600,10)

#------------------------------------

plt.figure(figsize =(15,5)) # tamanho da figura
plt.suptitle('Figura', fontsize = 15) # título da figura

#-------------------------------------

plt.subplot(1,3,1) # subplot com 1 linha e 3 colunas
plt.plot(x, y1, color = 'k')
plt.title('Subplot 1', pad = 10)
plt.xlabel ('Eixo X')
plt.ylabel('Eixo Y')

plt.subplot(1,3,2)
plt.plot(x, y2, color ='r')
plt.title('Subplot 2', pad =10)
plt.xlabel('Eixo X')
plt.ylabel('Eixo Y')

plt.subplot(1,3,3)
plt.plot(x, y3, color ='g')
plt.title('Subplot 3', pad =10)
plt.xlabel('Eixo X')
plt.ylabel('Eixo Y')

plt.tight_layout(pad=4) # aumentar o espaçamento entre cada subplot
plt.show() 


In [None]:
# criar a mesma figura anterior de forma mais simplificada

fig, ax = plt.subplots(1,3, figsize = (15,5)) # config da figura
fig.suptitle('Figure')    # alterar o título da figura
ax[0].plot(x, y1, color = 'black') 
ax[1].plot(x, y2, color = 'red')
ax[2].plot(x, y3, color = 'green')

for i in range(3):
    ax[i].set(title = f'Subplot {i+1}', xlabel = 'Eixo X', ylabel = 'Eixo Y')

 Histograma e boxplot

In [None]:
data = np.random.normal(10,0.5,5000)
plt.hist(data)
plt.show()

In [None]:
plt.boxplot(data);

Scallet plot

In [None]:
# distribuições estatísticas (simulação)
x = np.random.normal(10, 0.5, 100)
y = np.random.uniform(0, 20, 100)

In [None]:
fig = plt.figure() # criar figura
ax = plt.axes() # criar eixo
ax.scatter(x, y, marker = 'o', color = 'red', label = 'data 1', alpha = 0.5)
ax.scatter(x*0.5, y*0.5, marker = 'v', color = 'black', label = 'data 2', alpha =0.7)
ax.legend();

Dados Econômicos

In [None]:
import plotly.express as px

In [None]:
px.data.gapminder()

In [None]:
# armazenar dados na variável df / filtra apenas / Brazil / alterar indice para year
df = px.data.gapminder().query('country == "Brazil"').set_index('year')

In [None]:
df.head()

In [None]:
# evolução da renda per capita
plt.plot(df.index, df['gdpPercap'])
plt.title('PIB per Capita do Brasil') # título 
plt.ylabel('PIB per capita') # Legenda do eixo Y
plt.xlabel('Tempo'); # legenda do eixo X

In [None]:
# olhando dataframe
df.head()

*Relação Expectativa de Vida Vs. renda per Capita Brasil*

In [None]:
title = 'Relação entre expectativa de vida e renda per capita no Brasil' # título

plt.figure(figsize =(12, 4)) # config da figura
plt.scatter(df['lifeExp'], df['gdpPercap'], cmap = 'viridis') 
# o que vai no eixo X: df['lifeExp']
# o que vai no eixo Y: df['gdpPercap']

plt.xlabel('Expectativa de Vida')
plt.ylabel('Renda per Capita')
plt.title(title, loc = 'left')
plt.show()

In [None]:
# Gráfico de barra
plt.bar(x= df.index, # Eixo X
        height = df['pop'], # altura do grafico - eixo Y
        color = 'red'
       )
plt.title('População brasileira');

In [None]:
# função para filtrar continente
def filtrar_continente(continente):
    df = px.data.gapminder()
    df = df[df['continent'] == continente]
    return df

In [None]:
def filtrar_pais(pais, variavel):
    'Filtra algum país da amostra para as variáveis "pop", "gdpPercap" e "lifeExp"'
    df = px.data.gapminder()
    df = df[df['country'] == pais][variavel]
    return df
    

In [None]:
paises

In [None]:
americas = filtrar_continente('Americas') #filtrar continente - países do continente Americano
paises = americas['country'].unique() # ver países dentro da amostra
plt.figure(figsize = (12,8)) # tamanho da figura
for pais in paises: # para cada país dentro da lista de países
    plt.scatter(filtrar_pais(pais = pais,
                                   variavel = 'lifeExp'
                                  ),
# filtrar em expectativa de vida
#--------------------------------------------------------
                    filtrar_pais(pais = pais,
                                   variavel = 'gdpPercap'
                                  ))
# filtrar em renda per capita
#---------------------------------------------------------
plt.legend(labels = paises, loc = 'best') #legenda
plt.title('Relação entre renda per capita e expectativa de vida', loc =  'left')
plt.xlabel('Expectativa de vida')
plt.ylabel('Renda per capita');