# Data Visualization: criando gráficos com bibliotecas Python

## Conhecendo a biblioteca Matplotlib

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

In [None]:
url = 'https://raw.githubusercontent.com/lukaswyllis/formacao-avancando-em-data-science-com-python/refs/heads/master/dados-curso1/imigrantes_canada.csv'

In [None]:
df = pd.read_csv(url)

In [None]:
df

In [None]:
df.info()

In [None]:
df.set_index('País', inplace=True)

In [None]:
df

In [None]:
anos = list(map(str, range(1980, 2014)))

In [None]:
anos

In [None]:
brasil = df.loc['Brasil', anos]

In [None]:
brasil

In [None]:
brasil_dict = {
    'ano': brasil.index.tolist(),
    'imigrantes': brasil.values.tolist()
}

In [None]:
dados_brasil = pd.DataFrame(brasil_dict)

In [None]:
dados_brasil

In [None]:
plt.plot(dados_brasil['ano'], dados_brasil['imigrantes'])

In [None]:
plt.figure(figsize=(8, 4)) # em polegadas, primeiro largura e depois altura
plt.plot(dados_brasil['ano'], dados_brasil['imigrantes']) # plota o gráfico
plt.title('Imigração do Brasil para o Canadá') # adiciona um título ao gráfico
plt.xlabel('Ano') # adiciona o título ao eixo x
plt.ylabel('Número de imigrantes') # adiciona o título ao eixo y
plt.xticks(['1980', '1985', '1990', '1995', '2000', '2005', '2010', '2015']) # explicita o eixo x
plt.yticks([500, 1000, 1500, 2000, 2500, 3000]) # explicita o eixo
plt.show() # deve ser a última linha, qualquer coisa depois disso não é executada

### Desafio 1: comparando tendências de imigração

In [None]:
argentina = df.loc['Argentina', anos]
argentina

In [None]:
plt.figure(figsize=(8, 4))
plt.plot(anos, argentina, label='Argentina')
plt.plot(anos, brasil, label='Brasil')
plt.title('Imigração da Argentina e Brasil para o Canadá')
plt.xlabel('Ano')
plt.ylabel('Número de imigrantes')
plt.xticks(['1980', '1985', '1990', '1995', '2000', '2005', '2010', '2015'])
plt.legend()
plt.show()

## Criando figuras com o Matplotlib

In [None]:
fig, ax = plt.subplots(figsize=(8, 4))
ax.plot(dados_brasil['ano'], dados_brasil['imigrantes'])
plt.show()

In [None]:
fig, ax = plt.subplots(figsize=(8, 4))
ax.plot(dados_brasil['ano'], dados_brasil['imigrantes'])
ax.xaxis.set_major_locator(plt.MultipleLocator(5)) #seta o eixo x de 5 em 5 anos
plt.show()

In [None]:
fig, ax = plt.subplots(figsize=(8, 4))
ax.plot(dados_brasil['ano'], dados_brasil['imigrantes'])
ax.set_title('Imigração do Brasil para o Canadá\n1980 a 2013')
ax.xaxis.set_major_locator(plt.MultipleLocator(5)) #seta o eixo x de 5 em 5 anos
plt.show()

In [None]:
fig, ax = plt.subplots(figsize=(8, 4))
ax.plot(dados_brasil['ano'], dados_brasil['imigrantes'])
ax.set_title('Imigração do Brasil para o Canadá\n1980 a 2013')
ax.set_xlabel('Ano')
ax.set_ylabel('Número de imigrantes')
ax.xaxis.set_major_locator(plt.MultipleLocator(5)) #seta o eixo x de 5 em 5 anos
plt.show()

In [None]:
fig, axs = plt.subplots(1, 2, figsize=(15, 5))

axs[0].plot(dados_brasil['ano'], dados_brasil['imigrantes'])
axs[0].set_title('Imigração do Brasil para o Canadá\n1980 a 2013')
axs[0].set_xlabel('Ano')
axs[0].set_ylabel('Número de imigrantes')
axs[0].xaxis.set_major_locator(plt.MultipleLocator(5))
axs[0].grid()

axs[1].boxplot(dados_brasil['imigrantes'])
axs[1].set_title('Boxplot da imigração do Brasil para o Canadá\n1980 a 2013')
axs[1].set_xlabel('Brasil')
axs[1].set_ylabel('Número de imigrantes')
axs[1].grid()

plt.show()

In [None]:
dados_brasil.describe()

In [None]:
fig, axs = plt.subplots(2, 2, figsize=(10,6))
fig.subplots_adjust(hspace=0.5, wspace=0.3) # espaçamento horizontal e vertical, respectivamente
fig.suptitle('Imigração dos quatro maiores países da américa do sul para o Canadá\n1980 a 2013')

axs[0,0].plot(df.loc['Brasil', anos])
axs[0,0].set_title('Brasil')

axs[0,1].plot(df.loc['Colômbia', anos])
axs[0,1].set_title('Colômbia')

axs[1,0].plot(df.loc['Argentina', anos])
axs[1,0].set_title('Argentina')

axs[1,1].plot(df.loc['Peru', anos])
axs[1,1].set_title('Peru')

for ax in axs.flat:
  ax.xaxis.set_major_locator(plt.MultipleLocator(5))
  ax.set_xlabel('Ano')
  ax.set_ylabel('Número de imigrantes')

ymin = 0
ymax = 7000

for ax in axs.ravel():
  ax.set_ylim(ymin, ymax)

plt.show()

## Desafio: visualizando dados de vendas de diferentes lojas

In [None]:
lojas = ['A', 'B', 'C', 'D']

vendas_2022 = {'Jan': [100, 80, 150, 50],
    'Fev': [120, 90, 170, 60],
    'Mar': [150, 100, 200, 80],
    'Abr': [180, 110, 230, 90],
    'Mai': [220, 190, 350, 200],
    'Jun': [230, 150, 280, 120],
    'Jul': [250, 170, 300, 140],
    'Ago': [260, 180, 310, 150],
    'Set': [240, 160, 290, 130],
    'Out': [220, 140, 270, 110],
    'Nov': [400, 220, 350, 190],
    'Dez': [300, 350, 400, 250]
}
vendas = pd.DataFrame(vendas_2022, index=lojas)
meses = list(vendas.columns)
vendas


In [None]:
fig, axs = plt.subplots(2, 2, figsize=(14,8))
fig.subplots_adjust(hspace=0.5, wspace=0.3) # espaçamento horizontal e vertical, respectivamente
fig.suptitle('Vendas 2022')

axs[0,0].plot(meses, vendas.loc['A'])
axs[0,0].set_title('Loja A')

axs[0,1].plot(meses, vendas.loc['B'])
axs[0,1].set_title('Loja B')

axs[1,0].plot(meses, vendas.loc['C'])
axs[1,0].set_title('Loja C')

axs[1,1].plot(meses, vendas.loc['D'])
axs[1,1].set_title('Loja D')

for ax in axs.flat:
    ax.set_xlabel('Mês')
    ax.set_ylabel('Número de vendas')

plt.show()

## Customizando com Matplotlib

In [None]:
fig, ax = plt.subplots(figsize =(8,4))
ax.plot(dados_brasil['ano'], dados_brasil['imigrantes'], lw=2, color='springgreen')
ax.set_title('Imigração do Brasil para o Canadá\n1980 a 2013', fontsize=18, loc='left')
ax.set_xlabel('Ano', fontsize=14)
ax.set_ylabel('Número de imigrantes', fontsize=14)
ax.xaxis.set_tick_params(labelsize=12) # determina os parametros do rotulo do eixo x
ax.yaxis.set_tick_params(labelsize=12) # determina os parametros do rotulo do eixo y
ax.xaxis.set_major_locator(plt.MultipleLocator(5))

plt.show()

In [None]:
america_sul = df.query('Região == "América do Sul"')

In [None]:
america_sul

In [None]:
cores = ['royalblue', 'orange', 'forestgreen', 'orchid', 'purple', 'brown', 'slateblue', 'gray', 'olive', 'navy', 'teal', 'tomato']
fig, ax = plt.subplots(figsize=(12,5))
ax.barh(america_sul.index, america_sul['Total'], color=cores)
ax.set_title('Imigração da América do sul para o Canadá\n1980 a 2013', loc='left', fontsize=16)
ax.set_ylabel('')
ax.set_xlabel('Número de imigrantes', fontsize=12)
ax.xaxis.set_tick_params(labelsize=12)
ax.yaxis.set_tick_params(labelsize=12)

plt.show()

In [None]:
america_sul_sorted = america_sul.sort_values('Total', ascending=True)

In [None]:
cores = ['royalblue', 'orange', 'forestgreen', 'orchid', 'purple', 'brown', 'slateblue', 'gray', 'olive', 'navy', 'teal', 'tomato']
fig, ax = plt.subplots(figsize=(12,5))
ax.barh(america_sul_sorted.index, america_sul_sorted['Total'], color=cores)
ax.set_title('Imigração da América do sul para o Canadá\n1980 a 2013', loc='left', fontsize=16)
ax.set_ylabel('')
ax.set_xlabel('Número de imigrantes', fontsize=12)
ax.xaxis.set_tick_params(labelsize=12)
ax.yaxis.set_tick_params(labelsize=12)

plt.show()

In [None]:
cores = []

for pais in america_sul_sorted.index:
  if pais == 'Brasil':
    cores.append('green')
  else:
    cores.append('silver')


fig, ax = plt.subplots(figsize=(12,5))
ax.barh(america_sul_sorted.index, america_sul_sorted['Total'], color=cores)
ax.set_title('América do Sul: Brasil foi o quarto país com mais imigrantes\npara o Canadá no período de 1980 a 2013', loc='left', fontsize=14)
ax.set_ylabel('')
ax.set_xlabel('Número de imigrantes', fontsize=12)
ax.xaxis.set_tick_params(labelsize=12)
ax.yaxis.set_tick_params(labelsize=12)

for i, v in enumerate(america_sul_sorted['Total']):
  ax.text(v + 20, i, str(v), color='black', fontsize=10, ha='left', va='center')

ax.set_frame_on(False)
ax.get_xaxis().set_visible(False)
ax.tick_params(axis='both', which='both', length=0)

plt.show()

In [None]:
print(fig.canvas.get_supported_filetypes())

In [None]:
fig, ax = plt.subplots(figsize =(8,4))
ax.plot(dados_brasil['ano'], dados_brasil['imigrantes'], lw=2, color='springgreen')
ax.set_title('Imigração do Brasil para o Canadá\n1980 a 2013', fontsize=18, loc='left')
ax.set_xlabel('Ano', fontsize=14)
ax.set_ylabel('Número de imigrantes', fontsize=14)
ax.xaxis.set_tick_params(labelsize=12) # determina os parametros do rotulo do eixo x
ax.yaxis.set_tick_params(labelsize=12) # determina os parametros do rotulo do eixo y
ax.xaxis.set_major_locator(plt.MultipleLocator(5))

ax.spines['top'].set_visible(False)
ax.spines['right'].set_visible(False)

fig.savefig('imigracao_brasil_canada.png', transparent=False, dpi=300, bbox_inches='tight')

plt.show()