# Introdução
Este notebook utiliza a biblioteca Plotly para criar visualizações interativas de dados de imigração para o Canadá. A análise inclui dados do Brasil e de outros países da América do Sul.

In [32]:
import plotly.express as px
import pandas as pd

In [33]:
# Importando as bibliotecas necessárias para análise e visualização de dados
import plotly.express as px
import pandas as pd

df = pd.read_csv('../data/canadian_immegration_data.csv')

df.head()

Unnamed: 0,Country,Continent,Region,DevName,1980,1981,1982,1983,1984,1985,...,2005,2006,2007,2008,2009,2010,2011,2012,2013,Total
0,Afghanistan,Asia,Southern Asia,Developing regions,16,39,39,47,71,340,...,3436,3009,2652,2111,1746,1758,2203,2635,2004,58639
1,Albania,Europe,Southern Europe,Developed regions,1,0,0,0,0,0,...,1223,856,702,560,716,561,539,620,603,15699
2,Algeria,Africa,Northern Africa,Developing regions,80,67,71,69,63,44,...,3626,4807,3623,4005,5393,4752,4325,3774,4331,69439
3,American Samoa,Oceania,Polynesia,Developing regions,0,1,0,0,0,0,...,0,1,0,0,0,0,0,0,0,6
4,Andorra,Europe,Southern Europe,Developed regions,0,0,0,0,0,0,...,0,1,1,0,0,0,0,1,1,15


In [34]:
# Lendo os dados de imigração do arquivo CSV
df = pd.read_csv('../data/canadian_immegration_data.csv')

df.head()

df.set_index('Country', inplace=True)
years = list(map(str, range(1980,	2014)))

In [35]:
# Selecionando os anos de interesse para dados do Brasil
only_brazil_data = df.loc['Brazil', years]
only_brazil_data.head()


1980    211
1981    220
1982    192
1983    139
1984    145
Name: Brazil, dtype: object

In [36]:
# Selecionando os dados de imigração do Brasil para os anos selecionados
only_brazil_data = df.loc['Brazil', years]
only_brazil_data.head()

brazil_dict = {
  "years": only_brazil_data.index.tolist(),
  "immigrants": only_brazil_data.values.tolist()
}

data_brazil = pd.DataFrame(brazil_dict)

In [37]:
# Criando um DataFrame com os dados de imigração do Brasil
brazil_dict = {
  "years": only_brazil_data.index.tolist(),
  "immigrants": only_brazil_data.values.tolist()
}

data_brazil = pd.DataFrame(brazil_dict)

data_brazil.head()

Unnamed: 0,years,immigrants
0,1980,211
1,1981,220
2,1982,192
3,1983,139
4,1984,145


In [38]:
# Visualizando os dados de imigração do Brasil
data_brazil.head()

fig = px.line(data_brazil, x='years', y='immigrants', title='Imigração do Brasil para o Canadá no período de 1980 a 2013')

fig.update_traces(line_color='green', line_width=4)

fig.update_layout(
    width=1000, 
    height=500, 
    xaxis={'tickangle': -45}, 
    xaxis_title='Ano', 
    yaxis_title='Número de imigrantes',
    font_family='Arial',
    font_size=14,
    font_color='grey',
    title_font_color='black',
    title_font_size=22
  )

fig.show()

In [39]:
south_america = df.query('Region == "South America"').sort_values(by='Total', ascending=True)
south_america.head()

# Criando um gráfico de linha para visualizar a imigração do Brasil para o Canadá
fig = px.line(data_brazil, x='years', y='immigrants', title='Imigração do Brasil para o Canadá no período de 1980 a 2013')

fig.update_traces(line_color='green', line_width=4)

fig.update_layout(
    width=1000, 
    height=500, 
    xaxis={'tickangle': -45}, 
    xaxis_title='Ano', 
    yaxis_title='Número de imigrantes',
    font_family='Arial',
    font_size=14,
    font_color='grey',
    title_font_color='black',
    title_font_size=22
  )

fig.show()

In [40]:
# Selecionando e ordenando os dados de imigração da América do Sul
south_america = df.query('Region == "South America"').sort_values(by='Total', ascending=True)
south_america.head()

df_south_america_clean = south_america.drop(['Continent', 'Region', 'Total'], axis=1)
south_america_final = df_south_america_clean.T

In [41]:
# Limpando e transformando os dados da América do Sul
df_south_america_clean = south_america.drop(['Continent', 'Region', 'Total'], axis=1)
south_america_final = df_south_america_clean.T

south_america_final.head()

Country,Suriname,Paraguay,Bolivia (Plurinational State of),Uruguay,Ecuador,Argentina,Venezuela (Bolivarian Republic of),Chile,Brazil,Peru,Colombia,Guyana
DevName,Developing regions,Developing regions,Developing regions,Developing regions,Developing regions,Developing regions,Developing regions,Developing regions,Developing regions,Developing regions,Developing regions,Developing regions
1980,15,45,44,128,238,368,103,1233,211,317,266,2334
1981,10,26,52,132,207,426,117,1069,220,456,326,2943
1982,21,32,42,146,184,626,174,1078,192,401,360,3575
1983,12,40,49,105,155,241,124,781,139,241,244,2650


In [42]:
# Visualizando os dados transformados da América do Sul
south_america_final.head()

fig = px.line(data_frame=south_america_final, 
              x=south_america_final.index, 
              y=south_america_final.columns, 
              color='Country', 
              title='Imigração dos países da América do Sul para o Canadá de 1980 a 2013', 
              markers=True
          )

fig.update_layout(
  xaxis={
    'tickangle': -45
  },
  xaxis_title='Ano',
  yaxis_title='Número de imigrantes'
)

fig.show()

In [49]:
south_america_long = south_america_final.reset_index().melt(
    id_vars='index',
    var_name='Country',
    value_name='Immigrants'
)
south_america_long.rename(columns={'index': 'Year'}, inplace=True)

In [51]:
# Criando um gráfico de linha para visualizar a imigração dos países da América do Sul para o Canadá
fig = px.line(data_frame=south_america_final, 
              x=south_america_final.index, 
              y=south_america_final.columns, 
              color='Country', 
              title='Imigração dos países da América do Sul para o Canadá de 1980 a 2013', 
              markers=True
          )

fig.update_layout(
  xaxis={
    'tickangle': -45
  },
  xaxis_title='Ano',
  yaxis_title='Número de imigrantes'
)

fig.show()


In [44]:
# Salvando o gráfico da América do Sul em um arquivo HTML

fig.write_html('imigration_south_america.html')
fig.write_image("fig1.png", width=600, height=350, scale=1)

#### Animações

In [54]:
import plotly.graph_objects as go

fig = go.Figure(
    data=[go.Scatter(x=[0, 1], y=[0, 1])],
    layout=go.Layout(
        xaxis=dict(range=[0, 5], autorange=False),
        yaxis=dict(range=[0, 5], autorange=False),
        title=dict(text="Start Title"),
        updatemenus=[dict(
            type="buttons",
            buttons=[dict(label="Play",
                          method="animate",
                          args=[None])])]
    ),
    frames=[go.Frame(data=[go.Scatter(x=[1, 2], y=[1, 2])]),
            go.Frame(data=[go.Scatter(x=[1, 4], y=[1, 4])]),
            go.Frame(data=[go.Scatter(x=[3, 4], y=[3, 4])],
                     layout=go.Layout(title_text="End Title"))]
)

fig.show()