# Time-Spacial Exploration

By **Franklin Oliveira**

-----
This notebook contains all code necessary to make charts from `repteis` database with focus on time and space exploration. Here you'll find some basic data treatment and charts' code. 

Database: <font color='blue'>'Compilacao Livros Repteis - 2 a 10 - 2020_04_28.xls'</font>.m
    

In [1]:
import datetime
import numpy as np
import pandas as pd

from collections import defaultdict

# quick visualization
import matplotlib.pyplot as plt
import seaborn as sns

# Waffle Charts
# from pywaffle import Waffle 
# docs: https://pywaffle.readthedocs.io/en/latest/examples/block_shape_distance_location_and_direction.html

# visualization
import altair as alt

# enabling notebook renderer
# alt.renderers.enable('notebook')
# alt.renderers.enable('default')

# disabling rows limit
alt.data_transformers.disable_max_rows()

DataTransformerRegistry.enable('default')

## Importing data...

In [2]:
NewTable = pd.read_csv('./data/treated_db.csv', sep=';', encoding='utf-8-sig', low_memory=False)

<br>

<font size=5>**Paleta de cores por Ordem**</font>

Abaixo está a imagem usada como inspiração (https://color.adobe.com/create/image)

<img src="./src/paleta_cores.jpeg" width='500px'>

Cores: 

- verde_escuro: #284021
- verde_claro: #88BF11
- amarelo: #D9CB0B
- laranja: #D99311
- laranja_escuro: #BF4417
- marrom-_laro: #BF8D7A

In [3]:
# p.s.: Caudata is an error and should be removed
cores_ordem = {
    'Squamata': '#BF4417',
    'Testudines': '#D9CB0B', 
    'Crocodylia': '#284021'
}

ordens = list(cores_ordem.keys())
cores = list(cores_ordem.values())

Cores por continente: <br>
**Paleta 1:**
["#d963cf", "#10b651", "#21638f", "#bce091", "#8d102b", "#52e9e6", "#5e4028"]

<ul>
    <li style="color:#d963cf"><b>cor 1</b></li>
    <li style="color:#10b651"><b>cor 2</b></li>
    <li style="color:#21638f"><b>cor 3</b></li>
    <li style="color:#bce091"><b>cor 4</b></li>
    <li style="color:#8d102b"><b>cor 5</b></li>
    <li style="color:#52e9e6"><b>cor 6</b></li>
    <li style="color:#5e4028"><b>cor 7</b></li>
</ul>

**Paleta 2:**
["#208eb7", "#c5df72", "#382010", "#6fd8c5", "#1a6587", "#fdb5ac", "#7b0905"]

<ul>
    <li style="color:#208eb7"><b>cor 1</b></li>
    <li style="color:#c5df72"><b>cor 2</b></li>
    <li style="color:#382010"><b>cor 3</b></li>
    <li style="color:#6fd8c5"><b>cor 4</b></li>
    <li style="color:#1a6587"><b>cor 5</b></li>
    <li style="color:#fdb5ac"><b>cor 6</b></li>
    <li style="color:#7b0905"><b>cor 7</b></li>
</ul>

**Paleta 3:**
["#d963cf", "#80c6b8", "#bf3e15", "#b7d165", "#3a6566", "#efaa79", "#803e4c"]

<ul>
    <li style="color:#d963cf"><b>cor 1</b></li>
    <li style="color:#80c6b8"><b>cor 2</b></li>
    <li style="color:#bf3e15"><b>cor 3</b></li>
    <li style="color:#b7d165"><b>cor 4</b></li>
    <li style="color:#3a6566"><b>cor 5</b></li>
    <li style="color:#efaa79"><b>cor 6</b></li>
    <li style="color:#803e4c"><b>cor 7</b></li>
</ul>

In [42]:
# dicionarios de cores por continente
cores_continente = {
    "#N/D":"#5e4028",
    "América do Sul":"#10b651",
    "América Central":"#bce091",
    "América do Norte":"#21638f",
    "Ásia":"#d963cf",
    "África":"#52e9e6",
    "Europa":"#8d102b"
}

cores_continente3 = {
    "#N/D":"#d963cf",
    "América do Sul":"#3a6566",
    "América Central":"#b7d165",
    "América do Norte":"#80c6b8",
    "Ásia":"#803e4c",
    "África":"#efaa79",
    "Europa":"#bf3e15"
}

In [92]:
NewTable[NewTable['continente'] == "Europa"]['pais'].unique()

array(['Bósnia e Herzegovina', 'Romênia', 'Alemanha', 'Kingdom', nan],
      dtype=object)

In [109]:
# dicionario de cores por país (degrade da cor escolhida para o continente)
# América do Sul
# ['#bbffd4', '#94efc6', '#57d5c9', '#00b8cc', '#0096c9', '#0071ba', '#004da4', '#002e8b', '#00237a']
# '#a6d2eb', '#9ebdcb'
# América Central
# ['#e3ff63', '#caf94f', '#b2e439', '#9acf1c', '#81ba00', '#69a600', '#519200', '#3a7e00', '#256b00']
# Ásia
# ['#f0c0d7', '#e5aec6', '#d89bb2', '#cb879c', '#bc7386', '#ad6274', '#9e5466', '#8f485a', '#803e4c']
# África
# ['#ffceb2', '#ffba94', '#efaa79', '#d39a5f', '#ba8a47', '#a57b34', '#956c25', '#895d1a', '#815010']
# Europa
# ['#ffcea9', '#ffb996', '#ffa583', '#ff916f', '#ff7d5c', '#eb6949', '#d25638', '#ba4327', '#a52e17']

cores_pais = {
    '#N/D':'#5e4028',
    'nan':'#000000',  # preto
    # América do Sul
    'Brasil':'#00237a',
    'Uruguai':'#002e8b',
    'Colômbia':'#004da4',
    'Peru':'#0071ba',
    'Paraguai':'#0096c9',
    'Argentina':'#00b8cc',
    'Guiana Francesa':'#57d5c9',
    'Venezuela':'#94efc6',
    'Guiana':'#9ebdcb',
    'Chile':'#bbffd4',
    'Equador':'#a6d2eb',
    # América Central
    'Guatemala':'#e3ff63',
    'Panamá':'#caf94f',
    'Porto Rico':'#b2e439',
    'Costa Rica':'#9acf1c',
    'México':'#256b00',
    'Nicarágua':'#81ba00',
    'Honduras':'#69a600',
    'Cuba':'#519200',
    'República Dominicana':'#3a7e00',
    # América do Norte
    'Estados Unidos':'#80c6b8',
    # Ásia
    'Israel':'#803e4c',
    'Indonésia':'#9e5466',
    'Índia':'#bc7386',
    'Filipinas':'#d89bb2',
    # África
    'África do Sul':'#ba8a47',
    'Egito':'#efaa79',
    # Europa
    'Bósnia e Herzegovina':'#ffb996',
    'Romênia':'#ff916f',
    'Alemanha':'#eb6949',
    'Kingdom':'#ba4327'
}

# apenas países da América do Sul
cores_AS = {
    'Brasil':'#00237a',
    'Uruguai':'#002e8b',
    'Colômbia':'#004da4',
    'Peru':'#0071ba',
    'Paraguai':'#0096c9',
    'Argentina':'#00b8cc',
    'Guiana Francesa':'#57d5c9',
    'Venezuela':'#94efc6',
    'Guiana':'#9ebdcb',
    'Chile':'#bbffd4',
    'Equador':'#a6d2eb',
}

<br>

Cores por Região do Brasil:

**Paleta 1:**
["#52ef99", "#944557", "#75d5e1", "#ee4454", "#b1bf81"]

<ul>
    <li style='color:#52ef99'><b>cor 1</b></li>
    <li style='color:#944557'><b>cor 2</b></li>
    <li style='color:#75d5e1'><b>cor 3</b></li>
    <li style='color:#ee4454'><b>cor 4</b></li>
    <li style='color:#b1bf81'><b>cor 5</b></li>
</ul>

**Paleta 2:**
["#48bf8e", "#cc4c3e", "#7fa69d", "#bb8377", "#2a6866"]

<ul>
    <li style='color:#48bf8e'><b>cor 1</b></li>
    <li style='color:#cc4c3e'><b>cor 2</b></li>
    <li style='color:#7fa69d'><b>cor 3</b></li>
    <li style='color:#bb8377'><b>cor 4</b></li>
    <li style='color:#2a6866'><b>cor 5</b></li>
</ul>

In [126]:
teste2[teste2['regiao'] == 'CO']['estado_ou_provincia'].unique()

array(['Goiás', 'Mato Grosso', 'Mato Grosso do Sul', 'Distrito Federal',
       'Brasília', 'Minas Gerais/Goiás/Distrito Federal'], dtype=object)

In [127]:
# Paleta 2
cores_regioes = {
    'SE':'#bb8377',
    'NE':'#cc4c3e',  # calor
    'S':'#48bf8e',   # frio
    'N':'#2a6866',   # floresta
    'CO':'#7fa69d'
}

# SE: ['#f6ccd0', '#eababc', '#dba9a6', '#cb968e', '#bb8377', '#ab7364', '#9c6556', '#8d594b', '#7d4f3f']
# NE: ['#ffc7aa', '#ffb499', '#ffa389', '#ff917a', '#ff7f68', '#f36e5a', '#df5d4b', '#cc4c3e', '#b83b2f']
# S: ['#9bffff', '#72f7fd', '#3be5f4', '#00d3ea', '#00c2e0', '#00b2d6', '#00a2cc', '#0093c1', '#0084b5']
# N: ['#c5e1cf', '#afd2c1', '#97c2b3', '#7db2a6', '#63a098', '#4c908a', '#3d827d', '#337570', '#2a6866']
# CO: ['#fffdfd', '#efeef0', '#d8dee3', '#c1ccd7', '#a8bac9', '#94aabb', '#869bad', '#7b8d9f', '#738093']

cores_estados = {
    # SE
    'Rio de Janeiro':'#8d594b',
    'São Paulo':'#ab7364',
    'Espírito Santo':'#cb968e',
    'Minas Gerais':'#eababc',
    # NE
    'Pernambuco':'#b83b2f',
    'Bahia':'#cc4c3e',
    'Ceará':'#df5d4b',
    'Paraíba':'#f36e5a',
    'Alagoas':'#ff7f68',
    'Piauí':'#ff917a',
    'Rio Grande do Norte':'#ffa389',
    'Sergipe':'#ffb499',
    # S
    'Paraná':'#0084b5',
    'Santa Catarina':'#00a2cc',
    'Rio Grande do Sul':'#00c2e0',
    'Santa Catarina-Rio Grande do Sul':'#3be5f4',        # ERRO NA BASE
    # N
    'Amazonas':'#2a6866',
    'Roraima':'#337570',
    'Pará':'#3d827d',
    'Acre':'#4c908a',
    'Rondônia':'#63a098',
    'Maranhão':'#7db2a6',
    'Amapá':'#97c2b3',
    'Tocantins':'#afd2c1',
    # CO
    'Goiás':'#7b8d9f',
    'Mato Grosso':'#869bad',
    'Mato Grosso do Sul':'#94aabb',
    'Distrito Federal':'#a8bac9',
    'Brasília':'#c1ccd7',
    'Minas Gerais/Goiás/Distrito Federal':'#d8dee3',    # ERRO NA BASE
}

<br>

## Graph: Exploring time-spacial evolution of the database

In [5]:
# corrects a typo (Améica do Sul)
NewTable['continente'] = NewTable['continente'].apply(lambda x: 'América do Sul' if x=='Améica do Sul' else x)

In [6]:
NewTable['continente'].value_counts()

América do Sul      21927
América Central       135
América do Norte      103
Ásia                   54
#N/D                   25
África                 13
Europa                  9
Name: continente, dtype: int64

### Chart 1: Evolution per time and continent

In [7]:
# agrupando por Ano e Continente
teste = NewTable.groupby(['ano_coleta','continente', 'ordem']).count()['class'].reset_index().rename(columns={
    'class':'counts'
})

In [8]:
g1 = alt.Chart(teste, title='Evolução temporal da coleção por continente').mark_circle().encode(
    x= alt.X('ano_coleta', type="ordinal", title='Ano de Coleta'),
    y= alt.Y('continente', title='Continente', 
             sort=alt.EncodingSortField('counts', op="count", order='descending')), 
    size=alt.Size('counts', scale= alt.Scale(range=[30,1200])), 
    order= alt.Order('counts', sort='descending'),  # smaller points in front
    color= alt.Color('ordem', scale=alt.Scale(domain=ordens, range=cores)),
    tooltip= alt.Tooltip(['continente','ano_coleta','ordem','counts'])
)

g1 = g1.configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# g1.save('./graphs/time-spacial/evolucao_por_continente.html')

# g1

<br>

#### Cumulative count:

In [9]:
# agrupando por Ano e Continente
teste = NewTable.groupby(['ano_coleta','continente']).count()['class'].reset_index().rename(columns={
    'class':'counts'
})

teste = teste.sort_values(['continente', 'ano_coleta'])

In [10]:
cumSum = []
for continente in teste['continente'].unique():
    cumSum.extend(list(teste[teste['continente'] == continente]['counts'].cumsum()))
    
teste['cumulative_sum'] = cumSum

In [51]:
g1 = alt.Chart(teste, title='Evolução temporal da coleção por continente', width=600).mark_line(point=True).encode(
    x= alt.X('ano_coleta', type="ordinal", title='Ano de Coleta'),
    y= alt.Y('cumulative_sum', title='', 
             sort=alt.EncodingSortField('counts', op="count", order='descending')),
    color= alt.Color('continente:N', title='Continente',
                     scale=alt.Scale(domain=list(cores_continente.keys()), range=list(cores_continente.values()))),
    tooltip= alt.Tooltip(['continente','ano_coleta','counts', 'cumulative_sum'])
)

g1 = g1.configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# g1.save('./graphs/cumCounts/time-spacial/evolucao_por_continente.html')

# g1

In [53]:
g1 = alt.Chart(teste[teste['continente']!='América do Sul'],
               title='Evolução temporal da coleção por continente (ex. América do Sul)', 
width=600).mark_line(point=True).encode(
    x= alt.X('ano_coleta', type="ordinal", title='Ano de Coleta'),
    y= alt.Y('cumulative_sum', title='', 
             sort=alt.EncodingSortField('counts', op="count", order='descending')),
    color= alt.Color('continente:N', title='Continente',
                     scale=alt.Scale(domain=list(cores_continente.keys()), range=list(cores_continente.values()))),
    tooltip= alt.Tooltip(['continente','ano_coleta','counts', 'cumulative_sum'])
)

g1 = g1.configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# g1.save('./graphs/cumCounts/time-spacial/evolucao_por_OUTROS_continentes.html')

g1

<br>

### Chart 2: Evolution per time and country

In [54]:
# agrupando por Ano e Continente
teste1 = NewTable.groupby(['ano_coleta','pais', 'ordem']).count()['class'].reset_index().rename(columns={
    'class':'counts'
})

In [55]:
# retirei Brasil (será detalhado por Estados depois)
g1 = alt.Chart(teste1[teste1['pais'] != 'Brasil'], title='Animais coletados por ano em outros países',
              width=800).mark_circle().encode(
    x= alt.X('ano_coleta', type="ordinal", title='Ano de Coleta'),
    y= alt.Y('pais', title='País', 
             sort=alt.EncodingSortField('counts', op="sum", order='descending')), 
    size=alt.Size('counts', scale= alt.Scale(range=[20,250])), 
    order= alt.Order('counts', sort='descending'),  # smaller points in front
    color= alt.Color('ordem', scale=alt.Scale(domain=ordens, range=cores)),
    tooltip= alt.Tooltip(['pais','ano_coleta','ordem','counts'])
)

g1 = g1.configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# g1.save('./graphs/time-spacial/evolucao_por_pais.html')

# g1

<br>

#### Cumulative count:

In [148]:
# agrupando por Ano e Continente
teste = NewTable.groupby(['ano_coleta','continente','pais']).count()['class'].reset_index().rename(columns={
    'class':'counts'
})

teste = teste.sort_values(['pais', 'ano_coleta'])

In [149]:
cumSum = []
for pais in teste['pais'].unique():
    cumSum.extend(list(teste[teste['pais'] == pais]['counts'].cumsum()))
    
teste['cumulative_sum'] = cumSum

In [166]:
g1 = alt.Chart(teste, title='Evolução temporal da coleção por país', 
width=600).mark_line(point=True).encode(
    x= alt.X('ano_coleta', type="ordinal", title='Ano de Coleta'),
    y= alt.Y('cumulative_sum', title='', 
             sort=alt.EncodingSortField('counts', op="count", order='descending')),
    color= alt.Color('pais:N', title='País',
                     legend= alt.Legend(columns=2, symbolLimit=42),
                     scale= alt.Scale(domain=list(cores_pais.keys()), range=list(cores_pais.values()))),
    tooltip= alt.Tooltip(['pais','ano_coleta','counts', 'cumulative_sum'])
)

g1 = g1.configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# g1.save('./graphs/cumCounts/time-spacial/evolucao_por_país.html')

# g1

In [161]:
g1 = alt.Chart(teste[teste['pais'] != 'Brasil'], title='Evolução temporal da coleção por país (ex. Brasil)', 
width=600).mark_line(point=True).encode(
    x= alt.X('ano_coleta', type="ordinal", title='Ano de Coleta'),
    y= alt.Y('cumulative_sum', title='', 
             sort=alt.EncodingSortField('counts', op="count", order='descending')),
    color= alt.Color('pais:N', title='País',
                     legend= alt.Legend(columns=2, symbolLimit=42),
                     scale= alt.Scale(domain=list(cores_pais.keys()), range=list(cores_pais.values()))),
    tooltip= alt.Tooltip(['pais','ano_coleta','counts', 'cumulative_sum'])
)

g1 = g1.configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# g1.save('./graphs/cumCounts/time-spacial/evolucao_por_país-exBrasil.html')

g1

In [165]:
g1 = alt.Chart(teste[teste['continente'] == 'América do Sul'], 
               title='Evolução temporal da coleção por país da América do Sul',
width=600).mark_line(point=True).encode(
    x= alt.X('ano_coleta', type="ordinal", title='Ano de Coleta'),
    y= alt.Y('cumulative_sum', title='', 
             sort=alt.EncodingSortField('counts', op="count", order='descending')),
    color= alt.Color('pais:N', title='País',
                     legend= alt.Legend(columns=2),
                     scale= alt.Scale(domain=list(cores_AS.keys()), range=list(cores_AS.values()))),
    tooltip= alt.Tooltip(['pais','ano_coleta','counts'])
)

g1 = g1.configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# g1.save('./graphs/cumCounts/time-spacial/evolucao_por_país-AmericaDoSul.html')

# g1

In [160]:
g1 = alt.Chart(teste[(teste['continente'] == 'América do Sul') & (teste['pais'] != 'Brasil')], 
               title='Evolução temporal da coleção por país da América do Sul (ex. Brasil)',
width=600).mark_line(point=True).encode(
    x= alt.X('ano_coleta', type="ordinal", title='Ano de Coleta'),
    y= alt.Y('cumulative_sum', title='', 
             sort=alt.EncodingSortField('counts', op="count", order='descending')),
    color= alt.Color('pais:N', title='País',
                     legend= alt.Legend(columns=2),
                     scale= alt.Scale(domain=list(cores_AS.keys()), range=list(cores_AS.values()))),
    tooltip= alt.Tooltip(['pais','ano_coleta','counts'])
)

g1 = g1.configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# g1.save('./graphs/cumCounts/time-spacial/evolucao_por_país-AmericaDoSul-exBrasil.html')

g1

<br>

### Chart 3: Evolution per time and brazilian states

In [128]:
# agrupando por Ano e Continente
teste2 = NewTable[NewTable['pais'] == 'Brasil']
teste2 = teste2.groupby(['ano_coleta','estado_ou_provincia', 'ordem']).count()['class'].reset_index().rename(columns={
    'class':'counts'
})

#### creating column with brazilian regions

In [129]:
regioes = {
    'Rio de Janeiro':'SE',
    'São Paulo':'SE',
    'Espírito Santo': 'SE',
    'Pernambuco':'NE',
    'Santa Catarina':'S',
    'Amazonas':'N',
    'Goiás':'CO',
    'Roraima':'N',
    'Pará':'N',
    'Mato Grosso':'CO',
    'Acre': 'N',
    'Bahia': 'NE',
    'Minas Gerais': 'SE',
    'Mato Grosso do Sul': 'CO',
    'Paraná': 'S',
    'Rondônia': 'N',
    'Ceará': 'NE',
    'Maranhão': 'N',
    'Rio Grande do Sul': 'S',
    'Paraíba': 'NE',
    'Distrito Federal': 'CO',
    'Alagoas': 'NE',
    'Amapá':'N',
    'Piauí': 'NE',
    'Brasília': 'CO',
    'Tocantins': 'N',
    'Rio Grande do Norte': 'NE',
    'Sergipe': 'NE',
    'Minas Gerais/Goiás/Distrito Federal': 'CO',
    'Santa Catarina-Rio Grande do Sul': 'S'
}

# criando coluna com as regiões
teste2['regiao'] = teste2['estado_ou_provincia'].apply(lambda x: regioes[str(x)])

# coluna com estado, regiao
teste2['regiao_e_estado'] = teste2['estado_ou_provincia'] + ', ' + teste2['regiao']

# ordenando por região e soma das contagens
sorting = teste2.groupby(['regiao_e_estado', 'regiao']).sum()['counts'].reset_index(
                                                                ).rename(columns={'counts':'soma'})
sorting = sorting.sort_values(['regiao','soma'], ascending=False)['regiao_e_estado'].unique()

In [130]:
g1 = alt.Chart(teste2, title='Animais coletados por ano nos Estados Brasileiros').mark_circle(opacity=0.8).encode(
    x= alt.X('ano_coleta', type="ordinal", title='Ano de Coleta'),
    y= alt.Y('regiao_e_estado', type="nominal",title='Estado, Região',
            sort= sorting, axis=alt.Axis(labels=True)), 
    y2 = alt.Y2('regiao', title='Região'),
    size=alt.Size('counts', scale= alt.Scale(range=[30,1200], zero=False)), 
    order= alt.Order('counts', sort='descending'),  # smaller points in front
    color= alt.Color('ordem', scale=alt.Scale(domain=ordens, range=cores)),
    tooltip= alt.Tooltip(['regiao','estado_ou_provincia','ano_coleta','ordem','counts'])
)

# OBS: marca o background da região que eu quiser, mas distorce as cores
# rule = alt.Chart(teste2[teste2['regiao'].isin(['SE','NE','CO'])], 
#                  title='Animais coletados por ano nos Estados Brasileiros').mark_rule(
#                     opacity=0.1, size=19, color='#dedede', filled=False, fill='green').encode(
#     y= alt.Y('regiao_e_estado', type="nominal",title='Estado, Região',
#             sort= sorting, axis=alt.Axis(labels=True))
# )

g1 = g1.configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# g1.save('./graphs/time-spacial/evolucao_por_estados_brasileiros.html')

# g1

<br>
<br>

<font color='red' size='5'> Separando por períodos </font>

In [131]:
# periodos: <1938, >=1938 e <= 1985, > 1985 
ano_corte1 = 1938
ano_corte2 = 1985

periodo1 = teste2[teste2['ano_coleta'] < 1938].copy()
periodo2 = teste2[(teste2['ano_coleta'] >= 1938) & (teste2['ano_coleta'] <= 1985)].copy()
periodo3 = teste2[teste2['ano_coleta'] > 1985].copy()

### periodo 1: até 1937

In [132]:
g1 = alt.Chart(periodo1, title='Animais coletados por ano nos Estados Brasileiros (até 1937)',
              width=800, height=600).mark_circle(opacity=0.8).encode(
    x= alt.X('ano_coleta', type="ordinal", title='Ano de Coleta'),
    y= alt.Y('regiao_e_estado', type="nominal",title='Estado, Região',
            sort= sorting, axis=alt.Axis(labels=True)), 
    y2 = alt.Y2('regiao', title='Região'),
    size=alt.Size('counts', scale= alt.Scale(range=[30,1200], zero=False)), 
    order= alt.Order('counts', sort='descending'),  # smaller points in front
    color= alt.Color('ordem', scale=alt.Scale(domain=ordens, range=cores)),
    tooltip= alt.Tooltip(['regiao','estado_ou_provincia','ano_coleta','ordem','counts'])
)

g1 = g1.configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# g1.save('./graphs/time-spacial/evolucao_por_estados_brasileiros-ate1937.html')

# g1

### periodo 2: de 1938 a 1985

In [133]:
g1 = alt.Chart(periodo2, title='Animais coletados por ano nos Estados Brasileiros (de 1938 a 1985)',
              width=800, height=600).mark_circle(opacity=0.8).encode(
    x= alt.X('ano_coleta', type="ordinal", title='Ano de Coleta'),
    y= alt.Y('regiao_e_estado', type="nominal",title='Estado, Região',
            sort= sorting, axis=alt.Axis(labels=True)), 
    y2 = alt.Y2('regiao', title='Região'),
    size=alt.Size('counts', scale= alt.Scale(range=[30,1200], zero=False)), 
    order= alt.Order('counts', sort='descending'),  # smaller points in front
    color= alt.Color('ordem', scale=alt.Scale(domain=ordens, range=cores)),
    tooltip= alt.Tooltip(['regiao','estado_ou_provincia','ano_coleta','ordem','counts'])
)

g1 = g1.configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# g1.save('./graphs/time-spacial/evolucao_por_estados_brasileiros-de1938a1985.html')

# g1

### periodo 3: após 1985

In [134]:
g1 = alt.Chart(periodo3, title='Animais coletados por ano nos Estados Brasileiros (após 1985)',
              width=800, height=600).mark_circle(opacity=0.8).encode(
    x= alt.X('ano_coleta', type="ordinal", title='Ano de Coleta'),
    y= alt.Y('regiao_e_estado', type="nominal",title='Estado, Região',
            sort= sorting, axis=alt.Axis(labels=True)), 
    y2 = alt.Y2('regiao', title='Região'),
    size=alt.Size('counts', scale= alt.Scale(range=[30,1200], zero=False)), 
    order= alt.Order('counts', sort='descending'),  # smaller points in front
    color= alt.Color('ordem', scale=alt.Scale(domain=ordens, range=cores)),
    tooltip= alt.Tooltip(['regiao','estado_ou_provincia','ano_coleta','ordem','counts'])
)

g1 = g1.configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# g1.save('./graphs/time-spacial/evolucao_por_estados_brasileiros-apos1985.html')

# g1

<br>

#### Cumulative count:

In [135]:
# agrupando por Ano e Continente
# OBS: variável teste2 já tem as informações que precisamos (vide a criação do gráfico anterior)
teste = teste2.groupby(['ano_coleta','regiao_e_estado']).count()['ordem'].reset_index().rename(columns={
    'ordem':'counts'
})

teste = teste.sort_values(['regiao_e_estado', 'ano_coleta'])

In [136]:
cumSum = []
for reg_est in teste['regiao_e_estado'].unique():
    cumSum.extend(list(teste[teste['regiao_e_estado'] == reg_est]['counts'].cumsum()))
    
teste['cumulative_sum'] = cumSum

In [140]:
teste['estado'] = teste['regiao_e_estado'].apply(lambda x:x.split(',')[0])
teste['regiao'] = teste['regiao_e_estado'].apply(lambda x:x.split(',')[1])

In [145]:
g1 = alt.Chart(teste, title='Evolução temporal da coleção por Estado', width=600).mark_line(point=True).encode(
    x= alt.X('ano_coleta', type="ordinal", title='Ano de Coleta'),
    y= alt.Y('cumulative_sum', title='', 
             sort=alt.EncodingSortField('counts', op="count", order='descending')),
    color= alt.Color('estado:N', title='Estado', 
                        legend= alt.Legend(columns=2, symbolLimit=42),
                     scale= alt.Scale(domain=list(cores_estados.keys()), range=list(cores_estados.values()))),
    tooltip= alt.Tooltip(['regiao_e_estado','ano_coleta','counts', 'cumulative_sum'])
)

g1 = g1.configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# g1.save('./graphs/cumCounts/time-spacial/evolucao_por_estado.html')

g1

<br>

## Lat Long

In [16]:
def regiao(est):
    if est not in regioes.keys():
        return np.NAN
    else:
        return regioes[est]
    
NewTable['regiao'] = NewTable['estado_ou_provincia'].apply(regiao)

In [17]:
from vega_datasets import data

source = alt.topo_feature(data.world_110m.url, 'countries')

world = alt.Chart(source).mark_geoshape(
    fill='white',
    stroke='gray'
).project('naturalEarth1')

# world

In [18]:
# dynamic version
slider = alt.binding_range(min=1900, max=2016, step=1)
select_year = alt.selection_single(name=' ', fields=['ano_coleta'],
                                   bind=slider, init={'ano_coleta': 1935})

# data = NewTable[(NewTable['long'] < 10) & (NewTable['long'] >-150)].copy()
data = NewTable.copy()

back = alt.Chart(data).mark_circle(opacity=0.7, color='lightgray').encode(
    longitude = alt.X('long', type='quantitative', title='Longitude'),
    latitude = alt.Y('lat', type='quantitative', title='Latitude'),
    tooltip = alt.Tooltip(['lat','long','pais','regiao','estado_ou_provincia',
                           'ano_coleta','mes_coleta', 'ordem'])
)

front = alt.Chart(data).mark_circle().encode(
    longitude = alt.X('long', type='quantitative', title='Longitude'),
    latitude = alt.Y('lat', type='quantitative', title='Latitude'),
    color = alt.Color('ordem:N', title='Ordem', scale=
                     alt.Scale(range=cores, domain=ordens)),
    tooltip = alt.Tooltip(['lat','long','pais','regiao','estado_ou_provincia',
                           'ano_coleta','mes_coleta', 'ordem'])
).add_selection(
    select_year
).transform_filter(
    select_year
)

equador = alt.Chart(data[data['lat'] == 0], width=800, height= 400).mark_rule(color='black').encode(
    y = alt.Y('lat:Q', axis=alt.Axis(grid=False))
)


g = alt.layer(world, back, front).properties(
    width= 800,
    height= 500
)  # tirei o equador

# ajustando tamanho de fonte
g = g.configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# g.save('./graphs/time-spacial/lat_long-worldwide.html')

# g

<br>

<font color='red' size='5'>Lat long (layout 2 estático)</font>

In [49]:
# https://nextjournal.com/sdanisch/cartographic-visualization

# seletores
select_order = alt.selection_multi(fields=['ordem'], bind='legend')
select_type = alt.selection_multi(fields=['type_status'], bind='legend')

tipos = NewTable['type_status'].unique()  # lista temporária! ajustar depois!

# AJUSTAR CORES

from vega_datasets import data

front = alt.Chart(NewTable).mark_point(filled=True).encode(
    longitude = alt.X('long', type='quantitative', title='Longitude'),
    latitude = alt.Y('lat', type='quantitative', title='Latitude'),
    color = alt.Color('ordem:N', title='Ordem', scale=
                     alt.Scale(range=cores, domain=ordens)),
    shape = alt.Shape('type_status:N', title='Type', scale= alt.Scale(domain=tipos)),
    tooltip = alt.Tooltip(['lat','long','pais','regiao','estado_ou_provincia',
                           'ano_coleta','mes_coleta', 'genero_atual','familia','ordem', 'type_status'])
).add_selection(select_order, select_type).transform_filter(select_order).transform_filter(select_type)

mapa = alt.layer(
     # use the sphere of the Earth as the base layer
    alt.Chart({'sphere': True}).mark_geoshape(
        fill='#f2f2f2'
    ),
    # add a graticule for geographic reference lines
    alt.Chart({'graticule': True}).mark_geoshape(
        stroke='#ffffff', strokeWidth=1
    ),
    # and then the countries of the world
    alt.Chart(alt.topo_feature(data.world_110m.url, 'countries')).mark_geoshape(
        fill='#white', stroke='black', strokeWidth=0.5
    ),
    front
).properties(
    width=800,
    height=500
)

mapa = mapa.project(
    type='naturalEarth1', scale=140
).configure_view(stroke=None)

mapa = mapa.configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# mapa.save('./graphs/time-spacial/lat_long-worldwide-static-grid.html')

# mapa

In [52]:
teste = alt.Chart(NewTable).mark_point(filled=True).encode(
    longitude = alt.X('long:Q', title='Longitude'),
    latitude = alt.Y('lat:Q', title='Latitude'),
    color = alt.Color('ordem:N', title='Ordem', scale = alt.Scale(range=cores, domain=ordens)),
    shape = alt.Shape('type_status:N', title='Type', scale= alt.Scale(domain=tipos)),
    tooltip = alt.Tooltip(['lat','long','pais','regiao','estado_ou_provincia',
                           'ano_coleta','mes_coleta', 'genero_atual','familia','ordem', 'type_status'])
).project(type='naturalEarth1').add_selection(select_order, 
                            select_type).transform_filter(select_order).transform_filter(select_type)

temp = (world + teste).properties(width=800, height=500).configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# temp.save('./graphs/time-spacial/lat_long-worldwide-static.html')
# temp

<br>

### Latin America

In [53]:
# seletores
select_order = alt.selection_multi(fields=['ordem'], bind='legend')
select_type = alt.selection_multi(fields=['type_status'], bind='legend')

tipos = NewTable['type_status'].unique()  # lista temporária! ajustar depois!

# mapa
from vega_datasets import data

source = alt.topo_feature(data.world_110m.url, 'countries')

latinAmerica = alt.Chart(source).mark_geoshape(
    fill='white',
    stroke='gray'
).project('naturalEarth1', translate=[680, 150], scale=450)

# pontos
teste = alt.Chart(NewTable).mark_point(filled=True).encode(
    longitude = alt.X('long:Q', title='Longitude'),
    latitude = alt.Y('lat:Q', title='Latitude'),
    color = alt.Color('ordem:N', title='Order', scale = alt.Scale(range=cores, domain=ordens)),
    shape = alt.Shape('type_status:N', title='Type', scale= alt.Scale(domain=tipos)),
    tooltip = alt.Tooltip(['lat','long','pais','regiao','estado_ou_provincia',
                           'ano_coleta','mes_coleta', 'genero_atual','familia','ordem', 'type_status'])
).project(type='naturalEarth1', translate=[680, 150], scale=450).add_selection(select_order,
                                select_type).transform_filter(select_order).transform_filter(select_type)


# configurando grafico
temp = (latinAmerica + teste).properties(width=600, height=600).configure_title(fontSize=16).configure_axis(
    labelFontSize=12,
    titleFontSize=12
).configure_legend(
    labelFontSize=12,
    titleFontSize=12
)

# temp.save('./graphs/time-spacial/lat_long-latinAmerica-static.html')
# temp

**Fim!**