<a href="https://colab.research.google.com/github/triatebr/aprenda-arduino/blob/master/OpenData_TDC.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

![logos](https://mundogeo.com/wp-content/uploads/2014/01/Plataforma-Dados-Abertos.jpg)


Hoje teremos contato com os conceitos/prática de **Dados Abertos** e realizaremos uma análise exploratória usando comandos do **Python** via [Colab.research](https://colab.research.google.com/notebooks/welcome.ipynb)

In [0]:
import pandas as pd
import seaborn as sns
import numpy as np
import io
import matplotlib.pyplot as plt
%matplotlib inline

In [0]:
# Fonte dos dados: http://dados.gov.br/dataset/comite-nacional-para-os-refugiados
url = 'https://www.justica.gov.br/seus-direitos/refugio/anexos/1990-a-2019-solicitacoes-de-reconhecimento-da-condicao-de-refugiado.xlsx'

In [0]:
dfs = pd.read_excel(url,enconding='latin',delimiter=";")

In [0]:
# Visualização das 5 primeiras linhas do dataframe, mas caso prefira mais linhas? insira o numero entre os '()'
# Costuma-se usar nome sugestivos para os Dataframes, com foco na facilidade de lembrar e usar
dfs.head()

Unnamed: 0,Tipo de Alertas e Restrições,Nacionalidade,Mês/Ano,UF,Quantidade
0,SOLICITAÇÃO DE REFÚGIO,AFEGANISTÃO,12/2001,DF,1
1,SOLICITAÇÃO DE REFÚGIO,AFEGANISTÃO,01/2010,DF,1
2,SOLICITAÇÃO DE REFÚGIO,AFEGANISTÃO,03/2010,DF,2
3,SOLICITAÇÃO DE REFÚGIO,AFEGANISTÃO,03/2010,SP,2
4,SOLICITAÇÃO DE REFÚGIO,AFEGANISTÃO,08/2010,DF,1


In [0]:
# Quantidade de linhas e colunas do dataframe
dfs.shape

(11656, 5)

In [0]:
# Todas as colunas do dataframe
dfs.columns

Index(['Tipo de Alertas e Restrições', 'Nacionalidade', 'Mês/Ano', 'UF',
       'Quantidade'],
      dtype='object')

In [0]:
# Após a importação e visualização, como serão as colunas e características do nosso Dataframe?
dfs.dtypes

Tipo de Alertas e Restrições    object
Nacionalidade                   object
Mês/Ano                         object
UF                              object
Quantidade                       int64
dtype: object

Informação **NACIONALIDADE**

In [0]:
# Para sabermos os valores únicos de uma determinada coluna, usamos o 'unique()'
dfs['Nacionalidade'].unique()

array(['AFEGANISTÃO', 'ALBÂNIA', 'ALEMANHA', 'ANDORRA', 'ANGOLA',
       'APÁTRIDA', 'ARGENTINA', 'ARGÉLIA', 'ARMÊNIA', 'ARÁBIA SAUDITA',
       'AUSTRÁLIA', 'BANGLADESH', 'BARBADOS', 'BAREINE', 'BELARUS',
       'BELIZE', 'BENIN', 'BHUTAN', 'BOLÍVIA', 'BRASIL', 'BULGÁRIA',
       'BURKINA FASO', 'BURUNDI', 'BUTÃO', 'BÉLGICA',
       'BÓSNIA E HERZEGOVINA', 'CABO VERDE', 'CAMARÕES', 'CAMBOJA',
       'CANADÁ', 'CAZAQUISTÃO', 'CHILE', 'CHINA', 'COLÔMBIA', 'CONGO',
       'CORÉIA DO NORTE', 'CORÉIA DO SUL', 'COSTA DO MARFIM',
       'COSTA RICA', 'CROÁCIA', 'CUBA', 'DAOME', 'DINAMARCA', 'DJIBUTI',
       'DOMINICA', 'EGITO', 'EL SALVADOR', 'EMIRADOS ÁRABES', 'EQUADOR',
       'ERITRÉIA', 'ESLOVÁQUIA', 'ESPANHA', 'ESTADOS UNIDOS', 'ESTÔNIA',
       'ETIÓPIA', 'FIJI, ILHAS', 'FILIPINAS', 'FRANÇA', 'GABÃO', 'GANA',
       'GEÓRGIA', 'GRÉCIA', 'GUAM', 'GUATEMALA', 'GUIANA',
       'GUIANA FRANCESA', 'GUINÉ', 'GUINÉ BISSAU', 'GUINÉ EQUATORIAL',
       'GÂMBIA', 'HAITI', 'HONDURAS', 'HUNGRIA',

In [0]:
# Agrupando dados, inicialmente por Nacionalidade
dfs['Nacionalidade'].value_counts()

CUBA                              887
HAITI                             775
VENEZUELA                         665
COLÔMBIA                          556
SENEGAL                           469
SÍRIA                             466
BANGLADESH                        385
GUINÉ BISSAU                      371
ANGOLA                            343
CONGO                             337
PAQUISTÃO                         325
GANA                              298
NIGÉRIA                           294
REP. DOMINICANA                   289
LÍBANO                            255
GUINÉ                             219
MARROCOS                          178
IRAQUE                            164
PALESTINA                         150
ÍNDIA                             147
NACIONALIDADE INDEFINIDA          144
EGITO                             137
SERRA LEOA                        132
TOGO                              131
CAMARÕES                          124
SOMÁLIA                           122
REPÚBLICA DE

In [0]:
#selecionando uma Nacionalidade específica
dfs.loc[(dfs['Nacionalidade'] == 'BOLÍVIA')]

Unnamed: 0,Tipo de Alertas e Restrições,Nacionalidade,Mês/Ano,UF,Quantidade
1082,SOLICITAÇÃO DE REFÚGIO,BOLÍVIA,02/2002,SP,1
1083,SOLICITAÇÃO DE REFÚGIO,BOLÍVIA,06/2002,SP,7
1084,SOLICITAÇÃO DE REFÚGIO,BOLÍVIA,07/2002,SP,1
1085,SOLICITAÇÃO DE REFÚGIO,BOLÍVIA,01/2006,SP,1
1086,SOLICITAÇÃO DE REFÚGIO,BOLÍVIA,07/2006,SP,1
1087,SOLICITAÇÃO DE REFÚGIO,BOLÍVIA,11/2008,AC,16
1088,SOLICITAÇÃO DE REFÚGIO,BOLÍVIA,11/2008,DF,3
1089,SOLICITAÇÃO DE REFÚGIO,BOLÍVIA,11/2008,RO,3
1090,SOLICITAÇÃO DE REFÚGIO,BOLÍVIA,12/2008,AC,35
1091,SOLICITAÇÃO DE REFÚGIO,BOLÍVIA,12/2008,DF,5


In [0]:
dfs.loc[(dfs['Nacionalidade'] == 'BOLÍVIA')  & (dfs['UF'] =='AM')]

Unnamed: 0,Tipo de Alertas e Restrições,Nacionalidade,Mês/Ano,UF,Quantidade
1157,SOLICITAÇÃO DE REFÚGIO,BOLÍVIA,10/2016,AM,1
1169,SOLICITAÇÃO DE REFÚGIO,BOLÍVIA,01/2018,AM,1
1173,SOLICITAÇÃO DE REFÚGIO,BOLÍVIA,05/2018,AM,1
1178,SOLICITAÇÃO DE REFÚGIO,BOLÍVIA,07/2018,AM,1
1179,SOLICITAÇÃO DE REFÚGIO,BOLÍVIA,08/2018,AM,1
1184,SOLICITAÇÃO DE REFÚGIO,BOLÍVIA,10/2018,AM,4


In [0]:
#selecionando + de 1 Nacionalidade específica
dfs.loc[(dfs['Nacionalidade'] == 'UZBEQUISTÃO')  | (dfs['Nacionalidade'] =='ESTÔNIA')]

Unnamed: 0,Tipo de Alertas e Restrições,Nacionalidade,Mês/Ano,UF,Quantidade
3960,SOLICITAÇÃO DE REFÚGIO,ESTÔNIA,12/2017,AM,1
10693,SOLICITAÇÃO DE REFÚGIO,UZBEQUISTÃO,07/2009,DF,1
10694,SOLICITAÇÃO DE REFÚGIO,UZBEQUISTÃO,06/2018,SP,2


![logos](https://d1nhio0ox7pgb.cloudfront.net/_img/o_collection_png/green_dark_grey/256x256/plain/table.png)

Outro **Dataframe** agora ...

In [0]:
url1 = 'https://www.justica.gov.br/seus-direitos/refugio/anexos/decisoes-conare-ate-jan-2019.xlsx'

In [0]:
dfd = pd.read_excel(url1,enconding='latin',delimiter=";")

In [0]:
dfd.head()

Unnamed: 0,TOTAL= 1510,STATUS,DATA SOLICITAÇÃO,PAÍS DE ORIGEM,GÊNERO,ANO DE NASCIMENTO,CIDADE SOLICITAÇÃO,ANO DECISÃO
0,,ELEGIBILIDADE / DEFERIMENTO,1993-04-15,ANGOLA,,Desconhecido,RJ (RIO DE JANEIRO),1993.0
1,,ELEGIBILIDADE / DEFERIMENTO,1993-04-15,ANGOLA,,Desconhecido,RJ (RIO DE JANEIRO),1994.487979
2,,ELEGIBILIDADE / DEFERIMENTO,1995-06-22,LIBÉRIA,,Desconhecido,RJ (RIO DE JANEIRO),1995.0
3,,ELEGIBILIDADE / DEFERIMENTO,1995-06-22,LIBÉRIA,,Desconhecido,RJ (RIO DE JANEIRO),1994.487866
4,,ELEGIBILIDADE / DEFERIMENTO,1992-07-22,APÁTRIDA,,Desconhecido,RJ (RIO DE JANEIRO),1992.0


In [0]:
dfg = dfd.drop(['TOTAL= 1510'], axis=1)

In [0]:
# quantidade de linhas e colunas do dataframe
dfg.shape

(1515, 7)

In [0]:
# as últimas 5 linhas
dfg.head()

Unnamed: 0,STATUS,DATA SOLICITAÇÃO,PAÍS DE ORIGEM,GÊNERO,ANO DE NASCIMENTO,CIDADE SOLICITAÇÃO,ANO DECISÃO
0,ELEGIBILIDADE / DEFERIMENTO,1993-04-15,ANGOLA,,Desconhecido,RJ (RIO DE JANEIRO),1993.0
1,ELEGIBILIDADE / DEFERIMENTO,1993-04-15,ANGOLA,,Desconhecido,RJ (RIO DE JANEIRO),1994.487979
2,ELEGIBILIDADE / DEFERIMENTO,1995-06-22,LIBÉRIA,,Desconhecido,RJ (RIO DE JANEIRO),1995.0
3,ELEGIBILIDADE / DEFERIMENTO,1995-06-22,LIBÉRIA,,Desconhecido,RJ (RIO DE JANEIRO),1994.487866
4,ELEGIBILIDADE / DEFERIMENTO,1992-07-22,APÁTRIDA,,Desconhecido,RJ (RIO DE JANEIRO),1992.0


In [0]:
# após a importação e visualização, como serão as colunas e características do nosso Dataframe?
dfg.dtypes

STATUS                        object
DATA SOLICITAÇÃO      datetime64[ns]
PAÍS DE ORIGEM                object
GÊNERO                        object
ANO DE NASCIMENTO             object
CIDADE SOLICITAÇÃO            object
ANO DECISÃO                  float64
dtype: object

In [0]:
dfg['PAÍS DE ORIGEM'].value_counts()

ANGOLA                   861
LIBÉRIA                  182
ZAIRE                     93
CUBA                      64
IRAQUE                    57
IUGOSLÁVIA                37
PERU                      28
SERRA LEOA                20
IRÃ                       17
RUANDA                    15
ARGENTINA                 13
NIGÉRIA                   12
LÍBANO                    11
SOMÁLIA                   10
SUDÃO                      8
APÁTRIDA                   7
SÉRVIA                     5
GANA                       5
MACEDÔNIA                  5
ETIÓPIA                    4
EL SALVADOR                4
ARGÉLIA                    4
EGITO                      4
CROÁCIA                    4
VIETNÃ                     3
ÁFRICA DO SUL              3
SÍRIA                      3
LÍBIA                      3
ARMÊNIA                    2
MOÇAMBIQUE                 2
CAMARÕES                   2
GUIANA                     2
PALESTINA                  2
TANZANIA                   2
REPÚBLICA DOMI

In [0]:
dfg['STATUS'].value_counts()

ELEGIBILIDADE / DEFERIMENTO    1503
Name: STATUS, dtype: int64