# Project

### Importando as bibliotecas

In [1]:
import sys
sys.path.append('..')
import pandas as pd
import requests
import pprint
import params.consts as consts

### Fazendo a requisição get para a API

In [2]:
response = requests.get(consts.URL_API) # Fazendo uma requisição get para a API

### Verificando o status code da API

In [3]:
if response.status_code == 200: # Criando uma condição para informar o status code da requisição da API
    print('Status Code: 200 - Ok\n\nA requisição foi bem sucedida.')
elif response.status_code == 404:
    print('Status Code: 404 - Not Found.\n\nO servidor não encontrou uma representação atual do recurso solicitado.')
else:
    print(f'Status Code: {response.status_code}')

Status Code: 200 - Ok

A requisição foi bem sucedida.


### Verificando o tipo de dado retornado pela API

In [4]:
response.headers['Content-Type'] # Verificando o tipo de dado retornado pela API, geralmente em JSON

'application/json'

### Armazenando o retorno em uma variável

In [5]:
response_all = response.json() # Armazenando o retorno em uma variável

### Verificando o tamanho do JSON retornado

In [6]:
len(response_all) # Verificando o tamanho do JSON retornado

250

### Verificando as chaves do JSON retornado

In [7]:
for key in response_all[0].keys(): # Criando uma estrutura de repetição para listar as chaves do JSON retornado
    print(key)

name
tld
cca2
ccn3
cca3
independent
status
unMember
currencies
idd
capital
altSpellings
region
languages
translations
latlng
landlocked
area
demonyms
flag
maps
population
car
timezones
continents
flags
coatOfArms
startOfWeek
capitalInfo


### Verificando os dados retornados

In [8]:
pprint.pprint(response_all[0]) # Verificando o primeiro json/dicionário retornado

{'altSpellings': ['GS', 'South Georgia and the South Sandwich Islands'],
 'area': 3903.0,
 'capital': ['King Edward Point'],
 'capitalInfo': {'latlng': [-54.28, -36.5]},
 'car': {'side': 'right', 'signs': ['']},
 'cca2': 'GS',
 'cca3': 'SGS',
 'ccn3': '239',
 'coatOfArms': {},
 'continents': ['Antarctica'],
 'currencies': {'SHP': {'name': 'Saint Helena pound', 'symbol': '£'}},
 'demonyms': {'eng': {'f': 'South Georgian South Sandwich Islander',
                      'm': 'South Georgian South Sandwich Islander'}},
 'flag': '🇬🇸',
 'flags': {'png': 'https://flagcdn.com/w320/gs.png',
           'svg': 'https://flagcdn.com/gs.svg'},
 'idd': {'root': '+5', 'suffixes': ['00']},
 'independent': False,
 'landlocked': False,
 'languages': {'eng': 'English'},
 'latlng': [-54.5, -37.0],
 'maps': {'googleMaps': 'https://goo.gl/maps/mJzdaBwKBbm2B81q9',
          'openStreetMaps': 'https://www.openstreetmap.org/relation/1983629'},
 'name': {'common': 'South Georgia',
          'nativeName': {'eng': 

### Definindo as chaves que serão usadas para criar o dataset

- area
- capital
- continents
- idd
- name
- population

### Otimizando a consulta à API para retornar apenas os dados que serão utilizados no dataset

In [9]:
response = requests.get(consts.URL_API_FILTERED) # Fazendo uma requisição get para a API com filtros de somente os dados necessários

### Verificando o status code da API

In [10]:
if response.status_code == 200: # Criando uma condição para informar o status code da requisição da API
    print('Status Code: 200 - Ok\n\nA requisição foi bem sucedida.')
elif response.status_code == 404:
    print('Status Code: 404 - Not Found.\n\nO servidor não encontrou uma representação atual do recurso solicitado.')
else:
    print(f'Status Code: {response.status_code}')

Status Code: 200 - Ok

A requisição foi bem sucedida.


### Verificando o tipo de dado retornado pela API

In [11]:
response.headers['Content-Type'] # Verificando o tipo de dado retornado pela API, geralmente em JSON

'application/json'

### Armazenando o retorno em uma variável

In [12]:
response_all = response.json() # Armazenando o retorno em uma variável

### Verificando o tamanho do JSON retornado

In [13]:
len(response_all) # Verificando o tamanho do JSON retornado

250

### Verificando as chaves do JSON retornado

In [14]:
for key in response_all[0].keys(): # Criando uma estrutura de repetição para listar as chaves do JSON retornado
    print(key)

name
idd
capital
area
population
continents


### Verificando os dados retornados

In [15]:
pprint.pprint(response_all[:3]) # Verificando os 3 primeiros json/dicionário retornados

[{'area': 3903.0,
  'capital': ['King Edward Point'],
  'continents': ['Antarctica'],
  'idd': {'root': '+5', 'suffixes': ['00']},
  'name': {'common': 'South Georgia',
           'nativeName': {'eng': {'common': 'South Georgia',
                                  'official': 'South Georgia and the South '
                                              'Sandwich Islands'}},
           'official': 'South Georgia and the South Sandwich Islands'},
  'population': 30},
 {'area': 344.0,
  'capital': ["St. George's"],
  'continents': ['North America'],
  'idd': {'root': '+1', 'suffixes': ['473']},
  'name': {'common': 'Grenada',
           'nativeName': {'eng': {'common': 'Grenada', 'official': 'Grenada'}},
           'official': 'Grenada'},
  'population': 112519},
 {'area': 41284.0,
  'capital': ['Bern'],
  'continents': ['Europe'],
  'idd': {'root': '+4', 'suffixes': ['1']},
  'name': {'common': 'Switzerland',
           'nativeName': {'fra': {'common': 'Suisse',
                           

### Criando o dataset com os dados retornados

In [16]:
df = pd.DataFrame(response_all) # Criando o dataset com os dados retornados

df.head() # Exibindo o dataset

Unnamed: 0,name,idd,capital,area,population,continents
0,"{'common': 'South Georgia', 'official': 'South...","{'root': '+5', 'suffixes': ['00']}",[King Edward Point],3903.0,30,[Antarctica]
1,"{'common': 'Grenada', 'official': 'Grenada', '...","{'root': '+1', 'suffixes': ['473']}",[St. George's],344.0,112519,[North America]
2,"{'common': 'Switzerland', 'official': 'Swiss C...","{'root': '+4', 'suffixes': ['1']}",[Bern],41284.0,8654622,[Europe]
3,"{'common': 'Sierra Leone', 'official': 'Republ...","{'root': '+2', 'suffixes': ['32']}",[Freetown],71740.0,7976985,[Africa]
4,"{'common': 'Hungary', 'official': 'Hungary', '...","{'root': '+3', 'suffixes': ['6']}",[Budapest],93028.0,9749763,[Europe]


### Criando uma lista com os dados organizados

In [17]:
paises = [] # Criando uma lista vazia para receber os países

for pais in response_all: # Criando uma estrutura de repetição para extrair os dados e gerar um dataset otimizado
    item = {
        'country': pais['name']['common'],
        'capital': pais['capital'][0] if 'capital' in pais and len(pais['capital']) > 0 else 'N/A',
        'continents': pais['continents'][0],
        'area': pais['area'],
        'population': pais['population'],
        'idd': pais['idd']['root'],
    }
    paises.append(item) # Adicionando o item a lista de países

pprint.pprint(paises) # Exibindo os dados dos países

[{'area': 3903.0,
  'capital': 'King Edward Point',
  'continents': 'Antarctica',
  'country': 'South Georgia',
  'idd': '+5',
  'population': 30},
 {'area': 344.0,
  'capital': "St. George's",
  'continents': 'North America',
  'country': 'Grenada',
  'idd': '+1',
  'population': 112519},
 {'area': 41284.0,
  'capital': 'Bern',
  'continents': 'Europe',
  'country': 'Switzerland',
  'idd': '+4',
  'population': 8654622},
 {'area': 71740.0,
  'capital': 'Freetown',
  'continents': 'Africa',
  'country': 'Sierra Leone',
  'idd': '+2',
  'population': 7976985},
 {'area': 93028.0,
  'capital': 'Budapest',
  'continents': 'Europe',
  'country': 'Hungary',
  'idd': '+3',
  'population': 9749763},
 {'area': 36193.0,
  'capital': 'Taipei',
  'continents': 'Asia',
  'country': 'Taiwan',
  'idd': '+8',
  'population': 23503349},
 {'area': 142.0,
  'capital': 'Mata-Utu',
  'continents': 'Oceania',
  'country': 'Wallis and Futuna',
  'idd': '+6',
  'population': 11750},
 {'area': 430.0,
  'capita

### Otimizando o dataset com os dados organizados

In [18]:
df = pd.DataFrame(paises) # Criando o dataset com os dados retornados

df.head() # Exibindo o início do dataset

Unnamed: 0,country,capital,continents,area,population,idd
0,South Georgia,King Edward Point,Antarctica,3903.0,30,5
1,Grenada,St. George's,North America,344.0,112519,1
2,Switzerland,Bern,Europe,41284.0,8654622,4
3,Sierra Leone,Freetown,Africa,71740.0,7976985,2
4,Hungary,Budapest,Europe,93028.0,9749763,3


In [19]:
df.tail() # Exibindo o fim do dataset

Unnamed: 0,country,capital,continents,area,population,idd
245,Belgium,Brussels,Europe,30528.0,11555997,3
246,Israel,Jerusalem,Asia,20770.0,9216900,9
247,New Zealand,Wellington,Oceania,270467.0,5084300,6
248,Nicaragua,Managua,North America,130373.0,6624554,5
249,Anguilla,The Valley,North America,91.0,13452,1


### Salvando o dataset

In [20]:
df.to_csv(consts.DATASET, index=False) # Salvando o dataset em formato csv