# API and Web Scraping Project

### The presented project aims to demonstrate the necessary skills to use API and web scrapping.


In [1]:
#importing the necessary packages
import pandas as pd
import json
import requests
from bs4 import BeautifulSoup
from pandas import DataFrame
import time
import re

### STEP 1 - Webscraping and data manipulation

#### Web Scraping the Wikipedia page from airports in Brasil.

In [2]:
website_url = requests.get('https://pt.wikipedia.org/wiki/Lista_de_aeroportos_do_Brasil_por_movimento').text

In [3]:
soup = BeautifulSoup(website_url,'lxml')
print(soup.prettify())

<!DOCTYPE html>
<html class="client-nojs" dir="ltr" lang="pt">
 <head>
  <meta charset="utf-8"/>
  <title>
   Lista de aeroportos do Brasil por movimento – Wikipédia, a enciclopédia livre
  </title>
  <script>
   document.documentElement.className="client-js";RLCONF={"wgBreakFrames":!1,"wgSeparatorTransformTable":[",\t."," \t,"],"wgDigitTransformTable":["",""],"wgDefaultDateFormat":"dmy","wgMonthNames":["","janeiro","fevereiro","março","abril","maio","junho","julho","agosto","setembro","outubro","novembro","dezembro"],"wgMonthNamesShort":["","jan.","fev.","mar.","abr.","mai.","jun.","jul.","ago.","set.","out.","nov.","dez."],"wgRequestId":"XkWNMQpAAEEAAJpUrUIAAAAX","wgCSPNonce":!1,"wgCanonicalNamespace":"","wgCanonicalSpecialPageName":!1,"wgNamespaceNumber":0,"wgPageName":"Lista_de_aeroportos_do_Brasil_por_movimento","wgTitle":"Lista de aeroportos do Brasil por movimento","wgCurRevisionId":57365069,"wgRevisionId":57365069,"wgArticleId":2217518,"wgIsArticle":!0,"wgIsRedirect":!1,"wgActi

Inspecting the html script we can find the table with the airports: It's the one under the class wikitable sortable

In [4]:
air_table = soup.find('table',{'class':'wikitable sortable'})
air_table

<table class="wikitable sortable">
<caption>
</caption>
<tbody><tr>
<td align="center"><b>#</b>
</td>
<td align="center"><b>Aeroporto</b>
</td>
<td align="center"><b>Passageiros pagos<br/>(2019)</b><sup class="reference" id="cite_ref-ANAC_1-1"><a href="#cite_note-ANAC-1"><span>[</span>1<span>]</span></a></sup>
</td>
<td align="center"><b>Class</b>
</td>
<td align="center"><b>Cidade</b>
</td>
<td align="center"><b>Unidade federativa</b>
</td></tr>
<tr>
<td>1
</td>
<td><a href="/wiki/Aeroporto_Internacional_de_S%C3%A3o_Paulo-Guarulhos" title="Aeroporto Internacional de São Paulo-Guarulhos">Aeroporto Internacional de São Paulo-Guarulhos</a>
</td>
<td>42 248 207
</td>
<td><span title="Estável"><img alt="Estável" data-file-height="300" data-file-width="300" decoding="async" height="11" src="//upload.wikimedia.org/wikipedia/commons/thumb/9/96/Steady2.svg/11px-Steady2.svg.png" srcset="//upload.wikimedia.org/wikipedia/commons/thumb/9/96/Steady2.svg/17px-Steady2.svg.png 1.5x, //upload.wikimedia

In [5]:
#finding the airport names and localization filtering the 'a'
links = air_table.findAll('a')
links

[<a href="#cite_note-ANAC-1"><span>[</span>1<span>]</span></a>,
 <a href="/wiki/Aeroporto_Internacional_de_S%C3%A3o_Paulo-Guarulhos" title="Aeroporto Internacional de São Paulo-Guarulhos">Aeroporto Internacional de São Paulo-Guarulhos</a>,
 <a href="/wiki/Guarulhos" title="Guarulhos">Guarulhos</a>,
 <a href="/wiki/S%C3%A3o_Paulo_(estado)" title="São Paulo (estado)">São Paulo</a>,
 <a href="/wiki/Aeroporto_de_S%C3%A3o_Paulo-Congonhas" title="Aeroporto de São Paulo-Congonhas">Aeroporto de São Paulo-Congonhas</a>,
 <a href="/wiki/S%C3%A3o_Paulo" title="São Paulo">São Paulo</a>,
 <a href="/wiki/S%C3%A3o_Paulo_(estado)" title="São Paulo (estado)">São Paulo</a>,
 <a href="/wiki/Aeroporto_Internacional_de_Bras%C3%ADlia" title="Aeroporto Internacional de Brasília">Aeroporto Internacional de Brasília</a>,
 <a href="/wiki/Bras%C3%ADlia" title="Brasília">Brasília</a>,
 <a href="/wiki/Distrito_Federal_(Brasil)" title="Distrito Federal (Brasil)">Distrito Federal</a>,
 <a href="/wiki/Aeroporto_Inter

In [6]:
# the necessary data is after the string 'title':
Airports = []
for link in links:
    Airports.append(link.get('title'))
print(Airports)

[None, 'Aeroporto Internacional de São Paulo-Guarulhos', 'Guarulhos', 'São Paulo (estado)', 'Aeroporto de São Paulo-Congonhas', 'São Paulo', 'São Paulo (estado)', 'Aeroporto Internacional de Brasília', 'Brasília', 'Distrito Federal (Brasil)', 'Aeroporto Internacional do Rio de Janeiro-Galeão', 'Rio de Janeiro', 'Rio de Janeiro (estado)', 'Aeroporto Internacional de Belo Horizonte-Confins', 'Confins', 'Minas Gerais', 'Aeroporto Internacional de Campinas', 'Campinas', 'São Paulo (estado)', 'Aeroporto do Rio de Janeiro-Santos Dumont', 'Rio de Janeiro', 'Rio de Janeiro (estado)', 'Aeroporto Internacional do Recife-Guararapes', 'Recife', 'Pernambuco', 'Aeroporto Internacional de Porto Alegre', 'Porto Alegre', 'Rio Grande do Sul', 'Aeroporto Internacional de Salvador', 'Salvador (Bahia)', 'Bahia', 'Bahia', 'Aeroporto Internacional de Fortaleza', 'Fortaleza', 'Ceará', 'Aeroporto Internacional de Curitiba', 'São José dos Pinhais', 'Paraná', 'Aeroporto Internacional de Florianópolis', 'Florianó

In [7]:
df_air = pd.DataFrame()
df_air['Airport'] = Airports

df_air.head(60)

Unnamed: 0,Airport
0,
1,Aeroporto Internacional de São Paulo-Guarulhos
2,Guarulhos
3,São Paulo (estado)
4,Aeroporto de São Paulo-Congonhas
5,São Paulo
6,São Paulo (estado)
7,Aeroporto Internacional de Brasília
8,Brasília
9,Distrito Federal (Brasil)


#### Cleaning the new dataframe called df_air

In [8]:
df_air = df_air.drop([df_air.index[30] , df_air.index[43], df_air.index[71]])

df_air = df_air.iloc[1:]

In [9]:
df_air = df_air.reset_index()

In [10]:
df_original = df_air

#### Spliting one string in three columns: Airport, City and State

In [11]:
df_air = pd.DataFrame(df_air.Airport.values.reshape(-1,3),columns=['Airport','City','State'])

In [12]:
df_air

Unnamed: 0,Airport,City,State
0,Aeroporto Internacional de São Paulo-Guarulhos,Guarulhos,São Paulo (estado)
1,Aeroporto de São Paulo-Congonhas,São Paulo,São Paulo (estado)
2,Aeroporto Internacional de Brasília,Brasília,Distrito Federal (Brasil)
3,Aeroporto Internacional do Rio de Janeiro-Galeão,Rio de Janeiro,Rio de Janeiro (estado)
4,Aeroporto Internacional de Belo Horizonte-Confins,Confins,Minas Gerais
5,Aeroporto Internacional de Campinas,Campinas,São Paulo (estado)
6,Aeroporto do Rio de Janeiro-Santos Dumont,Rio de Janeiro,Rio de Janeiro (estado)
7,Aeroporto Internacional do Recife-Guararapes,Recife,Pernambuco
8,Aeroporto Internacional de Porto Alegre,Porto Alegre,Rio Grande do Sul
9,Aeroporto Internacional de Salvador,Salvador (Bahia),Bahia


#### Cleaning all the word inside parentheses and removing white spaces

In [13]:
#applying a regex to replace values

df_air['State'].replace(to_replace='[\(\[].*?[\)\]]', value='',inplace=True,regex=True)
df_air['City'].replace(to_replace='[\(\[].*?[\)\]]', value='',inplace=True,regex=True) 

In [14]:
#df_air['State'] = df_air['State'].str.replace(r"\(.*\)",'')
#df_air['City'] = df_air['City'].str.replace(r"\(.*\)",'')

In [15]:
# using the strip function to clean white spaces
df_air['State'] = df_air['State'].apply(lambda x: x.strip())
df_air['City'] = df_air['City'].apply(lambda x: x.strip())

In [16]:
df_air

Unnamed: 0,Airport,City,State
0,Aeroporto Internacional de São Paulo-Guarulhos,Guarulhos,São Paulo
1,Aeroporto de São Paulo-Congonhas,São Paulo,São Paulo
2,Aeroporto Internacional de Brasília,Brasília,Distrito Federal
3,Aeroporto Internacional do Rio de Janeiro-Galeão,Rio de Janeiro,Rio de Janeiro
4,Aeroporto Internacional de Belo Horizonte-Confins,Confins,Minas Gerais
5,Aeroporto Internacional de Campinas,Campinas,São Paulo
6,Aeroporto do Rio de Janeiro-Santos Dumont,Rio de Janeiro,Rio de Janeiro
7,Aeroporto Internacional do Recife-Guararapes,Recife,Pernambuco
8,Aeroporto Internacional de Porto Alegre,Porto Alegre,Rio Grande do Sul
9,Aeroporto Internacional de Salvador,Salvador,Bahia


#### To get the IDs from the cities that we are going to consult we need de Initials from each State:

In [17]:
#creating a dictionary with the key as States and the values as the Initials tha we need
State_Initials = {'Acre':'AC','Alagoas':'AL','Amapá':'AP','Amazonas':'AM','Bahia':'BA','Ceará':'CE','Distrito Federal':'DF',
                'Espírito Santo':'ES','Goiás':'GO','Maranhão':'MA','Mato Grosso':'MT','Mato Grosso do Sul':'MS',
                'Minas Gerais':'MG','Pará':'PA','Paraíba':'PB','Paraná':'PR','Pernambuco':'PE','Piauí':'PI','Rio de Janeiro':'RJ',
                'Rio Grande do Norte':'RN','Rio Grande do Sul':'RS','Rondônia':'RO','Roraima':'RR','Santa Catarina':'SC',
                'São Paulo':'SP','Sergipe':'SE','Tocantins':'TO'}

In [18]:
State_Initials_df = DataFrame(list(State_Initials.items()),columns = ['State','Initials'])

State_Initials_df

Unnamed: 0,State,Initials
0,Acre,AC
1,Alagoas,AL
2,Amapá,AP
3,Amazonas,AM
4,Bahia,BA
5,Ceará,CE
6,Distrito Federal,DF
7,Espírito Santo,ES
8,Goiás,GO
9,Maranhão,MA


#### Merging the State_Initials_df with df_air

In [19]:
df_air = pd.merge(df_air, State_Initials_df, on='State', how='left').fillna(0)

In [20]:
df_air

Unnamed: 0,Airport,City,State,Initials
0,Aeroporto Internacional de São Paulo-Guarulhos,Guarulhos,São Paulo,SP
1,Aeroporto de São Paulo-Congonhas,São Paulo,São Paulo,SP
2,Aeroporto Internacional de Brasília,Brasília,Distrito Federal,DF
3,Aeroporto Internacional do Rio de Janeiro-Galeão,Rio de Janeiro,Rio de Janeiro,RJ
4,Aeroporto Internacional de Belo Horizonte-Confins,Confins,Minas Gerais,MG
5,Aeroporto Internacional de Campinas,Campinas,São Paulo,SP
6,Aeroporto do Rio de Janeiro-Santos Dumont,Rio de Janeiro,Rio de Janeiro,RJ
7,Aeroporto Internacional do Recife-Guararapes,Recife,Pernambuco,PE
8,Aeroporto Internacional de Porto Alegre,Porto Alegre,Rio Grande do Sul,RS
9,Aeroporto Internacional de Salvador,Salvador,Bahia,BA


### Step 2 - Working with APIs

In [21]:
#Testing the API

In [22]:
response = requests.get('http://apiadvisor.climatempo.com.br/api/v1/locale/city?name=São Paulo&state=SP&token=8255c8cdeb0f00fd00df3b5c073585e7')

response

<Response [200]>

In [23]:
print(response.content)

b'[{"id":3477,"name":"S\\u00e3o Paulo","state":"SP","country":"BR  "}]'


In [24]:
api_token = '8255c8cdeb0f00fd00df3b5c073585e7'

#### The API that we are going to use it is from Climatempo ('https://advisor.climatempo.com.br/'). Before we get the curent weather from the locations above we need to get the ID from each city. The parameters we must send are City, Initials and the token provided 

In [25]:
def id_request(row):
    return {
            'name':row['City'],
            'state':row['Initials'],
            'token':api_token
    }

In [26]:
parameters = df_air.apply(id_request, axis=1).tolist()

In [27]:
print(parameters)

[{'name': 'Guarulhos', 'state': 'SP', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'name': 'São Paulo', 'state': 'SP', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'name': 'Brasília', 'state': 'DF', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'name': 'Rio de Janeiro', 'state': 'RJ', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'name': 'Confins', 'state': 'MG', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'name': 'Campinas', 'state': 'SP', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'name': 'Rio de Janeiro', 'state': 'RJ', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'name': 'Recife', 'state': 'PE', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'name': 'Porto Alegre', 'state': 'RS', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'name': 'Salvador', 'state': 'BA', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'name': 'Fortaleza', 'state': 'CE', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'name': 'São José dos Pinhais', 'state': 'PR', 'token': '8255c8cdeb0f00fd00df3b5

In [28]:
parameters[0]

{'name': 'Guarulhos',
 'state': 'SP',
 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}

In [29]:
#Iterating over the request with the dic parameters
info = list()
for val in parameters:
    temp = requests.get("http://apiadvisor.climatempo.com.br/api/v1/locale/city", params=val)
    if temp.ok == True:
        info.append(temp.content)
    else:
        info.append(0)
    time.sleep(7)

In [30]:
print(temp)

<Response [200]>


In [31]:
print(temp.content)

b'[{"id":6997,"name":"Londrina","state":"PR","country":"BR  "},{"id":6653,"name":"Nova Londrina","state":"PR","country":"BR  "}]'


In [32]:
print(info)

[b'[{"id":4235,"name":"Guarulhos","state":"SP","country":"BR  "}]', b'[{"id":3477,"name":"S\\u00e3o Paulo","state":"SP","country":"BR  "}]', b'[{"id":8173,"name":"Bras\\u00edlia","state":"DF","country":"BR  "}]', b'[{"id":5959,"name":"Rio de Janeiro","state":"RJ","country":"BR  "},{"id":73779,"name":"Rio de Janeiro - centro","state":"RJ","country":"BR  "}]', b'[{"id":8616,"name":"Confins","state":"MG","country":"BR  "}]', b'[{"id":4456,"name":"Campinas","state":"SP","country":"BR  "}]', b'[{"id":5959,"name":"Rio de Janeiro","state":"RJ","country":"BR  "},{"id":73779,"name":"Rio de Janeiro - centro","state":"RJ","country":"BR  "}]', b'[{"id":7140,"name":"Recife","state":"PE","country":"BR  "}]', b'[{"id":5346,"name":"Porto Alegre","state":"RS","country":"BR  "}]', b'[{"id":7564,"name":"Salvador","state":"BA","country":"BR  "}]', b'[{"id":8050,"name":"Fortaleza","state":"CE","country":"BR  "}]', b'[{"id":6551,"name":"S\\u00e3o Jos\\u00e9 dos Pinhais","state":"PR","country":"BR  "}]', b'[

In [33]:
#transforming id_table into a dataframe

id_table = pd.DataFrame(info)

id_table

Unnamed: 0,0
0,"b'[{""id"":4235,""name"":""Guarulhos"",""state"":""SP"",..."
1,"b'[{""id"":3477,""name"":""S\\u00e3o Paulo"",""state""..."
2,"b'[{""id"":8173,""name"":""Bras\\u00edlia"",""state"":..."
3,"b'[{""id"":5959,""name"":""Rio de Janeiro"",""state"":..."
4,"b'[{""id"":8616,""name"":""Confins"",""state"":""MG"",""c..."
5,"b'[{""id"":4456,""name"":""Campinas"",""state"":""SP"",""..."
6,"b'[{""id"":5959,""name"":""Rio de Janeiro"",""state"":..."
7,"b'[{""id"":7140,""name"":""Recife"",""state"":""PE"",""co..."
8,"b'[{""id"":5346,""name"":""Porto Alegre"",""state"":""R..."
9,"b'[{""id"":7564,""name"":""Salvador"",""state"":""BA"",""..."


In [34]:
#adding the id dataframe to df_air

df_air['API_response'] = id_table

df_air

Unnamed: 0,Airport,City,State,Initials,API_response
0,Aeroporto Internacional de São Paulo-Guarulhos,Guarulhos,São Paulo,SP,"b'[{""id"":4235,""name"":""Guarulhos"",""state"":""SP"",..."
1,Aeroporto de São Paulo-Congonhas,São Paulo,São Paulo,SP,"b'[{""id"":3477,""name"":""S\\u00e3o Paulo"",""state""..."
2,Aeroporto Internacional de Brasília,Brasília,Distrito Federal,DF,"b'[{""id"":8173,""name"":""Bras\\u00edlia"",""state"":..."
3,Aeroporto Internacional do Rio de Janeiro-Galeão,Rio de Janeiro,Rio de Janeiro,RJ,"b'[{""id"":5959,""name"":""Rio de Janeiro"",""state"":..."
4,Aeroporto Internacional de Belo Horizonte-Confins,Confins,Minas Gerais,MG,"b'[{""id"":8616,""name"":""Confins"",""state"":""MG"",""c..."
5,Aeroporto Internacional de Campinas,Campinas,São Paulo,SP,"b'[{""id"":4456,""name"":""Campinas"",""state"":""SP"",""..."
6,Aeroporto do Rio de Janeiro-Santos Dumont,Rio de Janeiro,Rio de Janeiro,RJ,"b'[{""id"":5959,""name"":""Rio de Janeiro"",""state"":..."
7,Aeroporto Internacional do Recife-Guararapes,Recife,Pernambuco,PE,"b'[{""id"":7140,""name"":""Recife"",""state"":""PE"",""co..."
8,Aeroporto Internacional de Porto Alegre,Porto Alegre,Rio Grande do Sul,RS,"b'[{""id"":5346,""name"":""Porto Alegre"",""state"":""R..."
9,Aeroporto Internacional de Salvador,Salvador,Bahia,BA,"b'[{""id"":7564,""name"":""Salvador"",""state"":""BA"",""..."


In [35]:
# using the astype(str) method to get only the 4 digit ID code

df_air['API_response'] = df_air['API_response'].astype(str)

df_air['ID'] = df_air['API_response'].str[9:13]

df_air

Unnamed: 0,Airport,City,State,Initials,API_response,ID
0,Aeroporto Internacional de São Paulo-Guarulhos,Guarulhos,São Paulo,SP,"b'[{""id"":4235,""name"":""Guarulhos"",""state"":""SP"",...",4235
1,Aeroporto de São Paulo-Congonhas,São Paulo,São Paulo,SP,"b'[{""id"":3477,""name"":""S\\u00e3o Paulo"",""state""...",3477
2,Aeroporto Internacional de Brasília,Brasília,Distrito Federal,DF,"b'[{""id"":8173,""name"":""Bras\\u00edlia"",""state"":...",8173
3,Aeroporto Internacional do Rio de Janeiro-Galeão,Rio de Janeiro,Rio de Janeiro,RJ,"b'[{""id"":5959,""name"":""Rio de Janeiro"",""state"":...",5959
4,Aeroporto Internacional de Belo Horizonte-Confins,Confins,Minas Gerais,MG,"b'[{""id"":8616,""name"":""Confins"",""state"":""MG"",""c...",8616
5,Aeroporto Internacional de Campinas,Campinas,São Paulo,SP,"b'[{""id"":4456,""name"":""Campinas"",""state"":""SP"",""...",4456
6,Aeroporto do Rio de Janeiro-Santos Dumont,Rio de Janeiro,Rio de Janeiro,RJ,"b'[{""id"":5959,""name"":""Rio de Janeiro"",""state"":...",5959
7,Aeroporto Internacional do Recife-Guararapes,Recife,Pernambuco,PE,"b'[{""id"":7140,""name"":""Recife"",""state"":""PE"",""co...",7140
8,Aeroporto Internacional de Porto Alegre,Porto Alegre,Rio Grande do Sul,RS,"b'[{""id"":5346,""name"":""Porto Alegre"",""state"":""R...",5346
9,Aeroporto Internacional de Salvador,Salvador,Bahia,BA,"b'[{""id"":7564,""name"":""Salvador"",""state"":""BA"",""...",7564


#### Now we are going to make the weather requests with the ID provided above, but before we need to indicate which ID we are goint to consult:

In [36]:
# for this URl we just need the ID and the token:
def weather_requests(df):
    return {
            'id':df['ID'],
            'token':api_token
            }

In [37]:
id_parameters = df_air.apply(weather_requests, axis=1).to_list()
print(id_parameters)

[{'id': '4235', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'id': '3477', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'id': '8173', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'id': '5959', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'id': '8616', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'id': '4456', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'id': '5959', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'id': '7140', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'id': '5346', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'id': '7564', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'id': '8050', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'id': '6551', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'id': '4915', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'id': '7704', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'id': '8284', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'id': '8303', 'token': '8255c8cdeb0f00fd00df3b5c073585e7'}, {'id': '7544', 'token':

In [38]:
# creating a function do create a list of ID requests to iterate over:
def string_sep(dictionary, strings):
  string_list = []
  for i in range(len(dictionary)):
    string_list.append(strings.format(**dictionary[i]))

  return string_list

In [39]:
# creating the ID URLS list

weather_url = "http://apiadvisor.climatempo.com.br/api/v1/weather/locale/{id}/current?token={token}"

id_url = string_sep(id_parameters, weather_url)

id_url = list(id_url)

id_url

['http://apiadvisor.climatempo.com.br/api/v1/weather/locale/4235/current?token=8255c8cdeb0f00fd00df3b5c073585e7',
 'http://apiadvisor.climatempo.com.br/api/v1/weather/locale/3477/current?token=8255c8cdeb0f00fd00df3b5c073585e7',
 'http://apiadvisor.climatempo.com.br/api/v1/weather/locale/8173/current?token=8255c8cdeb0f00fd00df3b5c073585e7',
 'http://apiadvisor.climatempo.com.br/api/v1/weather/locale/5959/current?token=8255c8cdeb0f00fd00df3b5c073585e7',
 'http://apiadvisor.climatempo.com.br/api/v1/weather/locale/8616/current?token=8255c8cdeb0f00fd00df3b5c073585e7',
 'http://apiadvisor.climatempo.com.br/api/v1/weather/locale/4456/current?token=8255c8cdeb0f00fd00df3b5c073585e7',
 'http://apiadvisor.climatempo.com.br/api/v1/weather/locale/5959/current?token=8255c8cdeb0f00fd00df3b5c073585e7',
 'http://apiadvisor.climatempo.com.br/api/v1/weather/locale/7140/current?token=8255c8cdeb0f00fd00df3b5c073585e7',
 'http://apiadvisor.climatempo.com.br/api/v1/weather/locale/5346/current?token=8255c8cde

In [40]:
# creating a function to sent the IDs and getting the weather from them

confirmation = []
weather =[]
for i in df_air['ID']:
  id_data = 'localeId[]=' + i
  header = {'Content-Type': 'application/x-www-form-urlencoded'}
  temp = requests.put('http://apiadvisor.climatempo.com.br/api-manager/user-token/8255c8cdeb0f00fd00df3b5c073585e7/locales', data=id_data, headers=header)
  if temp.ok == True:
    time.sleep(7)
    for x in id_url:
      temp2 = requests.get(x)
      if temp2.ok == True:
        weather.append(temp2.content.decode("ISO-8859-1"))
      else:
        weather.append(temp2.content)
        time.sleep(7)
  else:
        confirmation.append(0)
  time.sleep(7)

In [41]:
weather

['{"id":4235,"name":"Guarulhos","state":"SP","country":"BR  ","data":{"temperature":21,"wind_direction":"S","wind_velocity":6,"humidity":88,"condition":"C\\u00e9u encoberto","pressure":1017,"icon":"3n","sensation":21,"date":"2020-02-14 19:58:41"}}',
 b'{"error":true,"detail":"Access forbidden, you have no acces for this locale: 3477"}',
 b'{"error":true,"detail":"Access forbidden, you have no acces for this locale: 8173"}',
 b'{"error":true,"detail":"Access forbidden, you have no acces for this locale: 5959"}',
 b'{"error":true,"detail":"Access forbidden, you have no acces for this locale: 8616"}',
 b'{"error":true,"detail":"Access forbidden, you have no acces for this locale: 4456"}',
 b'{"error":true,"detail":"Access forbidden, you have no acces for this locale: 5959"}',
 b'{"error":true,"detail":"Access forbidden, you have no acces for this locale: 7140"}',
 b'{"error":true,"detail":"Access forbidden, you have no acces for this locale: 5346"}',
 b'{"error":true,"detail":"Access forb

In [42]:
bkp = weather

In [43]:
weather = pd.DataFrame(weather)

In [44]:
weather.columns = ['results']

In [45]:
weather['results'] = weather['results'].astype(str)

In [46]:
weather = weather[~weather.results.str.contains("error")]

In [47]:
weather = weather.reset_index()

In [48]:
weather = weather.drop_duplicates()

In [49]:
weather

Unnamed: 0,index,results
0,0,"{""id"":4235,""name"":""Guarulhos"",""state"":""SP"",""co..."
1,31,"{""id"":3477,""name"":""S\u00e3o Paulo"",""state"":""SP..."
2,62,"{""id"":8173,""name"":""Bras\u00edlia"",""state"":""DF""..."
3,93,"{""id"":5959,""name"":""Rio de Janeiro"",""state"":""RJ..."
4,96,"{""id"":5959,""name"":""Rio de Janeiro"",""state"":""RJ..."
5,124,"{""id"":8616,""name"":""Confins"",""state"":""MG"",""coun..."
6,155,"{""id"":4456,""name"":""Campinas"",""state"":""SP"",""cou..."
7,183,"{""id"":5959,""name"":""Rio de Janeiro"",""state"":""RJ..."
8,186,"{""id"":5959,""name"":""Rio de Janeiro"",""state"":""RJ..."
9,217,"{""id"":7140,""name"":""Recife"",""state"":""PE"",""count..."


In [50]:
weather = weather.drop([weather.index[3] , weather.index[7]])

In [51]:
weather = weather.reset_index()

In [52]:
weather = weather.drop(['level_0','index'], axis = 1)

In [53]:
weather = weather = pd.DataFrame(weather)

In [54]:
weather

Unnamed: 0,results
0,"{""id"":4235,""name"":""Guarulhos"",""state"":""SP"",""co..."
1,"{""id"":3477,""name"":""S\u00e3o Paulo"",""state"":""SP..."
2,"{""id"":8173,""name"":""Bras\u00edlia"",""state"":""DF""..."
3,"{""id"":5959,""name"":""Rio de Janeiro"",""state"":""RJ..."
4,"{""id"":8616,""name"":""Confins"",""state"":""MG"",""coun..."
5,"{""id"":4456,""name"":""Campinas"",""state"":""SP"",""cou..."
6,"{""id"":5959,""name"":""Rio de Janeiro"",""state"":""RJ..."
7,"{""id"":7140,""name"":""Recife"",""state"":""PE"",""count..."
8,"{""id"":5346,""name"":""Porto Alegre"",""state"":""RS"",..."
9,"{""id"":7564,""name"":""Salvador"",""state"":""BA"",""cou..."


In [55]:
df_air['weather_now'] = weather['results']

In [56]:
df_air

Unnamed: 0,Airport,City,State,Initials,API_response,ID,weather_now
0,Aeroporto Internacional de São Paulo-Guarulhos,Guarulhos,São Paulo,SP,"b'[{""id"":4235,""name"":""Guarulhos"",""state"":""SP"",...",4235,"{""id"":4235,""name"":""Guarulhos"",""state"":""SP"",""co..."
1,Aeroporto de São Paulo-Congonhas,São Paulo,São Paulo,SP,"b'[{""id"":3477,""name"":""S\\u00e3o Paulo"",""state""...",3477,"{""id"":3477,""name"":""S\u00e3o Paulo"",""state"":""SP..."
2,Aeroporto Internacional de Brasília,Brasília,Distrito Federal,DF,"b'[{""id"":8173,""name"":""Bras\\u00edlia"",""state"":...",8173,"{""id"":8173,""name"":""Bras\u00edlia"",""state"":""DF""..."
3,Aeroporto Internacional do Rio de Janeiro-Galeão,Rio de Janeiro,Rio de Janeiro,RJ,"b'[{""id"":5959,""name"":""Rio de Janeiro"",""state"":...",5959,"{""id"":5959,""name"":""Rio de Janeiro"",""state"":""RJ..."
4,Aeroporto Internacional de Belo Horizonte-Confins,Confins,Minas Gerais,MG,"b'[{""id"":8616,""name"":""Confins"",""state"":""MG"",""c...",8616,"{""id"":8616,""name"":""Confins"",""state"":""MG"",""coun..."
5,Aeroporto Internacional de Campinas,Campinas,São Paulo,SP,"b'[{""id"":4456,""name"":""Campinas"",""state"":""SP"",""...",4456,"{""id"":4456,""name"":""Campinas"",""state"":""SP"",""cou..."
6,Aeroporto do Rio de Janeiro-Santos Dumont,Rio de Janeiro,Rio de Janeiro,RJ,"b'[{""id"":5959,""name"":""Rio de Janeiro"",""state"":...",5959,"{""id"":5959,""name"":""Rio de Janeiro"",""state"":""RJ..."
7,Aeroporto Internacional do Recife-Guararapes,Recife,Pernambuco,PE,"b'[{""id"":7140,""name"":""Recife"",""state"":""PE"",""co...",7140,"{""id"":7140,""name"":""Recife"",""state"":""PE"",""count..."
8,Aeroporto Internacional de Porto Alegre,Porto Alegre,Rio Grande do Sul,RS,"b'[{""id"":5346,""name"":""Porto Alegre"",""state"":""R...",5346,"{""id"":5346,""name"":""Porto Alegre"",""state"":""RS"",..."
9,Aeroporto Internacional de Salvador,Salvador,Bahia,BA,"b'[{""id"":7564,""name"":""Salvador"",""state"":""BA"",""...",7564,"{""id"":7564,""name"":""Salvador"",""state"":""BA"",""cou..."


In [57]:
df_air['test'] = df_air['weather_now']

In [58]:
df_air['test'].str.split('"data":{')

0     [{"id":4235,"name":"Guarulhos","state":"SP","c...
1     [{"id":3477,"name":"S\u00e3o Paulo","state":"S...
2     [{"id":8173,"name":"Bras\u00edlia","state":"DF...
3     [{"id":5959,"name":"Rio de Janeiro","state":"R...
4     [{"id":8616,"name":"Confins","state":"MG","cou...
5     [{"id":4456,"name":"Campinas","state":"SP","co...
6     [{"id":5959,"name":"Rio de Janeiro","state":"R...
7     [{"id":7140,"name":"Recife","state":"PE","coun...
8     [{"id":5346,"name":"Porto Alegre","state":"RS"...
9     [{"id":7564,"name":"Salvador","state":"BA","co...
10    [{"id":8050,"name":"Fortaleza","state":"CE","c...
11    [{"id":6551,"name":"S\u00e3o Jos\u00e9 dos Pin...
12    [{"id":4915,"name":"Florian\u00f3polis","state...
13    [{"id":7704,"name":"Bel\u00e9m","state":"PA","...
14    [{"id":8284,"name":"Vit\u00f3ria","state":"ES"...
15    [{"id":8303,"name":"Aparecida de Goi\u00e2nia"...
16    [{"id":7544,"name":"Manaus","state":"AM","coun...
17    [{"id":7694,"name":"V\u00e1rzea Grande","s

In [59]:
def hyphen_split(a):
    if a.count("{") == 1:
        return a.split("{")[0]
    else:
        return "{".join(a.split("{", 2)[:2])

In [60]:
df_air['test'] = df_air['test'].str.split(':{').str[-1].str.strip()

In [61]:
df_air['test']

0     "temperature":21,"wind_direction":"S","wind_ve...
1     "temperature":20,"wind_direction":"SSE","wind_...
2     "temperature":25,"wind_direction":"S","wind_ve...
3     "temperature":25,"wind_direction":"SSE","wind_...
4     "temperature":25,"wind_direction":"NE","wind_v...
5     "temperature":30,"wind_direction":"SW","wind_v...
6     "temperature":25,"wind_direction":"SSE","wind_...
7     "temperature":29,"wind_direction":"ND","wind_v...
8     "temperature":30,"wind_direction":"W","wind_ve...
9     "temperature":27,"wind_direction":"ENE","wind_...
10    "temperature":28,"wind_direction":"ENE","wind_...
11    "temperature":21,"wind_direction":"ESE","wind_...
12    "temperature":26,"wind_direction":"N","wind_ve...
13    "temperature":25,"wind_direction":"E","wind_ve...
14    "temperature":28,"wind_direction":"E","wind_ve...
15    "temperature":26,"wind_direction":"W","wind_ve...
16    "temperature":27,"wind_direction":"N","wind_ve...
17    "temperature":30,"wind_direction":"S","win

In [0]:
df_air

Unnamed: 0,Airport,City,State,Initials,API_response,ID,weather_now,test
0,Aeroporto Internacional de São Paulo-Guarulhos,Guarulhos,São Paulo,SP,"b'[{""id"":4235,""name"":""Guarulhos"",""state"":""SP"",...",4235,"{""id"":4235,""name"":""Guarulhos"",""state"":""SP"",""co...","""temperature"":22,""wind_direction"":""SSE"",""wind_..."
1,Aeroporto de São Paulo-Congonhas,São Paulo,São Paulo,SP,"b'[{""id"":3477,""name"":""S\\u00e3o Paulo"",""state""...",3477,"{""id"":3477,""name"":""S\u00e3o Paulo"",""state"":""SP...","""temperature"":22,""wind_direction"":""S"",""wind_ve..."
2,Aeroporto Internacional de Brasília,Brasília,Distrito Federal,DF,"b'[{""id"":8173,""name"":""Bras\\u00edlia"",""state"":...",8173,"{""id"":8173,""name"":""Bras\u00edlia"",""state"":""DF""...","""temperature"":24,""wind_direction"":""ENE"",""wind_..."
3,Aeroporto Internacional do Rio de Janeiro-Galeão,Rio de Janeiro,Rio de Janeiro,RJ,"b'[{""id"":5959,""name"":""Rio de Janeiro"",""state"":...",5959,"{""id"":5959,""name"":""Rio de Janeiro"",""state"":""RJ...","""temperature"":24,""wind_direction"":""ESE"",""wind_..."
4,Aeroporto Internacional de Belo Horizonte-Confins,Confins,Minas Gerais,MG,"b'[{""id"":8616,""name"":""Confins"",""state"":""MG"",""c...",8616,"{""id"":8616,""name"":""Confins"",""state"":""MG"",""coun...","""temperature"":20,""wind_direction"":""ESE"",""wind_..."
5,Aeroporto Internacional de Campinas,Campinas,São Paulo,SP,"b'[{""id"":4456,""name"":""Campinas"",""state"":""SP"",""...",4456,"{""id"":4456,""name"":""Campinas"",""state"":""SP"",""cou...","""temperature"":27,""wind_direction"":""SSE"",""wind_..."
6,Aeroporto do Rio de Janeiro-Santos Dumont,Rio de Janeiro,Rio de Janeiro,RJ,"b'[{""id"":5959,""name"":""Rio de Janeiro"",""state"":...",5959,"{""id"":5959,""name"":""Rio de Janeiro"",""state"":""RJ...","""temperature"":24,""wind_direction"":""ESE"",""wind_..."
7,Aeroporto Internacional do Recife-Guararapes,Recife,Pernambuco,PE,"b'[{""id"":7140,""name"":""Recife"",""state"":""PE"",""co...",7140,"{""id"":7140,""name"":""Recife"",""state"":""PE"",""count...","""temperature"":29,""wind_direction"":""SE"",""wind_v..."
8,Aeroporto Internacional de Porto Alegre,Porto Alegre,Rio Grande do Sul,RS,"b'[{""id"":5346,""name"":""Porto Alegre"",""state"":""R...",5346,"{""id"":5346,""name"":""Porto Alegre"",""state"":""RS"",...","""temperature"":28,""wind_direction"":""ESE"",""wind_..."
9,Aeroporto Internacional de Salvador,Salvador,Bahia,BA,"b'[{""id"":7564,""name"":""Salvador"",""state"":""BA"",""...",7564,"{""id"":7564,""name"":""Salvador"",""state"":""BA"",""cou...","""temperature"":29,""wind_direction"":""ESE"",""wind_..."
