# **Equipo 12** Postwork 6: Automatización y APIs

OBJETIVO
- Practicar el uso de APIs y peticiones HTTP.
- Automatizar procesos de exploración y limpieza usando for loops.
- Proteger nuestro código contra errores usando try except.

REQUISITOS
- Haber realizado previamente la primer fase de limpieza de tu dataset







# [ Covid-19-API](https://github.com/M-Media-Group/Covid-19-API)

**Descripcion:** Covid 19 cases, deaths and recovery per country

**Authorization:** No authorisation is required to fetch data from the API.



Lo que vamos a realizar utilizando esta API es crear un dataset con  informacion sobre:
- Casos confirmados
- Defunciones
- Fecha de actualizacion
- Tasa de letalidad

para cada estado donde vivimos los integrantes del equipo

## Requests a la API

In [None]:
#libreria requests
import requests

In [None]:
#API base
url_2='https://covid-api.mmediagroup.fr/v1/cases'

In [None]:
#parametros, seleccionamos la informacion de México
payload={
    'country':'Mexico'
}

In [None]:
#guardamos el requests
r=requests.get(url_2,params=payload)

In [None]:
#resultado
r.json()

{'Aguascalientes': {'confirmed': 29004,
  'deaths': 2519,
  'lat': '21.8853',
  'long': '-102.2916',
  'recovered': 0,
  'updated': '2021/08/13 17:21:29+00'},
 'All': {'abbreviation': 'MX',
  'capital_city': 'Ciudad de M',
  'confirmed': 3045571,
  'continent': 'North America',
  'country': 'Mexico',
  'deaths': 246811,
  'elevation_in_meters': '1,111',
  'iso': 484,
  'lat': '19.4969',
  'life_expectancy': '71.5',
  'location': 'Central America',
  'long': '-99.7233',
  'population': 129163276,
  'recovered': 0,
  'sq_km_area': 1958201},
 'Baja California': {'confirmed': 54037,
  'deaths': 8965,
  'lat': '30.8406',
  'long': '-115.2838',
  'recovered': 0,
  'updated': '2021/08/13 17:21:29+00'},
 'Baja California Sur': {'confirmed': 51384,
  'deaths': 2091,
  'lat': '26.0444',
  'long': '-111.6661',
  'recovered': 0,
  'updated': '2021/08/13 17:21:29+00'},
 'Campeche': {'confirmed': 16301,
  'deaths': 1538,
  'lat': '19.8301',
  'long': '-90.5349',
  'recovered': 0,
  'updated': '2021/

In [None]:
#guardamos  nuestro json
data=r.json()

In [None]:
#las keys son los estados dentro del pais
data.keys()

dict_keys(['All', 'Aguascalientes', 'Baja California', 'Baja California Sur', 'Campeche', 'Chiapas', 'Chihuahua', 'Ciudad de Mexico', 'Coahuila', 'Colima', 'Durango', 'Guanajuato', 'Guerrero', 'Hidalgo', 'Jalisco', 'Mexico', 'Michoacan', 'Morelos', 'Nayarit', 'Nuevo Leon', 'Oaxaca', 'Puebla', 'Queretaro', 'Quintana Roo', 'San Luis Potosi', 'Sinaloa', 'Sonora', 'Tabasco', 'Tamaulipas', 'Tlaxcala', 'Unknown', 'Veracruz', 'Yucatan', 'Zacatecas'])

In [None]:
#filtramos un estado para conocer la informacion que tenemos
data['Guanajuato']

{'confirmed': 143637,
 'deaths': 11265,
 'lat': '21.019',
 'long': '-101.2574',
 'recovered': 0,
 'updated': '2021/08/13 17:21:29+00'}

# Creamos el dataset concatenando la informacion de los siguientes estados:

- Guanajuato, Andrés y Juan
- Nayarit, Arath
- Estado de Mexico, Saul y Cesar
- Yucatán, Sofía



In [None]:
import pandas as pd

In [None]:
#lista  con los nombres de los estados de los ingrantes del equipo
estados=['Guanajuato','Nayarit','Mexico','Yucatan']

In [None]:
#creamos un dataframe vacio para concatenar los datos de cada estado
df_covid_19=pd.DataFrame()

In [None]:
#normalizamos los diccionarios, los convertimos en df y los concatenamos  

#utilizamos el try, except en caso de que el nombre de un estado se escriba incorrectamente
for estado in estados:
  try:
    normalized_estado=pd.json_normalize(data[estado])
    df_estado=pd.DataFrame.from_dict(normalized_estado)
    df_covid_19=pd.concat([df_covid_19,df_estado],axis=0)

  except:
    print('El nombre del estado es incorrecto')
    estados.pop(estados.index(estado))

df_covid_19

Unnamed: 0,lat,long,confirmed,recovered,deaths,updated
0,21.019,-101.2574,143637,0,11265,2021/08/13 17:21:29+00
0,21.7514,-104.8455,23836,0,2170,2021/08/13 17:21:29+00
0,19.4969,-99.7233,311224,0,39157,2021/08/13 17:21:29+00
0,20.7099,-89.0943,56968,0,4674,2021/08/13 17:21:29+00


In [None]:
estados

['Guanajuato', 'Nayarit', 'Mexico', 'Yucatan']

In [None]:
#Agregamos una nueva columna al df con los nombres de los estados
df_covid_19['state']=estados
df_covid_19
#las columnas lat y long no tienen importancia para nosotros
#  la columna recovered si es importante pero la API la desprecia asi que tambien la omitimos

Unnamed: 0,lat,long,confirmed,recovered,deaths,updated,state
0,21.019,-101.2574,143637,0,11265,2021/08/13 17:21:29+00,Guanajuato
0,21.7514,-104.8455,23836,0,2170,2021/08/13 17:21:29+00,Nayarit
0,19.4969,-99.7233,311224,0,39157,2021/08/13 17:21:29+00,Mexico
0,20.7099,-89.0943,56968,0,4674,2021/08/13 17:21:29+00,Yucatan


In [None]:
#Seleccionamos las columnas y el orden que necesitamos
df_covid_19=df_covid_19[['state','updated','confirmed','deaths']]
df_covid_19

Unnamed: 0,state,updated,confirmed,deaths
0,Guanajuato,2021/08/13 17:21:29+00,143637,11265
0,Nayarit,2021/08/13 17:21:29+00,23836,2170
0,Mexico,2021/08/13 17:21:29+00,311224,39157
0,Yucatan,2021/08/13 17:21:29+00,56968,4674


In [None]:
# tenemos dos columnas tipo object y dos tipo int
df_covid_19.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 4 entries, 0 to 0
Data columns (total 4 columns):
 #   Column     Non-Null Count  Dtype 
---  ------     --------------  ----- 
 0   state      4 non-null      object
 1   updated    4 non-null      object
 2   confirmed  4 non-null      int64 
 3   deaths     4 non-null      int64 
dtypes: int64(2), object(2)
memory usage: 160.0+ bytes


In [None]:
#cambiamos el indice en nuestro df para que no sean todos 0
#utilizamos esta estructura para no tener que modificar el codigo si es necesario ingresar un nuevo estado
indices=[estado +1 for estado in range(len(estados))]
df_covid_19.index=indices
df_covid_19

Unnamed: 0,state,updated,confirmed,deaths
1,Guanajuato,2021/08/13 17:21:29+00,143637,11265
2,Nayarit,2021/08/13 17:21:29+00,23836,2170
3,Mexico,2021/08/13 17:21:29+00,311224,39157
4,Yucatan,2021/08/13 17:21:29+00,56968,4674


**La fecha de actualizacion tambien tiene la hora, pero solo nos interesa la fecha**

In [None]:
#separamos la fecha y la hora de nuestro df en 2 columnas distintas
df_covid_19['updated'].str.split('\s',expand=True)

Unnamed: 0,0,1
1,2021/08/13,17:21:29+00
2,2021/08/13,17:21:29+00
3,2021/08/13,17:21:29+00
4,2021/08/13,17:21:29+00


In [None]:
#asignamos solamente la columna fecha a nuestro df
df_covid_19['updated']=df_covid_19['updated'].str.split('\s',expand=True)[0]

In [None]:
df_covid_19

Unnamed: 0,state,updated,confirmed,deaths
1,Guanajuato,2021/08/13,143637,11265
2,Nayarit,2021/08/13,23836,2170
3,Mexico,2021/08/13,311224,39157
4,Yucatan,2021/08/13,56968,4674


### **Agregamos la columna extra para conocer la tasa de letalidad del COVID-19 en cada estado**

**La tasa de letalidad**

"Es el cociente entre el número de fallecimientos a causa de una determinada enfermedad en un período de tiempo y el número de afectados por esa misma enfermedad en ese mismo período".

In [None]:
#obtenemos una lista con la tasa de letalidad para cada estado

#lista vacia para guardar los valores
fatality_rate_list=[]
#funcion para calcular la letaldad
def fatality_rate_function():
  for indice in indices: 
    fatality_rate_list.append((df_covid_19['deaths'][indice]/df_covid_19['confirmed'][indice])*100)

#llamamos a la funcion
fatality_rate_function()
#lista final
fatality_rate_list


[7.842686772906703, 9.10387648934385, 12.581613243194612, 8.204606094649627]

In [None]:
#tenemos muchos decimales, redondearemos nuestro resultado a los primeros 3
#para ello utilizaremos numpy 
import numpy as np


In [None]:
fatality_rate_list=np.round(fatality_rate_list,3)
fatality_rate_list

array([ 7.843,  9.104, 12.582,  8.205])

In [None]:
#agregamos la nueva columna a nuestro df
df_covid_19['case_fatality_rate(%)']=fatality_rate_list

In [None]:
#ya tenemos nuestro df limpio y ordenado con la nueva columna que nos indica la tasa de letalidad en cada uno de nuestros estados
df_covid_19

Unnamed: 0,state,updated,confirmed,deaths,case_fatality_rate(%)
1,Guanajuato,2021/08/13,143637,11265,7.843
2,Nayarit,2021/08/13,23836,2170,9.104
3,Mexico,2021/08/13,311224,39157,12.582
4,Yucatan,2021/08/13,56968,4674,8.205
