## Usando la librería Request 

$ python -m pip install requests

Es importante instalarlo de manera global o revisar si es virtual, ya que tuve muchos problemas.

In [1]:
import requests
import pandas as pd

Vamos a hacer peticiones a una api de la NASA que ofrece datos sobre objetos que orbitan cerca de la Tierra. Pueden ver la documentación [aqui](https://api.nasa.gov/). Ahí podemos ver los endpoints y la manera en la que se usa la Api Key. Ve a la página y consigue tu propia Api Key para que puedas realizar los ejercicios.

Ahora, para empezar, necesitamos nuestro endpoint y nuestro diccionario de parámetros.

In [62]:
endpoint = 'https://api.nasa.gov/neo/rest/v1/neo/browse?api_key=DEMO_KEY'
payload = {'api_key': 'T7u3esh2ylnMbWjIhLfpMaeLJ8LmVd3HkoliFzsg'}

Ambos se los pasamos al método GET de requests para realizar la petición a ese endpoint y enviar los parámetros como información extra que el API necesita para validar nuestra petición:

In [63]:
r = requests.get(endpoint, params=payload)

Ahora, podemos leer lo siguiente de nuestro objeto de respuesta:

In [64]:
r.status_code

200

In [65]:
json = r.json()

In [66]:
json.keys()

dict_keys(['links', 'page', 'near_earth_objects'])

In [67]:
json['links']

{'next': 'http://api.nasa.gov/neo/rest/v1/neo/browse?page=1&size=20&api_key=DEMO_KEY',
 'self': 'http://api.nasa.gov/neo/rest/v1/neo/browse?page=0&size=20&api_key=DEMO_KEY'}

In [68]:
json['page']

{'size': 20, 'total_elements': 37902, 'total_pages': 1896, 'number': 0}

In [69]:
data = json['near_earth_objects']

In [70]:
data[0]

{'links': {'self': 'http://api.nasa.gov/neo/rest/v1/neo/2000433?api_key=DEMO_KEY'},
 'id': '2000433',
 'neo_reference_id': '2000433',
 'name': '433 Eros (A898 PA)',
 'name_limited': 'Eros',
 'designation': '433',
 'nasa_jpl_url': 'https://ssd.jpl.nasa.gov/tools/sbdb_lookup.html#/?sstr=2000433',
 'absolute_magnitude_h': 10.41,
 'estimated_diameter': {'kilometers': {'estimated_diameter_min': 22.0067027115,
   'estimated_diameter_max': 49.2084832235},
  'meters': {'estimated_diameter_min': 22006.7027114738,
   'estimated_diameter_max': 49208.4832234845},
  'miles': {'estimated_diameter_min': 13.6743268705,
   'estimated_diameter_max': 30.5767244291},
  'feet': {'estimated_diameter_min': 72200.4705239119,
   'estimated_diameter_max': 161445.1600989368}},
 'is_potentially_hazardous_asteroid': False,
 'close_approach_data': [{'close_approach_date': '1900-12-27',
   'close_approach_date_full': '1900-Dec-27 01:30',
   'epoch_date_close_approach': -2177879400000,
   'relative_velocity': {'kilom

`links` y `page` son metadata que vamos a utilizar luego para automatizar el proceso de peticiones. data es una lista de diccionarios que contiene los datos que queremos utilizar. Vamos a convertirlos en un DataFrame:

In [71]:
normalized = pd.json_normalize(data)

df = pd.DataFrame.from_dict(normalized)

df.head()

Unnamed: 0,id,neo_reference_id,name,name_limited,designation,nasa_jpl_url,absolute_magnitude_h,is_potentially_hazardous_asteroid,close_approach_data,is_sentry_object,...,orbital_data.perihelion_distance,orbital_data.perihelion_argument,orbital_data.aphelion_distance,orbital_data.perihelion_time,orbital_data.mean_anomaly,orbital_data.mean_motion,orbital_data.equinox,orbital_data.orbit_class.orbit_class_type,orbital_data.orbit_class.orbit_class_description,orbital_data.orbit_class.orbit_class_range
0,2000433,2000433,433 Eros (A898 PA),Eros,433,https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,10.41,False,"[{'close_approach_date': '1900-12-27', 'close_...",False,...,1.133458052992745,178.9102909699136,1.782904615277399,2460445.664780181,86.6675514525051,0.5597405522715084,J2000,AMO,Near-Earth asteroid orbits similar to that of ...,1.017 AU < q (perihelion) < 1.3 AU
1,2000719,2000719,719 Albert (A911 TB),Albert,719,https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,15.59,False,"[{'close_approach_date': '1909-08-21', 'close_...",False,...,1.19476035548719,156.2155261769503,4.07755393959166,2459955.8335730024,148.4506773209914,0.2302751796962134,J2000,AMO,Near-Earth asteroid orbits similar to that of ...,1.017 AU < q (perihelion) < 1.3 AU
2,2000887,2000887,887 Alinda (A918 AA),Alinda,887,https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,13.84,False,"[{'close_approach_date': '1974-01-04', 'close_...",False,...,1.06048261982238,350.4742461310368,3.884567382539453,2460678.6099920897,340.1984297817156,0.2535087981517903,J2000,AMO,Near-Earth asteroid orbits similar to that of ...,1.017 AU < q (perihelion) < 1.3 AU
3,2001036,2001036,1036 Ganymed (A924 UB),Ganymed,1036,https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,9.18,False,"[{'close_approach_date': '1910-02-25', 'close_...",False,...,1.245158481022833,132.4961444460951,4.085439038246464,2460569.6625112286,6.984964970516151,0.2265088776311576,J2000,AMO,Near-Earth asteroid orbits similar to that of ...,1.017 AU < q (perihelion) < 1.3 AU
4,2001221,2001221,1221 Amor (1932 EA1),Amor,1221,https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,17.38,False,"[{'close_approach_date': '1908-03-14', 'close_...",False,...,1.085428152631312,26.7176005107723,2.754879623203948,2460838.8728195266,271.7008031502767,0.3704247700094682,J2000,AMO,Near-Earth asteroid orbits similar to that of ...,1.017 AU < q (perihelion) < 1.3 AU


¡Listo! Ahora tenemos un `DataFrame` con los datos de nuestra primera petición. En esta sesión vamos a aprender a automatizar este proceso. Pero antes, practiquemos un poco el uso de la librería requests.

## For Loops

Los for loops nos ayudan a automatizar procesos. Básicamente definimos primero sobre qué queremos iterar (o ciclar), después definimos una variable (o variables) que van a recibir cada valor de la iteración, y luego tenemos el bloque del for loop, que es donde realizamos los procesos a automatizar. Mira cómo se ven en acción:

In [72]:
for i in range(0, 10):
    print(i)


0
1
2
3
4
5
6
7
8
9


In [73]:
lista_de_numeros = []

for i in range(0, 50):
    lista_de_numeros.append(i)
    
print(lista_de_numeros)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49]


In [74]:
numero = 150

for _ in range(0, 20):
    
    # este proceso es independiente del loop, por eso no usamos la variable del loop
    # en este caso el loop solo sirve para realizar una tarea repetidas veces
    
    numero = numero + 1

print(numero)

170


In [75]:
dict_1 = {
    'a': 1,
    'b': 2,
    'c': 3,
    'd': 4,
    'e': 5
}

for key in dict_1:
    print(dict_1[key])

1
2
3
4
5


## Excepciones y try except

Durante el proceso de un programa pueden suceder diferentes tipos de errores, que llamamos Excepciones. Una Excepción puede suceder en alguno de estos casos, por ejemplo:

lista_1 = [1, 2, 3, 4, 5]

lista_1[10]

---------------------------------------------------------------------------
IndexError                                Traceback (most recent call last)<br>
Cell In[76], line 3<br>
      1 lista_1 = [1, 2, 3, 4, 5]<br>
----> 3 lista_1[10]<br>
<br>
IndexError: list index out of range<br>


dict_1 = {<br>
    'a': 1,<br>
    'b': 2,<br>
    'c': 3,<br>
    'd': 4<br>
}<br>
<br>
dict_1['z']<br>

---------------------------------------------------------------------------
KeyError                                  Traceback (most recent call last)<br>
Cell In[77], line 8<br>
      1 dict_1 = {<br>
      2     'a': 1,<br>
      3     'b': 2,<br>
      4     'c': 3,<br>
      5     'd': 4<br>
      6 }<br>
----> 8 dict_1['z']<br>
<br>
KeyError: 'z'<br>

int("Holi")<br>

---------------------------------------------------------------------------
ValueError<br>                                Traceback (most recent call last)
Cell In[78], line 1<br>
----> 1 int("Holi")<br>
<br>
ValueError: invalid literal for int() with base 10: 'Holi'<br>

Cuando automatizamos programas, tenemos que evitar que Excepciones ocurran, pues detendrían nuestro programa y arruinarían nuestra automatización. Podemos usar estructuras try except para evitar que esto suceda:

In [79]:
lista_2 = [1, 2, 3, 4, 5]

try:
    print(lista_2[10])
except:
    print("Ese numero esta fuera de rango")
    print("Mejor leamos este número")
    print(lista_2[2])

Ese numero esta fuera de rango
Mejor leamos este número
3


In [80]:
dict_2 = {
    'a': 1,
    'b': 2,
    'c': 3,
    'd': 4
}

try:
    print(dict_2['z'])
except:
    print("Esa llave no existe")
    print("Mejor leamos esta llave")
    print(dict_2['b'])

Esa llave no existe
Mejor leamos esta llave
2


In [81]:
try:
    print(int("Holi"))
except:
    print("Ese no es un número")
    print("Mejor vamos a imprimirlo convirtiéndolo en una lista")
    print(list("Holi"))

Ese no es un número
Mejor vamos a imprimirlo convirtiéndolo en una lista
['H', 'o', 'l', 'i']


## Concat con Series

Muchas veces vamos a tener `Series` o `DataFrames` que queremos unir en una sola estructura. Para eso podemos usar pd.concat. Concatenando Series, podemos hacer lo siguiente:

In [82]:
serie_1 = pd.Series([1, 2, 3], index=['a', 'b', 'c'])
serie_2 = pd.Series([4, 5, 6], index=['d', 'f', 'e'])

In [83]:
pd.concat([serie_1, serie_2], axis=0)

a    1
b    2
c    3
d    4
f    5
e    6
dtype: int64

También podemos concatenar horizontalmente:

In [84]:
pd.concat([serie_1, serie_2], axis=1)

Unnamed: 0,0,1
a,1.0,
b,2.0,
c,3.0,
d,,4.0
f,,5.0
e,,6.0


Podemos nombrar nuestras columnas para saber cuál era cuál:

In [85]:
pd.concat([serie_1, serie_2], axis=1, keys=['serie_1', 'serie_2'])

Unnamed: 0,serie_1,serie_2
a,1.0,
b,2.0,
c,3.0,
d,,4.0
f,,5.0
e,,6.0


Esto pasa si concatenamos horizontalmente usando el mismo índice:

In [86]:
serie_3 = pd.Series([7, 8, 9], index=['a', 'b', 'c'])

pd.concat([serie_1, serie_3], axis=1, keys=['serie_1', 'serie_3'])

Unnamed: 0,serie_1,serie_3
a,1,7
b,2,8
c,3,9


Si concatenamos verticalmente dos `Series` que comparten el índice, tenemos el problema de no poder diferenciar los índices:

In [87]:
pd.concat([serie_1, serie_3], axis=0)

a    1
b    2
c    3
a    7
b    8
c    9
dtype: int64

A veces queremos esto, pero cuando no, podemos agregar un segundo nivel de índice para hacer la diferencia:

In [88]:
pd.concat([serie_1, serie_3], axis=0, keys=['serie_1', 'serie_3'])

serie_1  a    1
         b    2
         c    3
serie_3  a    7
         b    8
         c    9
dtype: int64

Esto se llama un `Multiíndice`. Podemos acceder a un multiíndice en un solo nivel o en ambos:

In [89]:
series_concat = pd.concat([serie_1, serie_3], axis=0, keys=['serie_1', 'serie_3'])

In [90]:
series_concat.loc['serie_1']

a    1
b    2
c    3
dtype: int64

In [91]:
series_concat.loc[('serie_1', 'b')]

np.int64(2)

## Concat con DataFrames

Exactamente los mismos principios aplican a la concatenación de DataFrames:

In [92]:
data_1 = {
    'column_1': [1, 2, 3],
    'column_2': [4, 5, 6]
}

df_1 = pd.DataFrame(data_1, index=['a', 'b', 'c'])

df_1

Unnamed: 0,column_1,column_2
a,1,4
b,2,5
c,3,6


In [93]:
data_2 = {
    'column_1': [7, 8, 9],
    'column_2': [10, 11, 12]
}

df_2 = pd.DataFrame(data_1, index=['d', 'e', 'f'])

df_2

Unnamed: 0,column_1,column_2
d,1,4
e,2,5
f,3,6


Podemos unirlos verticalmente:

In [94]:
pd.concat([df_1, df_2], axis=0)

Unnamed: 0,column_1,column_2
a,1,4
b,2,5
c,3,6
d,1,4
e,2,5
f,3,6


Horizontalmente:

In [95]:
pd.concat([df_1, df_2], axis=1)

Unnamed: 0,column_1,column_2,column_1.1,column_2.1
a,1.0,4.0,,
b,2.0,5.0,,
c,3.0,6.0,,
d,,,1.0,4.0
e,,,2.0,5.0
f,,,3.0,6.0


Si tienen el mismo índice, evitamos los NaNs:

In [96]:
data_3 = {
    'column_3': [7, 8, 9],
    'column_4': [10, 11, 12]
}

df_3 = pd.DataFrame(data_3, index=['a', 'b', 'c'])

df_3

Unnamed: 0,column_3,column_4
a,7,10
b,8,11
c,9,12


In [97]:
pd.concat([df_1, df_3], axis=1)

Unnamed: 0,column_1,column_2,column_3,column_4
a,1,4,7,10
b,2,5,8,11
c,3,6,9,12


Si concatenamos verticalmente con el mismo índice, no podemos diferenciarlos:

In [98]:
data_4 = {
    'column_1': [7, 8, 9],
    'column_2': [10, 11, 12]
}

df_4 = pd.DataFrame(data_4, index=['a', 'b', 'c'])

df_4

Unnamed: 0,column_1,column_2
a,7,10
b,8,11
c,9,12


In [99]:
pd.concat([df_1, df_4], axis=0)

Unnamed: 0,column_1,column_2
a,1,4
b,2,5
c,3,6
a,7,10
b,8,11
c,9,12


Podemos agregar multiíndices:

In [100]:
df_concat = pd.concat([df_1, df_4], axis=0, keys=['df_1', 'df_4'])

df_concat

Unnamed: 0,Unnamed: 1,column_1,column_2
df_1,a,1,4
df_1,b,2,5
df_1,c,3,6
df_4,a,7,10
df_4,b,8,11
df_4,c,9,12


Y podemos accesarlos de igual manera:

In [101]:
df_concat.loc['df_1']

Unnamed: 0,column_1,column_2
a,1,4
b,2,5
c,3,6


In [102]:
df_concat.loc[('df_1', 'b')]

column_1    2
column_2    5
Name: (df_1, b), dtype: int64

También podemos unir más de dos DataFrames agregándolos todos a la lista:

In [103]:
pd.concat([df_1, df_2, df_3, df_4], axis=1)

Unnamed: 0,column_1,column_2,column_1.1,column_2.1,column_3,column_4,column_1.2,column_2.2
a,1.0,4.0,,,7.0,10.0,7.0,10.0
b,2.0,5.0,,,8.0,11.0,8.0,11.0
c,3.0,6.0,,,9.0,12.0,9.0,12.0
d,,,1.0,4.0,,,,
e,,,2.0,5.0,,,,
f,,,3.0,6.0,,,,


## Automatizando peticiones

- Usar todo lo que aprendimos para automatizar peticiones al API
- Guardar nuestros resultados en un archivo tipo .csv

In [104]:
import time

In [105]:
endpoint = 'https://api.nasa.gov/neo/rest/v1/neo/browse?api_key=DEMO_KEY'
payload = {'api_key': 'T7u3esh2ylnMbWjIhLfpMaeLJ8LmVd3HkoliFzsg'}

In [106]:
dict_datos = {}

for i in range(0, 10):
    
    try:
        time.sleep(5)
        r = requests.get(endpoint, params=payload, timeout=5)

        if r.status_code == 200:
            json = r.json()

            data = json['near_earth_objects']
            dict_datos[i] = data

            new_link = json['links']['next']
            endpoint = new_link
    except:
        continue

In [107]:
for key in dict_datos:
    normalized = pd.json_normalize(dict_datos[key])
    df = pd.DataFrame.from_dict(normalized)
    dict_datos[key] = df

In [108]:
lista_de_dataframes = []

for key in dict_datos:
    lista_de_dataframes.append(dict_datos[key])

In [109]:
df_completo = pd.concat(lista_de_dataframes, axis=0).reset_index(drop=True)

In [110]:
df_completo

Unnamed: 0,id,neo_reference_id,name,name_limited,designation,nasa_jpl_url,absolute_magnitude_h,is_potentially_hazardous_asteroid,close_approach_data,is_sentry_object,...,orbital_data.perihelion_distance,orbital_data.perihelion_argument,orbital_data.aphelion_distance,orbital_data.perihelion_time,orbital_data.mean_anomaly,orbital_data.mean_motion,orbital_data.equinox,orbital_data.orbit_class.orbit_class_type,orbital_data.orbit_class.orbit_class_range,orbital_data.orbit_class.orbit_class_description
0,2000433,2000433,433 Eros (A898 PA),Eros,433,https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,10.41,False,"[{'close_approach_date': '1900-12-27', 'close_...",False,...,1.133458052992745,178.9102909699136,1.782904615277399,2460445.664780181111,86.66755145250509,.5597405522715084,J2000,AMO,1.017 AU < q (perihelion) < 1.3 AU,Near-Earth asteroid orbits similar to that of ...
1,2000719,2000719,719 Albert (A911 TB),Albert,719,https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,15.59,False,"[{'close_approach_date': '1909-08-21', 'close_...",False,...,1.19476035548719,156.2155261769503,4.07755393959166,2459955.833573002386,148.4506773209914,.2302751796962134,J2000,AMO,1.017 AU < q (perihelion) < 1.3 AU,Near-Earth asteroid orbits similar to that of ...
2,2000887,2000887,887 Alinda (A918 AA),Alinda,887,https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,13.84,False,"[{'close_approach_date': '1974-01-04', 'close_...",False,...,1.060482619812964,350.4742461302646,3.884567382609386,2460678.609992147430,340.1984297674227,.2535087981471368,J2000,AMO,1.017 AU < q (perihelion) < 1.3 AU,Near-Earth asteroid orbits similar to that of ...
3,2001036,2001036,1036 Ganymed (A924 UB),Ganymed,1036,https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,9.18,False,"[{'close_approach_date': '1910-02-25', 'close_...",False,...,1.245158481026033,132.4961444461056,4.08543903824614,2460569.662511233402,6.984964969479949,.2265088776309744,J2000,AMO,1.017 AU < q (perihelion) < 1.3 AU,Near-Earth asteroid orbits similar to that of ...
4,2001221,2001221,1221 Amor (1932 EA1),Amor,1221,https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,17.38,False,"[{'close_approach_date': '1908-03-14', 'close_...",False,...,1.085428152631312,26.7176005107723,2.754879623203948,2460838.872819526800,271.7008031502767,.3704247700094682,J2000,AMO,1.017 AU < q (perihelion) < 1.3 AU,Near-Earth asteroid orbits similar to that of ...
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
195,2017511,2017511,17511 (1992 QN),,17511,https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,17.32,False,"[{'close_approach_date': '1918-01-13', 'close_...",False,...,.7628967637903167,202.4442596568223,1.616424374553274,2460586.164160164847,10.88911572162695,.7595729198177639,J2000,APO,a (semi-major axis) > 1.0 AU; q (perihelion) <...,Near-Earth asteroid orbits which cross the Ear...
196,2018106,2018106,18106 Blume (2000 NX3),Blume,18106,https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,17.78,False,"[{'close_approach_date': '1904-08-28', 'close_...",False,...,1.192035771623223,234.9618315338719,3.693705927026109,2460164.258081339583,112.610972230986,.2581388156754499,J2000,AMO,1.017 AU < q (perihelion) < 1.3 AU,Near-Earth asteroid orbits similar to that of ...
197,2018109,2018109,18109 (2000 NG11),,18109,https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,17.19,False,"[{'close_approach_date': '1902-10-30', 'close_...",False,...,1.188802833056478,319.2616103520979,2.572640796027616,2460293.077112228799,117.477157230987,.3821353643597905,J2000,AMO,1.017 AU < q (perihelion) < 1.3 AU,Near-Earth asteroid orbits similar to that of ...
198,2018172,2018172,18172 (2000 QL7),,18172,https://ssd.jpl.nasa.gov/tools/sbdb_lookup.htm...,15.69,False,"[{'close_approach_date': '1913-11-01', 'close_...",False,...,1.18567043787045,100.7115895241474,3.665121571774767,2460208.138190677775,102.3803985070888,.2609336486747862,J2000,AMO,1.017 AU < q (perihelion) < 1.3 AU,Near-Earth asteroid orbits similar to that of ...


In [114]:
df_completo.to_csv('../6. APIs, Automatización y concatenación de DataFrames/near_earth_objects-raw.csv')
# cree el documento en excel