# Recolectar Datos usando APIs del Mundo Real

Ahora ya tenemos una idea general sobre el mundo de las APIs, pero que está basada más bien en ejemplos controlados por sitios de prueba. Por lo tanto ha llegado el momento de llevar nuestros conocimientos al **mundo real** para que veamos una implementación completa, desde cero, que comienza viendo un sitio web, y que termine con una visualización basada en los datos extraídos.

En este caso vamos a trabajar con datos de la nasa, por lo que te presento [este sitio](https://api.nasa.gov/) más que interesante y lleno de recursos que te va a fascinar.

![](nasa_api_1.png)


Quiero volver a aclarar que cuando trabajamos con sitios externos, siempre estamos expuestos a que el diseño de los sitios vaya cambiando con el tiempo, por lo que puede que al momento en que tu estés haciendo este curso, este sitio web se vea distinto a cómo se muestra en esta lección. En ese caso deberías explorar por tu cuenta dónde se encuentra cada cosa, porque justamente **de eso se trata el trabajo con APIs**: de conocer cada sitio, y explorar qué te ofrece y aprender a interpretarlo e implementarlo. Cada aplicación con la que te quieras comunicar es un mundo aparte.

Volviendo al sitio de la nasa para APIs, la primera vez que ingreses te va a pedir que cargues **tus datos**, y te van a enviar una **clave API por email**.

Ahora investiguemos qué recursos nos ofrece la nasa. Sigamos bajando, y luego de unas instrucciones muy sencillas, encontramos que la nasa tiene todas estas APIs para que podamos comunicarnos con su servidor y extraer información de todo tipo. Este es el Disneylandia de los científicos de datos dedicados a la astronomía y la ciencia espacial.

![](nasa_api_2.png)

Voy a intentar comunicarme con una o dos APIs de las que nos ofrece la Nasa, y luego tu puedes seguir jugando con las demás si quieres afilar tus habilidades para aprender a trabajar con APIs.

## API 1

Voy a comenzar explorando la primera API de la nasa que se llama **APOD**, que significa *Foto Astronómica del Día*.

Parece que esta API contiene imágenes astronómicas para cada día. Por supuesto que ahí disponemos de toda la **documentación completa**, y debajo tenemos un resumen bastante claro de cómo implementar una **solicitud HTTP** para esta API.

Aquí podemos ver la **url** que deberíamos usar, y tenemos los **parámetros** que nos permiten especificar mejor nuestra búsqueda.

![](nasa_api_3.png)

Perfecto. Vamos a Jupyter y comencemos un cuaderno desde cero.

Por ahora, voy a comenzar importando a `requests`, y dos librerías más que voy a necesitar más adelante.

In [1]:
import requests
import pandas as pd
from IPython.display import Image, display

También voy a necesitar configurar dos variables básicas: mi **clave api** y la **url**:

In [2]:
url = "https://api.nasa.gov/planetary/apod"
api_key = "TU-API-KEY"

Ahora intentemos hacer el pedido con esta información (recuerda reemplazar [TU-API-KEY] con la cñave api que te ha enviado el sitio de la Nasa a tu email).

In [3]:
respuesta = requests.get(url)
data = respuesta.json()
data

{'error': {'code': 'API_KEY_MISSING',
  'message': 'No api_key was supplied. Get one at https://api.nasa.gov:443'}}

Lo que me devuelve `data` ciertamente no es lo que esperaba, y por lo que podemos ver aquí, es porque no ha recibido **ninguna clave API**.

### ¿Cómo le pasamos la clave api?

Cada sitio funciona de manera diferente. Voy a intentar resolverlo usando el *sentido común*, para que veas que eso también puede fallar.

Verifiquemos si la documentación de la Nasa me dice cómo pasar ese parámetro.

![](nasa_api_4.png)

Bueno, parece que la **clave API** se puede pasar usando el parámetro `api_key`. Intentemos eso.

In [4]:
respuesta = requests.get(url, apy_key=api_key)
data = respuesta.json()
data

TypeError: Session.request() got an unexpected keyword argument 'apy_key'

Ahora me devuelve un error, diciendo que no conoce a este parámetro. La razón por la que esto no funciona, es porque una cosa es **lo que pide la API**, y otra cosa es **cómo funciona `requests`**.

Para pasarle parámetros especiales a `requests`, esta librería nos brinda un parámetro llamado `params` (te recomiendo usar la ayuda contextual para conocer la documentación sobre ese parámetro).

In [5]:
params = {
    "api_key": api_key,
    "date": "2002-03-20"
}

Y ahora sí, completamos los parámetros de `requests.get()` apropiadamente.

In [6]:
respuesta = requests.get(url, params=params)
data = respuesta.json()
data

{'copyright': '\nRobert Schwarz \n(U. Wisconsin)\n',
 'date': '2002-03-20',
 'explanation': 'Looking out from the bottom of the world, strange and spectacular sights are sometimes observed.  Such was the case during the long Antarctic night of 1998, as awesome aurora sub-storms were photographed above scientific outposts.  Visible in the left foreground of the above photograph is the Martin A. Pomerantz Observatory while the now defunct SPIREX telescope canvas dome is visible to its right.  The outside temperature at the time this photograph was taken was about -73 Celsius (-100 Fahrenheit), although a slightly heated box sheltered the camera.',
 'hdurl': 'https://apod.nasa.gov/apod/image/0203/spaurora1_schwarz.jpg',
 'media_type': 'image',
 'service_version': 'v1',
 'title': 'Aurora Over Antarctica',
 'url': 'https://apod.nasa.gov/apod/image/0203/spaurora1_schwarz.jpg'}

Esto nos ha traido información positiva, entre la que tenemos aquí una clave llamada `url` que parece llevar a una imagen en formato `jpg`.

¿Vamos a verla dentro de mi cuaderno? Para eso voy a usar a `display` y a `Image` que son librerías que he importado oprtunamente al comienzo de este cuaderno.

In [7]:
display(Image(url=data['url']))

## API 2

Volvamos al sitio de APIs de la nasa, y probemos otra más, a ver si nos proporciona información para hacer **análisis de datos**.

Aquí tenemos una que se llama **DONKI**, y parece que su sigla nos dice que es la **Base de Datos de Notificaciones, Conocimiento e Información del Clima Espacial**. Parece interesante.

![](nasa_api_5.png)

Al abrir esta solapa vemos que aquí hay una API para **cada evento climático cósmico** diferente, como *tormentas geomagnéticas*, *ráfagas solares*, etc. Voy a elegir la que trata sobre **Shock Interplanetario (IPS)**. ¡Qué miedo! ¡Quiero saber más!

![](nasa_api_6.png)

Bueno, todo lo que nos brinda aquí es una **url de ejemplo**, con algunos **parámetros** ya cargados.

Por lo que vemos, si no configuramos sus parámetros, los valores por defecto van a devolver todos los eventos de todas las locaciones y de todo el catálogo, de los últimos 30 días hasta la fecha. 

Entonces voy a **copiar esta url de ejemplo**, y voy a cambiar algunos de sus parámetros y a otros los voy a dejar como vienen por defecto.

In [8]:
url = "https://api.nasa.gov/DONKI/IPS?"

Y ahora voy a crear una **función** que transforme esos datos en un **dataframe** (por eso he importado Pandas al principio del cuaderno).

In [9]:
def obtener_donki(fecha_inicio, fecha_fin):
    params = {
        "api_key": api_key,
        "startDate": fecha_inicio,
        "endDate": fecha_fin
    }
    respuesta = requests.get(url, params=params)
    data = respuesta.json()
    return pd.DataFrame(data)

Hagamos una petición cualquiera.

In [10]:
df = obtener_donki("2023-12-01", "2023-12-31")
df

Unnamed: 0,catalog,activityID,location,eventTime,link,instruments,submissionTime
0,M2M_CATALOG,2023-12-01T00:11:00-IPS-001,STEREO A,2023-12-01T00:11Z,https://webtools.ccmc.gsfc.nasa.gov/DONKI/view...,"[{'displayName': 'STEREO A: IMPACT'}, {'displa...",2023-12-06T02:01Z
1,M2M_CATALOG,2023-12-01T08:15:00-IPS-001,STEREO A,2023-12-01T08:15Z,https://webtools.ccmc.gsfc.nasa.gov/DONKI/view...,"[{'displayName': 'STEREO A: IMPACT'}, {'displa...",2023-12-06T02:52Z
2,M2M_CATALOG,2023-12-01T08:48:00-IPS-001,Earth,2023-12-01T08:48Z,https://webtools.ccmc.gsfc.nasa.gov/DONKI/view...,"[{'displayName': 'DSCOVR: PLASMAG'}, {'display...",2023-12-06T03:58Z
3,M2M_CATALOG,2023-12-04T04:30:00-IPS-001,Earth,2023-12-04T04:30Z,https://webtools.ccmc.gsfc.nasa.gov/DONKI/view...,"[{'displayName': 'DSCOVR: PLASMAG'}, {'display...",2023-12-05T17:02Z
4,M2M_CATALOG,2023-12-04T08:09:00-IPS-001,STEREO A,2023-12-04T08:09Z,https://webtools.ccmc.gsfc.nasa.gov/DONKI/view...,"[{'displayName': 'STEREO A: IMPACT'}, {'displa...",2023-12-05T18:23Z
5,M2M_CATALOG,2023-12-09T19:27:00-IPS-001,Mars,2023-12-09T19:27Z,https://webtools.ccmc.gsfc.nasa.gov/DONKI/view...,"[{'displayName': 'MAVEN: SEP'}, {'displayName'...",2024-01-10T17:22Z
6,M2M_CATALOG,2023-12-12T11:26:00-IPS-001,Earth,2023-12-12T11:26Z,https://webtools.ccmc.gsfc.nasa.gov/DONKI/view...,"[{'displayName': 'DSCOVR: PLASMAG'}, {'display...",2023-12-13T02:20Z
7,M2M_CATALOG,2023-12-13T00:00:00-IPS-001,STEREO A,2023-12-13T00:00Z,https://webtools.ccmc.gsfc.nasa.gov/DONKI/view...,"[{'displayName': 'STEREO A: IMPACT'}, {'displa...",2023-12-13T22:17Z
8,M2M_CATALOG,2023-12-13T21:54:00-IPS-001,Earth,2023-12-13T21:54Z,https://webtools.ccmc.gsfc.nasa.gov/DONKI/view...,[{'displayName': 'DSCOVR: PLASMAG'}],2023-12-20T18:14Z
9,M2M_CATALOG,2023-12-15T10:57:00-IPS-001,Earth,2023-12-15T10:57Z,https://webtools.ccmc.gsfc.nasa.gov/DONKI/view...,"[{'displayName': 'DSCOVR: PLASMAG'}, {'display...",2023-12-15T17:21Z


Por lo que vemos, ahora `df` es un **dataframe** que contiene los datos de las ocurrencias de los eventos que se han dado en las fechas que hemos pedido.

Entonces ahora, con las habilidades que has desarrollado a lo largo de todo el curso, puedes tomar este **dataframe**, inspeccionarlo, hacer limpieza de datos, transformaciones, etc, y por supuesto, finalmente visualizaciones basadas en información que has recolectaso usando APIs.

Espero que esta lección te haya resultado esclarecedora, porque a continuación se viene el **desafío del día**, que va a ser bastante parecido a lo que hicimos en esta lección, pero ahora por tu cuenta.

Nos vemos ahí.