# Obtención de Datos Mediante APIs en Python

Alguna de las formas de obtención de datos es a través de **APIs (Application Programming Interfaces)**. Las APIs son una forma eficiente de acceder a datos y servicios en línea. Aprenderemos a realizar solicitudes a través de Python utilizando la popular biblioteca `requests`.

## Introducción a las APIs

Una API (Application Programming Interface) es un conjunto de reglas y protocolos que permiten a diferentes aplicaciones interactuar entre sí. Las APIs permiten a las aplicaciones solicitar datos o realizar acciones en un servidor remoto de manera estructurada y estandarizada.

![imagen](./img/http.PNG)

## Protocolo HTTP

El Protocolo de Transferencia de Hipertexto (HTTP) es el protocolo subyacente utilizado en la World Wide Web. Se utiliza para solicitar y transmitir datos en la web. 

![imagen](./img/peticion_respuesta.PNG)

Aquí tienes un ejemplo de arquitectura:

![imagen](./img/arquitectura_servidor.PNG)

Las solicitudes HTTP se pueden realizar utilizando varios métodos, siendo los más comunes:

* **GET**: Para recuperar datos.
* **POST**: Para enviar datos al servidor.
* **PUT**: Para actualizar datos en el servidor.
* **DELETE**: Para eliminar datos en el servidor.


![imagen](./img/documentacion_api.PNG)

Podemos hacer una petición:

![imagen](./img/parametros.PNG)

y obtener como respuesta diferentes códigos:

![imagen](./img/status_codes.PNG)

Ejemplo de la API de Marvel. La URL se construye como *urlbase* + *endpoint* + *params*

En general para acceder a un servicio de una API la URL se construye como *urlbase* + *endpoint* + *params*

![imagen](./img/MarvelAccessPoints.png)

## Biblioteca ``requests``

La biblioteca requests es una de las más populares para realizar solicitudes HTTP en Python. Permite enviar solicitudes y procesar respuestas de una manera sencilla y eficiente.

In [None]:
#!pip install requests

In [None]:
# Importamos librerias
import requests
import zipfile
import pandas as pd

## Primera petición

In [None]:
url = "https://pbs.twimg.com/profile_images/616689518968762368/rkhjKqNb.jpg"
image = requests.get(url)

In [None]:
image


In [None]:
image.content

### Mediante pandas

In [None]:
df_inflation = pd.read_csv('https://datahub.io/core/inflation/r/inflation-gdp.csv')
df_inflation.head()

In [None]:
df_inflation[df_inflation['Country'] == "Spain"]

## Bajar datos de Bicimad

In [None]:
url = 'https://opendata.emtmadrid.es/getattachment/c3383795-121b-4ebf-98b4-c7b05e902eaf/202106_movements.aspx'

r = requests.get(url)

In [None]:
r

In [None]:
r.content

In [None]:
# Guardamos el zip
filename = 'data/bicis.zip'
with open(filename, 'wb') as f:
   f.write(r.content)

In [None]:
# Extraemos lo que hay dentro
filename = 'data/bicis.zip'
with zipfile.ZipFile(filename, 'r') as zip_ref:
    zip_ref.extractall("data/")

In [None]:
## Leemos los datos
datos_bicis = pd.read_json('data/202106_movements.json', lines=True, encoding='latin-1', nrows=10000)

In [None]:
# Vemos qué pinta tienen
datos_bicis.head()

In [None]:
datos_bicis.info()

In [None]:
datos_bicis['zip_code'].unique()

## Api chucknorris

[Enlace API](https://api.chucknorris.io/)

In [7]:
url = "https://api.chucknorris.io/jokes/random"  # Reemplaza con la URL de la API que deseas acceder.

response = requests.get(url)
response.json()
if response.status_code == 200:  # Código 200 indica una respuesta exitosa.
    data = response.json()  # Analizar la respuesta JSON.
    #print(data["value"])
    print(data)
else:
    print("Error en la solicitud: ", response.status_code)
data["value"]

{'categories': ['religion'], 'created_at': '2020-01-05 13:42:19.576875', 'icon_url': 'https://api.chucknorris.io/img/avatar/chuck-norris.png', 'id': 'hsnyecdiq0e7moidbhs3fw', 'updated_at': '2020-01-05 13:42:19.576875', 'url': 'https://api.chucknorris.io/jokes/hsnyecdiq0e7moidbhs3fw', 'value': 'Jesus can walk on water, but Chuck Norris can swim through land.'}


'Jesus can walk on water, but Chuck Norris can swim through land.'

In [8]:
def get_joke(url):
    response = requests.get(url)

    if response.status_code == 200:  # Código 200 indica una respuesta exitosa.
        data = response.json()  # Analizar la respuesta JSON.
        return data
    else:
        print("Error en la solicitud: ", response.status_code)

In [9]:
url = "https://api.chucknorris.io/jokes/categories"
get_joke(url)

['animal',
 'career',
 'celebrity',
 'dev',
 'explicit',
 'fashion',
 'food',
 'history',
 'money',
 'movie',
 'music',
 'political',
 'religion',
 'science',
 'sport',
 'travel']

In [10]:
url = "https://api.chucknorris.io/jokes/random?category=animal"
get_joke(url)

{'categories': ['animal'],
 'created_at': '2020-01-05 13:42:19.104863',
 'icon_url': 'https://api.chucknorris.io/img/avatar/chuck-norris.png',
 'id': 'o0sukejatqchi7oyjms6mw',
 'updated_at': '2020-01-05 13:42:19.104863',
 'url': 'https://api.chucknorris.io/jokes/o0sukejatqchi7oyjms6mw',
 'value': 'Chuck Norris can set ants on fire with a magnifying glass. At night.'}

In [None]:
joke = get_joke(url)
joke["value"]

### POST

In [11]:
# URL de la API de prueba
url = "https://reqres.in/api/users"

# Datos a enviar en el request
data = {
    "name": "Juan Pérez",
    "job": "Científico de Datos"
}

# Enviar solicitud POST
response = requests.post(url, json=data)

# Verificar la respuesta
if response.status_code == 201:  # Código 201 = Creado exitosamente
    print("Usuario creado con éxito.")
    print("Respuesta de la API:", response.json())  # Mostrar datos devueltos
else:
    print("Error en la solicitud:", response.status_code)

Usuario creado con éxito.
Respuesta de la API: {'name': 'Juan Pérez', 'job': 'Científico de Datos', 'id': '64', 'createdAt': '2025-03-27T11:16:42.712Z'}


## Datos del espacio

In [76]:
'''
https://thespacedevs.com/llapi
https://ll.thespacedevs.com/2.2.0/swagger
'''
space_url = "http://ll.thespacedevs.com/2.2.0"

path = "/astronaut"

url_total = space_url + path #+ "/?limit=20"

response = requests.get(url_total)

In [77]:
print(url_total)

http://ll.thespacedevs.com/2.2.0/astronaut


In [78]:
print(response.status_code)
#type(response.content)
#response.json()

429


In [79]:
type(response.content)


bytes

In [80]:
astronautas = response.json()
astronautas

{'detail': 'Request was throttled. Expected available in 173 seconds.'}

In [81]:
astronautas["results"][0]["name"]

KeyError: 'results'

In [None]:
astronautas["results"][0]["status"]["name"]

'Active'

In [None]:
#pd.DataFrame(astronautas["results"])

In [None]:
astronautas["results"][0]["agency"]["type"]

'Multinational'

In [None]:
for astronauta in astronautas["results"]:
    print(astronauta)

{'id': 1, 'url': 'https://ll.thespacedevs.com/2.2.0/astronaut/1/', 'name': 'Thomas Pesquet', 'status': {'id': 1, 'name': 'Active'}, 'type': {'id': 2, 'name': 'Government'}, 'in_space': False, 'time_in_space': 'P396DT11H33M45S', 'eva_time': 'P1DT15H54M', 'age': 47, 'date_of_birth': '1978-02-27', 'date_of_death': None, 'nationality': 'French', 'bio': 'Thomas Gautier Pesquet is a French aerospace engineer, pilot, and European Space Agency astronaut. Pesquet was selected by ESA as a candidate in May 2009, and he successfully completed his basic training in November 2010. From November 2016 to June 2017, Pesquet was part of Expeditions 50 and 51 on the International Space Station as a flight engineer.', 'twitter': 'https://twitter.com/Thom_astro', 'instagram': 'https://instagram.com/thom_astro', 'wiki': 'https://en.wikipedia.org/wiki/Thomas_Pesquet', 'agency': {'id': 27, 'url': 'https://ll.thespacedevs.com/2.2.0/agencies/27/', 'name': 'European Space Agency', 'featured': False, 'type': 'Mul

In [None]:

astro_dict = {
    "name":[],
    "status":[],
    "type":[]
}

for astronauta in astronautas["results"]:
    #print(astronauta["name"])
    #print(astronauta["status"]["name"])
    #print(astronauta["agency"]["type"])
    #print()
    astro_dict["name"].append(astronauta["name"])
    astro_dict["status"].append(astronauta["status"]["name"])
    astro_dict["type"].append(astronauta["agency"]["type"])
    
astro_dict
  

{'name': ['Thomas Pesquet',
  'Claude Nicollier',
  'Tim Peake',
  'Buzz Aldrin',
  'Chris Hadfield',
  'David Saint-Jacques',
  'Anne McClain',
  'Andrew R. Morgan',
  'Nick Hague',
  'Terry W. Virts'],
 'status': ['Active',
  'Retired',
  'Retired',
  'Retired',
  'Retired',
  'Active',
  'Active',
  'Active',
  'Active',
  'Retired'],
 'type': ['Multinational',
  'Multinational',
  'Multinational',
  'Government',
  'Government',
  'Government',
  'Government',
  'Government',
  'Government',
  'Government']}

In [None]:
astrodf = pd.DataFrame(astro_dict)
astrodf

Unnamed: 0,name,status,type
0,Thomas Pesquet,Active,Multinational
1,Claude Nicollier,Retired,Multinational
2,Tim Peake,Retired,Multinational
3,Buzz Aldrin,Retired,Government
4,Chris Hadfield,Retired,Government
5,David Saint-Jacques,Active,Government
6,Anne McClain,Active,Government
7,Andrew R. Morgan,Active,Government
8,Nick Hague,Active,Government
9,Terry W. Virts,Retired,Government


In [None]:
url_total

In [None]:
url_total = space_url + path + "/?age=45"

response_sp = requests.get(url_total)

In [None]:
response_sp

<Response [429]>

In [None]:
url_total

'http://ll.thespacedevs.com/2.2.0/astronaut/?age=45'

In [None]:
response_sp.json()

{'detail': 'Request was throttled. Expected available in 163 seconds.'}

In [None]:
response_sp.json()['results']

In [None]:
results = response_sp.json()['results']
len(results)

In [None]:
type(results)

In [None]:
results[0]

In [None]:
pd.DataFrame(response_sp.json()['results'])

In [None]:
response_sp.json()

In [None]:
response_sp.json()['results']

In [None]:
pd.DataFrame(response_sp.json()['results'])

## JSON to DataFrame

Recuerda que para crear un DataFrame a partir de un diccionario este diccionario tiene que tener para cada clave una lista. Las claves serán las columnas y los items de las listas los valores de las celdas.

O si prefieres crear el DataFrame a partir de una lista de diccionarios entonces todos los diccionarios tienen que tener las mismas claves y el DataFrame resultante tendrá como columnas los nombres de las claves de cualquier diccionario (todos tienen las mismas claves) y habrá una fila con con los valores del diccionario para cada diccionario de la lista. 

La conversión de JSON no es necesariamente satisfactoria a un DataFrame de forma general. Tendrás que obtener un diccionario de listas o una lista de diccionarios del objeto JSON navegando a través de las etiquetas para obtener el DataFrame que te interesa.  

In [None]:
response_sp.json()['results'][0]

KeyError: 'results'

In [None]:
response_sp.json()['results'][0]['status']

In [None]:
response_sp.json()['results'][0]['status']['name']

In [None]:
import pprint
for astronaut in response_sp.json()['results']:
    pprint.pprint(astronaut)

In [None]:
dict = {'name':[],
        'age':[],
        'date of birth':[],
        'space walks':[],
        'active':[]}

for astronaut in response_sp.json()['results']:
    dict['name'].append(astronaut['name'])
    dict['age'].append(astronaut['age'])
    dict['date of birth'].append(astronaut['date_of_birth'])
    dict['space walks'].append(astronaut['spacewalks_count'])
    dict['active'].append(astronaut['status']['name'])

    
dict



In [None]:
pd.DataFrame(dict)