# Sesion 4.  Datos desde API REST

Curso de Especialización en Inteligencia Artificial y Big Data
Profesor: Juan Carlos Pérez González
Departamento de Informática – IES de Teis

**API: Application Programming Interface biblioteca** o conjunto de funciones que ofrece una aplicación
para que sea accedida por otra. Actualmente trabajan preferentemente sobre request HTTP y devuelven
datos en formato json y xml, preferentemente

Flujo:
1. Identificar la URL de la API
2. Hacer petición o **request** HTTP
3. Recibir datos json, xml preferentemente
4. Procesar Datos 
5. Analizar información (ya es otra unidad)

**Ventajas**: datos estructurados supone menos limpieza, menos HTML supone menos errores y más rápido y eficiente


#### 1. Ejemplo tipo básico de página de entreno FAKESTOREAPI

In [1]:
import requests
import json

# URL del endpoint de la API
url = "https://fakestoreapi.com/products"

# Hacer la petición GET
response = requests.get(url)

# Verificar que la petición fue exitosa
if response.status_code == 200:
    # Convertir la respuesta a JSON
    datos = response.json()

    # Guardar todos los datos directamente en un archivo JSON
    with open("resultados.json", "w", encoding="utf-8") as f:
        json.dump(datos, f, ensure_ascii=False, indent=4)

    print("Datos guardados en 'resultados.json' ")

else:
    print("Error en la petición:", response.status_code)



Datos guardados en 'resultados.json' 


#### 2. OMDB API

Veamos ahora un ejemplo con registro con una API, en el caso de OMDB, que es una bbdd creada por usuarios sobre películas y series, tiene decenas de miles registradas de todo tipo de temáticas. 
En primer lugar tienes que registrate para que te den el APIKEY o número de acceso (es individual). 

https://www.omdbapi.com/apikey.aspx?__EVENTTARGET=freeAcct&__EVENTARGUMENT=&__LASTFOCUS=&__VIEWSTATE=%2FwEPDwUKLTIwNDY4MTIzNQ9kFgYCAQ9kFgICBw8WAh4HVmlzaWJsZWhkAgIPFgIfAGhkAgMPFgIfAGhkGAEFHl9fQ29udHJvbHNSZXF1aXJlUG9zdEJhY2tLZXlfXxYDBQtwYXRyZW9uQWNjdAUIZnJlZUFjY3QFCGZyZWVBY2N0oCxKYG7xaZwy2ktIrVmWGdWzxj%2FDhHQaAqqFYTiRTDE%3D&__VIEWSTATEGENERATOR=5E550F58&__EVENTVALIDATION=%2FwEdAAU%2BO86JjTqdg0yhuGR2tBukmSzhXfnlWWVdWIamVouVTzfZJuQDpLVS6HZFWq5fYpioiDjxFjSdCQfbG0SWduXFd8BcWGH1ot0k0SO7CfuulHLL4j%2B3qCcW3ReXhfb4KKsSs3zlQ%2B48KY6Qzm7wzZbR&at=freeAcct&Email=


Si saco primero el dataframe me da una idea de como guarda OMDB las películas.

In [2]:
import requests
import numpy as np
import pandas as pd
url='http://www.omdbapi.com/'

# La apikey se saca de la url
params = dict(
    apikey = 'aac5f6f',  
    t = 'Alien',      # s si quiere una búsqueda global
    type = 'movie'   #si quieres series type = 'series'
)

resp = requests.get(url=url, params=params)
datos=resp.json()   #convierte los datos en .json
print(datos['Title'])
df = pd.DataFrame([datos])
display(df)

# AHORA SIN DATAFRAME
# Realizar solicitud para obtener información sobre las películas
response = requests.get(url=url, params=params)

# Verificar el estado de la respuesta
if response.status_code == 200:
    print("Conectado")
    # Convertir la respuesta a formato JSON
    data = response.json()
    print(data)

    # Verificar si la solicitud fue exitosa y si hay resultados
    if data.get('Response') == 'True':
        # Obtener la lista de películas
        peliculas = data.get('Search', [])

        if peliculas:
            # Ordenar las películas por IMDb rating de mayor a menor
            peliculas_ordenadas = sorted(peliculas, key=lambda x: float(x.get('imdbRating', 0)), reverse=True)

            # Imprimir las 10 películas con el mayor IMDb rating
            for pelicula in peliculas_ordenadas[:10]:
                print(f"{pelicula['Title']} - IMDb Rating: {pelicula.get('imdbRating', 'N/A')}")
        else:
            print("No se encontraron resultados.")
    else:
        print(f"Error: {data.get('Error', 'Respuesta incorrecta de la API')}")
else:
    print(f"Error en la solicitud. Código de estado: {response.status_code}")

Alien


Unnamed: 0,Title,Year,Rated,Released,Runtime,Genre,Director,Writer,Actors,Plot,...,Metascore,imdbRating,imdbVotes,imdbID,Type,DVD,BoxOffice,Production,Website,Response
0,Alien,1979,R,22 Jun 1979,117 min,"Horror, Sci-Fi",Ridley Scott,"Dan O'Bannon, Ronald Shusett","Sigourney Weaver, Tom Skerritt, John Hurt",After investigating a mysterious transmission ...,...,89,8.5,1038309,tt0078748,movie,,"$84,206,106",,,True


Conectado
{'Title': 'Alien', 'Year': '1979', 'Rated': 'R', 'Released': '22 Jun 1979', 'Runtime': '117 min', 'Genre': 'Horror, Sci-Fi', 'Director': 'Ridley Scott', 'Writer': "Dan O'Bannon, Ronald Shusett", 'Actors': 'Sigourney Weaver, Tom Skerritt, John Hurt', 'Plot': 'After investigating a mysterious transmission of unknown origin, the crew of a commercial spacecraft encounters a deadly lifeform.', 'Language': 'English', 'Country': 'United Kingdom, United States', 'Awards': 'Won 1 Oscar. 19 wins & 22 nominations total', 'Poster': 'https://m.media-amazon.com/images/M/MV5BN2NhMDk2MmEtZDQzOC00MmY5LThhYzAtMDdjZGFjOGZjMjdjXkEyXkFqcGc@._V1_SX300.jpg', 'Ratings': [{'Source': 'Internet Movie Database', 'Value': '8.5/10'}, {'Source': 'Rotten Tomatoes', 'Value': '93%'}, {'Source': 'Metacritic', 'Value': '89/100'}], 'Metascore': '89', 'imdbRating': '8.5', 'imdbVotes': '1,038,309', 'imdbID': 'tt0078748', 'Type': 'movie', 'DVD': 'N/A', 'BoxOffice': '$84,206,106', 'Production': 'N/A', 'Website': 'N/

Otra forma más dinámica incluyendo variables, en este caso el tipo y el título

In [None]:
import requests

# Reemplaza 'TU_CLAVE_DE_API' con tu clave de API de OMDB
api_key = 'aac5f6f'

# URL base de la API de OMDB
base_url = 'http://www.omdbapi.com/'

tipo = input("Por favor si es una `series` o `movie`: ")
titulo = input("Por favor algún término del título: ")

# Parámetros de la primera solicitud para obtener una lista de películas
params_search = {'apikey': api_key, 'type': tipo, 's': titulo }

# Realizar la primera solicitud para obtener una lista de películas
response_search = requests.get(base_url, params=params_search)

# Verificar el estado de la respuesta
if response_search.status_code == 200:
    data_search = response_search.json()

    if data_search.get('Response') == 'True':
        peliculas = data_search.get('Search', [])

        if peliculas:
            # Lista para guardar los detalles de cada película
            peliculas_detalle = []

            # Realizar solicitudes adicionales para obtener información detallada por IMDb ID
            for pelicula in peliculas:
                imdb_id = pelicula.get('imdbID')
                params_detail = {'apikey': api_key, 'i': imdb_id}
                response_detail = requests.get(base_url, params=params_detail)
                data_detail = response_detail.json()

                if data_detail.get('Response') == 'True':
                    peliculas_detalle.append(data_detail)

            # Ordenar las películas por IMDb rating de mayor a menor
            peliculas_ordenadas = sorted(
                peliculas_detalle,
                key=lambda x: float(x.get('imdbRating', 0)) if x.get('imdbRating', 'N/A') != 'N/A' else 0,
                reverse=True
            )

            # Tomar las 20 primeras películas
            top_20_peliculas = peliculas_ordenadas[:20]

            # Imprimir información de cada película
            for pelicula in top_20_peliculas:
                print(f"{pelicula.get('Title')} - IMDb Rating: {pelicula.get('imdbRating', 'N/A')}")

        else:
            print("No se encontraron resultados.")
    else:
        print(f"Error: {data_search.get('Error', 'Respuesta incorrecta de la API')}")
else:
    print(f"Error en la primera solicitud. Código de estado: {response_search.status_code}")


Si visitamos la documentación del API:   https://omdbpy.readthedocs.io/_/downloads/en/latest/pdf/

##### 3. OPENWEATHER

En primer lugar obtenemos nuestra APIkey aquí:     https://openweathermap.org/api

LA CUENTA FREE PERMITE 60 PETICIONES POR MINUTO

In [None]:
# ====================================================
# EJEMPLO COMPLETO DE USO DE OPENWEATHER
# ====================================================

# PASO 1 Importar librerías
import requests
import json
import matplotlib.pyplot as plt

# PASO 2 Configurar tu API key
API_KEY = "b34d99baeeca1a0fbb226be4c88a29c9"  # <- CAMBIA POR LA TUYA TARDA UNOS MINUTOS



# PASO 3 Función para obtener clima de una ciudad,le paso dos parámetros

def obtener_clima(ciudad, api_key):
    url = f"http://api.openweathermap.org/data/2.5/weather?q={ciudad}&appid={api_key}&units=metric"
    
    respuesta = requests.get(url)
    datos = respuesta.json()
    print(respuesta.status_code)
    
    if respuesta.status_code == 200:
        info = {
            "ciudad": ciudad,
            "temperatura": datos['main']['temp'],
            "humedad": datos['main']['humidity'],
            "descripcion": datos['weather'][0]['description'],
            "viento": datos['wind']['speed']
        }
        return info
    else:
        print(f"Error en {ciudad}: {datos.get('message', 'Desconocido')}")
        return None
        
# PASO 4.  Solicitar ciudades

entrada = input("Introduce las ciudades que quieras consultar, separadas por comas: ")
ciudades = [c.strip() for c in entrada.split(",")]

print("Ciudades a consultar:", ciudades)

# PASO 5 Obtener información de todas las ciudades

resultados = []
for ciudad in ciudades:
    info = obtener_clima(ciudad, API_KEY)
    if info:
        resultados.append(info)

# PASO 5 Mostrar resultados en consola
for r in resultados:
    print(f"{r['ciudad']}: {r['temperatura']}°C, {r['descripcion']}, Humedad: {r['humedad']}%, Viento: {r['viento']} m/s")

# PASO 6 Graficar las temperaturas
nombres = [r['ciudad'] for r in resultados]
temps = [r['temperatura'] for r in resultados]

plt.figure(figsize=(8,5))
plt.bar(nombres, temps, color='skyblue')
plt.title("Temperaturas actuales por ciudad")
plt.xlabel("Ciudad")
plt.ylabel("Temperatura (°C)")
plt.show()


Algunos de los valores que una cuenta FREE nos deja obtener datos:
* **weather[0].main**  Tipo de clima (Clear, Clouds, Rain…)
* **weather[0].description** Descripción más detallada (e.g. "scattered clouds")
* **main.temp**	Temperatura actual en °C (con units=metric)
* **main.feels_like**	Sensación térmica
* **main.humidity**	Humedad relativa (%)
* **main.pressure**	Presión atmosférica (hPa)
* **wind.speed**	Velocidad del viento (m/s)
* **wind.deg**	Dirección del viento (grados)
* **clouds.all**	Cobertura de nubes (%)
* **rain.1h o rain.3h**	Lluvia en la última 1 o 3 horas (si hay)
* **snow.1h o snow.3h**	Nieve en la última 1 o 3 horas (si hay)
* **sys.sunrise y sys.sunset***	Hora de salida y puesta del sol (timestamp Unix)
* **dt**	Fecha y hora de la medición (timestamp Unix)
* **coord.lat y coord.lon**	Coordenadas geográficas de la ciudad

#### 3. EJERCICIOS

Elige uno de los propuestos (podéis trabajar en grupos de dos) y entregar al final de la clase o en la primera hora de la clase siguientes.

#####  **PROPUESTA 1 NewsAPI (noticias)**

* **Web:** [https://newsapi.org](https://newsapi.org)
* **Tipo:** Noticias globales por fuente, país, palabra clave.
* **Requiere:** API key gratuita.
* **Ejercicio posible:**

  * Pedir al alumno una palabra clave o fuente.
  * Extraer los últimos artículos (JSON).
  * Analizar cuántos artículos por fuente, fechas, palabras más frecuentes.
  * Guardar CSV para análisis de tendencias.

---

##### **PROPUESTA 2 Alpha Vantage (finanzas / bolsa)**

* **Web:** [https://www.alphavantage.co](https://www.alphavantage.co)
* **Tipo:** Datos de acciones, índices, divisas y cripto.
* **Requiere:** API key gratuita.
* **Ejercicio:**

  * Pedir al alumno un símbolo de acción (ej. AAPL, TSLA).
  * Extraer datos históricos diarios o intradía.
  * Calcular medias móviles, máximos, mínimos.
  * Graficar evolución de precios con `matplotlib`.

---

##### **PROPUESTA 3 TheCocktailDB (cocteles)**

* **Web:** [https://www.thecocktaildb.com/api.php](https://www.thecocktaildb.com/api.php)
* **Tipo:** Base de datos de cocteles (nombre, ingredientes, categoría, alcohol).
* **Requiere:** API key gratuita.
* **Ejercicio:**

  * Pedir un ingrediente.
  * Listar todas las bebidas que lo contienen.
  * Crear CSV con nombre, categoría, alcohol y receta.

---

##### **PROPUESTA 4 TMDB (The Movie Database)**

* **Web:** [https://www.themoviedb.org/documentation/api](https://www.themoviedb.org/documentation/api)
* **Tipo:** Información de películas, actores, géneros, ratings.
* **Requiere:** API key gratuita.
* **Ejercicio:**

  * Buscar películas de un año o actor.
  * Analizar ratings, duración, género.
  * Graficar distribución de géneros o ratings.

=============== ESTOS NO NECESITAN API KEY ====================
                    
##### **PROPUESTA 5: OpenAQ – Calidad del Aire**

API Key: No es obligatoria para fines educativos; puedes usar la API sin key.

Documentación: https://docs.openaq.org/
                    
**Enunciado:**

1. Solicita al usuario una o varias ciudades.
2. Conecta con la API de OpenAQ para obtener los datos de calidad del aire de cada ciudad.
3. Muestra en consola, para cada ciudad:

   * Concentración de PM2.5, PM10, CO y O3 (si están disponibles)
   * Última fecha de medición
4. Guarda los datos obtenidos en un archivo CSV.
5. Genera un gráfico de barras mostrando la concentración de PM2.5 por ciudad.

---

##### **PROPUESTA 6: COVID-19 – Series temporales por país**

API Key: No es obligatoria para fines educativos; puedes usar la API sin key.

Documentación: https://docs.openaq.org/
    
**Enunciado:**

1. Solicita al usuario uno o varios países.
2. Conecta con la API de COVID-19 para obtener los casos diarios de los últimos 30 días de cada país.
3. Muestra en consola, para cada país:

   * Fecha con mayor número de casos diarios
   * Media de casos diarios
4. Guarda los datos obtenidos en un archivo CSV.
5. Genera un gráfico de líneas mostrando la evolución de casos diarios para cada país.