# Uso de APIs en Ciencia de Datos con Python 



Una de las formas de obtención de datos es a través de **APIs (Application Programming Interfaces)**. Las APIs son una forma eficiente de acceder a datos y servicios en línea. Hoy aprenderás qué es una **API**, cómo conectarte a una desde **Python** utilizando la popular biblioteca `requests` y cómo convertir los datos obtenidos a un **archivo CSV** para analizarlos. 



# Que es una api 

Una API (Application Programming Interface) es un conjunto de reglas y protocolos que permiten a diferentes aplicaciones interactuar entre sí. Las APIs permiten a las aplicaciones solicitar datos o realizar acciones en un servidor remoto de manera estructurada y estandarizada. las APIs son muy útiles para obtener datos actualizados desde internet.

![imagen](./img/http.PNG)



Ejemplos comunes:
- Datos meteorológicos (OpenWeather)
- Noticias o precios financieros
- Datos públicos (gobiernos, universidades, ciencia, etc.)

## Cómo funciona una API REST

Las APIs REST son las más comunes y se basan en peticiones HTTP.  
Algunos conceptos clave:

| Elemento | Descripción | Ejemplo |
|-----------|--------------|----------|
| **Endpoint** | URL a la que se accede | `https://api.publicapis.org/entries` |
| **Método** | Tipo de acción (GET, POST, PUT, DELETE) | `GET` |
| **Parámetros** | Filtros o configuraciones | `?category=Animals` |
| **Headers** | Información adicional | Tipo de contenido, autenticación |
| **Respuesta** | Datos que devuelve la API | JSON |

El Protocolo de Transferencia de Hipertexto (HTTP) es el protocolo subyacente utilizado en la World Wide Web. Se utiliza para solicitar y transmitir datos en la web. 

![imagen](./img/peticion_respuesta.PNG)

Aquí tienes un ejemplo de arquitectura:

![imagen](./img/arquitectura_servidor.PNG)

[Requests Documentation](https://docs.python-requests.org/): La librería HTTP de Python

Las solicitudes HTTP se pueden realizar utilizando varios métodos, siendo los más comunes:

* **GET**: Para recuperar datos.
* **POST**: Para enviar datos al servidor.
* **PUT**: Para actualizar datos en el servidor.
* **DELETE**: Para eliminar datos en el servidor.


![imagen](./img/documentacion_api.PNG)

Podemos hacer una petición:

![imagen](./img/parametros.PNG)

y obtener como respuesta diferentes códigos:
[HTTP Status Codes](https://httpstatuses.com/)

![imagen](./img/status_codes.PNG)

## Flujo típico de trabajo con APIs en Ciencia de Datos

1. Conectarse con `requests`
2. Recibir datos en formato **JSON**
3. Convertirlos a **pandas DataFrame**
4. Analizarlos o visualizarlos
5. Exportarlos a **CSV**

[un monton de API Gratuitas](https://publicapis.io/)

In [None]:
# ==========================================
# PASO 1: IMPORTACIÓN DE LIBRERÍAS NECESARIAS
# ==========================================
# En este primer paso importamos todas las bibliotecas que vamos a utilizar
# para trabajar con APIs y procesar los datos obtenidos

# requests: Librería para hacer peticiones HTTP a APIs
# Es la biblioteca principal para comunicarnos con servicios web
import requests

# zipfile: Librería para trabajar con archivos comprimidos en formato .zip
# Nos permite extraer archivos descargados desde APIs
import zipfile

# pandas: Librería fundamental para análisis de datos
# Nos permite trabajar con datos en formato tabular (DataFrames)
import pandas as pd

# matplotlib.pyplot: Librería para crear visualizaciones y gráficos
# plt es el alias estándar que usamos para llamar a sus funciones
import matplotlib.pyplot as plt

## Primera petición

In [None]:
# ==========================================
# PASO 2: PRIMERA PETICIÓN A UNA URL - DESCARGA DE IMAGEN
# ==========================================
# En este ejemplo vamos a descargar una imagen desde internet usando requests

# Definimos la URL de la imagen que queremos descargar
# En este caso es una imagen de Twitter (ahora X)
url = "https://pbs.twimg.com/profile_images/616689518968762368/rkhjKqNb.jpg"

# Hacemos una petición GET a la URL para obtener la imagen
# requests.get() envía una solicitud HTTP al servidor y recibe la respuesta
# La respuesta se guarda en la variable 'image'
image = requests.get(url)

In [None]:
# Mostramos el objeto Response completo
# Esto nos permite ver información como el código de estado (200 = éxito)
# y otros metadatos de la petición HTTP
image

In [None]:
# Accedemos al contenido binario de la respuesta
# .content devuelve los datos en formato de bytes (binary)
# Este formato es necesario para guardar imágenes, videos, PDFs, etc.
image.content

In [None]:
# Guardamos la imagen descargada en nuestro disco local

# Usamos 'with open()' que es una buena práctica en Python
# porque cierra el archivo automáticamente cuando termina
# "data/mutenrroy.jpg" es la ruta donde guardaremos la imagen
# 'wb' significa "write binary" (escribir en modo binario)
with open("data/mutenrroy.jpg", 'wb') as f:
    # Escribimos el contenido binario de la imagen en el archivo
    f.write(image.content)
    
# Al terminar este bloque, la imagen ya está guardada en la carpeta data/

## Mediante pandas

In [None]:
# ==========================================
# USAR PANDAS PARA LEER DATOS DIRECTAMENTE DESDE UNA URL
# ==========================================
# Pandas puede leer archivos CSV directamente desde internet sin descargarlos

# pd.read_csv() lee un archivo CSV y lo convierte en un DataFrame
# La URL apunta a un dataset de inflación mundial
# Esto es muy útil porque no necesitamos descargar el archivo primero
df_inflation = pd.read_csv('https://datahub.io/core/inflation/r/inflation-gdp.csv')

# .head() muestra las primeras 5 filas del DataFrame
# Esto nos permite visualizar rápidamente la estructura de los datos
df_inflation.head()

In [None]:
# Filtramos el DataFrame para obtener solo los datos de España

# df_inflation[condición] es la sintaxis para filtrar en pandas
# df_inflation['Country'] == "Spain" crea una condición booleana
# Solo se mostrarán las filas donde la columna 'Country' sea igual a "Spain"
df_inflation[df_inflation['Country'] == "Spain"]

## Bicimad

In [None]:
# ==========================================
# DESCARGAR UN ARCHIVO ZIP DESDE UNA API - BICIMAD
# ==========================================
# Este ejemplo muestra cómo trabajar con APIs que devuelven archivos comprimidos

# URL que apunta a un archivo ZIP con datos de movimientos de Bicimad (junio 2021)
# Bicimad es el sistema de bicicletas públicas de Madrid
url = 'https://opendata.emtmadrid.es/getattachment/c3383795-121b-4ebf-98b4-c7b05e902eaf/202106_movements.aspx'

# Hacemos una petición GET para descargar el archivo ZIP
# La respuesta se guarda en la variable 'r'
r = requests.get(url)

In [None]:
# Mostramos el objeto Response para verificar que la petición fue exitosa
# Si vemos <Response [200]> significa que todo fue bien
r

In [None]:
# Guardamos el contenido descargado como un archivo ZIP en nuestro disco

# Definimos el nombre del archivo donde guardaremos el ZIP
filename = 'data/bicis.zip'

# Abrimos un archivo en modo escritura binaria ('wb')
with open(filename, 'wb') as f:
    # Escribimos el contenido binario de la respuesta en el archivo
    f.write(r.content)
    
# El archivo ZIP ya está guardado en la carpeta data/

In [None]:
# Extraemos el contenido del archivo ZIP

# Definimos la ruta del archivo ZIP que queremos descomprimir
filename = 'data/bicis.zip'

# Usamos zipfile.ZipFile para abrir el archivo comprimido
# 'r' significa modo lectura (read)
with zipfile.ZipFile(filename, 'r') as zip_ref:
    # extractall() extrae todos los archivos del ZIP
    # Los archivos se extraerán en la carpeta "data/"
    zip_ref.extractall("data/")
    
# Ahora tenemos el archivo JSON descomprimido en la carpeta data/

In [None]:
# Leemos el archivo JSON y lo convertimos en un DataFrame

# pd.read_json() lee archivos en formato JSON
# 'data/202106_movements.json' es la ruta del archivo extraído
# lines=True indica que cada línea del archivo es un objeto JSON independiente
# encoding='latin-1' especifica la codificación de caracteres para leer correctamente tildes y ñ
# nrows=10000 limita la lectura a las primeras 10,000 filas (útil para archivos muy grandes)
datos_bicis = pd.read_json('data/202106_movements.json', lines=True, encoding='latin-1', nrows=10000)

In [None]:
# Visualizamos las primeras 5 filas del DataFrame de bicis

# .head() nos permite ver rápidamente cómo están estructurados los datos
# y qué columnas tiene el DataFrame
datos_bicis.head()

In [None]:
# Obtenemos información general sobre el DataFrame

# .info() muestra:
# - Número total de filas y columnas
# - Nombre de cada columna
# - Tipo de datos de cada columna (int, float, object, etc.)
# - Cantidad de valores no nulos en cada columna
# - Uso de memoria del DataFrame
datos_bicis.info()

<table align="left">
 <tr><td width="80"><img src="./img/ejercicio.png" style="width:auto;height:auto"></td>
     <td style="text-align:left">
         <h3>Ejercicio datos.gob.es</h3>

Descarga con pandas un dataset de la página https://datos.gob.es/es/catalogo acerca del empleo y guárdalo en un csv en la carpeta data. Puedes utilizar pandas.
         
 </td></tr>
</table>

In [None]:
# ==========================================
# EJERCICIO: DESCARGAR DATOS DE DATOS.GOB.ES
# ==========================================
# En este ejemplo descargamos datos del Instituto Nacional de Estadística (INE)
# sobre riesgo de pobreza en España

# URL del dataset de riesgo de pobreza del INE
url = "https://www.ine.es/jaxiT3/files/t/csv_bdsc/59962.csv"

# Leemos el CSV directamente desde la URL usando pandas
df = pd.read_csv(url)

# Guardamos el DataFrame en un archivo CSV local
# "data/riesgo_pobreza.csv" es la ruta donde se guardará
# Este archivo ahora está disponible para análisis futuros
df.to_csv("data/riesgo_pobreza.csv")

In [None]:
# EJEMPLO AVANZADO: Descargar múltiples datasets en un bucle

# Creamos un diccionario que almacena nombres de archivos y sus URLs
# Clave = nombre del archivo, Valor = URL del dataset
datasets = {"riesgo_pobreza": "https://www.ine.es/jaxiT3/files/t/csv_bdsc/59962.csv",
            "dataset_2": "https://www.ine.es/jaxiT3/files/t/csv_bdsc/59947.csv",
            # "dataset_3": "https://www.ine.es/jaxiT3/files/t/csv_bdsc/60144.csv"  # Comentado
            }

# Iteramos sobre cada par clave-valor del diccionario
# key = nombre del archivo, value = URL
for key, value in datasets.items():
    # Leemos el CSV desde la URL
    df = pd.read_csv(value)

    # Guardamos el DataFrame con el nombre correspondiente
    # Concatenamos "data/" + nombre + ".csv" para crear la ruta completa
    # Ejemplo: "data/riesgo_pobreza.csv"
    df.to_csv("data/" + key + ".csv")
    
# Este enfoque es muy útil cuando necesitamos descargar múltiples datasets

## Api chucknorris

[Enlace API](https://api.chucknorris.io/)

In [None]:
# ==========================================
# API CHUCK NORRIS - CÓDIGO BASE PARA CUALQUIER PETICIÓN API
# ==========================================
# Este es el patrón básico que usaremos para trabajar con APIs REST

# 1. Definimos la URL del endpoint de la API
# Esta API devuelve chistes aleatorios de Chuck Norris
url = "https://api.chucknorris.io/jokes/random" 

# 2. Hacemos la petición GET al servidor
# requests.get() envía la solicitud y recibe la respuesta
response = requests.get(url)

# 3. Verificamos el código de estado de la respuesta
# 200 significa que la petición fue exitosa
if response.status_code == 200:  # Código 200 indica una respuesta exitosa.
    # 4. Convertimos la respuesta JSON en un diccionario de Python
    # .json() parsea el texto JSON y lo convierte en estructuras Python
    data = response.json()  # Analizar la respuesta JSON.
    
    # 5. Accedemos al chiste dentro del diccionario
    # data["value"] contiene el texto del chiste
    print(data["value"])
else:
    # Si el código no es 200, mostramos un mensaje de error
    print("Error en la solicitud: ", response.status_code)

In [None]:
# Creamos una FUNCIÓN para reutilizar el código de petición API

# Definimos una función que recibe una URL como parámetro
def get_joke(url):
    # Hacemos la petición GET a la URL proporcionada
    response = requests.get(url)

    # Verificamos si la petición fue exitosa
    if response.status_code == 200:  # Código 200 indica una respuesta exitosa.
        # Convertimos la respuesta JSON a un diccionario Python
        data = response.json()  # Analizar la respuesta JSON.
        
        # Retornamos los datos completos
        return data
    else:
        # Si hay error, imprimimos el código de estado
        print("Error en la solicitud: ", response.status_code)
        
# Esta función hace nuestro código más limpio y reutilizable

In [None]:
# Obtenemos la lista de CATEGORÍAS disponibles en la API

# URL del endpoint que devuelve todas las categorías de chistes
url = "https://api.chucknorris.io/jokes/categories"

# Llamamos a nuestra función personalizada para hacer la petición
# Esto nos devuelve una lista con todas las categorías disponibles
get_joke(url)

In [None]:
# Obtenemos un chiste aleatorio de UNA CATEGORÍA ESPECÍFICA

# Definimos la categoría que queremos (por ejemplo: science, sport, food, etc.)
categoria = "science"

# Usamos f-strings para construir la URL con parámetros
# ?category={categoria} añade un query parameter a la URL
# Esto le dice a la API que queremos un chiste de esa categoría específica
url = f"https://api.chucknorris.io/jokes/random?category={categoria}"

# Llamamos a nuestra función para obtener el chiste
get_joke(url)

In [None]:
# BÚSQUEDA de chistes que contengan una palabra específica

# Definimos la palabra que queremos buscar en los chistes
query = "Spain"

# Construimos la URL con el parámetro de búsqueda
# ?query={query} busca todos los chistes que contengan esa palabra
url = f"https://api.chucknorris.io/jokes/search?query={query}"

# Llamamos a la función para obtener los resultados de la búsqueda
# Esto devolverá múltiples chistes que contengan la palabra "Spain"
get_joke(url)

In [None]:
# ==========================================
# SETEO COMPLETO: De API a DataFrame a CSV
# ==========================================
# Este ejemplo muestra el flujo completo de trabajo con APIs en Data Science

# 1. Definir consulta
# Especificamos la palabra que queremos buscar
query = "Spain"
url = f"https://api.chucknorris.io/jokes/search?query={query}"

# 2. Hacer la solicitud
# Enviamos la petición GET a la API
response = requests.get(url)

# 3. Verificar estado
# Comprobamos que la petición fue exitosa
if response.status_code == 200:
    # Convertimos la respuesta JSON en un diccionario Python
    data = response.json()
    
    # El resultado viene en data["result"]
    # La API devuelve los chistes dentro de una clave llamada "result"
    jokes = data["result"]

    # 4. Convertir a DataFrame
    # Transformamos la lista de chistes en un DataFrame de pandas
    # Esto nos permite manipular y analizar los datos fácilmente
    df_jokes = pd.DataFrame(jokes)

    # 5. Guardar a CSV
    # Creamos un nombre de archivo dinámico usando la query
    filename = f"chuck_jokes_{query.lower()}.csv"
    
    # Guardamos el DataFrame en formato CSV
    # index=False evita que se guarde el índice como columna
    # encoding="utf-8" asegura que los caracteres especiales se guarden correctamente
    df_jokes.to_csv(filename, index=False, encoding="utf-8")
    
    # Mostramos mensaje de confirmación con la cantidad de chistes
    print(f"Archivo '{filename}' guardado con {len(df_jokes)} chistes.")

    # Mostrar algunos resultados
    # display() muestra el DataFrame de forma más bonita que print()
    # Seleccionamos solo las columnas "id" y "value" y mostramos las primeras 5 filas
    display(df_jokes[["id", "value"]].head())

else:
    # Si hubo algún error, mostramos el código de estado
    print("Error en la solicitud:", response.status_code)

## Ejemplo 2: Cat Facts API

La API [Cat Facts](https://catfact.ninja/) devuelve datos curiosos sobre gatos.

**URL base:** `https://catfact.ninja/facts`


In [None]:
# ==========================================
# CAT FACTS API - Datos curiosos sobre gatos
# ==========================================

# 1. Definir la URL
# ?limit=30 es un parámetro que indica que queremos 30 datos de gatos
url = "https://catfact.ninja/facts?limit=30"

# 2. Solicitud GET
# Hacemos la petición a la API
response = requests.get(url)

# 3. Verificar estado
# Comprobamos que la petición fue exitosa
if response.status_code == 200:
    # Convertimos la respuesta JSON a diccionario Python
    data = response.json()
    
    # Los datos vienen dentro de la clave "data"
    # Extraemos solo esa parte que contiene los facts
    facts = data["data"]

    # 4. Convertir a DataFrame
    # Transformamos la lista de facts en un DataFrame de pandas
    df_cats = pd.DataFrame(facts)

    # 5. Mostrar primeros datos
    # display() muestra el DataFrame de forma visual y clara
    display(df_cats.head())

    # 6. Exportar a CSV
    # Guardamos los datos en un archivo local para análisis posteriores
    df_cats.to_csv("cat_facts.csv", index=False)
    print("✅ Archivo guardado como cat_facts.csv")

    # 7. Analizar longitud de cada fact
    # Creamos una nueva columna calculando la longitud de cada texto
    # .apply(len) aplica la función len() a cada elemento de la columna "fact"
    # Esto nos permite analizar qué tan largos son los facts
    df_cats["length"] = df_cats["fact"].apply(len)


else:
    # Si hubo error, mostramos el código de estado
    print("❌ Error en la solicitud:", response.status_code)

## Datos del espacio

In [None]:
# ==========================================
# API DEL ESPACIO - The Space Devs
# ==========================================
# Esta API proporciona información sobre astronautas, lanzamientos espaciales, etc.

'''
Documentación de la API:
https://thespacedevs.com/llapi
https://ll.thespacedevs.com/2.2.0/swagger
'''

# Definimos la URL base de la API
# Esta es la raíz desde donde accederemos a todos los endpoints
space_url = "http://ll.thespacedevs.com/2.2.0"

# Definimos el path (ruta) del endpoint específico que queremos consultar
# En este caso, queremos información sobre astronautas
path = "/astronaut"

# Concatenamos la URL base con el path para crear la URL completa
url_total = space_url + path

# Hacemos la petición GET a la API
# Esto nos devolverá información sobre astronautas
response = requests.get(url_total)

In [None]:
# Verificamos el código de estado de la respuesta
# Debería mostrarnos 200 si la petición fue exitosa
print(response.status_code)

# Verificamos el tipo de dato del contenido
# Debería ser 'bytes' (datos binarios)
type(response.content)

# Convertimos la respuesta JSON a un diccionario Python y lo mostramos
# .json() parsea el texto JSON y nos devuelve una estructura de datos Python
response.json()

In [None]:
# Mostramos la URL completa que estamos usando
# Esto es útil para verificar que la URL se construyó correctamente
url_total

In [None]:
# Añadimos PARÁMETROS a la URL para filtrar los resultados

# Construimos una nueva URL con un parámetro de filtro
# /?age=45 filtra para mostrar solo astronautas de 45 años
# El símbolo ? indica el inicio de los parámetros de la URL
url_total = space_url + path + "/?age=45"

# Hacemos una nueva petición con este filtro aplicado
response_sp = requests.get(url_total)

In [None]:
# Mostramos el objeto Response de la nueva petición filtrada
response_sp

In [None]:
# Verificamos la URL con el parámetro de edad
url_total

In [None]:
# Convertimos la respuesta a JSON y la mostramos
# Esto nos permite ver todos los datos de los astronautas de 45 años
response_sp.json()

In [None]:
# Convertimos directamente los resultados en un DataFrame

# response_sp.json() devuelve todo el JSON
# ['results'] accede específicamente a la lista de astronautas dentro del JSON
# pd.DataFrame() convierte esa lista en un DataFrame de pandas
pd.DataFrame(response_sp.json()['results'])

In [None]:
# Filtramos por NACIONALIDAD - Astronautas españoles

# Construimos la URL con el parámetro nationality=Spanish
# Esto nos devolverá solo los astronautas de nacionalidad española
url_total = space_url + path + "/?nationality=Spanish"

# Hacemos la petición con el filtro de nacionalidad
response_sp = requests.get(url_total)

# Mostramos el objeto Response para verificar que fue exitosa
print(response_sp)

# Convertimos y mostramos los datos JSON
# Veremos información sobre todos los astronautas españoles
response_sp.json()

In [None]:
# Iteramos sobre los resultados para imprimir solo los NOMBRES

# response_sp.json()['results'] nos da la lista de astronautas
# for astronauta in ... recorre cada astronauta de la lista
for astronauta in response_sp.json()['results']:
    # Cada astronauta es un diccionario, accedemos a la clave 'name'
    # Esto imprime solo el nombre de cada astronauta español
    print(astronauta['name'])

### Modo Avanzado

### preparamos los dos siguiente ejemplos con funciones y las librerias necesarias 

In [None]:
# ==========================================
# MODO AVANZADO: IMPORTACIÓN DE LIBRERÍAS Y FUNCIONES AUXILIARES
# ==========================================
# Esta celda prepara un entorno profesional para trabajar con APIs

# Librería principal para hacer peticiones HTTP
import requests

# Librería para análisis y manipulación de datos
import pandas as pd

# Librería para trabajar con datos JSON
import json

# Librerías para crear visualizaciones
import matplotlib.pyplot as plt
import seaborn as sns

# Librería para trabajar con fechas y horas
from datetime import datetime, timedelta

# Librería para pausas y delays en el código
import time

# Librería para operaciones con archivos y directorios
import os
from pathlib import Path

# Typing: Para añadir anotaciones de tipo a nuestras funciones
# Esto hace el código más robusto y fácil de entender
from typing import Dict, List, Optional, Union

# Librería para suprimir warnings innecesarios
import warnings

# ==========================================
# CONFIGURACIÓN PARA VISUALIZACIONES
# ==========================================

# Establecemos el estilo visual por defecto para los gráficos
plt.style.use('default')

# Definimos una paleta de colores armoniosa
sns.set_palette("husl")

# Configuramos el tamaño por defecto de las figuras (12x6 pulgadas)
plt.rcParams['figure.figsize'] = (12, 6)

# Establecemos el tamaño de fuente por defecto
plt.rcParams['font.size'] = 10

# ==========================================
# SUPRIMIR WARNINGS INNECESARIOS
# ==========================================

# Ignoramos warnings que podrían distraer durante el análisis
warnings.filterwarnings('ignore')

# Mensaje de confirmación
print("✅Librerías importadas correctamente")
print(f"📅 Fecha de ejecución: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")


# ==========================================
# FUNCIÓN 1: HACER PETICIÓN API DE MANERA SEGURA
# ==========================================

def hacer_peticion_api(url: str, params: Optional[Dict] = None, 
                      headers: Optional[Dict] = None, timeout: int = 10) -> Optional[Union[Dict, List]]:
    """
    Función para hacer peticiones a APIs de manera segura con manejo de errores
    
    Args:
        url: URL de la API a consultar
        params: Diccionario con parámetros opcionales para la petición (ej: {'limit': 10})
        headers: Diccionario con headers opcionales (ej: {'Authorization': 'Bearer token'})
        timeout: Tiempo límite para la petición en segundos (por defecto 10)
    
    Returns:
        Diccionario o Lista con los datos obtenidos, o None si hay error
    """
    try:
        # Informamos qué URL estamos consultando
        print(f" Haciendo petición a: {url}")
        
        # Realizamos la petición GET con todos los parámetros
        response = requests.get(
            url,                    # URL del endpoint
            params=params,          # Query parameters (si existen)
            headers=headers,        # Headers HTTP (si existen)
            timeout=timeout         # Tiempo máximo de espera
        )
        
        # raise_for_status() lanza una excepción si el código de estado indica error
        # Por ejemplo, si recibimos 404, 500, etc.
        response.raise_for_status()
        
        # Si llegamos aquí, la petición fue exitosa
        print(f" Petición exitosa. Status: {response.status_code}")
        
        # Convertimos la respuesta JSON y la retornamos
        return response.json()
        
    except requests.exceptions.Timeout:
        # Error: La petición tardó demasiado tiempo
        print(f" Timeout: La petición tardó más de {timeout} segundos")
        return None
        
    except requests.exceptions.ConnectionError:
        # Error: No hay conexión a internet o el servidor no responde
        print(" Error de conexión: Verifica tu conexión a internet")
        return None
        
    except requests.exceptions.HTTPError as e:
        # Error: Código de estado HTTP indica error (4xx, 5xx)
        print(f"Error HTTP {e.response.status_code}: {e}")
        return None
        
    except json.JSONDecodeError:
        # Error: La respuesta no es un JSON válido
        print(" Error: La respuesta no es JSON válido")
        return None
        
    except Exception as e:
        # Cualquier otro error inesperado
        print(f" Error inesperado: {e}")
        return None


# ==========================================
# FUNCIÓN 2: GUARDAR DATAFRAME EN CSV CON TIMESTAMP
# ==========================================

def guardar_csv(dataframe: pd.DataFrame, nombre_archivo: str, 
                carpeta: str = "datos_api") -> bool:
    """
    Guarda un DataFrame en formato CSV con timestamp automático
    
    Args:
        dataframe: DataFrame de pandas que queremos guardar
        nombre_archivo: Nombre del archivo sin extensión (ej: "criptomonedas")
        carpeta: Carpeta donde guardar el archivo (por defecto "datos_api")
    
    Returns:
        True si se guardó correctamente, False en caso contrario
    """
    try:
        # Crear carpeta si no existe
        # exist_ok=True evita error si la carpeta ya existe
        Path(carpeta).mkdir(exist_ok=True)
        
        # Crear timestamp (marca de tiempo) para el archivo
        # Formato: YYYYMMDD_HHMMSS (ej: 20240315_143022)
        timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
        
        # Construir la ruta completa del archivo
        # Ejemplo: datos_api/criptomonedas_20240315_143022.csv
        archivo_completo = Path(carpeta) / f"{nombre_archivo}_{timestamp}.csv"
        
        # Guardar CSV
        # index=False: No guardamos el índice numérico como columna
        # encoding='utf-8': Guardamos con codificación UTF-8 (acepta tildes y caracteres especiales)
        dataframe.to_csv(archivo_completo, index=False, encoding='utf-8')
        
        # Mostramos información sobre el archivo guardado
        print(f" Archivo guardado: {archivo_completo}")
        print(f" Filas guardadas: {len(dataframe):,}")  # :, añade separador de miles
        print(f" Columnas: {list(dataframe.columns)}")
        
        return True
        
    except Exception as e:
        # Si ocurre algún error al guardar
        print(f" Error al guardar: {e}")
        return False


# ==========================================
# FUNCIÓN 3: MOSTRAR INFORMACIÓN DETALLADA DE UN DATAFRAME
# ==========================================

def mostrar_info_dataframe(df: pd.DataFrame, nombre: str) -> None:
    """
    Muestra información resumida y útil de un DataFrame
    
    Args:
        df: DataFrame a analizar
        nombre: Nombre descriptivo del DataFrame para el reporte
    """
    # Título del reporte
    print(f"\n Información del DataFrame: {nombre}")
    print("=" * 50)
    
    # Dimensiones del DataFrame
    # df.shape devuelve (filas, columnas)
    # :, añade separador de miles para mejor legibilidad
    print(f" Dimensiones: {df.shape[0]:,} filas × {df.shape[1]} columnas")
    
    # Memoria usada por el DataFrame
    # memory_usage(deep=True) calcula el uso real de memoria
    # / 1024**2 convierte de bytes a megabytes
    print(f" Memoria usada: {df.memory_usage(deep=True).sum() / 1024**2:.2f} MB")
    
    # Información de columnas y sus tipos de datos
    print("\n Tipos de datos:")
    for col, dtype in df.dtypes.items():
        print(f"  • {col}: {dtype}")
    
    # Análisis de valores nulos
    nulos = df.isnull().sum()  # Cuenta valores nulos por columna
    
    if nulos.sum() > 0:  # Si hay valores nulos
        print("\n Valores nulos:")
        # Iteramos solo sobre las columnas que tienen nulos
        for col, count in nulos[nulos > 0].items():
            # Calculamos el porcentaje de nulos
            porcentaje = (count / len(df)) * 100
            print(f"  • {col}: {count:,} ({porcentaje:.1f}%)")
    else:
        print("\n No hay valores nulos")
    
    # Mostramos las primeras 3 filas del DataFrame
    print("\n🔍 Primeras 3 filas:")
    display(df.head(3))


# Mensaje final de confirmación
print("\n Funciones auxiliares definidas correctamente")

## JSONPlaceholder API 

[JSONPlaceholder](https://jsonplaceholder.typicode.com/) es una API REST gratuita perfecta para practicar. Proporciona datos falsos de posts, usuarios, comentarios, etc.

###  Características:
-  **Gratuita** - Sin registro necesario
-  **Sin límites** - Uso ilimitado
-  **Fácil de usar** - Endpoints simples y claros
-  **Datos consistentes** - Perfecta para aprender

###  Obteniendo Posts

In [None]:
# ==========================================
# JSONPLACEHOLDER API - API de prueba con datos falsos
# ==========================================
# JSONPlaceholder es una API REST gratuita perfecta para aprender y practicar

# Obtenemos todos los posts de JSONPlaceholder
print("🔍 Obteniendo posts de JSONPlaceholder...")

# URL del endpoint que devuelve todos los posts
url_posts = "https://jsonplaceholder.typicode.com/posts"

# Usamos nuestra función personalizada para hacer la petición
# Esta función maneja automáticamente errores y verifica el estado
datos_posts = hacer_peticion_api(url_posts)

# Verificamos si obtuvimos datos correctamente
if datos_posts:
    # Mostramos cuántos posts se obtuvieron
    # :, añade separador de miles
    print(f" Se obtuvieron {len(datos_posts):,} posts")
    
    # Mostramos la estructura del primer post como ejemplo
    print("\n Estructura del primer post:")
    # json.dumps() convierte el diccionario a texto JSON formateado
    # indent=2 añade sangría de 2 espacios para mejor legibilidad
    # ensure_ascii=False permite mostrar tildes y caracteres especiales correctamente
    print(json.dumps(datos_posts[0], indent=2, ensure_ascii=False))
    
    # Convertir la lista de posts a un DataFrame de pandas
    df_posts = pd.DataFrame(datos_posts)
    
    # ==========================================
    # ENRIQUECEMOS EL DATAFRAME CON METADATOS
    # ==========================================
    
    # Añadimos un timestamp de cuándo descargamos los datos
    # .isoformat() devuelve la fecha en formato ISO (ej: 2024-03-15T14:30:22)
    df_posts['timestamp_descarga'] = datetime.now().isoformat()
    
    # Añadimos la fuente de los datos (útil si mezclamos datos de múltiples APIs)
    df_posts['fuente'] = 'JSONPlaceholder'
    
    # Calculamos la longitud de cada título
    # .str.len() calcula cuántos caracteres tiene cada string
    df_posts['longitud_titulo'] = df_posts['title'].str.len()
    
    # Calculamos la longitud del contenido (body)
    df_posts['longitud_contenido'] = df_posts['body'].str.len()
    
    # Mostramos información detallada del DataFrame usando nuestra función
    mostrar_info_dataframe(df_posts, "Posts de JSONPlaceholder")
    
    # ==========================================
    # ANÁLISIS ESTADÍSTICO BÁSICO
    # ==========================================
    
    print("\n Estadísticas de los posts:")
    
    # Número total de posts
    print(f"  • Posts totales: {len(df_posts):,}")
    
    # Contamos cuántos usuarios únicos hay
    # .nunique() cuenta valores únicos en una columna
    print(f"  • Usuarios únicos: {df_posts['userId'].nunique()}")
    
    # Calculamos la longitud promedio de los títulos
    # .mean() calcula el promedio
    print(f"  • Longitud promedio del título: {df_posts['longitud_titulo'].mean():.1f} caracteres")
    
    # Calculamos la longitud promedio del contenido
    print(f"  • Longitud promedio del contenido: {df_posts['longitud_contenido'].mean():.1f} caracteres")
    
else:
    # Si datos_posts es None, significa que hubo un error en la petición
    print(" No se pudieron obtener los posts")

##  CoinGecko API 

[CoinGecko](https://www.coingecko.com/en/api) proporciona una API gratuita para datos de criptomonedas sin necesidad de registro.

###  Características:
-  **Completamente gratuita** - Sin registro necesario
-  **Datos completos** - Precios, market caps, volúmenes, etc.
-  **Datos históricos** - Acceso a datos del pasado
-  **Actualizaciones frecuentes** - Datos en tiempo real

###  Obteniendo Datos de Criptomonedas

In [None]:
# ==========================================
# COINGECKO API - Datos de Criptomonedas en Tiempo Real
# ==========================================
# CoinGecko proporciona datos gratuitos de precios y mercado de criptomonedas

# Obtenemos las top 100 criptomonedas por capitalización de mercado
print(" Obteniendo datos de criptomonedas desde CoinGecko...")

# URL del endpoint para obtener datos del mercado de criptomonedas
url_crypto = "https://api.coingecko.com/api/v3/coins/markets"

# ==========================================
# PARÁMETROS DE LA PETICIÓN
# ==========================================
# Creamos un diccionario con los parámetros que queremos enviar

parametros_crypto = {
    'vs_currency': 'usd',           # Mostrar precios en dólares estadounidenses
    'order': 'market_cap_desc',     # Ordenar por capitalización de mercado descendente (mayor a menor)
    'per_page': 100,                # Número de resultados por página (100 criptos)
    'page': 1,                      # Página número 1 (las primeras 100)
    'sparkline': False,             # No incluir datos de gráfico sparkline (ahorra ancho de banda)
    'price_change_percentage': '1h,24h,7d,30d'  # Incluir cambios de precio en estas ventanas de tiempo
}

# Hacemos la petición usando nuestra función personalizada
# Pasamos tanto la URL como los parámetros
datos_crypto = hacer_peticion_api(url_crypto, parametros_crypto)

# Verificamos si la petición fue exitosa
if datos_crypto:
    # Informamos cuántas criptomonedas obtuvimos
    print(f" Se obtuvieron datos de {len(datos_crypto)} criptomonedas")
    
    # ==========================================
    # MOSTRAR ESTRUCTURA DE DATOS
    # ==========================================
    
    print("\n Estructura del primer registro:")
    # Creamos un diccionario solo con los campos más importantes del primer registro
    # Esto nos permite ver la estructura sin abrumar con todos los datos
    campos_ejemplo = {k: v for k, v in datos_crypto[0].items() if k in 
         ['id', 'symbol', 'name', 'current_price', 'market_cap', 'price_change_percentage_24h']}
    
    # Mostramos el diccionario formateado como JSON
    print(json.dumps(campos_ejemplo, indent=2, ensure_ascii=False))
    
    # ==========================================
    # CREAR DATAFRAME
    # ==========================================
    
    # Convertimos la lista de criptomonedas en un DataFrame
    df_crypto = pd.DataFrame(datos_crypto)
    
    # Seleccionamos solo las columnas más relevantes para el análisis
    # Esto hace el DataFrame más manejable y fácil de entender
    columnas_relevantes = [
        'id',                           # Identificador único de la cripto
        'symbol',                       # Símbolo (BTC, ETH, etc.)
        'name',                         # Nombre completo
        'current_price',                # Precio actual en USD
        'market_cap',                   # Capitalización de mercado
        'market_cap_rank',              # Ranking por capitalización
        'total_volume',                 # Volumen de trading en 24h
        'price_change_24h',             # Cambio de precio en 24h (valor absoluto)
        'price_change_percentage_24h',  # Cambio de precio en 24h (porcentaje)
        'price_change_percentage_7d',   # Cambio de precio en 7 días (porcentaje)
        'price_change_percentage_30d',  # Cambio de precio en 30 días (porcentaje)
        'circulating_supply',           # Suministro circulante
        'total_supply',                 # Suministro total
        'max_supply',                   # Suministro máximo
        'ath',                          # All-time high (precio histórico más alto)
        'ath_date'                      # Fecha del ATH
    ]
    
    # Filtramos solo las columnas que realmente existen en el DataFrame
    # Esto previene errores si alguna columna no está presente
    columnas_existentes = [col for col in columnas_relevantes if col in df_crypto.columns]
    
    # Creamos un nuevo DataFrame con solo las columnas seleccionadas
    # .copy() crea una copia independiente (buena práctica)
    df_crypto_limpio = df_crypto[columnas_existentes].copy()
    
    # ==========================================
    # AÑADIR METADATOS
    # ==========================================
    
    # Añadimos timestamp de cuándo descargamos los datos
    df_crypto_limpio['timestamp'] = datetime.now().isoformat()
    
    # Añadimos la fuente de los datos
    df_crypto_limpio['fuente'] = 'CoinGecko'
    
    # Mostramos información detallada del DataFrame
    mostrar_info_dataframe(df_crypto_limpio, "Datos de Criptomonedas")
    
    # ==========================================
    # MOSTRAR TOP 10 CRIPTOMONEDAS
    # ==========================================
    
    print("\n Top 10 criptomonedas por capitalización:")
    # Seleccionamos columnas relevantes y mostramos las primeras 10 filas
    display(df_crypto_limpio[['name', 'symbol', 'current_price', 'market_cap_rank', 'price_change_percentage_24h']].head(10))
    
    # ==========================================
    # ESTADÍSTICAS DEL MERCADO CRYPTO
    # ==========================================
    
    print("\n Estadísticas del mercado crypto:")
    
    # Calculamos el precio promedio de las 100 criptos
    print(f"  • Precio promedio: ${df_crypto_limpio['current_price'].mean():.2f}")
    
    # Encontramos la cripto con el precio más alto
    # .max() devuelve el valor máximo
    # .idxmax() devuelve el índice donde está el máximo
    # .loc[] accede a ese índice y extrae el nombre
    precio_max = df_crypto_limpio['current_price'].max()
    cripto_max = df_crypto_limpio.loc[df_crypto_limpio['current_price'].idxmax(), 'name']
    print(f"  • Precio más alto: ${precio_max:.2f} ({cripto_max})")
    
    # Calculamos el cambio promedio en las últimas 24 horas
    print(f"  • Cambio promedio 24h: {df_crypto_limpio['price_change_percentage_24h'].mean():.2f}%")
    
    # ==========================================
    # ANÁLISIS DE TENDENCIAS
    # ==========================================
    
    # Contamos cuántas criptos subieron en las últimas 24h
    # df[condición] filtra el DataFrame
    # len() cuenta cuántas filas cumplen la condición
    subidas = len(df_crypto_limpio[df_crypto_limpio['price_change_percentage_24h'] > 0])
    
    # Contamos cuántas bajaron
    bajadas = len(df_crypto_limpio[df_crypto_limpio['price_change_percentage_24h'] < 0])
    
    print(f"  • Subidas en 24h: {subidas} | Bajadas: {bajadas}")
    
    # ==========================================
    # GUARDAR DATOS EN CSV
    # ==========================================
    
    # Guardamos el DataFrame usando nuestra función personalizada
    # Esto creará un archivo con timestamp automático
    guardar_csv(df_crypto_limpio, "criptomonedas_coingecko")
    
else:
    # Si la petición falló
    print(" No se pudieron obtener datos de criptomonedas")

<table align="left">
 <tr><td width="80"><img src="./img/ejercicio.png" style="width:auto;height:auto"></td>
     <td style="text-align:left">
         <h3>Ejercicio: Consultar Información de Pokémon</h3>

**Objetivo:** Consumir la API de Pokémon y mostrar información básica.
Crea un programa que:

1. Pida al usuario el nombre de un Pokémon
2. Consulte la API: `https://pokeapi.co/api/v2/pokemon/{nombre}`
3. Muestre la siguiente información:
   * Nombre
   * Altura y peso
   * Tipos
   * 3 habilidades



 </td></tr>
</table>

**Pistas:**
- La API devuelve la altura en decímetros (divide entre 10 para metros)
- La API devuelve el peso en hectogramos (divide entre 10 para kg)
- Usa `.lower()` para el nombre del Pokémon en la URL
- Los tipos están en `datos['types']`
- Las habilidades están en `datos['abilities']`

### **APIs Gratuitas Recomendadas:**

#### Sin registro necesario:
- **[JSONPlaceholder](https://jsonplaceholder.typicode.com/)**: Datos de prueba (posts, usuarios, comentarios)
- **[CoinGecko](https://www.coingecko.com/en/api)**: Precios de criptomonedas
- **[REST Countries](https://restcountries.com/)**: Información de países
- **[Cat Facts API](https://catfact.ninja/)**: Datos curiosos sobre gatos
- **[Dog CEO](https://dog.ceo/dog-api/)**: Imágenes aleatorias de perros
- **[Random User](https://randomuser.me/)**: Generador de usuarios aleatorios

#### Con registro gratuito:
- **[OpenWeatherMap](https://openweathermap.org/api)**: Datos meteorológicos (1,000 llamadas/día)
- **[News API](https://newsapi.org/)**: Noticias (1,000 requests/día)
- **[GitHub API](https://docs.github.com/en/rest)**: Datos de repositorios y usuarios
- **[Alpha Vantage](https://www.alphavantage.co/)**: Datos financieros y bursátiles
- **[TMDB](https://www.themoviedb.org/documentation/api)**: Base de datos de películas

#### **Documentación oficial:**
- [Requests Documentation](https://docs.python-requests.org/): La librería HTTP de Python
- [Pandas User Guide](https://pandas.pydata.org/docs/user_guide/): Manipulación de datos
- [Matplotlib Tutorials](https://matplotlib.org/stable/tutorials/index.html): Visualización de datos

#### **Repositorios útiles:**
- [Public APIs](https://github.com/public-apis/public-apis): Lista masiva de APIs públicas
- [Awesome API](https://github.com/TonnyL/Awesome_APIs): APIs curadas por categoría

#### **Guías y best practices:**
- [REST API Design Best Practices](https://restfulapi.net/): Diseño de APIs
- [HTTP Status Codes](https://httpstatuses.com/): Referencia de códigos HTTP
- [Rate Limiting Best Practices](https://konghq.com/blog/how-to-design-a-scalable-rate-limiting-algorithm): Rate limiting
