# Uso de APIs en Ciencia de Datos con Python 



Una de las formas de obtenci√≥n de datos es a trav√©s de **APIs (Application Programming Interfaces)**. Las APIs son una forma eficiente de acceder a datos y servicios en l√≠nea. Hoy aprender√°s qu√© es una **API**, c√≥mo conectarte a una desde **Python** utilizando la popular biblioteca `requests` y c√≥mo convertir los datos obtenidos a un **archivo CSV** para analizarlos. 



# Que es una api 

Una API (Application Programming Interface) es un conjunto de reglas y protocolos que permiten a diferentes aplicaciones interactuar entre s√≠. Las APIs permiten a las aplicaciones solicitar datos o realizar acciones en un servidor remoto de manera estructurada y estandarizada. las APIs son muy √∫tiles para obtener datos actualizados desde internet.

![imagen](./img/http.PNG)



Ejemplos comunes:
- Datos meteorol√≥gicos (OpenWeather)
- Noticias o precios financieros
- Datos p√∫blicos (gobiernos, universidades, ciencia, etc.)

## C√≥mo funciona una API REST

Las APIs REST son las m√°s comunes y se basan en peticiones HTTP.  
Algunos conceptos clave:

| Elemento | Descripci√≥n | Ejemplo |
|-----------|--------------|----------|
| **Endpoint** | URL a la que se accede | `https://api.publicapis.org/entries` |
| **M√©todo** | Tipo de acci√≥n (GET, POST, PUT, DELETE) | `GET` |
| **Par√°metros** | Filtros o configuraciones | `?category=Animals` |
| **Headers** | Informaci√≥n adicional | Tipo de contenido, autenticaci√≥n |
| **Respuesta** | Datos que devuelve la API | JSON |

El Protocolo de Transferencia de Hipertexto (HTTP) es el protocolo subyacente utilizado en la World Wide Web. Se utiliza para solicitar y transmitir datos en la web. 

![imagen](./img/peticion_respuesta.PNG)

Aqu√≠ tienes un ejemplo de arquitectura:

![imagen](./img/arquitectura_servidor.PNG)

[Requests Documentation](https://docs.python-requests.org/): La librer√≠a HTTP de Python

Las solicitudes HTTP se pueden realizar utilizando varios m√©todos, siendo los m√°s comunes:

* **GET**: Para recuperar datos.
* **POST**: Para enviar datos al servidor.
* **PUT**: Para actualizar datos en el servidor.
* **DELETE**: Para eliminar datos en el servidor.


![imagen](./img/documentacion_api.PNG)

Podemos hacer una petici√≥n:

![imagen](./img/parametros.PNG)

y obtener como respuesta diferentes c√≥digos:
[HTTP Status Codes](https://httpstatuses.com/)

![imagen](./img/status_codes.PNG)

## Flujo t√≠pico de trabajo con APIs en Ciencia de Datos

1. Conectarse con `requests`
2. Recibir datos en formato **JSON**
3. Convertirlos a **pandas DataFrame**
4. Analizarlos o visualizarlos
5. Exportarlos a **CSV**

[un monton de API Gratuitas](https://publicapis.io/)

In [None]:
# ==========================================
# PASO 1: IMPORTACI√ìN DE LIBRER√çAS NECESARIAS
# ==========================================
# En este primer paso importamos todas las bibliotecas que vamos a utilizar
# para trabajar con APIs y procesar los datos obtenidos

# requests: Librer√≠a para hacer peticiones HTTP a APIs
# Es la biblioteca principal para comunicarnos con servicios web
import requests

# zipfile: Librer√≠a para trabajar con archivos comprimidos en formato .zip
# Nos permite extraer archivos descargados desde APIs
import zipfile

# pandas: Librer√≠a fundamental para an√°lisis de datos
# Nos permite trabajar con datos en formato tabular (DataFrames)
import pandas as pd

# matplotlib.pyplot: Librer√≠a para crear visualizaciones y gr√°ficos
# plt es el alias est√°ndar que usamos para llamar a sus funciones
import matplotlib.pyplot as plt

## Primera petici√≥n

In [None]:
# ==========================================
# PASO 2: PRIMERA PETICI√ìN A UNA URL - DESCARGA DE IMAGEN
# ==========================================
# En este ejemplo vamos a descargar una imagen desde internet usando requests

# Definimos la URL de la imagen que queremos descargar
# En este caso es una imagen de Twitter (ahora X)
url = "https://pbs.twimg.com/profile_images/616689518968762368/rkhjKqNb.jpg"

# Hacemos una petici√≥n GET a la URL para obtener la imagen
# requests.get() env√≠a una solicitud HTTP al servidor y recibe la respuesta
# La respuesta se guarda en la variable 'image'
image = requests.get(url)

In [None]:
# Mostramos el objeto Response completo
# Esto nos permite ver informaci√≥n como el c√≥digo de estado (200 = √©xito)
# y otros metadatos de la petici√≥n HTTP
image

In [None]:
# Accedemos al contenido binario de la respuesta
# .content devuelve los datos en formato de bytes (binary)
# Este formato es necesario para guardar im√°genes, videos, PDFs, etc.
image.content

In [None]:
# Guardamos la imagen descargada en nuestro disco local

# Usamos 'with open()' que es una buena pr√°ctica en Python
# porque cierra el archivo autom√°ticamente cuando termina
# "data/mutenrroy.jpg" es la ruta donde guardaremos la imagen
# 'wb' significa "write binary" (escribir en modo binario)
with open("data/mutenrroy.jpg", 'wb') as f:
    # Escribimos el contenido binario de la imagen en el archivo
    f.write(image.content)
    
# Al terminar este bloque, la imagen ya est√° guardada en la carpeta data/

## Mediante pandas

In [None]:
# ==========================================
# USAR PANDAS PARA LEER DATOS DIRECTAMENTE DESDE UNA URL
# ==========================================
# Pandas puede leer archivos CSV directamente desde internet sin descargarlos

# pd.read_csv() lee un archivo CSV y lo convierte en un DataFrame
# La URL apunta a un dataset de inflaci√≥n mundial
# Esto es muy √∫til porque no necesitamos descargar el archivo primero
df_inflation = pd.read_csv('https://datahub.io/core/inflation/r/inflation-gdp.csv')

# .head() muestra las primeras 5 filas del DataFrame
# Esto nos permite visualizar r√°pidamente la estructura de los datos
df_inflation.head()

In [None]:
# Filtramos el DataFrame para obtener solo los datos de Espa√±a

# df_inflation[condici√≥n] es la sintaxis para filtrar en pandas
# df_inflation['Country'] == "Spain" crea una condici√≥n booleana
# Solo se mostrar√°n las filas donde la columna 'Country' sea igual a "Spain"
df_inflation[df_inflation['Country'] == "Spain"]

## Bicimad

In [None]:
# ==========================================
# DESCARGAR UN ARCHIVO ZIP DESDE UNA API - BICIMAD
# ==========================================
# Este ejemplo muestra c√≥mo trabajar con APIs que devuelven archivos comprimidos

# URL que apunta a un archivo ZIP con datos de movimientos de Bicimad (junio 2021)
# Bicimad es el sistema de bicicletas p√∫blicas de Madrid
url = 'https://opendata.emtmadrid.es/getattachment/c3383795-121b-4ebf-98b4-c7b05e902eaf/202106_movements.aspx'

# Hacemos una petici√≥n GET para descargar el archivo ZIP
# La respuesta se guarda en la variable 'r'
r = requests.get(url)

In [None]:
# Mostramos el objeto Response para verificar que la petici√≥n fue exitosa
# Si vemos <Response [200]> significa que todo fue bien
r

In [None]:
# Guardamos el contenido descargado como un archivo ZIP en nuestro disco

# Definimos el nombre del archivo donde guardaremos el ZIP
filename = 'data/bicis.zip'

# Abrimos un archivo en modo escritura binaria ('wb')
with open(filename, 'wb') as f:
    # Escribimos el contenido binario de la respuesta en el archivo
    f.write(r.content)
    
# El archivo ZIP ya est√° guardado en la carpeta data/

In [None]:
# Extraemos el contenido del archivo ZIP

# Definimos la ruta del archivo ZIP que queremos descomprimir
filename = 'data/bicis.zip'

# Usamos zipfile.ZipFile para abrir el archivo comprimido
# 'r' significa modo lectura (read)
with zipfile.ZipFile(filename, 'r') as zip_ref:
    # extractall() extrae todos los archivos del ZIP
    # Los archivos se extraer√°n en la carpeta "data/"
    zip_ref.extractall("data/")
    
# Ahora tenemos el archivo JSON descomprimido en la carpeta data/

In [None]:
# Leemos el archivo JSON y lo convertimos en un DataFrame

# pd.read_json() lee archivos en formato JSON
# 'data/202106_movements.json' es la ruta del archivo extra√≠do
# lines=True indica que cada l√≠nea del archivo es un objeto JSON independiente
# encoding='latin-1' especifica la codificaci√≥n de caracteres para leer correctamente tildes y √±
# nrows=10000 limita la lectura a las primeras 10,000 filas (√∫til para archivos muy grandes)
datos_bicis = pd.read_json('data/202106_movements.json', lines=True, encoding='latin-1', nrows=10000)

In [None]:
# Visualizamos las primeras 5 filas del DataFrame de bicis

# .head() nos permite ver r√°pidamente c√≥mo est√°n estructurados los datos
# y qu√© columnas tiene el DataFrame
datos_bicis.head()

In [None]:
# Obtenemos informaci√≥n general sobre el DataFrame

# .info() muestra:
# - N√∫mero total de filas y columnas
# - Nombre de cada columna
# - Tipo de datos de cada columna (int, float, object, etc.)
# - Cantidad de valores no nulos en cada columna
# - Uso de memoria del DataFrame
datos_bicis.info()

<table align="left">
 <tr><td width="80"><img src="./img/ejercicio.png" style="width:auto;height:auto"></td>
     <td style="text-align:left">
         <h3>Ejercicio datos.gob.es</h3>

Descarga con pandas un dataset de la p√°gina https://datos.gob.es/es/catalogo acerca del empleo y gu√°rdalo en un csv en la carpeta data. Puedes utilizar pandas.
         
 </td></tr>
</table>

In [None]:
# ==========================================
# EJERCICIO: DESCARGAR DATOS DE DATOS.GOB.ES
# ==========================================
# En este ejemplo descargamos datos del Instituto Nacional de Estad√≠stica (INE)
# sobre riesgo de pobreza en Espa√±a

# URL del dataset de riesgo de pobreza del INE
url = "https://www.ine.es/jaxiT3/files/t/csv_bdsc/59962.csv"

# Leemos el CSV directamente desde la URL usando pandas
df = pd.read_csv(url)

# Guardamos el DataFrame en un archivo CSV local
# "data/riesgo_pobreza.csv" es la ruta donde se guardar√°
# Este archivo ahora est√° disponible para an√°lisis futuros
df.to_csv("data/riesgo_pobreza.csv")

In [None]:
# EJEMPLO AVANZADO: Descargar m√∫ltiples datasets en un bucle

# Creamos un diccionario que almacena nombres de archivos y sus URLs
# Clave = nombre del archivo, Valor = URL del dataset
datasets = {"riesgo_pobreza": "https://www.ine.es/jaxiT3/files/t/csv_bdsc/59962.csv",
            "dataset_2": "https://www.ine.es/jaxiT3/files/t/csv_bdsc/59947.csv",
            # "dataset_3": "https://www.ine.es/jaxiT3/files/t/csv_bdsc/60144.csv"  # Comentado
            }

# Iteramos sobre cada par clave-valor del diccionario
# key = nombre del archivo, value = URL
for key, value in datasets.items():
    # Leemos el CSV desde la URL
    df = pd.read_csv(value)

    # Guardamos el DataFrame con el nombre correspondiente
    # Concatenamos "data/" + nombre + ".csv" para crear la ruta completa
    # Ejemplo: "data/riesgo_pobreza.csv"
    df.to_csv("data/" + key + ".csv")
    
# Este enfoque es muy √∫til cuando necesitamos descargar m√∫ltiples datasets

## Api chucknorris

[Enlace API](https://api.chucknorris.io/)

In [None]:
# ==========================================
# API CHUCK NORRIS - C√ìDIGO BASE PARA CUALQUIER PETICI√ìN API
# ==========================================
# Este es el patr√≥n b√°sico que usaremos para trabajar con APIs REST

# 1. Definimos la URL del endpoint de la API
# Esta API devuelve chistes aleatorios de Chuck Norris
url = "https://api.chucknorris.io/jokes/random" 

# 2. Hacemos la petici√≥n GET al servidor
# requests.get() env√≠a la solicitud y recibe la respuesta
response = requests.get(url)

# 3. Verificamos el c√≥digo de estado de la respuesta
# 200 significa que la petici√≥n fue exitosa
if response.status_code == 200:  # C√≥digo 200 indica una respuesta exitosa.
    # 4. Convertimos la respuesta JSON en un diccionario de Python
    # .json() parsea el texto JSON y lo convierte en estructuras Python
    data = response.json()  # Analizar la respuesta JSON.
    
    # 5. Accedemos al chiste dentro del diccionario
    # data["value"] contiene el texto del chiste
    print(data["value"])
else:
    # Si el c√≥digo no es 200, mostramos un mensaje de error
    print("Error en la solicitud: ", response.status_code)

In [None]:
# Creamos una FUNCI√ìN para reutilizar el c√≥digo de petici√≥n API

# Definimos una funci√≥n que recibe una URL como par√°metro
def get_joke(url):
    # Hacemos la petici√≥n GET a la URL proporcionada
    response = requests.get(url)

    # Verificamos si la petici√≥n fue exitosa
    if response.status_code == 200:  # C√≥digo 200 indica una respuesta exitosa.
        # Convertimos la respuesta JSON a un diccionario Python
        data = response.json()  # Analizar la respuesta JSON.
        
        # Retornamos los datos completos
        return data
    else:
        # Si hay error, imprimimos el c√≥digo de estado
        print("Error en la solicitud: ", response.status_code)
        
# Esta funci√≥n hace nuestro c√≥digo m√°s limpio y reutilizable

In [None]:
# Obtenemos la lista de CATEGOR√çAS disponibles en la API

# URL del endpoint que devuelve todas las categor√≠as de chistes
url = "https://api.chucknorris.io/jokes/categories"

# Llamamos a nuestra funci√≥n personalizada para hacer la petici√≥n
# Esto nos devuelve una lista con todas las categor√≠as disponibles
get_joke(url)

In [None]:
# Obtenemos un chiste aleatorio de UNA CATEGOR√çA ESPEC√çFICA

# Definimos la categor√≠a que queremos (por ejemplo: science, sport, food, etc.)
categoria = "science"

# Usamos f-strings para construir la URL con par√°metros
# ?category={categoria} a√±ade un query parameter a la URL
# Esto le dice a la API que queremos un chiste de esa categor√≠a espec√≠fica
url = f"https://api.chucknorris.io/jokes/random?category={categoria}"

# Llamamos a nuestra funci√≥n para obtener el chiste
get_joke(url)

In [None]:
# B√öSQUEDA de chistes que contengan una palabra espec√≠fica

# Definimos la palabra que queremos buscar en los chistes
query = "Spain"

# Construimos la URL con el par√°metro de b√∫squeda
# ?query={query} busca todos los chistes que contengan esa palabra
url = f"https://api.chucknorris.io/jokes/search?query={query}"

# Llamamos a la funci√≥n para obtener los resultados de la b√∫squeda
# Esto devolver√° m√∫ltiples chistes que contengan la palabra "Spain"
get_joke(url)

In [None]:
# ==========================================
# SETEO COMPLETO: De API a DataFrame a CSV
# ==========================================
# Este ejemplo muestra el flujo completo de trabajo con APIs en Data Science

# 1. Definir consulta
# Especificamos la palabra que queremos buscar
query = "Spain"
url = f"https://api.chucknorris.io/jokes/search?query={query}"

# 2. Hacer la solicitud
# Enviamos la petici√≥n GET a la API
response = requests.get(url)

# 3. Verificar estado
# Comprobamos que la petici√≥n fue exitosa
if response.status_code == 200:
    # Convertimos la respuesta JSON en un diccionario Python
    data = response.json()
    
    # El resultado viene en data["result"]
    # La API devuelve los chistes dentro de una clave llamada "result"
    jokes = data["result"]

    # 4. Convertir a DataFrame
    # Transformamos la lista de chistes en un DataFrame de pandas
    # Esto nos permite manipular y analizar los datos f√°cilmente
    df_jokes = pd.DataFrame(jokes)

    # 5. Guardar a CSV
    # Creamos un nombre de archivo din√°mico usando la query
    filename = f"chuck_jokes_{query.lower()}.csv"
    
    # Guardamos el DataFrame en formato CSV
    # index=False evita que se guarde el √≠ndice como columna
    # encoding="utf-8" asegura que los caracteres especiales se guarden correctamente
    df_jokes.to_csv(filename, index=False, encoding="utf-8")
    
    # Mostramos mensaje de confirmaci√≥n con la cantidad de chistes
    print(f"Archivo '{filename}' guardado con {len(df_jokes)} chistes.")

    # Mostrar algunos resultados
    # display() muestra el DataFrame de forma m√°s bonita que print()
    # Seleccionamos solo las columnas "id" y "value" y mostramos las primeras 5 filas
    display(df_jokes[["id", "value"]].head())

else:
    # Si hubo alg√∫n error, mostramos el c√≥digo de estado
    print("Error en la solicitud:", response.status_code)

## Ejemplo 2: Cat Facts API

La API [Cat Facts](https://catfact.ninja/) devuelve datos curiosos sobre gatos.

**URL base:** `https://catfact.ninja/facts`


In [None]:
# ==========================================
# CAT FACTS API - Datos curiosos sobre gatos
# ==========================================

# 1. Definir la URL
# ?limit=30 es un par√°metro que indica que queremos 30 datos de gatos
url = "https://catfact.ninja/facts?limit=30"

# 2. Solicitud GET
# Hacemos la petici√≥n a la API
response = requests.get(url)

# 3. Verificar estado
# Comprobamos que la petici√≥n fue exitosa
if response.status_code == 200:
    # Convertimos la respuesta JSON a diccionario Python
    data = response.json()
    
    # Los datos vienen dentro de la clave "data"
    # Extraemos solo esa parte que contiene los facts
    facts = data["data"]

    # 4. Convertir a DataFrame
    # Transformamos la lista de facts en un DataFrame de pandas
    df_cats = pd.DataFrame(facts)

    # 5. Mostrar primeros datos
    # display() muestra el DataFrame de forma visual y clara
    display(df_cats.head())

    # 6. Exportar a CSV
    # Guardamos los datos en un archivo local para an√°lisis posteriores
    df_cats.to_csv("cat_facts.csv", index=False)
    print("‚úÖ Archivo guardado como cat_facts.csv")

    # 7. Analizar longitud de cada fact
    # Creamos una nueva columna calculando la longitud de cada texto
    # .apply(len) aplica la funci√≥n len() a cada elemento de la columna "fact"
    # Esto nos permite analizar qu√© tan largos son los facts
    df_cats["length"] = df_cats["fact"].apply(len)


else:
    # Si hubo error, mostramos el c√≥digo de estado
    print("‚ùå Error en la solicitud:", response.status_code)

## Datos del espacio

In [None]:
# ==========================================
# API DEL ESPACIO - The Space Devs
# ==========================================
# Esta API proporciona informaci√≥n sobre astronautas, lanzamientos espaciales, etc.

'''
Documentaci√≥n de la API:
https://thespacedevs.com/llapi
https://ll.thespacedevs.com/2.2.0/swagger
'''

# Definimos la URL base de la API
# Esta es la ra√≠z desde donde accederemos a todos los endpoints
space_url = "http://ll.thespacedevs.com/2.2.0"

# Definimos el path (ruta) del endpoint espec√≠fico que queremos consultar
# En este caso, queremos informaci√≥n sobre astronautas
path = "/astronaut"

# Concatenamos la URL base con el path para crear la URL completa
url_total = space_url + path

# Hacemos la petici√≥n GET a la API
# Esto nos devolver√° informaci√≥n sobre astronautas
response = requests.get(url_total)

In [None]:
# Verificamos el c√≥digo de estado de la respuesta
# Deber√≠a mostrarnos 200 si la petici√≥n fue exitosa
print(response.status_code)

# Verificamos el tipo de dato del contenido
# Deber√≠a ser 'bytes' (datos binarios)
type(response.content)

# Convertimos la respuesta JSON a un diccionario Python y lo mostramos
# .json() parsea el texto JSON y nos devuelve una estructura de datos Python
response.json()

In [None]:
# Mostramos la URL completa que estamos usando
# Esto es √∫til para verificar que la URL se construy√≥ correctamente
url_total

In [None]:
# A√±adimos PAR√ÅMETROS a la URL para filtrar los resultados

# Construimos una nueva URL con un par√°metro de filtro
# /?age=45 filtra para mostrar solo astronautas de 45 a√±os
# El s√≠mbolo ? indica el inicio de los par√°metros de la URL
url_total = space_url + path + "/?age=45"

# Hacemos una nueva petici√≥n con este filtro aplicado
response_sp = requests.get(url_total)

In [None]:
# Mostramos el objeto Response de la nueva petici√≥n filtrada
response_sp

In [None]:
# Verificamos la URL con el par√°metro de edad
url_total

In [None]:
# Convertimos la respuesta a JSON y la mostramos
# Esto nos permite ver todos los datos de los astronautas de 45 a√±os
response_sp.json()

In [None]:
# Convertimos directamente los resultados en un DataFrame

# response_sp.json() devuelve todo el JSON
# ['results'] accede espec√≠ficamente a la lista de astronautas dentro del JSON
# pd.DataFrame() convierte esa lista en un DataFrame de pandas
pd.DataFrame(response_sp.json()['results'])

In [None]:
# Filtramos por NACIONALIDAD - Astronautas espa√±oles

# Construimos la URL con el par√°metro nationality=Spanish
# Esto nos devolver√° solo los astronautas de nacionalidad espa√±ola
url_total = space_url + path + "/?nationality=Spanish"

# Hacemos la petici√≥n con el filtro de nacionalidad
response_sp = requests.get(url_total)

# Mostramos el objeto Response para verificar que fue exitosa
print(response_sp)

# Convertimos y mostramos los datos JSON
# Veremos informaci√≥n sobre todos los astronautas espa√±oles
response_sp.json()

In [None]:
# Iteramos sobre los resultados para imprimir solo los NOMBRES

# response_sp.json()['results'] nos da la lista de astronautas
# for astronauta in ... recorre cada astronauta de la lista
for astronauta in response_sp.json()['results']:
    # Cada astronauta es un diccionario, accedemos a la clave 'name'
    # Esto imprime solo el nombre de cada astronauta espa√±ol
    print(astronauta['name'])

### Modo Avanzado

### preparamos los dos siguiente ejemplos con funciones y las librerias necesarias 

In [None]:
# ==========================================
# MODO AVANZADO: IMPORTACI√ìN DE LIBRER√çAS Y FUNCIONES AUXILIARES
# ==========================================
# Esta celda prepara un entorno profesional para trabajar con APIs

# Librer√≠a principal para hacer peticiones HTTP
import requests

# Librer√≠a para an√°lisis y manipulaci√≥n de datos
import pandas as pd

# Librer√≠a para trabajar con datos JSON
import json

# Librer√≠as para crear visualizaciones
import matplotlib.pyplot as plt
import seaborn as sns

# Librer√≠a para trabajar con fechas y horas
from datetime import datetime, timedelta

# Librer√≠a para pausas y delays en el c√≥digo
import time

# Librer√≠a para operaciones con archivos y directorios
import os
from pathlib import Path

# Typing: Para a√±adir anotaciones de tipo a nuestras funciones
# Esto hace el c√≥digo m√°s robusto y f√°cil de entender
from typing import Dict, List, Optional, Union

# Librer√≠a para suprimir warnings innecesarios
import warnings

# ==========================================
# CONFIGURACI√ìN PARA VISUALIZACIONES
# ==========================================

# Establecemos el estilo visual por defecto para los gr√°ficos
plt.style.use('default')

# Definimos una paleta de colores armoniosa
sns.set_palette("husl")

# Configuramos el tama√±o por defecto de las figuras (12x6 pulgadas)
plt.rcParams['figure.figsize'] = (12, 6)

# Establecemos el tama√±o de fuente por defecto
plt.rcParams['font.size'] = 10

# ==========================================
# SUPRIMIR WARNINGS INNECESARIOS
# ==========================================

# Ignoramos warnings que podr√≠an distraer durante el an√°lisis
warnings.filterwarnings('ignore')

# Mensaje de confirmaci√≥n
print("‚úÖLibrer√≠as importadas correctamente")
print(f"üìÖ Fecha de ejecuci√≥n: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")


# ==========================================
# FUNCI√ìN 1: HACER PETICI√ìN API DE MANERA SEGURA
# ==========================================

def hacer_peticion_api(url: str, params: Optional[Dict] = None, 
                      headers: Optional[Dict] = None, timeout: int = 10) -> Optional[Union[Dict, List]]:
    """
    Funci√≥n para hacer peticiones a APIs de manera segura con manejo de errores
    
    Args:
        url: URL de la API a consultar
        params: Diccionario con par√°metros opcionales para la petici√≥n (ej: {'limit': 10})
        headers: Diccionario con headers opcionales (ej: {'Authorization': 'Bearer token'})
        timeout: Tiempo l√≠mite para la petici√≥n en segundos (por defecto 10)
    
    Returns:
        Diccionario o Lista con los datos obtenidos, o None si hay error
    """
    try:
        # Informamos qu√© URL estamos consultando
        print(f" Haciendo petici√≥n a: {url}")
        
        # Realizamos la petici√≥n GET con todos los par√°metros
        response = requests.get(
            url,                    # URL del endpoint
            params=params,          # Query parameters (si existen)
            headers=headers,        # Headers HTTP (si existen)
            timeout=timeout         # Tiempo m√°ximo de espera
        )
        
        # raise_for_status() lanza una excepci√≥n si el c√≥digo de estado indica error
        # Por ejemplo, si recibimos 404, 500, etc.
        response.raise_for_status()
        
        # Si llegamos aqu√≠, la petici√≥n fue exitosa
        print(f" Petici√≥n exitosa. Status: {response.status_code}")
        
        # Convertimos la respuesta JSON y la retornamos
        return response.json()
        
    except requests.exceptions.Timeout:
        # Error: La petici√≥n tard√≥ demasiado tiempo
        print(f" Timeout: La petici√≥n tard√≥ m√°s de {timeout} segundos")
        return None
        
    except requests.exceptions.ConnectionError:
        # Error: No hay conexi√≥n a internet o el servidor no responde
        print(" Error de conexi√≥n: Verifica tu conexi√≥n a internet")
        return None
        
    except requests.exceptions.HTTPError as e:
        # Error: C√≥digo de estado HTTP indica error (4xx, 5xx)
        print(f"Error HTTP {e.response.status_code}: {e}")
        return None
        
    except json.JSONDecodeError:
        # Error: La respuesta no es un JSON v√°lido
        print(" Error: La respuesta no es JSON v√°lido")
        return None
        
    except Exception as e:
        # Cualquier otro error inesperado
        print(f" Error inesperado: {e}")
        return None


# ==========================================
# FUNCI√ìN 2: GUARDAR DATAFRAME EN CSV CON TIMESTAMP
# ==========================================

def guardar_csv(dataframe: pd.DataFrame, nombre_archivo: str, 
                carpeta: str = "datos_api") -> bool:
    """
    Guarda un DataFrame en formato CSV con timestamp autom√°tico
    
    Args:
        dataframe: DataFrame de pandas que queremos guardar
        nombre_archivo: Nombre del archivo sin extensi√≥n (ej: "criptomonedas")
        carpeta: Carpeta donde guardar el archivo (por defecto "datos_api")
    
    Returns:
        True si se guard√≥ correctamente, False en caso contrario
    """
    try:
        # Crear carpeta si no existe
        # exist_ok=True evita error si la carpeta ya existe
        Path(carpeta).mkdir(exist_ok=True)
        
        # Crear timestamp (marca de tiempo) para el archivo
        # Formato: YYYYMMDD_HHMMSS (ej: 20240315_143022)
        timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
        
        # Construir la ruta completa del archivo
        # Ejemplo: datos_api/criptomonedas_20240315_143022.csv
        archivo_completo = Path(carpeta) / f"{nombre_archivo}_{timestamp}.csv"
        
        # Guardar CSV
        # index=False: No guardamos el √≠ndice num√©rico como columna
        # encoding='utf-8': Guardamos con codificaci√≥n UTF-8 (acepta tildes y caracteres especiales)
        dataframe.to_csv(archivo_completo, index=False, encoding='utf-8')
        
        # Mostramos informaci√≥n sobre el archivo guardado
        print(f" Archivo guardado: {archivo_completo}")
        print(f" Filas guardadas: {len(dataframe):,}")  # :, a√±ade separador de miles
        print(f" Columnas: {list(dataframe.columns)}")
        
        return True
        
    except Exception as e:
        # Si ocurre alg√∫n error al guardar
        print(f" Error al guardar: {e}")
        return False


# ==========================================
# FUNCI√ìN 3: MOSTRAR INFORMACI√ìN DETALLADA DE UN DATAFRAME
# ==========================================

def mostrar_info_dataframe(df: pd.DataFrame, nombre: str) -> None:
    """
    Muestra informaci√≥n resumida y √∫til de un DataFrame
    
    Args:
        df: DataFrame a analizar
        nombre: Nombre descriptivo del DataFrame para el reporte
    """
    # T√≠tulo del reporte
    print(f"\n Informaci√≥n del DataFrame: {nombre}")
    print("=" * 50)
    
    # Dimensiones del DataFrame
    # df.shape devuelve (filas, columnas)
    # :, a√±ade separador de miles para mejor legibilidad
    print(f" Dimensiones: {df.shape[0]:,} filas √ó {df.shape[1]} columnas")
    
    # Memoria usada por el DataFrame
    # memory_usage(deep=True) calcula el uso real de memoria
    # / 1024**2 convierte de bytes a megabytes
    print(f" Memoria usada: {df.memory_usage(deep=True).sum() / 1024**2:.2f} MB")
    
    # Informaci√≥n de columnas y sus tipos de datos
    print("\n Tipos de datos:")
    for col, dtype in df.dtypes.items():
        print(f"  ‚Ä¢ {col}: {dtype}")
    
    # An√°lisis de valores nulos
    nulos = df.isnull().sum()  # Cuenta valores nulos por columna
    
    if nulos.sum() > 0:  # Si hay valores nulos
        print("\n Valores nulos:")
        # Iteramos solo sobre las columnas que tienen nulos
        for col, count in nulos[nulos > 0].items():
            # Calculamos el porcentaje de nulos
            porcentaje = (count / len(df)) * 100
            print(f"  ‚Ä¢ {col}: {count:,} ({porcentaje:.1f}%)")
    else:
        print("\n No hay valores nulos")
    
    # Mostramos las primeras 3 filas del DataFrame
    print("\nüîç Primeras 3 filas:")
    display(df.head(3))


# Mensaje final de confirmaci√≥n
print("\n Funciones auxiliares definidas correctamente")

## JSONPlaceholder API 

[JSONPlaceholder](https://jsonplaceholder.typicode.com/) es una API REST gratuita perfecta para practicar. Proporciona datos falsos de posts, usuarios, comentarios, etc.

###  Caracter√≠sticas:
-  **Gratuita** - Sin registro necesario
-  **Sin l√≠mites** - Uso ilimitado
-  **F√°cil de usar** - Endpoints simples y claros
-  **Datos consistentes** - Perfecta para aprender

###  Obteniendo Posts

In [None]:
# ==========================================
# JSONPLACEHOLDER API - API de prueba con datos falsos
# ==========================================
# JSONPlaceholder es una API REST gratuita perfecta para aprender y practicar

# Obtenemos todos los posts de JSONPlaceholder
print("üîç Obteniendo posts de JSONPlaceholder...")

# URL del endpoint que devuelve todos los posts
url_posts = "https://jsonplaceholder.typicode.com/posts"

# Usamos nuestra funci√≥n personalizada para hacer la petici√≥n
# Esta funci√≥n maneja autom√°ticamente errores y verifica el estado
datos_posts = hacer_peticion_api(url_posts)

# Verificamos si obtuvimos datos correctamente
if datos_posts:
    # Mostramos cu√°ntos posts se obtuvieron
    # :, a√±ade separador de miles
    print(f" Se obtuvieron {len(datos_posts):,} posts")
    
    # Mostramos la estructura del primer post como ejemplo
    print("\n Estructura del primer post:")
    # json.dumps() convierte el diccionario a texto JSON formateado
    # indent=2 a√±ade sangr√≠a de 2 espacios para mejor legibilidad
    # ensure_ascii=False permite mostrar tildes y caracteres especiales correctamente
    print(json.dumps(datos_posts[0], indent=2, ensure_ascii=False))
    
    # Convertir la lista de posts a un DataFrame de pandas
    df_posts = pd.DataFrame(datos_posts)
    
    # ==========================================
    # ENRIQUECEMOS EL DATAFRAME CON METADATOS
    # ==========================================
    
    # A√±adimos un timestamp de cu√°ndo descargamos los datos
    # .isoformat() devuelve la fecha en formato ISO (ej: 2024-03-15T14:30:22)
    df_posts['timestamp_descarga'] = datetime.now().isoformat()
    
    # A√±adimos la fuente de los datos (√∫til si mezclamos datos de m√∫ltiples APIs)
    df_posts['fuente'] = 'JSONPlaceholder'
    
    # Calculamos la longitud de cada t√≠tulo
    # .str.len() calcula cu√°ntos caracteres tiene cada string
    df_posts['longitud_titulo'] = df_posts['title'].str.len()
    
    # Calculamos la longitud del contenido (body)
    df_posts['longitud_contenido'] = df_posts['body'].str.len()
    
    # Mostramos informaci√≥n detallada del DataFrame usando nuestra funci√≥n
    mostrar_info_dataframe(df_posts, "Posts de JSONPlaceholder")
    
    # ==========================================
    # AN√ÅLISIS ESTAD√çSTICO B√ÅSICO
    # ==========================================
    
    print("\n Estad√≠sticas de los posts:")
    
    # N√∫mero total de posts
    print(f"  ‚Ä¢ Posts totales: {len(df_posts):,}")
    
    # Contamos cu√°ntos usuarios √∫nicos hay
    # .nunique() cuenta valores √∫nicos en una columna
    print(f"  ‚Ä¢ Usuarios √∫nicos: {df_posts['userId'].nunique()}")
    
    # Calculamos la longitud promedio de los t√≠tulos
    # .mean() calcula el promedio
    print(f"  ‚Ä¢ Longitud promedio del t√≠tulo: {df_posts['longitud_titulo'].mean():.1f} caracteres")
    
    # Calculamos la longitud promedio del contenido
    print(f"  ‚Ä¢ Longitud promedio del contenido: {df_posts['longitud_contenido'].mean():.1f} caracteres")
    
else:
    # Si datos_posts es None, significa que hubo un error en la petici√≥n
    print(" No se pudieron obtener los posts")

##  CoinGecko API 

[CoinGecko](https://www.coingecko.com/en/api) proporciona una API gratuita para datos de criptomonedas sin necesidad de registro.

###  Caracter√≠sticas:
-  **Completamente gratuita** - Sin registro necesario
-  **Datos completos** - Precios, market caps, vol√∫menes, etc.
-  **Datos hist√≥ricos** - Acceso a datos del pasado
-  **Actualizaciones frecuentes** - Datos en tiempo real

###  Obteniendo Datos de Criptomonedas

In [None]:
# ==========================================
# COINGECKO API - Datos de Criptomonedas en Tiempo Real
# ==========================================
# CoinGecko proporciona datos gratuitos de precios y mercado de criptomonedas

# Obtenemos las top 100 criptomonedas por capitalizaci√≥n de mercado
print(" Obteniendo datos de criptomonedas desde CoinGecko...")

# URL del endpoint para obtener datos del mercado de criptomonedas
url_crypto = "https://api.coingecko.com/api/v3/coins/markets"

# ==========================================
# PAR√ÅMETROS DE LA PETICI√ìN
# ==========================================
# Creamos un diccionario con los par√°metros que queremos enviar

parametros_crypto = {
    'vs_currency': 'usd',           # Mostrar precios en d√≥lares estadounidenses
    'order': 'market_cap_desc',     # Ordenar por capitalizaci√≥n de mercado descendente (mayor a menor)
    'per_page': 100,                # N√∫mero de resultados por p√°gina (100 criptos)
    'page': 1,                      # P√°gina n√∫mero 1 (las primeras 100)
    'sparkline': False,             # No incluir datos de gr√°fico sparkline (ahorra ancho de banda)
    'price_change_percentage': '1h,24h,7d,30d'  # Incluir cambios de precio en estas ventanas de tiempo
}

# Hacemos la petici√≥n usando nuestra funci√≥n personalizada
# Pasamos tanto la URL como los par√°metros
datos_crypto = hacer_peticion_api(url_crypto, parametros_crypto)

# Verificamos si la petici√≥n fue exitosa
if datos_crypto:
    # Informamos cu√°ntas criptomonedas obtuvimos
    print(f" Se obtuvieron datos de {len(datos_crypto)} criptomonedas")
    
    # ==========================================
    # MOSTRAR ESTRUCTURA DE DATOS
    # ==========================================
    
    print("\n Estructura del primer registro:")
    # Creamos un diccionario solo con los campos m√°s importantes del primer registro
    # Esto nos permite ver la estructura sin abrumar con todos los datos
    campos_ejemplo = {k: v for k, v in datos_crypto[0].items() if k in 
         ['id', 'symbol', 'name', 'current_price', 'market_cap', 'price_change_percentage_24h']}
    
    # Mostramos el diccionario formateado como JSON
    print(json.dumps(campos_ejemplo, indent=2, ensure_ascii=False))
    
    # ==========================================
    # CREAR DATAFRAME
    # ==========================================
    
    # Convertimos la lista de criptomonedas en un DataFrame
    df_crypto = pd.DataFrame(datos_crypto)
    
    # Seleccionamos solo las columnas m√°s relevantes para el an√°lisis
    # Esto hace el DataFrame m√°s manejable y f√°cil de entender
    columnas_relevantes = [
        'id',                           # Identificador √∫nico de la cripto
        'symbol',                       # S√≠mbolo (BTC, ETH, etc.)
        'name',                         # Nombre completo
        'current_price',                # Precio actual en USD
        'market_cap',                   # Capitalizaci√≥n de mercado
        'market_cap_rank',              # Ranking por capitalizaci√≥n
        'total_volume',                 # Volumen de trading en 24h
        'price_change_24h',             # Cambio de precio en 24h (valor absoluto)
        'price_change_percentage_24h',  # Cambio de precio en 24h (porcentaje)
        'price_change_percentage_7d',   # Cambio de precio en 7 d√≠as (porcentaje)
        'price_change_percentage_30d',  # Cambio de precio en 30 d√≠as (porcentaje)
        'circulating_supply',           # Suministro circulante
        'total_supply',                 # Suministro total
        'max_supply',                   # Suministro m√°ximo
        'ath',                          # All-time high (precio hist√≥rico m√°s alto)
        'ath_date'                      # Fecha del ATH
    ]
    
    # Filtramos solo las columnas que realmente existen en el DataFrame
    # Esto previene errores si alguna columna no est√° presente
    columnas_existentes = [col for col in columnas_relevantes if col in df_crypto.columns]
    
    # Creamos un nuevo DataFrame con solo las columnas seleccionadas
    # .copy() crea una copia independiente (buena pr√°ctica)
    df_crypto_limpio = df_crypto[columnas_existentes].copy()
    
    # ==========================================
    # A√ëADIR METADATOS
    # ==========================================
    
    # A√±adimos timestamp de cu√°ndo descargamos los datos
    df_crypto_limpio['timestamp'] = datetime.now().isoformat()
    
    # A√±adimos la fuente de los datos
    df_crypto_limpio['fuente'] = 'CoinGecko'
    
    # Mostramos informaci√≥n detallada del DataFrame
    mostrar_info_dataframe(df_crypto_limpio, "Datos de Criptomonedas")
    
    # ==========================================
    # MOSTRAR TOP 10 CRIPTOMONEDAS
    # ==========================================
    
    print("\n Top 10 criptomonedas por capitalizaci√≥n:")
    # Seleccionamos columnas relevantes y mostramos las primeras 10 filas
    display(df_crypto_limpio[['name', 'symbol', 'current_price', 'market_cap_rank', 'price_change_percentage_24h']].head(10))
    
    # ==========================================
    # ESTAD√çSTICAS DEL MERCADO CRYPTO
    # ==========================================
    
    print("\n Estad√≠sticas del mercado crypto:")
    
    # Calculamos el precio promedio de las 100 criptos
    print(f"  ‚Ä¢ Precio promedio: ${df_crypto_limpio['current_price'].mean():.2f}")
    
    # Encontramos la cripto con el precio m√°s alto
    # .max() devuelve el valor m√°ximo
    # .idxmax() devuelve el √≠ndice donde est√° el m√°ximo
    # .loc[] accede a ese √≠ndice y extrae el nombre
    precio_max = df_crypto_limpio['current_price'].max()
    cripto_max = df_crypto_limpio.loc[df_crypto_limpio['current_price'].idxmax(), 'name']
    print(f"  ‚Ä¢ Precio m√°s alto: ${precio_max:.2f} ({cripto_max})")
    
    # Calculamos el cambio promedio en las √∫ltimas 24 horas
    print(f"  ‚Ä¢ Cambio promedio 24h: {df_crypto_limpio['price_change_percentage_24h'].mean():.2f}%")
    
    # ==========================================
    # AN√ÅLISIS DE TENDENCIAS
    # ==========================================
    
    # Contamos cu√°ntas criptos subieron en las √∫ltimas 24h
    # df[condici√≥n] filtra el DataFrame
    # len() cuenta cu√°ntas filas cumplen la condici√≥n
    subidas = len(df_crypto_limpio[df_crypto_limpio['price_change_percentage_24h'] > 0])
    
    # Contamos cu√°ntas bajaron
    bajadas = len(df_crypto_limpio[df_crypto_limpio['price_change_percentage_24h'] < 0])
    
    print(f"  ‚Ä¢ Subidas en 24h: {subidas} | Bajadas: {bajadas}")
    
    # ==========================================
    # GUARDAR DATOS EN CSV
    # ==========================================
    
    # Guardamos el DataFrame usando nuestra funci√≥n personalizada
    # Esto crear√° un archivo con timestamp autom√°tico
    guardar_csv(df_crypto_limpio, "criptomonedas_coingecko")
    
else:
    # Si la petici√≥n fall√≥
    print(" No se pudieron obtener datos de criptomonedas")

<table align="left">
 <tr><td width="80"><img src="./img/ejercicio.png" style="width:auto;height:auto"></td>
     <td style="text-align:left">
         <h3>Ejercicio: Consultar Informaci√≥n de Pok√©mon</h3>

**Objetivo:** Consumir la API de Pok√©mon y mostrar informaci√≥n b√°sica.
Crea un programa que:

1. Pida al usuario el nombre de un Pok√©mon
2. Consulte la API: `https://pokeapi.co/api/v2/pokemon/{nombre}`
3. Muestre la siguiente informaci√≥n:
   * Nombre
   * Altura y peso
   * Tipos
   * 3 habilidades



 </td></tr>
</table>

**Pistas:**
- La API devuelve la altura en dec√≠metros (divide entre 10 para metros)
- La API devuelve el peso en hectogramos (divide entre 10 para kg)
- Usa `.lower()` para el nombre del Pok√©mon en la URL
- Los tipos est√°n en `datos['types']`
- Las habilidades est√°n en `datos['abilities']`

### **APIs Gratuitas Recomendadas:**

#### Sin registro necesario:
- **[JSONPlaceholder](https://jsonplaceholder.typicode.com/)**: Datos de prueba (posts, usuarios, comentarios)
- **[CoinGecko](https://www.coingecko.com/en/api)**: Precios de criptomonedas
- **[REST Countries](https://restcountries.com/)**: Informaci√≥n de pa√≠ses
- **[Cat Facts API](https://catfact.ninja/)**: Datos curiosos sobre gatos
- **[Dog CEO](https://dog.ceo/dog-api/)**: Im√°genes aleatorias de perros
- **[Random User](https://randomuser.me/)**: Generador de usuarios aleatorios

#### Con registro gratuito:
- **[OpenWeatherMap](https://openweathermap.org/api)**: Datos meteorol√≥gicos (1,000 llamadas/d√≠a)
- **[News API](https://newsapi.org/)**: Noticias (1,000 requests/d√≠a)
- **[GitHub API](https://docs.github.com/en/rest)**: Datos de repositorios y usuarios
- **[Alpha Vantage](https://www.alphavantage.co/)**: Datos financieros y burs√°tiles
- **[TMDB](https://www.themoviedb.org/documentation/api)**: Base de datos de pel√≠culas

#### **Documentaci√≥n oficial:**
- [Requests Documentation](https://docs.python-requests.org/): La librer√≠a HTTP de Python
- [Pandas User Guide](https://pandas.pydata.org/docs/user_guide/): Manipulaci√≥n de datos
- [Matplotlib Tutorials](https://matplotlib.org/stable/tutorials/index.html): Visualizaci√≥n de datos

#### **Repositorios √∫tiles:**
- [Public APIs](https://github.com/public-apis/public-apis): Lista masiva de APIs p√∫blicas
- [Awesome API](https://github.com/TonnyL/Awesome_APIs): APIs curadas por categor√≠a

#### **Gu√≠as y best practices:**
- [REST API Design Best Practices](https://restfulapi.net/): Dise√±o de APIs
- [HTTP Status Codes](https://httpstatuses.com/): Referencia de c√≥digos HTTP
- [Rate Limiting Best Practices](https://konghq.com/blog/how-to-design-a-scalable-rate-limiting-algorithm): Rate limiting
