# Ejercicio: Crear un DataFrame Completo con SWAPI

## Objetivo:
El objetivo de este ejercicio es que los alumnos practiquen la obtención de datos de una API REST y su posterior procesamiento para crear un DataFrame en Pandas que contenga información detallada sobre personajes de Star Wars.

## Instrucciones:

1. Obtener los datos:

- Utilizar la API de Star Wars (SWAPI) para obtener datos sobre los personajes (people) de la saga.
- La URL base para obtener la lista de personajes es: https://swapi.tech/api/.
- Dado que los datos están paginados, deberán recorrer todas las páginas para obtener la lista completa de personajes.

2. Crear el DataFrame:

    Crear un DataFrame que incluya las siguientes columnas con la información detallada de cada personaje:

    - id: Identificador único del personaje.
    - name: Nombre del personaje.
    - height: Altura del personaje (en centímetros).
    - mass: Peso del personaje (en kilogramos).
    - hair_color: Color de cabello.
    - skin_color: Color de piel.
    - eye_color: Color de ojos.
    - birth_year: Año de nacimiento.
    - gender: Género.
    - homeworld: Nombre del planeta de origen (obtenido mediante una petición adicional a la API).
    - species: Nombre de la especie del personaje (obtenido mediante una petición adicional si el campo species no está vacío).
    - films: Lista de nombres de películas en las que aparece el personaje (obtenido mediante peticiones adicionales).

3. Procesamiento de datos:

    - Cada entrada en el campo homeworld de los personajes es un enlace a la API, desde el cual se debe obtener el nombre del planeta.

    - El campo species contiene una lista de enlaces. Si no está vacío, se debe obtener el nombre de la especie desde la API.

    - El campo films contiene una lista de enlaces a las películas. Se debe realizar una petición por cada enlace para obtener el título de la película.

4. Entrega del ejercicio:

    - Se debe entregar un archivo .ipynb (Jupyter Notebook) con el código que obtenga los datos, procese las respuestas y construya el DataFrame completo.

    - También deben incluir en el notebook una breve descripción de cómo organizaron el proceso para obtener los datos y construir el DataFrame.

Tips:

- Utilicen la librería requests para realizar las peticiones HTTP.
- Tengan en cuenta que la API utiliza paginación, por lo que deberán iterar sobre las páginas hasta obtener todos los datos.
- Los datos relacionados (homeworld, species, films) requieren realizar peticiones adicionales, así que gestionen adecuadamente los tiempos de espera (pueden considerar utilizar la función time.sleep() para evitar sobrecargar la API).
- Si encuentran campos con datos faltantes o errores, documenten cómo lo manejan en su notebook.

In [1]:
import hashlib
import requests
import datetime
import pandas as pd
from concurrent.futures import ThreadPoolExecutor, as_completed
from IPython.display import HTML
import warnings
warnings.filterwarnings('ignore')

In [6]:
url = "https://swapi.tech/api/"
response = requests.get(url)
print(response.text)

{"message":"ok","result":{"films":"https://swapi.tech/api/films","people":"https://swapi.tech/api/people","planets":"https://swapi.tech/api/planets","species":"https://swapi.tech/api/species","starships":"https://swapi.tech/api/starships","vehicles":"https://swapi.tech/api/vehicles"}}


In [10]:
def almacenar_dataframe(respuesta):

    starwars_dict = {
        "id": [x.get('id') for x in respuesta['data']['results']],
        "name": [x.get('name') for x in respuesta['data']['results']],
        "height": [x.get('height') for x in respuesta['data']['results']],
        "mass": [x.get('mass') for x in respuesta['data']['results']],        
        "hair_color": [x.get('hair_color') for x in respuesta['data']['results']],
        "skin_color": [x.get('skin_color') for x in respuesta['data']['results']],
        "eye_color": [x.get('eye_color') for x in respuesta['data']['results']],
        "birth_year": [x.get('birth_year') for x in respuesta['data']['results']],
        "gender": [x.get('gender') for x in respuesta['data']['results']],
        "homeworld": [x.get('homeworld') for x in respuesta['data']['results']],
        "species": [x.get('species') for x in respuesta['data']['results']],
        "films": [x.get('films') for x in respuesta['data']['results']],

    }
    df = pd.DataFrame(starwars_dict)