# EVALUACIÓN FINAL MÓDULO 2 
Este script realiza el proceso completo:
1. Fase 1: Extracción de 100 registros desde API y limpieza de DataFrame.
2. Fase 2: Creación de la base de datos 'adalab_pelis_json' mediante Python.
3. Fase 3: Inserción de datos.
4. Fase 4: Consultas.

In [1]:
# Requisito previo: Instalación de librerías necesarias
# pip install requests / mysql-connector-python / pandas

import requests 
import mysql.connector 
import pandas as pd

## FASE 1: Extracción y transformación

In [None]:
url_pelis_adalab = "https://beta.adalab.es/resources/apis/pelis/pelis.json"

peticion = requests.get(url_pelis_adalab) # Petición a la API

In [23]:
if peticion.status_code == 200: # Verificamos si la conexión ha sido exitosa (status 200 = ok)
        print("Conexión API exitosa.")
        datos_iniciales = peticion.json()
else: # Si algo falla, que nos devuelva el código para buscar la explicación del fallo
        print(f"Error al conectar con la API: {peticion.status_code}")

Conexión API exitosa.


In [None]:
if len(datos_iniciales) > 0: # Vemos cuántos registros tenemos y las claves del primero para saber qué podemos encontrar en la bbdd
        print(f"Registros totales detectados: {len(datos_iniciales)}")
        print("Claves del primer registro:", datos_iniciales[0].keys())


Registros totales detectados: 100
Claves del primer registro: dict_keys(['id', 'titulo', 'año', 'duracion', 'genero', 'adultos', 'subtitulos'])


In [25]:
# Aunque nos piden extraer 100 registros, que son los que hay, limitamos datos para evitar sobrecarga si la API crece
limite = 100 
datos_limitados = datos_iniciales[:limite] # Cogiendo del inicio al limite marcado

In [None]:
display(datos_limitados) # Visualización rápida de los datos

[{'id': 1,
  'titulo': 'The Godfather',
  'año': 1972,
  'duracion': 175,
  'genero': 'Crimen',
  'adultos': False,
  'subtitulos': ['es', 'en']},
 {'id': 2,
  'titulo': 'The Godfather Part II',
  'año': 1974,
  'duracion': 202,
  'genero': 'Crimen',
  'adultos': False,
  'subtitulos': ['es', 'en']},
 {'id': 3,
  'titulo': 'Pulp Fiction',
  'año': 1994,
  'duracion': 154,
  'genero': 'Crimen',
  'adultos': True,
  'subtitulos': ['es', 'en']},
 {'id': 4,
  'titulo': 'Forrest Gump',
  'año': 1994,
  'duracion': 142,
  'genero': 'Drama',
  'adultos': False,
  'subtitulos': ['es', 'en', 'fr']},
 {'id': 5,
  'titulo': 'The Dark Knight',
  'año': 2008,
  'duracion': 152,
  'genero': 'Acción',
  'adultos': False,
  'subtitulos': ['es', 'en']},
 {'id': 6,
  'titulo': 'Fight Club',
  'año': 1999,
  'duracion': 139,
  'genero': 'Drama',
  'adultos': True,
  'subtitulos': ['es', 'en']},
 {'id': 7,
  'titulo': 'Inception',
  'año': 2010,
  'duracion': 148,
  'genero': 'Ciencia ficción',
  'adultos

In [194]:
lista_peliculas = [] # Creamos una lista vacía y vamos añadiendo diccionarios completos (filas) en cada iteración.

for peli in datos_limitados: # NO incluimos 'subtitulos' en este diccionario para simular que, en este punto del proyecto, ese dato no nos interesaba.
        nueva_peli = {
            'Titulo': peli.get('titulo', 'desconocido'), # Si no hay título, ponemos 'Desconocido' para evitar vacíos
            'Año': peli.get('año', 0), # Si no hay año, ponemos 0 para evitar vacíos
            'Duracion': peli.get('duracion', 0),
            'Genero': peli.get('genero', 'sin clasificar'),
            'Contenido adulto': peli.get('adultos', False) 
         }
        lista_peliculas.append(nueva_peli)  # Añadimos la película procesada a la lista

In [195]:
df_peliculas = pd.DataFrame(lista_peliculas)
print("DataFrame creado correctamente (datos sin subtítulos).")
pd.DataFrame(lista_peliculas) 

DataFrame creado correctamente (datos sin subtítulos).


Unnamed: 0,Titulo,Año,Duracion,Genero,Contenido adulto
0,The Godfather,1972,175,Crimen,False
1,The Godfather Part II,1974,202,Crimen,False
2,Pulp Fiction,1994,154,Crimen,True
3,Forrest Gump,1994,142,Drama,False
4,The Dark Knight,2008,152,Acción,False
5,Fight Club,1999,139,Drama,True
6,Inception,2010,148,Ciencia ficción,False
7,The Matrix,1999,136,Ciencia ficción,False
8,The Shawshank Redemption,1994,142,Drama,False
9,Interstellar,2014,169,Ciencia ficción,False


In [None]:
# AJUSTES VISUALES : 
df_peliculas.index = range(1, len(df_peliculas) + 1) # Índice desde 1 (no desde 0)
pd.set_option('display.max_columns', None)  # Mostrar todas las columnas
pd.set_option('display.width', 1000)        # Ancho máximo para evitar saltos de línea
pd.set_option('display.colheader_justify', 'center') # Centrar encabezados
print(df_peliculas)
    

                          Titulo                         Año  Duracion      Genero       Contenido adulto
1                                        The Godfather  1972     175             Crimen        False     
2                                The Godfather Part II  1974     202             Crimen        False     
3                                         Pulp Fiction  1994     154             Crimen         True     
4                                         Forrest Gump  1994     142              Drama        False     
5                                      The Dark Knight  2008     152             Acción        False     
6                                           Fight Club  1999     139              Drama         True     
7                                            Inception  2010     148    Ciencia ficción        False     
8                                           The Matrix  1999     136    Ciencia ficción        False     
9                             The Shawshank Re

## FASE 2: Creación de la base de datos

In [197]:
config = {
    "host": "localhost",
    "user": "root",
    "password": "", # Pon tu contraseña si tienes
    "auth_plugin": "mysql_native_password"
}