# Ejercicio Intermedio - Creación de BBDD de películas extraídas de MovieDatabase

- En este ejercicio vamos a poner en práctica lo que hemos aprendido sobre la **extracción de contenido de APIs** y la **creación de una base de datos** con sus tablas. Siguiendo las fases propuestas, conseguiremos extraer datos de películas y subtítulos, almacenarlos en un DataFrame y finalmente crear una base de datos con la estructura adecuada.

## Fase 1: Extracción de datos de películas

Nuestro primer objetivo es **extraer los datos de películas** de la API de MovieDatabase. Aquí están los detalles:

- Enlace a la API: [MovieDatabase API](https://rapidapi.com/dolphinnoirbusiness/api/moviedatabase8)
- Endpoint a utilizar: `Random`
- Datos a extraer:
  - Título
  - Año de lanzamiento
  - Duración (en minutos)
  - Género (solo el primero)
  - Contenido para adultos (sí o no)
  - `id_imdb`

  El objetivo es **extraer 1000 películas** de esta API utilizando el endpoint mencionado.

In [2]:
import pandas as pd
import requests 

In [5]:
url = "https://moviedatabase8.p.rapidapi.com/Random/1000"

headers = {
	"x-rapidapi-key": "784ba5649fmshc4797be1d2a5e7dp17675ejsnff3cf7a5ea60",
	"x-rapidapi-host": "moviedatabase8.p.rapidapi.com"
}

response = requests.get(url, headers=headers)

response.json()

[{'_id': '65ef4014675dde8010877c6d',
  'id': 364242,
  'title': 'Ladies Club',
  'vote_average': 5.5,
  'vote_count': 3,
  'status': 'Released',
  'release_date': '1956-04-12T00:00:00.000Z',
  'revenue': 0,
  'runtime': 90,
  'adult': False,
  'budget': 0,
  'imdb_id': 'tt0047943',
  'original_language': 'es',
  'original_title': 'Club de señoritas',
  'overview': 'Lonelyhearts advisor on a tv show becomes feminist icon and movement-leader.',
  'popularity': 1.249,
  'genres': 'Comedy, Music',
  'production_companies': 'Cinematográfica Calderón S.A.',
  'production_countries': 'Mexico',
  'spoken_languages': 'Spanish'},
 {'_id': '65ef4401675dde801093f477',
  'id': 683664,
  'title': 'XXX Chubby Twats',
  'vote_average': 0,
  'vote_count': 0,
  'status': 'Released',
  'release_date': '2006-01-01T00:00:00.000Z',
  'revenue': 0,
  'runtime': 0,
  'adult': True,
  'budget': 0,
  'original_language': 'en',
  'original_title': 'XXX Chubby Twats',
  'overview': 'Straight from the pages of Vol

In [6]:
response.status_code

200

In [8]:
pelis = response.json()

In [9]:
len(pelis)

1000

In [10]:
peliculas = {
    "titulo": [],
    "año_de_lanzamiento": [],
    "duracion": [],
    "genero": [],
    "contenido_para_adultos": [],
    "id_imdb": []
}
# Contador peliculas 
contador_peliculas = 0

# Bucle para hacer hasta 1000 llamadas y extraer datos
for i in range(1000):  # Intento obtener hasta 1000 películas
    if contador_peliculas < 10:  # Limito a 10 llamadas
        try:
            # Realizo la solicitud a la API
            response = requests.get(url, headers=headers)
            
            # Verifico si la respuesta es exitosa
            if response.status_code == 200:
                data = pelis
                
                # Extraigo los campos requeridos
                titulo = data.get('title', 'N/A')
                ano = data.get('releaseYear', 'N/A')
                duracion = data.get('runtime', 'N/A')
                genero = data['genres'][0] if data.get('genres') else 'N/A'
                adultos = "Sí" if data.get('adult', False) else "No"
                id_imdb = data.get('imdb_id', 'N/A')

                # Agrego los datos extraídos a las listas correspondientes en el diccionario
                peliculas["titulo"].append(titulo)
                peliculas["año_de_lanzamiento"].append(ano)
                peliculas["duracion"].append(duracion)
                peliculas["genero"].append(genero)
                peliculas["contenido_para_adultos"].append(adultos)
                peliculas["id_imdb"].append(id_imdb)

                # Incremento el contador de películas
                contador_peliculas += 1

            else:
                print(f"Error en la solicitud: {response.status_code}")

        except Exception as e:
            print(f"Error durante la extracción de datos: {e}")

Error durante la extracción de datos: 'list' object has no attribute 'get'
Error durante la extracción de datos: 'list' object has no attribute 'get'
Error durante la extracción de datos: 'list' object has no attribute 'get'
Error durante la extracción de datos: 'list' object has no attribute 'get'
Error durante la extracción de datos: 'list' object has no attribute 'get'
Error durante la extracción de datos: 'list' object has no attribute 'get'
Error durante la extracción de datos: 'list' object has no attribute 'get'
Error en la solicitud: 429
Error en la solicitud: 429
Error en la solicitud: 429
Error en la solicitud: 429
Error en la solicitud: 429
Error en la solicitud: 429
Error en la solicitud: 429
Error en la solicitud: 429
Error en la solicitud: 429
Error en la solicitud: 429
Error en la solicitud: 429
Error en la solicitud: 429
Error en la solicitud: 429
Error en la solicitud: 429
Error en la solicitud: 429
Error en la solicitud: 429
Error en la solicitud: 429
Error en la soli

KeyboardInterrupt: 

## Fase 2: Extracción de subtítulos

Con el `id_imdb` obtenido en la fase anterior, vamos a **extraer los subtítulos** de cada película utilizando una API diferente:

- Enlace a la API: [MoviesDatabase API](https://rapidapi.com/SAdrian/api/moviesdatabase)
- Endpoint a utilizar: `/titles/{id}` (donde `{id}` es el `id_imdb` extraído previamente)

El objetivo en esta fase es obtener el subtítulo asociado a cada película. (caption)

## Fase 3: Creación de DataFrames

Una vez que hayamos extraído los datos de ambas APIs, vamos a:

1. **Crear un DataFrame** con los datos de las películas.
2. **Crear un segundo DataFrame** con los subtítulos asociados a las películas.

Para ello, vamos a utilizar la librería **Pandas**. Es necesario desarrollar funciones que almacenen los datos extraídos en un diccionario, para luego convertirlos en DataFrames.

## Fase 4: Creación de la Base de Datos

En esta fase:

1. **Importamos las librerías necesarias** para crear una base de datos (como `mysql.connector` o `SQLAlchemy`).
2. **Automatizamos la creación de una base de datos** utilizando Python.
3. **Creamos las tablas en la base de datos** a partir de los DataFrames creados previamente.

### Estructura de la Base de Datos:

- **Tabla de películas**:
  - `id` (entero, `AUTO_INCREMENT`, clave primaria)
  - `titulo` (texto)
  - `anio_lanzamiento` (entero)
  - `duracion` (entero, en minutos)
  - `genero` (texto)
  - `adulto` (booleano)
  - `id_imdb` (texto)

- **Tabla de subtítulos**:
  - `id_imdb` (texto, clave primaria)
  - `subtitulo` (texto)

## Bonus - Inserción de los Datos en la Base de Datos

En este apartado adicional, vamos a realizar la inserción de los datos extraídos en las tablas creadas en nuestra base de datos MySQL. 