# Proyecto
______________

API: https://dev.adalab.es/cinema/
Endpoint : https://dev.adalab.es/api/cinema/movies?year=2010&genre=Drama

- **Librerías y display**

In [98]:
#Importar librerías para su posterior uso en el código
import tqdm
from bs4 import BeautifulSoup
import requests
import pandas as pd
import re
import datetime
import json
from time import sleep
pd.set_option('display.max_columns', None) # para poder visualizar todas las columnas de los DataFrames
# Importar librerías de Selenium
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.ui import Select
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait 

# Importar librería para la conexión con MySQL
# -----------------------------------------------------------------------
import mysql.connector
from mysql.connector import errorcode


# Importar librerías para manipulación y análisis de datos
# -----------------------------------------------------------------------
import pandas as pd
import numpy as np

# Comprobando que el display sea el máximo para mostrar mejor el data frame
pd.set_option('display.max_rows', 100)  # Cambia el número máximo de filas mostradas
pd.set_option('display.max_columns', 10)  # Cambia el número máximo de columnas mostradas
pd.set_option('display.width', 1000)  # Cambia el ancho máximo de la pantalla

- **Extracción API** (generos y rango años 15)

In [77]:
# Lista de años buscados: 15 años
anio_lista = list(range(2009, 2025))

# Lista de géneros
generos_lista = ["Drama", "Comedy", "Action", "Fantasy", "Horror", "Mystery", "Romance", "Thriller"]

# Lista vacía en la cual almacenaremos los datos extrañidos de la API
datos_peliculas = []

# Bucle para iterar por año y género
for anio in anio_lista:
    for genero in generos_lista:
        # Determinar URL
        url_movies = f"https://dev.adalab.es/api/cinema/movies?year={anio}&genre={genero}"
        
        # Llamada a API
        res_url_movies = requests.get(url_movies)
        
        # Pausa para la API
        sleep(1) 
        
        # Verificar la espuesta de la API
        if res_url_movies.status_code == 200:
            try:
                json_url_general = res_url_movies.json()
                 
                # Imprimir jason para verlo
                print(f"Response for {anio} - {genero}: {json_url_general}")
                
                # Verificar si la llamada tiene la info correcta
                if isinstance(json_url_general, dict) and 'results' in json_url_general:
                    movies = json_url_general['results']
                    
                    # Verificar que es lista
                    if isinstance(movies, list):
                        # Bucle por película para extraer info
                        for pelicula in movies:
                            id = pelicula.get("idOwner")
                            titulo = pelicula.get("title")
                            tipo = pelicula.get("type")
                            anio = pelicula.get("year")
                            genero = pelicula.get("genre")
                            
                            # Añadir info a la lista anteriormente vacía
                            datos_peliculas.append((id, titulo, tipo, anio, genero))
                    else:
                        print("Expected 'results' to be a list.")
                else:
                    print("Expected JSON structure not found.")
            except json.JSONDecodeError:
                print("Error decoding JSON response.")
        else:
            print(f"Error: {res_url_movies.status_code} - {res_url_movies.reason}")

# Convertir a pandas frame
df_peliculas = pd.DataFrame(datos_peliculas)

# Salvar la busqueda en un documento con formato CSV
df_peliculas.to_csv("movies_last_15_years.csv", index=False)

print("Extracción completada y almacenada en: movies_last_15_years.csv.")


Response for 2009 - Drama: {'info': {'count': 10}, 'results': [{'id': 59404, 'title': 'Apaföld', 'type': 'Movie', 'year': '2009', 'genre': 'Drama', 'idOwner': 'tt0143558', 'image': 'https://m.media-amazon.com/images/M/MV5BYjA5Y2M3ZDAtNjg4OC00ZDQ5LWI4MzgtM2E0NTdjZmUwZjE1XkEyXkFqcGdeQXVyNDYzMDMxOTc@._V1_.jpg'}, {'id': 59405, 'title': 'Rózsaszín sajt', 'type': 'Movie', 'year': '2009', 'genre': 'Drama', 'idOwner': 'tt0153140', 'image': 'https://m.media-amazon.com/images/M/MV5BMjE2NDAxNDE0Nl5BMl5BanBnXkFtZTgwMTU1MjQwNjE@._V1_.jpg'}, {'id': 59406, 'title': 'Sanam Teri Kasam', 'type': 'Movie', 'year': '2009', 'genre': 'Drama', 'idOwner': 'tt0205380', 'image': 'https://m.media-amazon.com/images/M/MV5BYjc3MGNhMmItMjljOS00NjY5LThlMmQtYWM1NWZiOGJlY2EyXkEyXkFqcGdeQXVyMjU4NDY1ODA@._V1_.jpg'}, {'id': 59407, 'title': 'Twice as Dead', 'type': 'Movie', 'year': '2009', 'genre': 'Drama', 'idOwner': 'tt0254832', 'image': 'https://m.media-amazon.com/images/M/MV5BMTI2NjA5NDkyMl5BMl5BanBnXkFtZTcwNjAxNTEwMw@@

- Verificar el output

In [82]:
print(datos_peliculas)
print(type(datos_peliculas))

[('tt0143558', 'Apaföld', 'Movie', '2009', 'Drama'), ('tt0153140', 'Rózsaszín sajt', 'Movie', '2009', 'Drama'), ('tt0205380', 'Sanam Teri Kasam', 'Movie', '2009', 'Drama'), ('tt0254832', 'Twice as Dead', 'Movie', '2009', 'Drama'), ('tt0311698', 'Railed', 'Movie', '2009', 'Drama'), ('tt0327597', 'Coraline', 'Movie', '2009', 'Drama'), ('tt0344074', 'Mitsein', 'Movie', '2009', 'Drama'), ('tt0346631', 'Blood and Bone', 'Movie', '2009', 'Drama'), ('tt0361748', 'Inglourious Basterds', 'Movie', '2009', 'Drama'), ('tt0362478', 'The Box', 'Movie', '2009', 'Drama'), ('tt0067230', 'I Miss Sonia Henie', 'Short', '2009', 'Comedy'), ('tt0288190', 'El reino de los cielos', 'Movie', '2009', 'Comedy'), ('tt0304876', 'Unter Strom', 'Movie', '2009', 'Comedy'), ('tt0312958', 'Chinango', 'Movie', '2009', 'Comedy'), ('tt0345683', 'Mutant Swinger from Mars', 'Video', '2009', 'Comedy'), ('tt0353765', 'Los muertos van deprisa', 'Movie', '2009', 'Comedy'), ('tt0365873', 'Two-Minute Heist', 'Movie', '2009', 'Com

In [None]:
# Obtiene los nombres en la posición 2 (0,1,2) que es en donde está el type
nombres_tipos = set(pelicula [2] for pelicula in datos_peliculas)
print("Los tipos dentro de posición 2 son:", nombres_tipos)

# Crear listas vacías para cada tipo de película en minúsculas y añadir info con list comprehension
tv_mini_series_lista = [pelicula for pelicula in datos_peliculas if pelicula[2].replace('_', ' ') == "TV Mini Series"]
movie = [pelicula for pelicula in datos_peliculas if pelicula[2].replace('_', ' ') == "Movie"]
tv_series = [pelicula for pelicula in datos_peliculas if pelicula[2].replace('_', ' ') == "TV Series"]
short = [pelicula for pelicula in datos_peliculas if pelicula[2].replace('_', ' ') == "Short"]
tv_episode = [pelicula for pelicula in datos_peliculas if pelicula[2].replace('_', ' ') == "TV Episode"]
video = [pelicula for pelicula in datos_peliculas if pelicula[2].replace('_', ' ') == "Video"]
tv_movie = [pelicula for pelicula in datos_peliculas if pelicula[2].replace('_', ' ') == "TV Movie"]
video_game = [pelicula for pelicula in datos_peliculas if pelicula[2].replace('_', ' ') == "Video Game"]

print(movie)


Sacar variable de movies y shorts

In [86]:
movie = [pelicula for pelicula in datos_peliculas if pelicula[2] == "Movie"]
print(movie)

short = [pelicula for pelicula in datos_peliculas if pelicula[2] == "Short"]
print(short)

[('tt0143558', 'Apaföld', 'Movie', '2009', 'Drama'), ('tt0153140', 'Rózsaszín sajt', 'Movie', '2009', 'Drama'), ('tt0205380', 'Sanam Teri Kasam', 'Movie', '2009', 'Drama'), ('tt0254832', 'Twice as Dead', 'Movie', '2009', 'Drama'), ('tt0311698', 'Railed', 'Movie', '2009', 'Drama'), ('tt0327597', 'Coraline', 'Movie', '2009', 'Drama'), ('tt0344074', 'Mitsein', 'Movie', '2009', 'Drama'), ('tt0346631', 'Blood and Bone', 'Movie', '2009', 'Drama'), ('tt0361748', 'Inglourious Basterds', 'Movie', '2009', 'Drama'), ('tt0362478', 'The Box', 'Movie', '2009', 'Drama'), ('tt0288190', 'El reino de los cielos', 'Movie', '2009', 'Comedy'), ('tt0304876', 'Unter Strom', 'Movie', '2009', 'Comedy'), ('tt0312958', 'Chinango', 'Movie', '2009', 'Comedy'), ('tt0353765', 'Los muertos van deprisa', 'Movie', '2009', 'Comedy'), ('tt0365873', 'Two-Minute Heist', 'Movie', '2009', 'Comedy'), ('tt0375568', 'Astro Boy', 'Movie', '2009', 'Comedy'), ('tt0365929', 'Whiteout', 'Movie', '2009', 'Action'), ('tt0373340', 'Ste

- Conectar con SQL, crear cursor y creación BBDD

In [99]:
# Conectar a SQL
cnx = mysql.connector.connect(user='root', password='AlumnaAdalab',
                              host='127.0.0.1')
# Crear cursor
mycursor = cnx.cursor()

# Crear base de datos
try:
    mycursor.execute("CREATE DATABASE BBDD_CinemExtract")
    print(mycursor)
except mysql.connector.Error as err: # verificar si hay errores
    print(err)
    print("Error Code:", err.errno)
    print("SQLSTATE", err.sqlstate)
    print("Message", err.msg)

1007 (HY000): Can't create database 'bbdd_cinemextract'; database exists
Error Code: 1007
SQLSTATE HY000
Message Can't create database 'bbdd_cinemextract'; database exists


- Ubicarse en la bbdd adecuada y Crear tabla y columnas tabla 1 (**datos_peliculas**) ---- API

In [97]:
# Seleccionar la base de datos
try:
    mycursor.execute("USE BBDD_CinemExtract")
    print("Base de datos seleccionada correctamente.")
except mysql.connector.Error as err:
    print("Error al seleccionar la base de datos.")
    print("Código de Error:", err.errno)
    print("SQLSTATE:", err.sqlstate)
    print("Mensaje:", err.msg)
    
# Crear tabla 1 = datos_peliculas, sus columnas y sus tipos de datos
try:
    mycursor.execute("""
    CREATE TABLE datos_peliculas (
        id_pelicula VARCHAR(15) PRIMARY KEY, 
        titulo_pelicula VARCHAR(100), 
        tipo_pelicula VARCHAR(50) NOT NULL, 
        anio_pelicula INT NOT NULL, 
        genero_pelicula VARCHAR(20) NOT NULL
    )
    """)
    print("Tabla 'datos_peliculas' creada exitosamente.")
except mysql.connector.Error as err:
    print("Se produjo un error al crear la tabla.")
    print("Código de Error:", err.errno)
    print("SQLSTATE:", err.sqlstate)
    print("Mensaje:", err.msg)

Error al seleccionar la base de datos.
Código de Error: 2013
SQLSTATE: HY000
Mensaje: Lost connection to MySQL server during query
Se produjo un error al crear la tabla.
Código de Error: 2013
SQLSTATE: HY000
Mensaje: Lost connection to MySQL server during query


- Insertar datos dentro de la tabla 1 = **movie**

In [24]:
# Insertar datos dentro de la tabla 1 = movie (corresponde solo al tipo movie dentro de datos_peliculas ya que en los siguientes codigos, solo usamos tipo movie)

sql = "INSERT INTO datos_peliculas (id_pelicula, titulo_pelicula, tipo_pelicula, anio_pelicula, genero_pelicula) VALUES (%s,%s,%s,%s,%s) "
val = movie

try: 
    mycursor.executemany(sql, val)
    cnx.commit()
    print(mycursor.rowcount, "registro/s insertado/s.")

except mysql.connector.Error as err:
    print(err)
    print("Error Code:", err.errno)
    print("SQLSTATE", err.sqlstate)
    print("Message", err.msg)


418 registro/s insertado/s.


- Insertar datos dentro de la tabla 1 = **short**

In [92]:
# Insertar datos dentro de la tabla 1 = movie (corresponde solo al tipo movie dentro de datos_peliculas ya que en los siguientes codigos, solo usamos tipo movie)

sql = "INSERT INTO datos_peliculas (id_pelicula, titulo_pelicula, tipo_pelicula, anio_pelicula, genero_pelicula) VALUES (%s,%s,%s,%s,%s) "
val = short

try: 
    mycursor.executemany(sql, val)
    cnx.commit()
    print(mycursor.rowcount, "registro/s insertado/s.")

except mysql.connector.Error as err:
    print(err)
    print("Error Code:", err.errno)
    print("SQLSTATE", err.sqlstate)
    print("Message", err.msg)

95 registro/s insertado/s.


- Extracción Selenium datos **peliculas IMDB**

In [74]:

# Iniciar el navegador
driver = webdriver.Chrome()
print("Abriendo Google")
# Maximizar la ventana del navegador
driver.maximize_window()
print("Pantalla maximizada")
sleep(3)

# Abrir página web
driver.get("https://www.imdb.com/")
print("Accediendo a la web")
sleep(3)

# Aceptar cookies
driver.find_element("css selector", "#__next > div > div > div.sc-jrcTuL.bPmWiM > div > button.icb-btn.sc-bcXHqe.sc-dkrFOg.sc-iBYQkv.dcvrLS.ddtuHe.dRCGjd").click()
print("Cookies aceptadas")
sleep(5)

# Diccionario vacío en dónde se almacenarán los datos
datos_imdb = {"id_pelicula":[], "nombre_pelicula":[], "puntuacion":[], "direccion":[], "guionista":[], "argumento":[] }


# Iterar sobre los IDs de las películas
id_pelicula_list = [pelicula[0] for pelicula in movie]

# Iterar sobre los IDs de las películas
for id_pelicula in id_pelicula_list:
    url_pelicula = f"https://www.imdb.com/title/{id_pelicula}/"
    
    # Navegar a la página de la película usando el ID
    driver.get(url_pelicula)
    sleep(5)

    try:
        # Extraer el nombre de la película
        titulo = driver.find_element("css selector", "h1 span").text
        datos_imdb["nombre_pelicula"].append(titulo)
        datos_imdb["id_pelicula"].append(id_pelicula)
        print(f"Titulo: {titulo}")

        # Extraer la puntuación
        try:
            puntuacion = driver.find_element("css selector", "span.sc-eb51e184-1.ljxVSS").text
            # LIMPIEZA
            puntuacion = puntuacion.replace(",", ".")
            puntuacion = float(puntuacion)
            datos_imdb["puntuacion"].append(puntuacion)
            print(f"Puntuacion: {puntuacion}")
        except:
            datos_imdb["puntuacion"].append("N/A")
            print("Puntuación no encontrada")

        # Extraer la dirección
        try:
            direccion_elementos = driver.find_elements("xpath", '//li[span[contains(text(),"Dirección")]]//a')
            # Extraer los nombres de los guionistas
            directores = [director.text for director in direccion_elementos if director.text.strip()]
            directores_unicos = list(set(directores))
            # Comprobar si se encontraron guionistas y unir los nombres
            directores_limpio = ", ".join(directores_unicos) if directores else "N/A"
            # Añadir la lista de guionistas al diccionario
            datos_imdb["direccion"].append(directores_limpio)
            # Imprimir los guionistas extraídos
            print(f"Direccion: {directores_limpio}")
        except:
            datos_imdb["direccion"].append("N/A")
            print(f"Director no encontrado")
        # Extraer guionista
        try:
            guionistas_elementos = driver.find_elements("xpath", '//li[span[contains(text(),"Guión")]]//a')
            # Extraer los nombres de los guionistas
            guionistas = [guionista.text for guionista in guionistas_elementos if guionista.text.strip()]
            guionistas_unicos = list(set(guionistas))
            # Comprobar si se encontraron guionistas y unir los nombres
            guionistas_limpio = ", ".join(guionistas_unicos) if guionistas else "N/A"
            # Añadir la lista de guionistas al diccionario
            datos_imdb["guionista"].append(guionistas_limpio)
            # Imprimir los guionistas extraídos
            print(f"Guionistas: {guionistas_limpio}")
        except:
            datos_imdb["guionista"].append("N/A")
            print(f"Guionista no encontrado")


        # Extraer argumento
        try:
            argumento = driver.find_element("css selector", '#__next > main > div > section.ipc-page-background.ipc-page-background--base.sc-afa4bed1-0.iMxoKo > section > div:nth-child(5) > section > section > div.sc-491663c0-4.gxWIhN > div.sc-491663c0-6.etrlfo > div.sc-491663c0-10.iaQXlA > section > p > span.sc-2d37a7c7-2.ggeRnl').text
            # Añadir a diccionario
            datos_imdb["argumento"].append(argumento)
            print(f"Argumento: {argumento}")
           
        except:
            
            try: 
                argumento = driver.find_element("css selector", '#__next > main > div > section.ipc-page-background.ipc-page-background--base.sc-afa4bed1-0.iMxoKo > section > div:nth-child(5) > section > section > div.sc-491663c0-4.ILcwq > div.sc-491663c0-6.bvzCJs > div.sc-491663c0-10.tkbDg > section > p > span.sc-2d37a7c7-2.ggeRnl').text
                datos_imdb["argumento"].append(argumento)
                print(f"Argumento: {argumento}")

            except:
                datos_imdb["argumento"].append("N/A")
                print("Argumento no encontrado")

    except:
        print(f"Error al procesar la película con ID '{id_pelicula}'")
        datos_imdb["nombre_pelicula"].append("N/A")
        datos_imdb["id_pelicula"].append(id_pelicula)
        datos_imdb["puntuacion"].append("N/A")
        datos_imdb["direccion"].append("N/A")
        datos_imdb["guionista"].append("N/A")
        datos_imdb["argumento"].append("N/A")

print(datos_imdb)
# Cerrar el navegador
driver.quit()

# Convertir a pandas frame
df_peliculas_imdb = pd.DataFrame(datos_imdb)

# Salvar la busqueda en un documento con formato CSV
df_peliculas_imdb.to_csv("peliculas_imdb.csv", index=False)

print("Extracción completada y almacenada en: peliculas_imdbs.csv.")

Abriendo Google
Pantalla maximizada
Accediendo a la web
Cookies aceptadas
Titulo: Apaföld
Puntuacion: 5.2
Direccion: Viktor Oszkar Nagy
Guionistas: Viktor Oszkar Nagy
Argumento: 
Titulo: Rózsaszín sajt
Puntuacion: 5.9
Direccion: Barnabás Tóth
Guionistas: Frank Rizzo, Barnabás Tóth, Dániel Hamvas
Argumento: To escape the oppressive hyperactivity of his gynecologist father, Dani, 19-year-old student at the Medical University of Budapest, travels to France to his musician uncle. A vision of adolescence and father-son-women relationship filled with humour and human touches. This movie is spoken in Hungarian and French and subtitled in English.
Titulo: Sanam Teri Kasam
Puntuacion: 4.2
Direccion: Lawrence D'Souza
Guionistas: Talat Rekhi
Argumento: Se forma un triángulo amoroso cuando un hombre descubre que su mejor amigo se ha casado con su ex prometida, desatando un enredo de amor, traición y emociones encontradas.
Titulo: Twice as Dead
Puntuacion: 7.6
Direccion: Terence H. Winkless
Guionis

- Convertir a lista de tuplas

In [75]:
# Convertir los datos del diccionario en una lista de tuplas con verificación de valores vacíos
datos_imdb_tuplas = list(zip(
    [id_pelicula if id_pelicula != "" else "N/A" for id_pelicula in datos_imdb["id_pelicula"]],    # IDs de las películas
    [nombre if nombre != "" else "N/A" for nombre in datos_imdb["nombre_pelicula"]],               # Títulos de las películas
    [puntuacion if puntuacion != "" else "N/A" for puntuacion in datos_imdb["puntuacion"]],        # Puntuaciones
    [direccion if direccion != "" else "N/A" for direccion in datos_imdb["direccion"]],            # Directores
    [guionista if guionista != "" else "N/A" for guionista in datos_imdb["guionista"]],            # Guionistas
    [argumento if argumento != "" else "N/A" for argumento in datos_imdb["argumento"]]             # Argumentos
))

# Imprimir la lista de tuplas
print(datos_imdb_tuplas)


[('tt0143558', 'Apaföld', 5.2, 'Viktor Oszkar Nagy', 'Viktor Oszkar Nagy', 'N/A'), ('tt0153140', 'Rózsaszín sajt', 5.9, 'Barnabás Tóth', 'Frank Rizzo, Barnabás Tóth, Dániel Hamvas', 'To escape the oppressive hyperactivity of his gynecologist father, Dani, 19-year-old student at the Medical University of Budapest, travels to France to his musician uncle. A vision of adolescence and father-son-women relationship filled with humour and human touches. This movie is spoken in Hungarian and French and subtitled in English.'), ('tt0205380', 'Sanam Teri Kasam', 4.2, "Lawrence D'Souza", 'Talat Rekhi', 'Se forma un triángulo amoroso cuando un hombre descubre que su mejor amigo se ha casado con su ex prometida, desatando un enredo de amor, traición y emociones encontradas.'), ('tt0254832', 'Twice as Dead', 7.6, 'Terence H. Winkless', 'Terence H. Winkless, Raly Radouloff', 'Jack and Jill rob a bank and end up on the road with their contact and a sexy vixen on the run from the law.'), ('tt0311698',

- Crear tabla y columnas tabla 2 (**peliculas imdb**)

In [43]:
# Seleccionar la base de datos
try:
    mycursor.execute("USE BBDD_CinemExtract")
    print("Base de datos seleccionada correctamente.")
except mysql.connector.Error as err:
    print("Error al seleccionar la base de datos.")
    print("Código de Error:", err.errno)
    print("SQLSTATE:", err.sqlstate)
    print("Mensaje:", err.msg)
    
# Crear tabla 2 = peliculas_imdb, sus columnas y sus tipos de datos
try:
    mycursor.execute("""
    CREATE TABLE peliculas_imdb (
        id_imdb VARCHAR (15) PRIMARY KEY,
        titulo_imdb VARCHAR(100),
        puntuacion FLOAT DEFAULT NULL, 
        direccion VARCHAR(200) DEFAULT NULL, 
        guionista VARCHAR(200) DEFAULT NULL, 
        argumento VARCHAR(800) DEFAULT NULL
    )
    """)
    print("Tabla 'peliculas_imdb' creada exitosamente.")
except mysql.connector.Error as err:
    print("Se produjo un error al crear la tabla.")
    print("Código de Error:", err.errno)
    print("SQLSTATE:", err.sqlstate)
    print("Mensaje:", err.msg)

Base de datos seleccionada correctamente.
Tabla 'peliculas_imdb' creada exitosamente.


- Leer archivo CSV de peliculas_imdb para tabla 2 con la librería pandas

In [None]:
# Cargar el archivo CSV en un DataFrame
df = pd.read_csv(r"C:\Users\yaelp\Desktop\Adalab\Proyectos grupo\Proyecto_02\Repo-da.Promo-J.Modulo2.Team-FilmAnalytics\peliculas_imdb.csv")

# Verificar los datos leídos
print(df.head())  # Muestra las primeras 5 filas del DataFrame

- Insertar datos dentro de la tabla 2 = **peliculas_imdb**

In [44]:
# Reemplazar los valores NaN con NULL o cadenas vacías
df = df.replace({np.nan: None})  # Aquí reemplazas los NaN por None, que MySQL interpreta como NULL
# Convertir los datos del DataFrame en una lista de tuplas
datos_imdb_tuplas = [tuple(row) for row in df.itertuples(index=False, name=None)]

# Insertar datos dentro de la tabla 2 = peliculas_imdb
sql = "INSERT INTO peliculas_imdb (id_imdb,titulo_imdb, puntuacion, direccion, guionista, argumento) VALUES (%s,%s,%s,%s,%s,%s) "
val = datos_imdb_tuplas

try: 
    mycursor.executemany(sql, val)
    cnx.commit()
    print(mycursor.rowcount, "registro/s insertado/s.")

except mysql.connector.Error as err:
    print(err)
    print("Error Code:", err.errno)
    print("SQLSTATE", err.sqlstate)
    print("Message", err.msg)

1265 (01000): Data truncated for column 'puntuacion' at row 32
Error Code: 1265
SQLSTATE 01000
Message Data truncated for column 'puntuacion' at row 32


- Extracción Selenium **actores** de IMDB (nombre de los actores)

In [78]:
# Iniciar el navegador
driver = webdriver.Chrome()
print("Abriendo Google")
# Maximizar la ventana del navegador
driver.maximize_window()
print("Pantalla maximizada")
sleep(3)

# Abrir página web
driver.get("https://www.imdb.com/")
print("Accediendo a la web")
sleep(3)

# Aceptar cookies
driver.find_element("css selector", "#__next > div > div > div.sc-jrcTuL.bPmWiM > div > button.icb-btn.sc-bcXHqe.sc-dkrFOg.sc-iBYQkv.dcvrLS.ddtuHe.dRCGjd").click()
print("Cookies aceptadas")
sleep(5)


# Inicializar una lista vacía para almacenar los actores
actores_por_pelicula = []

# Iterar sobre los IDs de las películas
id_pelicula_list = [pelicula[0] for pelicula in movie]

for id_pelicula in id_pelicula_list:
    url_pelicula = f"https://www.imdb.com/title/{id_pelicula}/"
    # Navegar a la página de la película usando el ID
    driver.get(url_pelicula)
    sleep(5)

    # Realizar el scroll para que se cargue la información de los actores
    driver.execute_script("window.scrollTo(0,800)")
    print('scroll realizado')
    sleep(10)

    # Extraer los nombres de los actores
    actores_elements = driver.find_elements('css selector', '[data-testid="title-cast-item__actor"]')

    # Crear una lista solo con los nombres de los primeros 10 actores
    actores_list = [actor.text for actor in actores_elements[:10]]

    # Añadir una tupla con el ID de la película y la lista de actores a la lista actores_por_pelicula
    actores_por_pelicula.append((actores_list))
    print(f'Actores de la película {id_pelicula} agregados: {actores_list}')

# Mostrar el resultado final
print(actores_por_pelicula)

Abriendo Google
Pantalla maximizada
Accediendo a la web
Cookies aceptadas
scroll realizado
Actores de la película tt0143558 agregados: ['Tamás Ravasz', 'János Derzsi', 'Andrea Nagy', 'Lukács Bicskey', 'István Znamenák']
scroll realizado
Actores de la película tt0153140 agregados: ['Barnabás Tóth', 'Zoltán Bezerédi', 'Levente Molnár', 'Linda Lisztes', 'Béla Spindler', 'Angéla Eke', 'Gerda Pikali', 'Betta Lipcsei', 'Douceline Derreal', 'Olivier-Jacques Bernard']
scroll realizado
Actores de la película tt0205380 agregados: ['Saif Ali Khan', 'Atul Agnihotri', 'Pooja Bhatt', 'Sheeba Agarwal', 'Vikas Anand', 'Tabassum Govil', 'Dinesh Hingoo', 'Saeed Jaffrey', 'Shashi Kiran', 'Alok Nath']
scroll realizado
Actores de la película tt0254832 agregados: ['Ken Ward', 'Darlene Conte', 'Jeff Stearns', 'Katherine Boecher', 'Rowan Joseph', 'Suzanne Whang', 'Wendee Lee', 'Stephanie Kelley', 'Mike Meyers']
scroll realizado
Actores de la película tt0311698 agregados: ['Melissa McHenry', 'Mark Strohman']
s

- Extracción Selenium **actores** de IMDB (detalles de los actores)

In [95]:
# Crear funcion para encontrar los detalles de cada actor
def detalles_actor(actores_por_pelicula):
    url_actores = "https://www.imdb.com/"
    driver = webdriver.Chrome()

    # Navega a la página principal de IMDb y acepta las cookies
    driver.get(url_actores)
    driver.maximize_window()
    WebDriverWait(driver, 10).until(EC.element_to_be_clickable((By.CSS_SELECTOR, "#__next > div > div > div.sc-jrcTuL.bPmWiM > div > button.icb-btn.sc-bcXHqe.sc-dkrFOg.sc-iBYQkv.dcvrLS.ddtuHe.dRCGjd"))).click()
    
    datos_actores = []

    csv_counter = 1  # Contador para los archivos CSV

    for lista_actores in actores_por_pelicula:
        for actor in lista_actores:

            detalles_actores = []

            # Ingresar el nombre del actor en el campo de búsqueda
            search_box = WebDriverWait(driver, 20).until(
                EC.presence_of_element_located((By.CSS_SELECTOR, "#suggestion-search")))
            search_box.send_keys(actor, Keys.ENTER)
            sleep(5) 

            # Entrar al primer resultado de la búsqueda
            try:
                first_result = WebDriverWait(driver, 10).until(EC.element_to_be_clickable((By.XPATH, '//*[@id="__next"]/main/div[2]/div[3]/section/div/div[1]/section[2]/div[2]/ul/li[1]/div[2]/div/a')))
                first_result.click()
                detalles_actores.append(actor)
            except:
                print(f"No se encontró el primer resultado para {actor}")
                continue
            sleep(5)

            # Año de nacimiento
            try:
                anio_nacimiento = WebDriverWait(driver, 20).until(
                    EC.presence_of_element_located((By.XPATH, '//*[@id="__next"]/main/div/section[1]/section/div[3]/section/section/div[3]/div[2]/div[2]/section/aside/div/span[2]'))).text
                anio = re.search(r'\b\d{4}\b', anio_nacimiento).group()
                detalles_actores.append(int(anio))
            except:
                print(f"Error al encontrar el año de nacimiento para {actor}")
                detalles_actores.append("N/A")
            sleep(5)

            # Conocido por
            try:
                actor_conocido_por = driver.find_element(By.XPATH, '//*[@id="__next"]/main/div/section[1]/section/div[3]/section/section/div[3]/div[2]/div[1]/section/div/div/div/div').text
                conocido = re.search(r'conocido\s*por\s*(.*?\.)', actor_conocido_por).group(1)
                detalles_actores.append(conocido)
            except:
                print(f"Error al encontrar por qué es conocido el actor {actor}")
                detalles_actores.append("N/A")
            sleep(5)

            # Que hace (ocupaciones) del actor
            try:
                actor_que_hace = driver.find_element(By.XPATH, '//*[@id="__next"]/main/div/section[1]/section/div[3]/section/section/div[2]/div/ul').text
                lista_que_hace = actor_que_hace.split("\n")
                detalles_actores.append(", ".join(lista_que_hace))
            except:
                print(f"Error al encontrar qué hace el actor {actor}")
                detalles_actores.append("N/A")
            sleep(5)

            # Scroll y extracción de premios
            i = 500
            while i < 2000:
                try:
                    driver.execute_script(f"window.scrollTo(0, {i})")
                    sleep(3)
                    try:
                        texto_premios = driver.find_element(By.XPATH, '//*[@id="__next"]/main/div/section[1]/div/section/div/div[1]/section[1]/div/ul/li/div/ul').text
                        break
                    except:
                        texto_premios = driver.find_element(By.XPATH, '//*[@id="__next"]/main/div/section[1]/div/section/div/div[1]/section[2]/div/ul/li/div/ul').text
                        break
                except:
                    i += 500
            
            try:
                cantidad_premios = re.search(r'(\d+)\s+premios?', texto_premios, re.IGNORECASE).group(1)
                detalles_actores.append(cantidad_premios)
            except:
                print(f"Error al extraer los premios para {actor}")
                detalles_actores.append(0)
            driver.execute_script(f"window.scrollTo({i}, 0)")
            sleep(4)

            # Convertir a tupla y agregar a la lista de datos
            tupla_actores = tuple(detalles_actores)
            datos_actores.append(tupla_actores)

            # Guardar un CSV cada 100 filas
            if len(datos_actores) % 100 == 0:
                df_temp = pd.DataFrame(datos_actores, columns=["actor", "anio_nacimiento", "conocido_por", "que_hace", "premios"])
                csv_filename = f"extraccion_actores_parcial_{csv_counter}.csv"
                df_temp.to_csv(csv_filename, index=False)
                print(f"Guardado {csv_filename} con 300 entradas.")
                csv_counter += 1
                datos_actores = []  # Vacía la lista para continuar con los siguientes actores
    driver.quit()
    
    # Guardar el último archivo CSV si hay datos restantes
    if datos_actores:
        df_final = pd.DataFrame(datos_actores, columns=["actor", "anio_nacimiento", "conocido_por", "que_hace", "premios"])
        csv_filename = f"extraccion_actores_parcial_{csv_counter}.csv"
        df_final.to_csv(csv_filename, index=False)
        print(f"Guardado {csv_filename} con las últimas entradas.")

resultados = detalles_actor(actores_por_pelicula)

print(resultados)

Error al encontrar el año de nacimiento para Tamás Ravasz
Error al encontrar por qué es conocido el actor Tamás Ravasz
Error al extraer los premios para Tamás Ravasz
Error al encontrar el año de nacimiento para Andrea Nagy
Error al encontrar por qué es conocido el actor Andrea Nagy
Error al extraer los premios para Lukács Bicskey
Error al extraer los premios para Zoltán Bezerédi
Error al encontrar el año de nacimiento para Linda Lisztes
Error al encontrar por qué es conocido el actor Linda Lisztes
Error al encontrar el año de nacimiento para Béla Spindler
Error al encontrar por qué es conocido el actor Béla Spindler
Error al extraer los premios para Béla Spindler
Error al encontrar por qué es conocido el actor Angéla Eke
Error al extraer los premios para Angéla Eke
Error al encontrar el año de nacimiento para Gerda Pikali
Error al encontrar por qué es conocido el actor Gerda Pikali
Error al extraer los premios para Gerda Pikali
Error al encontrar el año de nacimiento para Betta Lipcsei

TimeoutException: Message: 
Stacktrace:
	GetHandleVerifier [0x00007FF7C68B9412+29090]
	(No symbol) [0x00007FF7C682E239]
	(No symbol) [0x00007FF7C66EB1DA]
	(No symbol) [0x00007FF7C673EFE7]
	(No symbol) [0x00007FF7C673F23C]
	(No symbol) [0x00007FF7C67897C7]
	(No symbol) [0x00007FF7C676672F]
	(No symbol) [0x00007FF7C67865A2]
	(No symbol) [0x00007FF7C6766493]
	(No symbol) [0x00007FF7C67309D1]
	(No symbol) [0x00007FF7C6731B31]
	GetHandleVerifier [0x00007FF7C6BD871D+3302573]
	GetHandleVerifier [0x00007FF7C6C24243+3612627]
	GetHandleVerifier [0x00007FF7C6C1A417+3572135]
	GetHandleVerifier [0x00007FF7C6975EB6+801862]
	(No symbol) [0x00007FF7C683945F]
	(No symbol) [0x00007FF7C6834FB4]
	(No symbol) [0x00007FF7C6835140]
	(No symbol) [0x00007FF7C682461F]
	BaseThreadInitThunk [0x00007FFC8A2E257D+29]
	RtlUserThreadStart [0x00007FFC8BDEAF28+40]


- Crear tabla y columnas tabla 3 (**actores**)

In [108]:
# Seleccionar la base de datos
try:
    mycursor.execute("USE BBDD_CinemExtract")
    print("Base de datos seleccionada correctamente.")
except mysql.connector.Error as err:
    print("Error al seleccionar la base de datos.")
    print("Código de Error:", err.errno)
    print("SQLSTATE:", err.sqlstate)
    print("Mensaje:", err.msg)
    
# Crear tabla 3 = actores, sus columnas y sus tipos de datos
try:
    mycursor.execute("""
    CREATE TABLE actores (
        id_actor INT AUTO_INCREMENT PRIMARY KEY,
        nombre VARCHAR(100) UNIQUE,
        anio_nacimiento INT DEFAULT NULL, 
        conocido_por VARCHAR(400) DEFAULT NULL, 
        que_hace VARCHAR(400) DEFAULT NULL, 
        premios VARCHAR(100) DEFAULT NULL 
    )
    """)
    print("Tabla 'actores' creada exitosamente.")
except mysql.connector.Error as err:
    print("Se produjo un error al crear la tabla.")
    print("Código de Error:", err.errno)
    print("SQLSTATE:", err.sqlstate)
    print("Mensaje:", err.msg)

Base de datos seleccionada correctamente.
Tabla 'actores' creada exitosamente.


- Leer archivo CSV de actores para tabla 3 con la librería pandas

In [113]:
# Lista de archivos CSV que deseas cargar
csv_files = [
    r"C:\Users\yaelp\Desktop\Adalab\Proyectos grupo\Proyecto_02\Repo-da.Promo-J.Modulo2.Team-FilmAnalytics\extraccion_actores_parcial_1.csv",
    r"C:\Users\yaelp\Desktop\Adalab\Proyectos grupo\Proyecto_02\Repo-da.Promo-J.Modulo2.Team-FilmAnalytics\extraccion_actores_parcial_2.csv",
    r"C:\Users\yaelp\Desktop\Adalab\Proyectos grupo\Proyecto_02\Repo-da.Promo-J.Modulo2.Team-FilmAnalytics\extraccion_actores_parcial_3.csv",
    r"C:\Users\yaelp\Desktop\Adalab\Proyectos grupo\Proyecto_02\Repo-da.Promo-J.Modulo2.Team-FilmAnalytics\extraccion_actores_parcial_4.csv",
    r"C:\Users\yaelp\Desktop\Adalab\Proyectos grupo\Proyecto_02\Repo-da.Promo-J.Modulo2.Team-FilmAnalytics\extraccion_actores_parcial_5.csv",
    r"C:\Users\yaelp\Desktop\Adalab\Proyectos grupo\Proyecto_02\Repo-da.Promo-J.Modulo2.Team-FilmAnalytics\extraccion_actores_parcial_6.csv",
    r"C:\Users\yaelp\Desktop\Adalab\Proyectos grupo\Proyecto_02\Repo-da.Promo-J.Modulo2.Team-FilmAnalytics\extraccion_actores_parcial_7.csv",
    r"C:\Users\yaelp\Desktop\Adalab\Proyectos grupo\Proyecto_02\Repo-da.Promo-J.Modulo2.Team-FilmAnalytics\extraccion_actores_parcial_8.csv",
    r"C:\Users\yaelp\Desktop\Adalab\Proyectos grupo\Proyecto_02\Repo-da.Promo-J.Modulo2.Team-FilmAnalytics\extraccion_actores_parcial_9.csv",
    r"C:\Users\yaelp\Desktop\Adalab\Proyectos grupo\Proyecto_02\Repo-da.Promo-J.Modulo2.Team-FilmAnalytics\extraccion_actores_parcial_10.csv",
    r"C:\Users\yaelp\Desktop\Adalab\Proyectos grupo\Proyecto_02\Repo-da.Promo-J.Modulo2.Team-FilmAnalytics\extraccion_actores_parcial_11.csv",
    r"C:\Users\yaelp\Desktop\Adalab\Proyectos grupo\Proyecto_02\Repo-da.Promo-J.Modulo2.Team-FilmAnalytics\extraccion_actores_parcial_12.csv",
    r"C:\Users\yaelp\Desktop\Adalab\Proyectos grupo\Proyecto_02\Repo-da.Promo-J.Modulo2.Team-FilmAnalytics\extraccion_actores_parcial_13.csv",
    r"C:\Users\yaelp\Desktop\Adalab\Proyectos grupo\Proyecto_02\Repo-da.Promo-J.Modulo2.Team-FilmAnalytics\extraccion_actores_parcial_14.csv"
]

# Leer y combinar todos los CSV en un solo DataFrame
df_list = [pd.read_csv(file) for file in csv_files]
df_combined = pd.concat(df_list, ignore_index=True)

# Verificar los datos combinados
print(df_combined.head())  # Muestra las primeras 5 filas del DataFrame combinado


             actor  anio_nacimiento                                       conocido_por                                           que_hace  premios
0     Tamás Ravasz              NaN                                                NaN                                            Reparto        0
1     János Derzsi           1954.0  Kontroll (2003), White God (2014) y El caballo...                                            Reparto        1
2      Andrea Nagy              NaN                                                NaN                                            Reparto        1
3   Lukács Bicskey           1961.0  La legión del águila (2011), Espías (2015) y R...                                            Reparto        0
4  István Znamenák           1966.0  Az állampolgár (2016), Taxidermia (2006) y Una...  Reparto, Dirección, Dirección de fotografía y ...        1


- Insertar datos dentro de la tabla 3 = **actores**

In [116]:
# Reemplazar los valores NaN con NULL o cadenas vacías
df_combined = df_combined.replace({np.nan: None})  # Aquí reemplazas los NaN por None, que MySQL interpreta como NULL
# Eliminar duplicados en el DataFrame
df_combined = df_combined.drop_duplicates()
# Convertir los datos del DataFrame en una lista de tuplas
datos_actores_tuplas = [tuple(row) for row in df_combined.itertuples(index=False, name=None)]

# Insertar datos dentro de la tabla 2 = peliculas_imdb
sql = "INSERT INTO actores (nombre, anio_nacimiento, conocido_por, que_hace, premios) VALUES (%s,%s,%s,%s,%s) ON DUPLICATE KEY UPDATE nombre = VALUES (nombre)"

try: 
    mycursor.executemany(sql, datos_actores_tuplas)
    cnx.commit()
    print(mycursor.rowcount, "registro/s insertado/s.")

except mysql.connector.Error as err:
    print(err)
    print("Error Code:", err.errno)
    print("SQLSTATE", err.sqlstate)
    print("Message", err.msg)

1254 registro/s insertado/s.


- Extracción Beautiful Soup **Premios Oscar**

In [102]:
# URL de la página de Wikipedia
url_oscar = "https://es.wikipedia.org/wiki/Premios_%C3%93scar"

# Realizar la solicitud HTTP a la página
res_url_oscar = requests.get(url_oscar)

# Verificar si la solicitud fue exitosa
if res_url_oscar.status_code == 200:
    # Parsear el contenido HTML con BeautifulSoup
    sopa_oscar = BeautifulSoup(res_url_oscar.content, "html.parser")

    # dict vacío en dónde se almacenarán los datos encontrados
    dict_datos_oscar = {"Ceremonia": [], "Mejor película": [], "Mejor director": [], "Mejor actor": [], "Mejor actriz": []}

    # Extraemos los datos de, únicamente la tabla dada.
    tabla_oscar = sopa_oscar.select_one("#mw-content-text .wikitable")
    # css selector COMPLETO: #mw-content-text > div.mw-content-ltr.mw-parser-output > table.wikitable
    # El selector se ha simplificado en caso de haber tablas anidadas. Y PORQUE CON EL COMPLETO NO NOS SALÍA ...... 
    
    # Crear una lista vacía para almacenar las tuplas
    lista_tuplas_oscar = []

    # Verificar que la tabla haya sido extraída correctamente
    if tabla_oscar:
        # Iterar sobre la tabla buscando las filas (Inspeccionando la web, vemos que las filas están en tr)
        filas = tabla_oscar.find_all('tr')
        
        # Iterando sobre las filas encontradas dentro de la tabla
        for fila in filas[1:]:  # La primera fila es el encabezdo que no necesitamos.
            
            celdas = fila.find_all('td') # Inspeccionando la web, vemos que en td, está el contenido de las celdas
            if len(celdas) >= 6: # Hay que revisar la cantidad de posiciones que tenemos
                
                # Extraer contenido de celdas por posición/ index 
                ceremonia = celdas[1].text.strip() #extraemos por index y sólo el texto y sin espacios extras
                mejor_pelicula = celdas[2].text.strip()
                mejor_director = celdas[3].text.strip()
                mejor_actor = celdas[4].text.strip()
                mejor_actriz = celdas[5].text.strip()
                
                #LIMPIEZA DATOS ---------------------------------------------------
                # Quitar la info extra que se encuentra entre paréntesis
                patron = r"\(.*?\)"
                mejor_pelicula_limpio = re.sub(patron, "", mejor_pelicula).strip()
                mejor_director_limpio = re.sub(patron, "", mejor_director).strip()
                mejor_actor_limpio = re.sub(patron, "", mejor_actor).strip()
                mejor_actriz_limpio = re.sub(patron, "", mejor_actriz).strip()

                # ------------------------------------------------------------------
                
                # Sacar el año de la celda seleccionada en el selector wikitable
                fecha_divida = ceremonia.split() # dividir el texto
                fecha_dividida_lista = list(fecha_divida) #convirtiendo a lista
                for i in fecha_dividida_lista: # iterando por los caracteres
                    numeros = i[-4::]     #trayendo unicamente los ultimos 4 caracter que corresponden al año
                anio = int(numeros)  # conviertiendo esos 4 ultimos caracteres a int para que sea un dato numérico


                # Extrar los datos de las películas desde el año 2000 en adelante
                if anio >= 2000:

                    # Añadir los datos al diccionario
                    dict_datos_oscar["Ceremonia"].append(anio) #es el entero sacado antes
                    dict_datos_oscar["Mejor película"].append(mejor_pelicula_limpio)
                    dict_datos_oscar["Mejor director"].append(mejor_director_limpio)
                    dict_datos_oscar["Mejor actor"].append(mejor_actor_limpio)
                    dict_datos_oscar["Mejor actriz"].append(mejor_actriz_limpio)

                    # Creamos una tupla con los datos extraídos de cada fila de la tabla y se añaden a la lista de tuplas ("lista_tuplas_oscar")
                    tupla = (anio, mejor_pelicula_limpio, mejor_director_limpio, mejor_actor_limpio, mejor_actriz_limpio)
                    lista_tuplas_oscar.append(tupla)


        # Convertir el diccionario en un DataFrame de pandas
        df_oscar = pd.DataFrame(dict_datos_oscar)
        # Mostrar el DataFrame
        print(df_oscar)

         # Iterar y printar cada tupla de la lista de tuplas ("lista_tuplas_oscar")
        print("_"*280)
        print("Lista de tuplas:")

        
        print(lista_tuplas_oscar)

    else:
        print("No se ha encontrado la tabla 'wikitable'")
else:
    print(f"Error al acceder a la página: {res_url_oscar.status_code}")





    Ceremonia                                 Mejor película        Mejor director     Mejor actor    Mejor actriz
0        2000                                American Beauty             S. Mendes       K. Spacey        H. Swank
1        2001                                      Gladiator         S. Soderbergh        R. Crowe      J. Roberts
2        2002                               A Beautiful Mind             R. Howard   D. Washington        H. Berry
3        2003                                        Chicago           R. Polanski        A. Brody       N. Kidman
4        2004  The Lord of the Rings: The Return of the King            P. Jackson         S. Penn       C. Theron
5        2005                            Million Dollar Baby           C. Eastwood         J. Foxx        H. Swank
6        2006                                          Crash                A. Lee   P. S. Hoffman  R. Witherspoon
7        2007                                   The Departed           M. Scorse

- Crear tabla y columnas tabla 4 (**premios_oscar**)

In [100]:
# Seleccionar la base de datos
try:
    mycursor.execute("USE BBDD_CinemExtract")
    print("Base de datos seleccionada correctamente.")
except mysql.connector.Error as err:
    print("Error al seleccionar la base de datos.")
    print("Código de Error:", err.errno)
    print("SQLSTATE:", err.sqlstate)
    print("Mensaje:", err.msg)
    
# Crear tabla 4 = premios_oscar, sus columnas y sus tipos de datos
try:
    mycursor.execute("""
    CREATE TABLE premios_oscar (
        ceremonia INT, 
        mejor_pelicula VARCHAR(100) PRIMARY KEY, 
        mejor_director VARCHAR(100), 
        mejor_actor VARCHAR(100), 
        mejor_actriz VARCHAR(100) 
    )
    """)
    print("Tabla 'premios_oscar' creada exitosamente.")
except mysql.connector.Error as err:
    print("Se produjo un error al crear la tabla.")
    print("Código de Error:", err.errno)
    print("SQLSTATE:", err.sqlstate)
    print("Mensaje:", err.msg)

Base de datos seleccionada correctamente.
Tabla 'premios_oscar' creada exitosamente.


- Insertar datos dentro de la tabla 1 = **premios_oscar**

In [103]:
# Insertar datos dentro de la tabla 4 = premios_oscar

sql = "INSERT INTO premios_oscar (ceremonia, mejor_pelicula, mejor_director, mejor_actor, mejor_actriz) VALUES (%s,%s,%s,%s,%s) "
val = lista_tuplas_oscar

try: 
    mycursor.executemany(sql, val)
    cnx.commit()
    print(mycursor.rowcount, "registro/s insertado/s.")

except mysql.connector.Error as err:
    print(err)
    print("Error Code:", err.errno)
    print("SQLSTATE", err.sqlstate)
    print("Message", err.msg)


25 registro/s insertado/s.


- **Cerrar** conexión con SQL

In [None]:
# Cerrar el cursor y la conexión a la base de datos
try:
    # Si el cursor está abierto, ciérralo
    if mycursor:
        mycursor.close()
    
    # Si la conexión está abierta, ciérrala
    if cnx:
        cnx.close()
    
    print("Conexión cerrada correctamente.")
except mysql.connector.Error as err:
    print("Error al cerrar la conexión:", err)