# Proyecto de Sistema de Recomendación para Plataforma de Streaming


Proyecto individual Soy Henry PT09
Julio 2024


### **Introducción:**
Este código representa un sistema de análisis de datos cinematográficos. Está diseñado para procesar y analizar un conjunto de datos sobre películas, proporcionando diversas funcionalidades para extraer información específica sobre estrenos de películas, valoraciones, actores y directores.

### **Objetivos:**

- Proporcionar estadísticas sobre la cantidad de películas estrenadas en meses y días específicos.
- Ofrecer información detallada sobre películas individuales, incluyendo puntuaciones y votos.
- Analizar la filmografía y el rendimiento de actores específicos.
- Proporcionar información detallada sobre la carrera de directores de cine.
- Crear una interfaz de usuario amigable para acceder a esta información.

### **Proceso:**

**Preparación de datos:** 
Normalización de columnas relevantes para facilitar búsquedas y comparaciones.
Implementación de funciones específicas:

cantidad_filmaciones_mes: Cuenta las películas estrenadas en un mes dado.
cantidad_filmaciones_dia: Cuenta las películas estrenadas en un día de la semana específico.
score_titulo: Proporciona información sobre la popularidad de una película específica.
votos_titulo: Ofrece datos sobre los votos recibidos por una película.
get_actor: Analiza la filmografía y el rendimiento de un actor.
get_director: Proporciona información detallada sobre las películas dirigidas por un director específico.


Desarrollo de una interfaz de usuario simple basada en entrada por consola para cada función.

## **Conclusiones:**

- El sistema permite un análisis detallado y multifacético de la base de datos de películas.
- La normalización de datos facilita búsquedas precisas independientemente de la variación en la entrada del usuario (mayúsculas, minúsculas, acentos).
- Las funciones proporcionan información valiosa sobre tendencias de estrenos, popularidad de películas, y carreras de actores y directores.
- La interfaz de usuario, aunque básica, permite un acceso fácil a las diversas funcionalidades del sistema.
- El código está estructurado de manera modular, lo que facilita su mantenimiento y posibles expansiones futuras.

### **2. DESARROLLO DE LA API**

In [273]:
pip install fastapi uvicorn pyarrow



[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.0[0m[39;49m -> [0m[32;49m24.1.2[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip3 install --upgrade pip[0m
Note: you may need to restart the kernel to use updated packages.


In [1]:
import pandas as pd

# Cargar el DataFrame desde el archivo Parquet
data = pd.read_parquet('data.parquet')


In [398]:
data

Unnamed: 0,budget,id,original_language,overview,popularity,release_date,revenue,runtime,status,tagline,...,cast_ids,cast_genders,cast_orders,cast_credit_ids,return,release_year,release_month,month_name_es,Crew_job,Crew_name
0,30000000.0,862,en,"Led by Woody, Andy's toys live happily in his ...",21.946943,1995-10-30,373554033.0,81.0,Released,,...,"[31, 12898, 7167, 12899, 12900, 7907, 8873, 11...","[2, 2, 2, 2, 2, 2, 1, 0, 2, 1, 2, 1, 2]","[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]","[52fe4284c3a36847f8024f95, 52fe4284c3a36847f80...",12.451801,1995.0,10.0,Octubre,Director,John Lasseter
1,65000000.0,8844,en,When siblings Judy and Peter discover an encha...,17.015539,1995-12-15,262797249.0,104.0,Released,Roll the dice and unleash the excitement!,...,"[2157, 8537, 205, 145151, 5149, 10739, 58563, ...","[2, 2, 1, 0, 1, 1, 2, 1, 0, 1, 2, 1, 2, 0, 0, ...","[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,...","[52fe44bfc3a36847f80a7c73, 52fe44bfc3a36847f80...",4.043035,1995.0,12.0,Diciembre,Screenplay,Joss Whedon
2,0.0,15602,en,A family wedding reignites the ancient feud be...,11.712900,1995-12-22,0.0,101.0,Released,Still Yelling. Still Fighting. Still Ready for...,...,"[6837, 3151, 13567, 16757, 589, 16523, 7166]","[2, 2, 1, 1, 1, 2, 2]","[0, 1, 2, 3, 4, 5, 6]","[52fe466a9251416c75077a8d, 52fe466a9251416c750...",0.000000,1995.0,12.0,Diciembre,Screenplay,Andrew Stanton
3,16000000.0,31357,en,"Cheated on, mistreated and stepped on, the wom...",3.859495,1995-12-22,81452156.0,127.0,Released,Friends are the people who let you be yourself...,...,"[8851, 9780, 18284, 51359, 66804, 352, 87118, ...","[1, 1, 1, 1, 2, 2, 2, 2, 2, 2]","[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]","[52fe44779251416c91011aad, 52fe44779251416c910...",5.090760,1995.0,12.0,Diciembre,Screenplay,Joel Cohen
4,0.0,11862,en,Just when George Banks has recovered from his ...,8.387519,1995-02-10,76578911.0,106.0,Released,Just When His World Is Back To Normal... He's ...,...,"[67773, 3092, 519, 70696, 59222, 18793, 14592,...","[2, 1, 2, 1, 2, 0, 2, 2, 1, 1, 2, 1]","[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]","[52fe44959251416c75039eb9, 52fe44959251416c750...",0.000000,1995.0,2.0,Febrero,Screenplay,Alec Sokolow
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
46660,0.0,30840,en,"Yet another version of the classic epic, with ...",5.683753,1991-05-13,0.0,104.0,Released,,...,"[29459, 139, 18616, 920, 1924]","[2, 1, 2, 2, 0]","[0, 1, 2, 3, 4]","[52fe44439251416c9100a887, 52fe44439251416c910...",0.000000,1991.0,5.0,Mayo,Screenplay,Thomas Hedley Jr.
46661,0.0,111109,tl,An artist struggles to finish his work while a...,0.178241,2011-11-17,0.0,360.0,Released,,...,"[1043186, 111636, 1204271, 278923, 1042953, 57...","[1, 0, 0, 2, 0, 0, 0, 0, 0, 0, 0]","[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]","[52fe4af1c3a36847f81e9b1f, 559eb4ecc3a368081d0...",0.000000,2011.0,11.0,Noviembre,Producer,Don Simpson
46662,0.0,67758,en,"When one of her hits goes wrong, a professiona...",0.903007,2003-08-01,0.0,90.0,Released,A deadly game of wits.,...,"[23764, 2059, 46277, 1736, 58646, 54649, 55270...","[1, 2, 1, 2, 2, 2, 2, 2, 2, 0, 2, 2, 2, 2, 0]","[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,...","[52fe4776c3a368484e0c83a3, 52fe4776c3a368484e0...",0.000000,2003.0,8.0,Agosto,Producer,Jerry Bruckheimer
46663,0.0,227506,en,"In a small town live two brothers, one a minis...",0.003503,1917-10-21,0.0,87.0,Released,,...,"[544742, 1090923, 1136422, 1261758, 29199]","[2, 1, 2, 0, 1]","[0, 1, 2, 3, 4]","[52fe4ea59251416c7515d7d5, 52fe4ea59251416c751...",0.000000,1917.0,10.0,Octubre,Original Music Composer,Giorgio Moroder


In [399]:
print(data.columns)


Index(['budget', 'id', 'original_language', 'overview', 'popularity',
       'release_date', 'revenue', 'runtime', 'status', 'tagline', 'title',
       'vote_average', 'vote_count', 'belongs_to_collection_id',
       'belongs_to_collection_name', 'genres_ids', 'genres_names',
       'company_names', 'company_ids', 'country_names', 'country_codes',
       'language_names', 'language_codes', 'cast_names', 'cast_characters',
       'cast_ids', 'cast_genders', 'cast_orders', 'cast_credit_ids', 'return',
       'release_year', 'release_month', 'month_name_es', 'Crew_job',
       'Crew_name'],
      dtype='object')


### PRUEBA DE CADA CODIGO DE LA APP

**a. cantidad_filmaciones_mes**

Esta función y el código asociado están diseñados para contar cuántas películas se estrenaron en un mes específico, proporcionado por el usuario en español. Aquí está la descripción detallada:

    - Función cantidad_filmaciones_mes(mes: str):
    - Propósito: Calcular la cantidad de películas estrenadas en un mes dado.
    - Entrada: Un string mes que representa el mes en español.

**Proceso:**

    - Convierte el nombre del mes a formato título (capitalize()) para asegurar la coincidencia con el formato de la columna month_name_es.
    - Filtra el DataFrame data para obtener solo las filas donde la columna month_name_es coincide con el mes proporcionado.
    - Cuenta el número de filas resultantes, que representan la cantidad de películas estrenadas en ese mes.
**Salida:** 
Un string que indica cuántas películas fueron estrenadas en el mes especificado.

**Código de interacción con el usuario:**
Muestra mensajes informativos para guiar al usuario sobre cómo ingresar el mes.
Pide al usuario que ingrese el mes en español, sin tildes ni caracteres especiales, y acepta mayúsculas o minúsculas.
Llama a la función cantidad_filmaciones_mes con el mes ingresado y muestra el resultado.

In [277]:

#CANTIDAD DE FILMACIONES AL MES 


def cantidad_filmaciones_mes(mes: str):
    # Convertir el mes a título para asegurar la coincidencia con la columna
    mes_normalizado = mes.capitalize()
    
    # Filtrar por el mes proporcionado
    peliculas_mes = data[data['month_name_es'] == mes_normalizado]
    cantidad = peliculas_mes.shape[0]
    
    return f"{cantidad} cantidad de películas fueron estrenadas en el mes de {mes_normalizado}"

# Mensaje informativo para el usuario
print("Por favor ingrese el mes en que quiere saber cuántas películas se filmaron.")
print("El sistema recibe el mes en español, sin tildes ni caracteres especiales.")
print("El sistema acepta mayúsculas o minúsculas.")

# Obtener la entrada del usuario
mes_entrada = input("Ingresa el mes: ")
print(cantidad_filmaciones_mes(mes_entrada))

Por favor ingrese el mes en que quiere saber cuántas películas se filmaron.
El sistema recibe el mes en español, sin tildes ni caracteres especiales.
El sistema acepta mayúsculas o minúsculas.
6032 cantidad de películas fueron estrenadas en el mes de Enero


**b. cantidad_filmaciones_dia**

**Importación de bibliotecas:** 

Se importan las bibliotecas necesarias, unidecode y pandas.

**Conversión de fechas:**

La columna release_date se convierte a tipo datetime.

**Extracción y traducción del día de la semana:**

Se extrae el nombre del día de la semana en inglés de la columna release_date.
Se mapea el nombre del día de la semana en inglés a español usando un diccionario de traducción.
Se normalizan los nombres de los días en español eliminando acentos y convirtiéndolos a minúsculas.

**Definición de la función cantidad_filmaciones_dia:**

Normaliza la entrada del usuario (día de la semana) eliminando acentos y convirtiendo a minúsculas.
Filtra el DataFrame data para obtener las filas correspondientes al día especificado.
Cuenta el número de películas estrenadas en el día dado.
Devuelve un mensaje indicando la cantidad de películas estrenadas o que no se encontraron películas si la cantidad es cero.

**Interacción con el usuario:**

Muestra mensajes informativos para guiar al usuario sobre cómo ingresar el día de la semana.
Solicita al usuario que ingrese el día de la semana en español, sin importar si usa mayúsculas, minúsculas o tildes.
Llama a la función cantidad_filmaciones_dia con el día ingresado y muestra el resultado.

#Se instala la libreria por que me ayudara con las posibles opciones de ingreso que pongan los usuarios 
%pip install unidecode


In [278]:
#cantidad de filmaciones por dia

from unidecode import unidecode

# Convertir 'release_date' a tipo datetime
data['release_date'] = pd.to_datetime(data['release_date'], errors='coerce')

# Extraer el día de la semana en inglés
data['day_of_week'] = data['release_date'].dt.day_name()

# Mapeo de días de la semana en inglés a español
day_translation = {
    'Monday': 'lunes',
    'Tuesday': 'martes',
    'Wednesday': 'miércoles',
    'Thursday': 'jueves',
    'Friday': 'viernes',
    'Saturday': 'sábado',
    'Sunday': 'domingo'
}

# Aplicar la traducción y normalizar (eliminar acentos y convertir a minúsculas)
data['day_of_week_es'] = data['day_of_week'].map(day_translation).apply(lambda x: unidecode(x.lower()))

# Mostrar los datos para verificar
#print(data[['release_date', 'day_of_week', 'day_of_week_es']])

# Definir la función para consultar la cantidad de filmaciones por día
def cantidad_filmaciones_dia(dia: str):
    # Normalizar la entrada del usuario
    dia_normalizado = unidecode(dia).lower()  # Convertir a minúsculas y eliminar acentos
    #print(f"Dia ingresado normalizado: {dia_normalizado}")  # Verificar normalización
    
    # Filtrar por el día proporcionado
    peliculas_dia = data[data['day_of_week_es'] == dia_normalizado]
    cantidad = peliculas_dia.shape[0]
    
    if cantidad == 0:
        return f"No se encontraron películas estrenadas en los días {dia}"
    
    return f"{cantidad} cantidad de películas fueron estrenadas en los días {dia}"

# Mensaje informativo para el usuario
print("Por favor ingrese el dia de la semana escrito (lunes) en que quiere saber cuántas películas se filmaron.")
print("El sistema acepta mayúsculas o minúsculas, con o sin tildes.")

# Obtener la entrada del usuario
dia_entrada = input("Ingresa el dia: ")
print(cantidad_filmaciones_dia(dia_entrada))

Por favor ingrese el dia de la semana escrito (lunes) en que quiere saber cuántas películas se filmaron.
El sistema acepta mayúsculas o minúsculas, con o sin tildes.
4700 cantidad de películas fueron estrenadas en los días martes


**c. def score_titulo**


**Importación de bibliotecas:** 

Se importan las bibliotecas necesarias, unidecode y pandas.

**Normalización de la columna title:**

La columna title se normaliza eliminando acentos y convirtiendo los títulos a minúsculas.

**Definición de la función score_titulo:**

Normaliza la entrada del usuario (título de la película) eliminando acentos y convirtiendo a minúsculas.
Busca la película en el DataFrame data usando el título normalizado.
Si no se encuentra la película, devuelve un mensaje indicando que no se encontró.
Si se encuentra, extrae y devuelve el título, el año de estreno y el score (popularidad) de la película.

**Interacción con el usuario:**

Muestra mensajes informativos para guiar al usuario sobre cómo ingresar el título de la película.
Solicita al usuario que ingrese el título de la película en español, sin importar si usa mayúsculas, minúsculas o tildes.
Llama a la función score_titulo con el título ingresado y muestra el resultado.

In [279]:
#SCORE TITULO
# Normalizar la columna 'title'
data['title_normalized'] = data['title'].apply(lambda x: unidecode(x.lower()))

# Definir la función para consultar el score de una película por título
def score_titulo(titulo_de_la_filmacion: str):
    # Normalizar la entrada del usuario
    titulo_normalizado = unidecode(titulo_de_la_filmacion.lower())  # Convertir a minúsculas y eliminar acentos
    
    # Buscar la película en el DataFrame
    pelicula = data[data['title_normalized'] == titulo_normalizado]
    
    if pelicula.empty:
        return f"No se encontró la película con el título '{titulo_de_la_filmacion}'"
    
    # Extraer información
    titulo = pelicula['title'].values[0]
    ano_estreno = int(pelicula['release_year'].values[0])
    score = pelicula['popularity'].values[0]
    
    return f"La película '{titulo}' fue estrenada en el año {ano_estreno} con un score/popularidad de {score}"

# Mensaje informativo para el usuario
print("Por favor ingrese el título de la película de la que quiere saber el score.")
print("El sistema acepta el título con o sin tildes y en mayúsculas o minúsculas.")

# Obtener la entrada del usuario
titulo_entrada = input("Ingresa el título de la película: ")
print(score_titulo(titulo_entrada))


Por favor ingrese el título de la película de la que quiere saber el score.
El sistema acepta el título con o sin tildes y en mayúsculas o minúsculas.
La película 'Titanic' fue estrenada en el año 1997 con un score/popularidad de 26.88907


**d. def votos_titulo** 


**Importación de bibliotecas:** 

Se importan las bibliotecas necesarias, unidecode y pandas.

**Normalización de la columna title:**

La columna title se normaliza eliminando acentos y convirtiendo los títulos a minúsculas.

**Definición de la función votos_titulo:**

Normaliza la entrada del usuario (título de la película) eliminando acentos y convirtiendo a minúsculas.
Busca la película en el DataFrame data usando el título normalizado.
Si no se encuentra la película, devuelve un mensaje indicando que no se encontró.
Si se encuentra, extrae y devuelve el título, el año de estreno, el total de votos y el promedio de votos de la película.
Si la película tiene menos de 2000 votos, devuelve un mensaje indicando que no cumple con el requisito de votos.

**Interacción con el usuario:**

Muestra mensajes informativos para guiar al usuario sobre cómo ingresar el título de la película.
Solicita al usuario que ingrese el título de la película en español, sin importar si usa mayúsculas, minúsculas o tildes.
Llama a la función votos_titulo con el título ingresado y muestra el resultado.

In [280]:
# DEFINIR VOTOS TITULO
# Normalizar la columna 'title'
data['title_normalized'] = data['title'].apply(lambda x: unidecode(x.lower()))

# Definir la función para consultar los votos de una película por título
def votos_titulo(titulo_de_la_filmacion: str):
    # Normalizar la entrada del usuario
    titulo_normalizado = unidecode(titulo_de_la_filmacion.lower())  # Convertir a minúsculas y eliminar acentos
    
    # Buscar la película en el DataFrame
    pelicula = data[data['title_normalized'] == titulo_normalizado]
    
    if pelicula.empty:
        return f"No se encontró la película con el título '{titulo_de_la_filmacion}'"
    
    # Extraer información
    titulo = pelicula['title'].values[0]
    ano_estreno = int(pelicula['release_year'].values[0])  # Convertir el año a entero
    total_votos = int(pelicula['vote_count'].values[0])  # Convertir el total de votos a entero
    promedio_votos = pelicula['vote_average'].values[0]
    
    if total_votos < 2000:
        return f"La película '{titulo}' no cumple con el requisito de al menos 2000 valoraciones."
    
    return f"La película '{titulo}' fue estrenada en el año {ano_estreno}. La misma cuenta con un total de {total_votos} valoraciones, con un promedio de {promedio_votos}."

# Mensaje informativo para el usuario
print("Por favor ingrese el título de la película de la que quiere saber el total y promedio de votos.")
print("El sistema acepta el título con o sin tildes y en mayúsculas o minúsculas.")

# Obtener la entrada del usuario
titulo_entrada = input("Ingresa el título de la película: ")
print(votos_titulo(titulo_entrada))

Por favor ingrese el título de la película de la que quiere saber el total y promedio de votos.
El sistema acepta el título con o sin tildes y en mayúsculas o minúsculas.
La película 'Titanic' fue estrenada en el año 1997. La misma cuenta con un total de 7770 valoraciones, con un promedio de 7.5.


**e. def get_actor** 

**Importación de bibliotecas:** 

Se importan las bibliotecas necesarias, numpy, pandas, unidecode y re.

**Normalización de la columna cast_names:**

La función normalize_cast_names normaliza los nombres de los actores eliminando acentos y convirtiéndolos a minúsculas.
La normalización se aplica a la columna cast_names.

**Definición de la función get_actor:**

Normaliza la entrada del usuario (nombre del actor) eliminando acentos y convirtiendo a minúsculas.
Filtra las filas del DataFrame data donde el actor está en la lista de actores normalizados.
Si no se encuentra el actor, devuelve un mensaje indicando que no se encontró información.
Si se encuentra, calcula y devuelve la cantidad de películas, el retorno total y el promedio de retorno del actor.

**Interacción con el usuario:**

Muestra mensajes informativos para guiar al usuario sobre cómo ingresar el nombre del actor.
Solicita al usuario que ingrese el nombre del actor, sin importar si usa mayúsculas, minúsculas o tildes.
Llama a la función get_actor con el nombre ingresado y muestra el resultado.


In [281]:
import re #se utilizo re para normlaizar unos datos en la busqueda del actor

In [282]:
#DEF GET ACTOR
def normalize_cast_names(cast_data):
    if isinstance(cast_data, np.ndarray):
        # Si es un array de NumPy, convertirlo a una lista de strings
        names = [str(name).strip() for name in cast_data]
    elif isinstance(cast_data, str):
        # Si es una cadena, primero intentar dividir por comas
        if ',' in cast_data:
            # Eliminar corchetes y dividir por comas
            names = cast_data.strip('[]').split(',')
            # Eliminar espacios y comillas
            names = [name.strip().strip("'\"") for name in names]
        else:
            # Si no hay comas, usar el método anterior
            names = re.findall(r"'([^']*)'", cast_data)
    else:
        # Si no es ni array ni string, devolver una lista vacía
        return []
    
    return [unidecode(name.lower()) for name in names if name]

# Aplicar la normalización a la columna 'cast_names'
data['cast_names_normalized'] = data['cast_names'].apply(normalize_cast_names)

def get_actor(nombre_actor: str):
    # Normalizar el nombre del actor ingresado
    nombre_actor_normalized = unidecode(nombre_actor.lower())
    
    # Filtrar las filas donde el actor esté en la lista de actores normalizados
    peliculas_actor = data[data['cast_names_normalized'].apply(lambda actors: nombre_actor_normalized in actors)]
    
    if peliculas_actor.empty:
        return f"No se encontró información para el actor '{nombre_actor}'"
    
    # Calcular la cantidad de películas, retorno total y promedio de retorno
    cantidad_peliculas = peliculas_actor.shape[0]
    retorno_total = peliculas_actor['return'].sum()
    promedio_retorno = retorno_total / cantidad_peliculas
    
    return f"El actor {nombre_actor} ha participado de {cantidad_peliculas} cantidad de filmaciones, el mismo ha conseguido un retorno de {retorno_total:.2f} con un promedio de {promedio_retorno:.2f} por filmación."

# Mensaje informativo para el usuario
print("Por favor ingrese el nombre del actor del que quiere saber información.")
print("El sistema acepta el nombre con o sin tildes y en mayúsculas o minúsculas.")

# Obtener la entrada del usuario
nombre_actor_entrada = input("Ingresa el nombre del actor: ")
print(get_actor(nombre_actor_entrada))

Por favor ingrese el nombre del actor del que quiere saber información.
El sistema acepta el nombre con o sin tildes y en mayúsculas o minúsculas.
El actor tom hanks ha participado de 71 cantidad de filmaciones, el mismo ha conseguido un retorno de 178.85 con un promedio de 2.52 por filmación.


**f.def get_director**

**Importación de bibliotecas:** 

Se importan las bibliotecas necesarias, pandas y unidecode.

**Normalización de las columnas Crew_name y Crew_job:**

La función unidecode se utiliza para normalizar los nombres y los trabajos eliminando acentos y convirtiéndolos a minúsculas.

**Definición de la función get_director:**

Normaliza la entrada del usuario (nombre del director) eliminando acentos y convirtiendo a minúsculas.
Filtra los registros donde el nombre coincide y es director.
Si no se encuentra el director, busca por el nombre y devuelve la información correspondiente (si no es director, especifica su trabajo).
Si se encuentra, extrae y devuelve la información requerida para cada película dirigida: título, fecha de lanzamiento, retorno individual, costo y ganancia.

**Interacción con el usuario:**

Muestra mensajes informativos para guiar al usuario sobre cómo ingresar el nombre del director.
Solicita al usuario que ingrese el nombre del director, sin importar si usa mayúsculas, minúsculas o tildes.
Llama a la función get_director con el nombre ingresado y muestra el resultado.


In [283]:
#DEF GET DIRECTOR 

# Normalizar las columnas relevantes para facilitar la búsqueda
data['Crew_name_normalized'] = data['Crew_name'].apply(lambda x: unidecode(x.lower()) if isinstance(x, str) else '')
data['Crew_job'] = data['Crew_job'].apply(lambda x: unidecode(x.lower()) if isinstance(x, str) else '')

def get_director(nombre_director: str):
    # Normalizar el nombre del director ingresado
    nombre_director_normalized = unidecode(nombre_director.lower())
    
    # Filtrar los registros donde el nombre coincida y es director
    director_records = data[(data['Crew_name_normalized'] == nombre_director_normalized) & (data['Crew_job'].str.contains('director', case=False))]
    
    if director_records.empty:
        # Si no es director, buscar por el nombre y devolver la información correspondiente
        not_director_records = data[(data['Crew_name_normalized'] == nombre_director_normalized)]
        if not_director_records.empty:
            crew_job = not_director_records['Crew_job'].values[0] if not_director_records['Crew_job'].notna().any() else 'desconocido'
            return f"No es director, el {nombre_director} es {crew_job}."
        else:
            return f"No se encontró información para {nombre_director}"
    
    # Extraer la información requerida para cada película del director
    peliculas_director = director_records[['title', 'release_date', 'revenue', 'budget']]
    peliculas_director['ganancia'] = peliculas_director['revenue'] - peliculas_director['budget']
    
    # Convertir la columna de fecha a formato string
    peliculas_director['release_date'] = peliculas_director['release_date'].dt.strftime('%Y-%m-%d')
    
    # Formatear el retorno
    peliculas_info = []
    for _, row in peliculas_director.iterrows():
        info = (f"Película: {row['title']}, Fecha de lanzamiento: {row['release_date']}, "
                f"Retorno individual: {row['revenue']:.0f}, Costo: {row['budget']:.0f}, "
                f"Ganancia: {row['ganancia']:.0f}")
        peliculas_info.append(info)
    
    peliculas_list = "\n".join(peliculas_info)
    return f"Director: {nombre_director}\n\n{peliculas_list}"

# Mensaje informativo para el usuario
print("Por favor ingrese el nombre del director del que quiere saber información.")
print("El sistema acepta el nombre con o sin tildes y en mayúsculas o minúsculas.")

# Obtener la entrada del usuario
nombre_director_entrada = input("Ingresa el nombre del director: ")
print(get_director(nombre_director_entrada))

Por favor ingrese el nombre del director del que quiere saber información.
El sistema acepta el nombre con o sin tildes y en mayúsculas o minúsculas.
Director: guillermo del toro

Película: Blood: The Last Vampire, Fecha de lanzamiento: 2000-11-18, Retorno individual: 0, Costo: 0, Ganancia: 0
Película: Concrete Blondes, Fecha de lanzamiento: 2013-05-02, Retorno individual: 0, Costo: 3100000, Ganancia: -3100000


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  peliculas_director['ganancia'] = peliculas_director['revenue'] - peliculas_director['budget']
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  peliculas_director['release_date'] = peliculas_director['release_date'].dt.strftime('%Y-%m-%d')
