# Pruebas de los endpoints

## 1 endpoints
* def cantidad_filmaciones_mes( Mes ): Se ingresa un mes en idioma Español. Debe devolver la cantidad de películas que fueron estrenadas en el mes consultado en la totalidad del dataset.

Ejemplo de retorno: X cantidad de películas fueron estrenadas en el mes de X

In [4]:
import pandas as pd

movies = pd.read_parquet('../Datasets/movies_compressed.parquet')

# Asegurarse de que release_date esté en formato de fecha
movies['release_date'] = pd.to_datetime(movies['release_date'], errors='coerce')

# Crear la función
def cantidad_filmaciones_mes(mes):
    # Crear un diccionario para mapear nombres de meses en español con números
    meses = {
        'enero': 1, 'febrero': 2, 'marzo': 3, 'abril': 4,
        'mayo': 5, 'junio': 6, 'julio': 7, 'agosto': 8,
        'septiembre': 9, 'octubre': 10, 'noviembre': 11, 'diciembre': 12
    }
    
    # Convertir el mes ingresado a su correspondiente número
    mes_numero = meses.get(mes.lower())
    
    if not mes_numero:
        return "Mes ingresado no es válido."
    
    # Filtrar el dataframe por el mes
    cantidad = movies[movies['release_date'].dt.month == mes_numero].shape[0]
    
    return f"{cantidad} cantidad de películas fueron estrenadas en el mes de {mes.capitalize()}."

# Ejemplo
print(cantidad_filmaciones_mes('enero'))


11425 cantidad de películas fueron estrenadas en el mes de Enero.


## 2 endpoint

* def cantidad_filmaciones_dia( Dia ): Se ingresa un día en idioma Español. Debe devolver la cantidad de películas que fueron estrenadas en día consultado en la totalidad del dataset.

Ejemplo de retorno: X cantidad de películas fueron estrenadas en los días X

In [7]:
import pandas as pd

movies2 = pd.read_parquet('../Datasets/movies_compressed.parquet')

# Asegurarse de que release_date esté en formato de fecha
movies2['release_date'] = pd.to_datetime(movies2['release_date'], errors='coerce')

# Crear la función
def cantidad_filmaciones_dia(dia):
    # Crear un diccionario para mapear nombres de días en español con números
    dias_semana = {
        'lunes': 0, 'martes': 1, 'miércoles': 2, 'miercoles': 2, 'jueves': 3,
        'viernes': 4, 'sábado': 5, 'sabado': 5, 'domingo': 6
    }
    
    # Convertir el día ingresado a su correspondiente número
    dia_numero = dias_semana.get(dia.lower())
    
    if dia_numero is None:
        return "Día ingresado no es válido."
    
    # Filtrar el dataframe por el día de la semana
    cantidad = movies2[movies2['release_date'].dt.dayofweek == dia_numero].shape[0]
    
    return f"{cantidad} cantidad de películas fueron estrenadas en los días {dia.capitalize()}."

# Ejemplo
print(cantidad_filmaciones_dia('lunes'))


6844 cantidad de películas fueron estrenadas en los días Lunes.


## 3 endpoint

* def score_titulo( titulo_de_la_filmación ): Se ingresa el título de una filmación esperando como respuesta el título, el año de estreno y el score.

Ejemplo de retorno: La película X fue estrenada en el año X con un score/popularidad de X

In [9]:
import pandas as pd

movies3 = pd.read_parquet('../Datasets/movies_compressed.parquet')

# Asegurarse de que release_date esté en formato de fecha
movies3['release_date'] = pd.to_datetime(movies3['release_date'], errors='coerce')

# Asegurarse de que popularity esté en formato numérico
movies3['popularity'] = pd.to_numeric(movies3['popularity'], errors='coerce')

# Crear la función
def score_titulo(titulo_de_la_filmacion):
    # Filtrar el DataFrame por el título de la filmación
    pelicula = movies3[movies3['title'].str.lower() == titulo_de_la_filmacion.lower()]
    
    if pelicula.empty:
        return f"No se encontró ninguna película con el título '{titulo_de_la_filmacion}'."
    
    # Extraer la información relevante
    titulo = pelicula.iloc[0]['title']
    anio_estreno = pelicula.iloc[0]['release_date'].year
    score = round(pelicula.iloc[0]['popularity'], 2) # Suponiendo que 'popularity' es la columna de score
    
    return f"La película {titulo} fue estrenada en el año {anio_estreno} con un score/popularidad de {score}"

# Ejemplo
print(score_titulo('Toy Story'))


La película Toy Story fue estrenada en el año 1995 con un score/popularidad de 21.95


## 4 endpoint

* def votos_titulo( titulo_de_la_filmación ): Se ingresa el título de una filmación esperando como respuesta el título, la cantidad de votos y el valor promedio de las votaciones. La misma variable deberá de contar con al menos 2000 valoraciones, caso contrario, debemos contar con un mensaje avisando que no cumple esta condición y que por ende, no se devuelve ningun valor.

Ejemplo de retorno: La película X fue estrenada en el año X. La misma cuenta con un total de X valoraciones, con un promedio de X

In [18]:
import pandas as pd

movies4 = pd.read_parquet('../Datasets/movies.parquet')

# Asegurarse de que release_date esté en formato de fecha
movies4['release_date'] = pd.to_datetime(movies4['release_date'], errors='coerce')

# Crear la función
def votos_titulo(titulo_de_la_filmacion):
    # Filtrar el DataFrame por el título de la filmación
    pelicula = movies4[movies4['title'].str.lower() == titulo_de_la_filmacion.lower()]
    
    if pelicula.empty:
        return f"No se encontró ninguna película con el título '{titulo_de_la_filmacion}'."
    
    # Extraer la cantidad de votos y el promedio de las votaciones
    votos = pelicula.iloc[0]['vote_count']
    promedio_votos = pelicula.iloc[0]['vote_average']
    
    if votos < 2000:
        return f"La película {pelicula.iloc[0]['title']} no cumple con el mínimo de 2000 valoraciones. Tiene {votos} valoraciones."

    # Extraer el título y el año de estreno
    titulo = pelicula.iloc[0]['title']
    anio_estreno = pelicula.iloc[0]['release_date'].year
    
    return f"La película {titulo} fue estrenada en el año {anio_estreno}. Con un total de {votos} valoraciones, con un promedio de {promedio_votos}"

# Ejemplo
print(votos_titulo('toy story'))


La película Toy Story fue estrenada en el año 1995. Con un total de 5415.0 valoraciones, con un promedio de 7.7


## 5 endpoint

* def get_actor( nombre_actor ): Se ingresa el nombre de un actor que se encuentre dentro de un dataset debiendo devolver el éxito del mismo medido a través del retorno. Además, la cantidad de películas que en las que ha participado y el promedio de retorno. La definición no deberá considerar directores.

Ejemplo de retorno: El actor X ha participado de X cantidad de filmaciones, el mismo ha conseguido un retorno de X con un promedio de X por filmación

In [26]:
import pandas as pd

# Leer el archivo parquet
movies5 = pd.read_parquet('../Datasets/endpoint_casting.parquet')

# Asegurarse de que release_date esté en formato de fecha
movies5['release_date'] = pd.to_datetime(movies5['release_date'], errors='coerce')

# Asegurarse de que 'name' no tenga valores nulos
if movies5['name'].isnull().any():
    movies5['name'] = movies5['name'].fillna('')  # Rellenar valores nulos con cadena vacía

# Crear la función
def get_actor(nombre_actor):
    # Filtrar el DataFrame por el nombre del actor en la columna 'name'
    peliculas_actor = movies5[movies5['name'].apply(lambda x: nombre_actor.lower() in x.lower())]
    
    if peliculas_actor.empty:
        return f"No se encontró ninguna película con el actor '{nombre_actor}'."
    
    # Eliminar duplicados basados en el 'id' de la película
    peliculas_actor_unicas = peliculas_actor.drop_duplicates(subset='id')
    
    # Calcular el éxito del actor medido a través del retorno
    total_retorno = peliculas_actor_unicas['return'].sum()
    cantidad_peliculas = peliculas_actor_unicas.shape[0]
    promedio_retorno = total_retorno / cantidad_peliculas if cantidad_peliculas > 0 else 0
    
    return (f"El actor {nombre_actor} ha participado en {cantidad_peliculas} filmaciones, "
            f"el mismo ha conseguido un retorno de {total_retorno:.2f} con un promedio de {promedio_retorno:.2f} por filmación.")

# Ejemplo de uso
print(get_actor('Robin Williams'))


El actor Robin Williams ha participado en 82 filmaciones, el mismo ha conseguido un retorno de 155.69 con un promedio de 1.90 por filmación.


## 6 endpoint

* def get_director( nombre_director ): Se ingresa el nombre de un director que se encuentre dentro de un dataset debiendo devolver el éxito del mismo medido a través del retorno. Además, deberá devolver el nombre de cada película con la fecha de lanzamiento, retorno individual, costo y ganancia de la misma.

In [28]:
import pandas as pd

# Leer el archivo parquet
movies6 = pd.read_parquet('../Datasets/endpoint_crew.parquet')

# Asegurarse de que release_date esté en formato de fecha
movies6['release_date'] = pd.to_datetime(movies6['release_date'], errors='coerce')

# Crear la función
def get_director(nombre_director):
    # Filtrar el DataFrame por el nombre del director en la columna 'name'
    peliculas_director = movies6[movies6['name'].str.lower() == nombre_director.lower()]
    
    if peliculas_director.empty:
        return f"No se encontró ninguna película dirigida por '{nombre_director}'."
    
    # Eliminar duplicados en función del título de la película
    peliculas_director = peliculas_director.drop_duplicates(subset='title')
    
    # Inicializar el total de retorno
    total_retorno = 0
    
    # Crear una lista para almacenar los detalles de las películas
    detalles_peliculas = []
    
    for _, pelicula in peliculas_director.iterrows():
        # Obtener detalles de la película
        titulo = pelicula['title']
        fecha_lanzamiento = pelicula['release_date'].date() if pd.notnull(pelicula['release_date']) else 'Fecha desconocida'
        presupuesto = pelicula['budget'] if pd.notnull(pelicula['budget']) else 'Desconocido'
        ganancia = pelicula['revenue'] if pd.notnull(pelicula['revenue']) else 'Desconocido'
        retorno = pelicula['return'] if pd.notnull(pelicula['return']) else 0
        
        # Sumar el retorno al total
        total_retorno += retorno
        
        # Agregar detalles a la lista
        detalles_peliculas.append({
            'titulo': titulo,
            'fecha_lanzamiento': fecha_lanzamiento,
            'retorno': retorno,
            'presupuesto': presupuesto,
            'ganancia': ganancia
        })
    
    # Crear el diccionario de respuesta
    resultado = {
        'director': nombre_director,
        'total_return': total_retorno,
        'movies': detalles_peliculas
    }
    
    return resultado

# Ejemplo de uso
print(get_director('John Lasseter'))


{'director': 'John Lasseter', 'total_return': 145.9549392653437, 'movies': [{'titulo': 'Toy Story', 'fecha_lanzamiento': datetime.date(1995, 10, 30), 'retorno': 12.4518011, 'presupuesto': 30000000.0, 'ganancia': 373554033.0}, {'titulo': 'Beauty and the Beast', 'fecha_lanzamiento': datetime.date(1991, 11, 13), 'retorno': 15.09402212, 'presupuesto': 25000000.0, 'ganancia': 377350553.0}, {'titulo': "A Bug's Life", 'fecha_lanzamiento': datetime.date(1998, 11, 25), 'retorno': 3.027157158333333, 'presupuesto': 120000000.0, 'ganancia': 363258859.0}, {'titulo': 'Toy Story 2', 'fecha_lanzamiento': datetime.date(1999, 10, 30), 'retorno': 5.526298544444445, 'presupuesto': 90000000.0, 'ganancia': 497366869.0}, {'titulo': 'Monsters, Inc.', 'fecha_lanzamiento': datetime.date(2001, 11, 1), 'retorno': 4.8940544, 'presupuesto': 115000000.0, 'ganancia': 562816256.0}, {'titulo': 'Finding Nemo', 'fecha_lanzamiento': datetime.date(2003, 5, 30), 'retorno': 10.003569531914891, 'presupuesto': 94000000.0, 'gan