**FUNCIONES API**

*En esta Notebook se realizan las funciones solicitadas que luego se disponibilizaran en la API*
*Se usa el dataset df_etl, que es el resultante de la limpieza de datos y de las transformaciones previas solicitadas. Tambien se han agregado al dataset algunas columnas que resultaran utiles para resolver las funciones*

In [66]:
import pandas as pd
import os
import ast


In [4]:
ruta_archivo = os.path.join('Dataset', 'df_etl.csv')    #Lo descargamos con ruta relativa a la carpeta actual
df = pd.read_csv(ruta_archivo)

**1**
*Consigna*

def cantidad_filmaciones_mes( Mes ): Se ingresa un mes en idioma Español. Debe devolver la cantidad de películas que fueron estrenadas en el mes consultado en la totalidad del dataset.
                    Ejemplo de retorno: X cantidad de películas fueron estrenadas en el mes de X

In [23]:
def cantidad_filmaciones_mes(mes):
    global df  # Declarar el DataFrame como una variable global
    
    meses = ['enero', 'febrero', 'marzo', 'abril', 'mayo', 'junio', 'julio', 'agosto', 'septiembre', 'octubre', 'noviembre', 'diciembre']

    if mes.lower() in meses:
        mask = df.release_month == mes.lower().capitalize()
        cantidad_peliculas = df.release_month[mask].count()

     # Crear el diccionario de resultados
        resultado = {
        'Mes de estreno': mes.capitalize(),
        'Cantidad de películas estrenadas': cantidad_peliculas
        }

        return resultado
    else:
        resultado = {
        'ERROR': 'MES INCORRECTO',
        
        }
        return resultado


In [40]:
# ejemplo de prueba
cantidad_filmaciones_mes('Octubre')


{'Mes de estreno': 'Octubre', 'Cantidad de películas estrenadas': 4389}

**2**

*def cantidad_filmaciones_dia( Dia ): Se ingresa un día en idioma Español. Debe devolver la cantidad de películas que fueron estrenadas en día consultado en la totalidad del dataset*

In [35]:
def cantidad_filmaciones_dia(dia:str):
   
     '''Se ingresa el dia y la funcion retorna la cantidad de peliculas que se estrenaron ese dia historicamente'''
     global df  # Declarar el DataFrame como una variable global
     respuesta = 0
     dia = dia.lower().capitalize()
     if dia in df.release_day.unique():
        mask_cantidad_filmaciones_dia = df['release_day'] == dia
        respuesta = df[mask_cantidad_filmaciones_dia].shape[0]
        return {'Peliculas estrenadas un':dia, 'Cantidad':respuesta}
     else:
        return {'ERROR EN PALABRA INGRESADA ':dia, 'Dia Ingresado':'No es correcto'}

In [41]:
# Ejemplo funcion 2
cantidad_filmaciones_dia('MaRTES')

{'Peliculas estrenadas un': 'Martes', 'Cantidad': 4427}

**3**

def score_titulo( titulo_de_la_filmación ): Se ingresa el título de una filmación esperando como respuesta el título, el año de estreno y el score.

In [47]:
def score_titulo(titulo:str):
    '''Se ingresa el título de una filmación esperando como respuesta el título, el año de estreno y el score'''
    global df  # Declarar el DataFrame como una variable global
    respuesta2 = 0
    respuesta3 = 0
    mask_titulo = 0
    
    if df['title'].str.lower().str.contains(titulo.lower()).any():
        mask_titulo = df['title'].str.lower() == titulo.lower()
        respuesta2 = df.loc[mask_titulo, 'release_year'].values[0]
        respuesta3 = df.loc[mask_titulo, 'popularity'].values[0]
        return {'Pelicula':titulo.title(), 'Se estrenó el año':respuesta2, 'La misma tiene Score':respuesta3}
    else:
        return {'Pelicula':titulo.title(), 'ERROR':'NO SE ENCONTRO'}

In [49]:
# Ejemplo
score_titulo('Toy Story')

{'Pelicula': 'Toy Story',
 'Se estrenó el año': 1995,
 'La misma tiene Score': 21.946943}

**4**
def votos_titulo( titulo_de_la_filmación ): Se ingresa el título de una filmación esperando como respuesta el título, la cantidad de votos y el valor promedio de las votaciones. La misma variable deberá de contar con al menos 2000 valoraciones, caso contrario, debemos contar con un mensaje avisando que no cumple esta condición y que por ende, no se devuelve ningun valor.

In [52]:
def votos_titulo(titulo:str):
    '''Se ingresa el título de una filmación esperando como respuesta el título, la cantidad de votos y el valor promedio de las votaciones. 
    La misma variable deberá de contar con al menos 2000 valoraciones, 
    caso contrario, debemos contar con un mensaje avisando que no cumple esta condición y que por ende, no se devuelve ningun valor.'''
    global df  # Declarar el DataFrame como una variable global
    
    mask_titulo = df['title'].str.lower() == titulo.lower()
    
    if df.loc[mask_titulo, 'vote_count'].values[0] < 2000:
        return {'ERROR':'No se cumplen los requisitos'}
    else:
        return {'titulo':titulo, 'anio':df.loc[mask_titulo, 'release_year'].values[0], 'voto_total':df.loc[mask_titulo, 'vote_count'].values[0], 'voto_promedio':df.loc[mask_titulo, 'vote_average'].values[0]}

In [53]:
# Ejemplo
votos_titulo('Toy Story')

{'titulo': 'Toy Story',
 'anio': 1995,
 'voto_total': 5415.0,
 'voto_promedio': 7.7}

In [75]:
df.columns

Index(['budget', 'genres', 'id', 'original_language', 'overview', 'popularity',
       'production_companies', 'production_countries', 'release_date',
       'revenue', 'runtime', 'spoken_languages', 'status', 'title',
       'vote_average', 'vote_count', 'collection_name', 'genre_name',
       'genre_id', 'release_year', 'release_month', 'release_day', 'return',
       'Actors', 'Director'],
      dtype='object')

**5**
def get_actor( nombre_actor ): Se ingresa el nombre de un actor que se encuentre dentro de un dataset debiendo devolver el éxito del mismo medido a través del retorno. Además, la cantidad de películas que en las que ha participado y el promedio de retorno. La definición no deberá considerar directores.

In [93]:

def get_actor(actor_name):
    global df  # Declarar el DataFrame como una variable global
    count = 0  # Variable para almacenar el contador de películas
    revenue_acumulado = 0  # Variable para almacenar la suma de revenue
    
    for actors, revenue in zip(df['Actors'], df['revenue']):
        if isinstance(actors, str):
            try:
                actors_list = ast.literal_eval(actors)
                if any(actor_name.lower() in actor.lower() for actor in actors_list):
                    count += 1
                    if pd.notnull(revenue):
                        revenue_acumulado += revenue
            except ValueError:
                pass
    
    revenue_promedio = revenue_acumulado / count if count > 0 else 0
    
    actor_data = {
        'Actor': actor_name,
        'Películas': count,
        'Revenue Total': revenue_acumulado,
        'Revenue Promedio': revenue_promedio
    }
    
    return actor_data



In [98]:
#ejemplo
get_actor('Harrison Ford')

{'Actor': 'Harrison Ford',
 'Películas': 57,
 'Revenue Total': 9330675809,
 'Revenue Promedio': 163696066.82456142}

**5**
def get_director( nombre_director ): Se ingresa el nombre de un director que se encuentre dentro de un dataset debiendo devolver el éxito del mismo medido a través del retorno. Además, deberá devolver el nombre de cada película con la fecha de lanzamiento, retorno individual, costo y ganancia de la misma.

In [61]:
def get_director(director_name):
    global df
    
    # Filtrar el dataframe por el director especificado
    director_movies = df[df['Director'] == director_name]
    
    if director_movies.empty:
        print(f"No se encontraron películas para el director {director_name}.")
        return None
    
    # Calcular el revenue acumulado
    total_revenue = director_movies['revenue'].sum()
    
    # Crear una lista para almacenar la información de las películas del director
    movies_info = []
    
    # Iterar sobre cada película del director
    for index, row in director_movies.iterrows():
        movie_title = row['title']
        release_date = row['release_date']
        revenue = row['revenue']
        budget = row['budget']
        profit = revenue - budget
        
        # Verificar si la fecha de lanzamiento es una cadena de texto
        if isinstance(release_date, str):
            release_date_str = release_date
        else:
            release_date_str = release_date.strftime('%Y-%m-%d') if not pd.isnull(release_date) else 'No especificado'
        
        movie_info = {
            'Película': movie_title,
            'Fecha de lanzamiento': release_date_str,
            'Revenue': revenue if revenue != 0 else 'No especificado',
            'Presupuesto': budget if budget != 0 else 'No especificado',
            'Ganancia': profit if revenue != 0 and budget != 0 else 'No especificado'
        }
        
        movies_info.append(movie_info)
    
    # Crear el diccionario de resultado
    director_data = {
        'Director': director_name,
        'Películas': movies_info,
        'Revenue acumulado': total_revenue if total_revenue != 0 else 'No especificado'
    }
    
    return director_data



In [62]:
#ejemplo
get_director('Sydney Pollack')

{'Director': 'Sydney Pollack',
 'Películas': [{'Película': 'Sabrina',
   'Fecha de lanzamiento': '1995-12-15',
   'Revenue': 'No especificado',
   'Presupuesto': 58000000.0,
   'Ganancia': 'No especificado'},
  {'Película': 'The Firm',
   'Fecha de lanzamiento': '1993-06-30',
   'Revenue': 270248367,
   'Presupuesto': 42000000.0,
   'Ganancia': 228248367.0},
  {'Película': 'Three Days of the Condor',
   'Fecha de lanzamiento': '1975-09-24',
   'Revenue': 27476252,
   'Presupuesto': 'No especificado',
   'Ganancia': 'No especificado'},
  {'Película': "They Shoot Horses, Don't They?",
   'Fecha de lanzamiento': '1969-12-10',
   'Revenue': 'No especificado',
   'Presupuesto': 'No especificado',
   'Ganancia': 'No especificado'},
  {'Película': 'Dead Again',
   'Fecha de lanzamiento': '1991-08-23',
   'Revenue': 38016380,
   'Presupuesto': 'No especificado',
   'Ganancia': 'No especificado'},
  {'Película': 'The Way We Were',
   'Fecha de lanzamiento': '1973-10-17',
   'Revenue': 45000000,