In [59]:
import pandas as pd
import locale

In [23]:
df_completo=pd.read_csv(r'Datasets/Data_ETL_EDA.csv')

In [20]:
df_completo.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 44362 entries, 0 to 44361
Data columns (total 17 columns):
 #   Column           Non-Null Count  Dtype  
---  ------           --------------  -----  
 0   budget           44362 non-null  float64
 1   id               44362 non-null  int64  
 2   overview         44362 non-null  object 
 3   popularity       44362 non-null  float64
 4   release_date     44362 non-null  object 
 5   revenue          44362 non-null  float64
 6   runtime          44362 non-null  int64  
 7   title            44362 non-null  object 
 8   release_year     44362 non-null  int64  
 9   return           44362 non-null  float64
 10  collection_name  4426 non-null   object 
 11  genres_name      44362 non-null  object 
 12  pcompany_name    44362 non-null  object 
 13  pcountry_name    44362 non-null  object 
 14  namecast         44362 non-null  object 
 15  idcast           44362 non-null  object 
 16  directors        44362 non-null  object 
dtypes: float64(4

In [62]:
cantidad_filmaciones_mes("enero")

{'mes': 'enero', 'cantidad': 5740}

In [61]:
def cantidad_filmaciones_mes(mes:str):
    '''Se ingresa el mes y la funcion retorna la cantidad de peliculas que se estrenaron ese mes historicamente'''
    fechas=pd.to_datetime(df_completo['release_date'],format='%Y-%m-%d')
    nmes=fechas[fechas.dt.month_name(locale='es_CO')==mes.capitalize()]
    respuesta=nmes.shape[0]
    return {'mes':mes, 'cantidad':respuesta}

In [60]:
cantidad_filmaciones_dia("lunes")

{'dia': 'lunes', 'cantidad': 3408}

In [58]:
def cantidad_filmaciones_dia(dia:str):
    '''Se ingresa el dia y la funcion retorna la cantidad de peliculas que se estrebaron ese dia historicamente'''
    locale.setlocale(locale.LC_TIME, 'es_ES.UTF-8') #configuración regional
    fechas=pd.to_datetime(df_completo['release_date'],format='%Y-%m-%d')
    ndia = fechas[fechas.dt.strftime('%A') == dia.lower()]
    respuesta=ndia.shape[0]
    return {'dia':dia, 'cantidad':respuesta}

In [53]:
score_titulo("toy story")

{'titulo': 'toy story', 'anio': 1995, 'popularidad': 21.946943}

In [52]:
def score_titulo(titulo: str):
    '''Se ingresa el título de una filmación esperando como respuesta el título, el año de estreno y el score'''
    # Convertir el título a minúsculas
    titulo = titulo.lower()
    # Filtrar el DataFrame para obtener la película correspondiente al título ingresado
    pelicula = df_completo[df_completo['title'].str.lower() == titulo]
    if pelicula.empty:
        return {'mensaje': 'No se encontró ninguna filmación con ese título.'}
    anio = pelicula['release_year'].iloc[0]
    popularidad = pelicula['popularity'].iloc[0]
    return {'titulo': titulo, 'anio': anio, 'popularidad': popularidad}

In [49]:
votos_titulo("Toy Story")

{'titulo': 'Toy Story', 'voto_total': 5415.0, 'voto_promedio': 5415.0}

In [46]:
def votos_titulo(titulo:str):
    '''Se ingresa el título de una filmación esperando como respuesta el título, la cantidad de votos y el valor promedio de las votaciones. 
    La misma variable deberá de contar con al menos 2000 valoraciones, 
    caso contrario, debemos contar con un mensaje avisando que no cumple esta condición y que por ende, no se devuelve ningun valor.'''
    low = titulo.lower()
    pel = df_completo[df_completo['title'].str.lower() == low]   # Filtrar por título ingresado
    votos = pel['vote_count'].iloc[0] # Suma de los votos
    promedio = votos.mean()  # Valor promedio de los votos
    if votos < 2000:  # Verificar si tiene menos de 2000 valoraciones
        return {'mensaje': f'La filmación "{titulo}" no cumple la condición de tener al menos 2000 valoraciones. ',"votos": votos}
    return {'titulo': titulo, 'voto_total': votos, 'voto_promedio': promedio}

In [51]:
get_actor("Tom Hanks")

{'actor': 'tom hanks',
 'cantidad_filmaciones': 68,
 'retorno_total': 178.8494960552024,
 'retorno_promedio': 2.6301396478706236}

In [50]:
def get_actor(nombre_actor: str):
    '''Se ingresa el nombre de un actor que se encuentre dentro de un dataset debiendo devolver el éxito del mismo medido a través del retorno. 
    Además, la cantidad de películas en las que ha participado y el promedio de retorno'''

    # Convertir el nombre del actor a minúsculas
    nombre_actor = nombre_actor.lower()
    
    # Filtrar el DataFrame para obtener las películas en las que participa el actor
    peliculas_actor = df_completo[df_completo['namecast'].str.lower().str.contains(nombre_actor)]
    
    # Obtener la cantidad de películas y el retorno total del actor
    cantidad_filmaciones = len(peliculas_actor)
    retorno_total = peliculas_actor['return'].sum()
    
    # Calcular el retorno promedio
    retorno_promedio = retorno_total / cantidad_filmaciones
    
    return {'actor': nombre_actor, 'cantidad_filmaciones': cantidad_filmaciones, 'retorno_total': retorno_total, 'retorno_promedio': retorno_promedio}


In [64]:
get_director('John Lasseter')

{'director': 'john lasseter',
 'retorno_total_director': 27.65437835777778,
 'peliculas': [{'nombre': 'Toy Story',
   'anio': 1995,
   'retorno_pelicula': 12.4518011,
   'budget_pelicula': 30000000.0,
   'revenue_pelicula': 373554033.0},
  {'nombre': "A Bug's Life",
   'anio': 1998,
   'retorno_pelicula': 3.027157158333333,
   'budget_pelicula': 120000000.0,
   'revenue_pelicula': 363258859.0},
  {'nombre': 'Toy Story 2',
   'anio': 1999,
   'retorno_pelicula': 5.526298544444445,
   'budget_pelicula': 90000000.0,
   'revenue_pelicula': 497366869.0},
  {'nombre': 'Luxo Jr.',
   'anio': 1986,
   'retorno_pelicula': 0.0,
   'budget_pelicula': 0.0,
   'revenue_pelicula': 0.0},
  {'nombre': 'Cars',
   'anio': 2006,
   'retorno_pelicula': 3.849859575,
   'budget_pelicula': 120000000.0,
   'revenue_pelicula': 461983149.0},
  {'nombre': 'Cars 2',
   'anio': 2011,
   'retorno_pelicula': 2.79926198,
   'budget_pelicula': 200000000.0,
   'revenue_pelicula': 559852396.0},
  {'nombre': 'Tin Toy',
 

In [63]:
def get_director(nombre_director: str):
    '''Se ingresa el nombre de un director que se encuentre dentro de un dataset debiendo devolver el éxito del mismo medido a través del retorno. 
    Además, deberá devolver el nombre de cada película con la fecha de lanzamiento, retorno individual, costo y ganancia de la misma.'''
    
    nombre_director = nombre_director.lower()# Convertir el nombre del director a minúsculas
    peliculas_director = df_completo[df_completo['directors'].str.lower().str.contains(nombre_director)]# Filtrar el DataFrame para obtener las películas del director
    retorno_total_director = peliculas_director['return'].sum()# Obtener el retorno total del director
    peliculas = []  # Crear una lista para almacenar la información de cada película
    for index, pelicula in peliculas_director.iterrows():
        # Obtener los datos de cada película
        nombre_pelicula = pelicula['title']
        anio_lanzamiento = pelicula['release_year']
        retorno_pelicula = pelicula['return']
        budget_pelicula = pelicula['budget']
        revenue_pelicula = pelicula['revenue']
        
        # Agregar los datos de la película a la lista
        peliculas.append({
            'nombre': nombre_pelicula,
            'anio': anio_lanzamiento,
            'retorno_pelicula': retorno_pelicula,
            'budget_pelicula': budget_pelicula,
            'revenue_pelicula': revenue_pelicula
        })
    
    return {
        'director': nombre_director,
        'retorno_total_director': retorno_total_director,
        'peliculas': peliculas
    }
