# API world

In [7]:
import pandas as pd

In [8]:
df = pd.read_parquet('movies_datasets.parquet')
df.head()
df.columns

Index(['budget', 'genres', 'id', 'original_language', 'overview', 'popularity',
       'production_companies', 'production_countries', 'release_date',
       'revenue', 'runtime', 'spoken_languages', 'status', 'tagline', 'title',
       'vote_average', 'vote_count', 'release_year', 'release_month', 'return',
       'franchise', 'release_day', 'actores', 'director'],
      dtype='object')

In [9]:
def score_titulo(titulo_de_la_filmación):
    '''
    Esta función recibe como dato un título de película y devuelve título, año de estreno
    y valoración.
    
    Parámetros:
    titulo_de_la_filmación (str): Título de la película.
    df (DataFrame): DataFrame que contiene la información de las películas.
    
    Retorna:
    None
    '''
    # Cambiamos el valor de titulo_de_la_filmación a lowercase para buscar
    titulo_de_la_filmación = titulo_de_la_filmación.lower()
    # Filtramos el DataFrame para obtener la fila que corresponde al título de la película
    fila_pelicula = df.loc[df['title'] == titulo_de_la_filmación]
    
    # Verificamos si se encontró la película
    if not fila_pelicula.empty:
        # Obtenemos el año de estreno y la popularidad de la película
        result_year = int(fila_pelicula['release_year'].values[0])
        result_popularity = fila_pelicula['popularity'].values[0]
        titulo_de_la_filmación = titulo_de_la_filmación.title()

        
        # Imprimimos la información de la película
        print('La película %s fue estrenada en el año %i, y tuvo una popularidad de %f' % (titulo_de_la_filmación, result_year, result_popularity))
    else:
        print('No se encontró la película con el título "%s"' % titulo_de_la_filmación)

In [10]:
score_titulo('sabrina')

La película Sabrina fue estrenada en el año 1995, y tuvo una popularidad de 6.677277


In [23]:
import unicodedata

In [24]:
def filmaciones_dia(dia: str):
    '''
    Esta función recibe como dato un día de la semana, escrito en español y 
    devuelve la cantidad de peliculas estrenadas ese día en todo el dataset
    
    Parámetros:
    dia (str): Día de la semana en español

    Return:
    str: string con la cantidad de películas'''
    
    #COnvertir dia a lower case
    dia = dia.lower()

    #Eliminar caracteres no deseados
    dia = unicodedata.normalize('NFD', dia).encode('ascii', 'ignore').decode('utf-8')

    #USar un diccionario para relacionar el día de la semana en español a inglés
    dia_ingles = {
        'lunes': 'Monday',
        'martes': 'Tuesday',
        'miercoles': 'Wednesday',
        'jueves': 'Thursday',
        'viernes': 'Friday',
        'sabado': 'Saturday',
        'domingo': 'Sunday'
    }

    #Guardo la cantidad de películas en la variable cantidad
    cantidad_dia = (df['release_day'] == dia_ingles[dia]).sum()
    print('%s cantidad de películas fueron estrenadas en los días %s' % (cantidad_dia, dia.capitalize()))


In [25]:
filmaciones_dia('lunes')

3509 cantidad de películas fueron estrenadas en los días Lunes


In [16]:
def filmaciones_mes (mes: str):
    '''Esta función recive el mes como parámetro y devuelve las 
    filmaciones estrenadas a ese mes
    
    Parámetro:
    mes (str): mes de la filmación. Puede ser 'Enero', 'Febrero', ..., 'Diciembre'

    Retorna:
    int: Cantidad de filmaciones estrenadas ese mes
    '''
    mes_dic = {'enero':1,
               'febrero':2,
               'marzo':3,
               'abril':4,
               'mayo':5,
               'junio':6,
               'julio':7,
               'agosto':8,
               'septiembre':9,
               'octubre':10,
               'noviembre':11,
               'diciembre':12}
    mes = mes.lower()
    return (df['release_month'] == mes_dic[mes]).sum()

In [18]:
filmaciones_mes('agosto')

np.int64(3396)

In [21]:
mes_dic = {'enero':1,
               'febrero':2,
               'marzo':3,
               'abril':4,
               'mayo':5,
               'junio':6,
               'julio':7,
               'agosto':8,
               'septiembre':9,
               'octubre':10,
               'noviembre':11,
               'diciembre':12}
mes_dic['enero']

1

In [22]:
(df['release_month'] == 2).sum()

np.int64(3032)

In [23]:
def score_titulo(titulo_de_la_filmación):
    '''
    Esta función recibe como dato un título de película y devuelve título, año de estreno
    y valoración.
    
    Parámetros:
    titulo_de_la_filmación (str): Título de la película.
    df (DataFrame): DataFrame que contiene la información de las películas.
    
    Retorna:
    None
    '''
    # Cambiamos el valor de titulo_de_la_filmación a lowercase para buscar
    titulo_de_la_filmación = titulo_de_la_filmación.lower()
    # Filtramos el DataFrame para obtener la fila que corresponde al título de la película
    fila_pelicula = df.loc[df['title'] == titulo_de_la_filmación]
    
    # Verificamos si se encontró la película
    if not fila_pelicula.empty:
        # Obtenemos el año de estreno y la popularidad de la película
        result_year = int(fila_pelicula['release_year'].values[0])
        result_popularity = fila_pelicula['popularity'].values[0]
        titulo_de_la_filmación = titulo_de_la_filmación.title()

        
        # Imprimimos la información de la película
        print('La película %s fue estrenada en el año %i, y tuvo una popularidad de %f' % (titulo_de_la_filmación, result_year, result_popularity))
    else:
        print('No se encontró la película con el título "%s"' % titulo_de_la_filmación)

In [67]:
titulo = 'beauty and the beast'

list_indices = df[df['title'] == titulo].index.tolist()
list_indices
for indice in list_indices:
    votos = int(df.loc[indice,'vote_count'])
    if votos > 2000:
        año_estreno = df.loc[indice,'release_year']
        votacion = df.loc[indice,'vote_average']
        print(f'La pelicula {titulo} fue estrenada en el {año_estreno}.La misma cuenta con un total de {votos} valoraciones, con un promedio de {votacion}')
# df.loc[list_indices, 'vote_count'].tolist()

La pelicula beauty and the beast fue estrenada en el 1991.La misma cuenta con un total de 3029 valoraciones, con un promedio de 7.5
La pelicula beauty and the beast fue estrenada en el 2017.La misma cuenta con un total de 5530 valoraciones, con un promedio de 6.8


In [81]:
titulo = 'loco'

mask1 = df['title'] == titulo
mask2 = df['vote_count'] > 1999

lista = df[mask1 & mask2].index.tolist()
if not len(lista) == 0:
    for indice in lista:
        votos = int(df.loc[indice,'vote_count'])
        año_estreno = df.loc[indice,'release_year']
        votacion = df.loc[indice,'vote_average']
        print(f'La pelicula {titulo} fue estrenada en el {año_estreno}.La misma cuenta con un total de {votos} valoraciones, con un promedio de {votacion}')
elif titulo in df['title'].values:
    print('La película posee menos de 2000 valoraciones')
else:
    print('La película no existe en la base de datos')


La película no existe en la base de datos


In [None]:
def recomendador(titulo: str):

    titulo = titulo.lower()
    