# API world

In [16]:
import pandas as pd

In [17]:
df = pd.read_parquet('movies_datasets.parquet')
df.head()
df.columns

Index(['belongs_to_collection', 'budget', 'genres', 'id', 'original_language',
       'overview', 'popularity', 'production_companies',
       'production_countries', 'release_date', 'revenue', 'runtime',
       'spoken_languages', 'status', 'tagline', 'title', 'vote_average',
       'vote_count', 'release_year', 'release_month', 'return'],
      dtype='object')

In [7]:
def score_titulo(titulo_de_la_filmación):
    '''
    Esta función recibe como dato un título de película y devuelve título, año de estreno
    y valoración.
    
    Parámetros:
    titulo_de_la_filmación (str): Título de la película.
    df (DataFrame): DataFrame que contiene la información de las películas.
    
    Retorna:
    None
    '''
    # Cambiamos el valor de titulo_de_la_filmación a lowercase para buscar
    titulo_de_la_filmación = titulo_de_la_filmación.lower()
    # Filtramos el DataFrame para obtener la fila que corresponde al título de la película
    fila_pelicula = df.loc[df['title'] == titulo_de_la_filmación]
    
    # Verificamos si se encontró la película
    if not fila_pelicula.empty:
        # Obtenemos el año de estreno y la popularidad de la película
        result_year = int(fila_pelicula['release_year'].values[0])
        result_popularity = fila_pelicula['popularity'].values[0]
        titulo_de_la_filmación = titulo_de_la_filmación.title()

        
        # Imprimimos la información de la película
        print('La película %s fue estrenada en el año %i, y tuvo una popularidad de %f' % (titulo_de_la_filmación, result_year, result_popularity))
    else:
        print('No se encontró la película con el título "%s"' % titulo_de_la_filmación)

In [15]:
score_titulo('sabrina')

La película Sabrina fue estrenada en el año 1995, y tuvo una popularidad de 6.677277


In [21]:
def filmaciones_dia(dia: str):
    """
    Cuenta la cantidad de veces que aparece una fecha en una columna de un DataFrame.

    Parámetros:
    dia (str): Día en la forma AAAA-MM-DD

    Retorna:
    int: Cantidad de veces que aparece la fecha en la columna.
    """
    dia = pd.to_datetime(dia)
    print((df['release_date'] == dia).sum())  

In [22]:
filmaciones_dia('1982-11-2')

2


In [18]:
def filmaciones_mes (mes: str):
    '''Esta función recive el mes como parámetro y devuelve las 
    filmaciones estrenadas a ese mes
    
    Parámetro:
    mes (str): mes de la filmación. Puede ser 'Enero', 'Febrero', ..., 'Diciembre'

    Retorna:
    int: Cantidad de filmaciones estrenadas ese mes
    '''
    mes_dic = {'enero':1,
               'febrero':2,
               'marzo':3,
               'abril':4,
               'mayo':5,
               'junio':6,
               'julio':7,
               'agosto':8,
               'septiembre':9,
               'octubre':10,
               'noviembre':11,
               'diciembre':12}
    mes = mes.lower()
    return (df['release_month'] == mes_dic[mes]).sum()

In [23]:
filmaciones_mes('agosto')

np.int64(3394)

In [20]:
mes_dic = {'enero':1,
               'febrero':2,
               'marzo':3,
               'abril':4,
               'mayo':5,
               'junio':6,
               'julio':7,
               'agosto':8,
               'septiembre':9,
               'octubre':10,
               'noviembre':11,
               'diciembre':12}
mes_dic['enero']

1

In [22]:
(df['release_month'] == 2).sum()

np.int64(3032)