# Funciones FASTAPI 

## Este archivo contiene las funciones finales utilizadas en FASTAPI

Puede servir para documentar el readme final para la entrega. Se puede basar en el archivo funciones ya que de ahí se tomó la idea aunque en el camino fue necesario ajustarlo para que funcionara en FASTAPI.

In [1]:
import pandas as pd

In [2]:
films = pd.read_csv('./datasets/films.csv')
films.head()

Unnamed: 0,movieId,platform,type,title,director,cast,country,date_added,release_year,clasificacion,listed_in,description,duration_int,duration_type,rating
0,as1,amazon,movie,the grand seduction,don mckellar,"brendan gleeson, taylor kitsch, gordon pinsent",canada,2021-03-30,2014,g,"comedy, drama",a small fishing village must procure a local d...,113,min,3.5
1,as2,amazon,movie,take care good night,girish joshi,"mahesh manjrekar, abhay mahajan, sachin khedekar",india,2021-03-30,2018,13+,"drama, international",a metro family decides to fight a cyber crimin...,110,min,3.5
2,as3,amazon,movie,secrets of deception,josh webber,"tom sizemore, lorenzo lamas, robert lasardo, r...",united states,2021-03-30,2017,g,"action, drama, suspense",after a man discovers his wife is cheating on ...,74,min,3.5
3,as4,amazon,movie,pink: staying true,sonia anderson,"interviews with: pink, adele, beyoncé, britney...",united states,2021-03-30,2014,g,documentary,"pink breaks the mold once again, bringing her ...",69,min,3.5
4,as5,amazon,movie,monster maker,giles foster,"harry dean stanton, kieran o'brien, george cos...",united kingdom,2021-03-30,1989,g,"drama, fantasy",teenage matt banting wants to work with a famo...,45,min,3.5


### Clase

In [3]:
class Peliculas:
    '''
    Esta clase tiene como objetivo definir las funciones de filtros del dataframe, de tal manera que permitirá aplicar los filtros
    en las funciones posteriores. Asimismo contempla casos en los que no se cumpla con los criterios con los que cuenta el dataframe
    por ejemplo que se elija un año que no se encuentre entre 1920 y 2021 que son los que tenemos, o alguna plataforma que no se encuentre
    dentro de las que tenemos disponibles.
    '''
    def __init__(self,df):
        self.df = df

    #Función para filtrar por año
    def year_filter(self,year):
        self.year = year
        if self.year < 1920: #Validamos si el parámetro ingresado es menor a 1920
            return ('No contamos con películas anteriores a 1920.')
        elif self.year > 2021: #Validamos si el parámetro ingresado es menor a 1920
            return ('No contamos con películas posteriores a 2021.')
        else:
            return self.df[self.df['release_year']==self.year] #Realizamos el filtro de todo el DF a partir del año ingresado

    #Función para filtrar por plataforma
    def platform_filter(self,platform):
        self.platform = platform
        if self.platform=='amazon' or self.platform=='disney' or self.platform=='hulu' or self.platform=='netflix': 
            return self.df[self.df['platform']==self.platform] #Realizamos el filtro a todo el DF a partir de la plataforma
        else:
            return ("Revisa que hayas escrito de manera correcta la plataforma solicitada. Las opciones son: 'amazon', 'disney', 'hulu', 'netflix'")
    
    #función para filtrar por tipo de duración
    def duration_filter(self,duration):
        self.duration = duration
        if self.duration == 'minutos': #Validamos si se pidieron películas cuya duración está en minutos
            self.duration = 'min'    
        elif self.duration=='temporadas': #Validamos si se pidieron películas cuya duración está en temporadas
            self.duration = 'season'
        else:
            return ("No se ha seleccionado un criterio de tiempo adecuado. Las opciones son: 'minutos' o 'temporadas")
        return self.df[self.df['duration_type']==self.duration] #Filtramos por tipo de duración

### 1 Funcion get_max_duration

In [4]:
def get_max_duration(year, platform, duration_type):    
    '''
    Esta función encuentra la película o serie con mayor duración que cumpla con los filtros seleccionados.
    Args:
        year: variable tipo integer que hace referencia al año en que se realizó la película.
        platform: variable tipo string que hace referencia a la plataforma de streaming en la que se encuentra la película.
        duration_type: variable tipo string que hace referencia a la unidad de medida ya sea minutos (min) o temporadas(season).
    Returns:
        Un string con el título de la película y los criterios seleccionados.
    '''
    #Validamos el parámetro año(year)
    if year == 0: #Si es 0 no aplicamos filtro
        filtroanio = films
    else:
        filtroanio = Peliculas(films) #Instanciamos el DF con la clase Peliculas
        filtroanio = filtroanio.year_filter(year) #Aplicamos la función de filtrar por año
        if type(filtroanio) == str: return filtroanio #Validamos si se ingresó un valor correcto, de lo contrario regresamos un mensaje
    
    #Validamos el parámetro plataforma (platform)
    if platform == 'none':
        filtroplat = filtroanio #Si no hay parámetro ocupamos el DF previamente filtrado.
    else:
        filtroplat = Peliculas(filtroanio) #Instanciamos el DF filtrado con la clase Peliculas.
        filtroplat = filtroplat.platform_filter(platform) #Aplicamos la función de filtrar por plataforma.
        if type(filtroplat) == str: return filtroplat #Validamos si se ingresó un valor correcto, de lo contrario regresamos un mensaje

    #Validamos el parámetro tipo de duración (durationi_type)
    if duration_type == 'none':
        filtroduration = filtroplat
    else:
        filtroduration = Peliculas(filtroplat) #Intanciamos el df para aplicarle el filtro
        filtroduration = filtroduration.duration_filter(duration_type) #Aplciamos la función de filtrar por tipo de duración
        if type(filtroduration) == str: return filtroduration #Validamos si se ingresó un valor correcto, de lo contrario regresamos un mensaje

    duration_max = filtroduration['duration_int'].max() #Identificamos el valor máximo del DF filtrado
    title_movie = filtroduration.loc[filtroduration['duration_int']==duration_max, 'title'].iloc[0]   #Extraemos el valor máximo de duración y regresamos el titulo
    return {"El titulo con mayor duración es": title_movie}

In [5]:
get_max_duration(2015,"amazon","minutos")

{'El titulo con mayor duración es': 'carmel beach waves for sleep'}

### 2 Función get_score_count

In [7]:
def get_score_count(platform, scored, year):        
    '''
    Esta función cuenta la cantidad de películas que tienen un puntaje superior al indicado como parámetro de la función.
    Args:
        scored: variable tipo float (obligatorio) para determinar el puntaje con el que deben cumplir las peliculas para ser contabilizadas
        platform: variable tipo string que hace referencia a la plataforma de streaming en la que se encuentra la película
        year: variable tipo integer que hace referencia al año en que se realizó la película.
    Returns:
        Un string con el numero de películas que cumplen con el puntaje seleccionado y la descripción de los filtros correspondientes.
    '''

    #Se utiliza el mismo método de filtro que en la primer función a través de la clase Peliculas    
    if platform == 'none':
        filtroplat = films
    else:
        filtroplat = Peliculas(films)
        filtroplat = filtroplat.platform_filter(platform)
        if type(filtroplat) == str: return filtroplat

    #Se utiliza el mismo método de filtro que en la primer función a través de la clase Peliculas
    if year == 0:
        filtroanio = filtroplat
    else:
        filtroanio = Peliculas(filtroplat)
        filtroanio = filtroanio.year_filter(year)
        if type(filtroanio) == str: return filtroanio
    
    #Se filtra el df ya filtrado con el rating mayor al indicado
    puntuacion = filtroanio[filtroanio["rating"]>scored]
    num_movies = puntuacion.shape[0] #Se identifica el tamaño y se extrae el número de filas que representa la cantidad de películas con los filtros aplicados.

    return {f"Cantidad de peliculas con puntaje mayor a {scored}": num_movies}

In [8]:
get_score_count("hulu",2.5,1988)

{'Cantidad de peliculas con puntaje mayor a 2.5': 8}

### 3 Funcion get_count_platform

In [9]:
def get_count_platform(platform:str):  
    '''
    Esta función cuenta la cantidad de películas existentes en cada plataforma o las 4 en conjunto si no se indica el parametro de platform.
    Args:
        platform: variable tipo string (opcional) para determinar el filtro de la plataforma de la cual se quieren contar las peliculas
    Return:
        Un string con la cantidad de películas encontradas y el detalle del filtro aplicado.
    '''
    #Se aplica el mismo filtro que las funciones anteriores.  
    if platform == 'none':
        filtroplat = films
    else:
        filtroplat = Peliculas(films)
        filtroplat = filtroplat.platform_filter(platform)
        if type(filtroplat) == str: return filtroplat

    #Ya filtrado el DF se selecciona el indice cero del tamaño, que indica el numero de filas o registros con los filtros aplicados.
    movies = filtroplat.shape[0]

    return {"Cantidad de películas": movies}

In [10]:
get_count_platform("netflix")

{'Cantidad de películas': 8807}

### 4 get_actor

In [11]:
def get_actor(platform, year):
    '''
    Esta función separa la columna 'cast' que contiene a los actores y cuenta las veces que se repite cada actor
    Args:
        platform: variable tipo string que hace referencia a la plataforma de streaming en la que se encuentra la película
        year: variable tipo integer que hace referencia al año en que se realizó la película.
    Returns:
        Un string con el dato del actor que más veces se repite con base en los filtros solicitados.
    '''
    #Se aplica el mismo filtro que las funciones anteriores. 
    if platform == 'none':
        filtroplat = films
    else:
        filtroplat = Peliculas(films)
        filtroplat = filtroplat.platform_filter(platform)
        if type(filtroplat) == str: return filtroplat

    #Se aplica el mismo filtro que las funciones anteriores. 
    if year == 0:
        filtroanio = filtroplat
    else:
        filtroanio = Peliculas(filtroplat)
        filtroanio = filtroanio.year_filter(year)
        if type(filtroanio) == str: return filtroanio


    df_actors = filtroanio['cast'].str.split(',') #Separamos la columna de cast donde vienen todos los actores por título.
    apariciones = df_actors.explode().value_counts()  #Contamos la cantidad de veces que aparece cada actor
    actor_max_apar = apariciones.idxmax() #Identificamos el que más veces se repite
    return {'El actor que más aparece es':actor_max_apar}

In [12]:
get_actor("disney",2018)

{'El actor que más aparece es': 'sam peltz'}