# Funciones

In [4]:
import pandas as pd
import numpy as np

In [7]:
df = pd.read_csv('proceso_etl_terminado.csv')

In [9]:
df.head(0)

Unnamed: 0,budget,id,original_language,overview,popularity,release_date,revenue,runtime,status,tagline,...,vote_average,vote_count,name_to_collection,name_genres,nombre_compania,pais_produccion,nombre_idioma_hablado,release_year,return,name_director


### 1. Esta función devuelve la cantidad de peliculas que hay en ese idioma que se introdujo

In [2]:
#Funcion 1: Cantidad de peliculas producidas en un idioma específico

import iso639

def peliculas_idioma(idioma: str):
    idioma_nombre = None

    try:
        codigo_iso639 = iso639.to_iso639_1(idioma.lower())
        idioma_nombre = iso639.to_name(codigo_iso639)
    except ValueError:
        return f"No se encontró información para el idioma {idioma}"

    cantidad_peliculas = len(df[df['original_language'] == codigo_iso639])
    return f"{cantidad_peliculas} cantidad de películas fueron estrenadas en idioma {idioma_nombre}"

In [5]:
peliculas_idioma('Spanish')

'991 cantidad de películas fueron estrenadas en idioma Spanish; Castilian'

### 2. Se ingresa una pelicula. Debe devolver la duracion y el año

In [135]:
def peliculas_duracion(pelicula: str):
    
    # Filtra el DataFrame por la película ingresada
    pelicula_filtrada = df[df['title'] == pelicula]
    
    # Verifica si se encontró la película
    if pelicula_filtrada.empty:
        return f"No se encontró información para la película '{pelicula}'."
    
    # Obtiene la duración y el año de la película
    duracion = pelicula_filtrada['runtime'].values[0]
    anio = pelicula_filtrada['release_year'].values[0]
    
    # Devuelve la duración y el año de la película
    return f"Duración: {duracion} minutos. Año: {anio}."

In [138]:
peliculas_duracion('Grumpier Old Men')

'Duración: 101.0 minutos. Año: 1995.'

### 3. Se ingresa la franquicia, retornando la cantidad de peliculas, ganancia total y promedio

In [165]:
def franquicia(Franquicia: str):    
    # Filtra el DataFrame por la franquicia ingresada
    franquicia_filtrada = df[df['name_to_collection'] == Franquicia]
    
    # Verifica si se encontró la franquicia
    if franquicia_filtrada.empty:
        return f"No se encontró información para la franquicia '{Franquicia}'."
    
    # Calcula la cantidad de películas de la franquicia
    cantidad_peliculas = len(franquicia_filtrada)
    
    # Calcula la ganancia total y promedio de la franquicia
    ganancia_total = franquicia_filtrada['revenue'].sum()
    ganancia_total_formateada = '{:,.0f}'.format(ganancia_total)
    ganancia_promedio = franquicia_filtrada['revenue'].mean()
    ganancia_promedio_formateada = '{:,.2f}'.format(ganancia_promedio)
    
    # Devuelve la información de la franquicia
    return f"La franquicia {Franquicia} posee {cantidad_peliculas} películas, una ganancia total de {ganancia_total_formateada} y una ganancia promedio de {ganancia_promedio_formateada}%"




In [166]:
franquicia('From Dusk Till Dawn Collection')

'La franquicia From Dusk Till Dawn Collection posee 3 películas, una ganancia total de 25,836,616 y una ganancia promedio de 8,612,205.33%'

### 4. Ingresar una País y retornar la cantidad de peliculas que pesee dicho país

In [203]:
def peliculas_pais(Pais: str):
    cantidad_peliculas = df[df['pais_produccion'].apply(lambda x: Pais in x)].shape[0]
    if cantidad_peliculas == 0:
        return f"No se encontraron películas producidas en el país {Pais}."
    else:
        return f"Se produjeron {cantidad_peliculas} películas en el país {Pais}."

In [205]:
peliculas_pais('France')

'Se produjeron 3956 películas en el país France.'

### 5. Se ingresa la productora, y retorna el revenue total y la cantidad de peliculas que realizo.

In [221]:
def productoras_exitosas(Productora: str):
    productora_films = df[df['nombre_compania'].apply(lambda x: Productora in x)]
    if productora_films.empty:
        return f"No se encontraron películas para la productora {Productora}."
    else:
        total_revenue = productora_films['revenue'].sum()
        cantidad_peliculas = len(productora_films)
        return f"La productora {Productora} ha tenido un revenue de {total_revenue} y ha realizado {cantidad_peliculas} películas."



In [228]:
productoras_exitosas('Interscope Communications')

'La productora Interscope Communications ha tenido un revenue de 1129048982.0 y ha realizado 36 películas.'

### 6. Se ingresa el nombre de un director que se encuentre dentro de un dataset debiendo devolver el éxito del mismo medido a través del retorno. Además, deberá devolver el nombre de cada película con la fecha de lanzamiento, retorno individual, costo y ganancia de la misma, en formato lista.

In [232]:
def get_director(nombre_director: str):
    director_films = df[df['name_director'] == nombre_director]
    if director_films.empty:
        return f"No se encontraron películas para el director {nombre_director}."
    else:
        director_success = director_films['return'].mean()
        movie_list = []
        for _, row in director_films.iterrows():
            movie_info = {
                'title': row['title'],
                'release_date': row['release_date'],
                'return': row['return'],
                'budget': row['budget'],
                'revenue': row['revenue']
            }
            movie_list.append(movie_info)
        
        return director_success, movie_list



In [234]:
get_director('Mel Brooks')

(8.386840551102477,
 [{'title': 'Dracula: Dead and Loving It',
   'release_date': '1995-12-22',
   'return': 0.0,
   'budget': 0.0,
   'revenue': 0.0},
  {'title': 'Robin Hood: Men in Tights',
   'release_date': '1993-07-28',
   'return': 1.78698775,
   'budget': 20000000.0,
   'revenue': 35739755.0},
  {'title': 'Young Frankenstein',
   'release_date': '1974-12-15',
   'return': 30.811904642857144,
   'budget': 2800000.0,
   'revenue': 86273333.0},
  {'title': 'The Producers',
   'release_date': '1967-11-22',
   'return': 0.0,
   'budget': 947000.0,
   'revenue': 0.0},
  {'title': 'History of the World: Part I',
   'release_date': '1981-06-12',
   'return': 2.8793551818181817,
   'budget': 11000000.0,
   'revenue': 31672907.0},
  {'title': 'Spaceballs',
   'release_date': '1987-06-24',
   'return': 1.6792723788546255,
   'budget': 22700000.0,
   'revenue': 38119483.0},
  {'title': 'The Twelve Chairs',
   'release_date': '1970-10-28',
   'return': 0.0,
   'budget': 0.0,
   'revenue': 0