In [2]:
#Realizamos la prueba de algunas funciones de la API segun la consigna en el proceso de ETL
import pandas as pd



data_types = {
    'budget': float,
    'id_pelicula': str,
    'original_language': str,
    'overview': str,
    'popularity': str,
    
    'revenue': float,
    'runtime': float,
    'status': str,
    'tagline': str,
    'title': str,
    'vote_average': float,
    'vote_count': 'Int32',  # Utiliza 'Int32' para un entero nullable
    'genres_ok': str,
    'spoken_languages_ok': str,
    'production_countries': str,
    'belong_to_collection': str,
    'production_companies_ok': str,
    'return': float,
    'release_year': 'Int64'  # Utiliza 'Int64' para un entero nullable
}



votadas_df = pd.read_csv('votadas_df.csv', dtype=data_types, low_memory=False)

# Visualizar el contenido del DataFrame. 
votadas_df.head()



Unnamed: 0,budget,id_pelicula,original_language,overview,popularity,release_date,revenue,runtime,status,tagline,title,vote_average,vote_count,genres_ok,spoken_languages_ok,production_countries,belong_to_collection,production_companies_ok,release_year,return
0,160000000.0,27205,en,"Cobb, a skilled thief who commits corporate es...",29.108149,2010-07-14,825532800.0,148.0,Released,Your mind is the scene of the crime.,Inception,8.1,14075,"Action,Thriller,Science Fiction,Mystery,Adventure",English,"United Kingdom,United States of America",,"Legendary Pictures,Warner Bros.,Syncopy",2010,5.16
1,185000000.0,155,en,Batman raises the stakes in his war on crime. ...,123.167259,2008-07-16,1004558000.0,152.0,Released,Why So Serious?,The Dark Knight,8.3,12269,"Drama,Action,Crime,Thriller","English,普通话","United Kingdom,United States of America",The Dark Knight Collection,"DC Comics,Legendary Pictures,Warner Bros.,DC E...",2008,5.43
2,237000000.0,19995,en,"In the 22nd century, a paraplegic Marine is di...",185.070892,2009-12-10,2787965000.0,162.0,Released,Enter the World of Pandora.,Avatar,7.2,12114,"Action,Adventure,Fantasy,Science Fiction","English,Español","United Kingdom,United States of America",Avatar Collection,"Ingenious Film Partners,Twentieth Century Fox ...",2009,11.76
3,220000000.0,24428,en,When an unexpected enemy emerges and threatens...,89.887648,2012-04-25,1519558000.0,143.0,Released,Some assembly required.,The Avengers,7.4,12000,"Science Fiction,Action,Adventure",English,United States of America,The Avengers Collection,"Paramount Pictures,Marvel Studios",2012,6.91
4,58000000.0,293660,en,Deadpool tells the origin story of former Spec...,187.860492,2016-02-09,783113000.0,108.0,Released,Witness the beginning of a happy ending,Deadpool,7.4,11444,"Action,Adventure,Comedy",English,United States of America,Deadpool Collection,"Twentieth Century Fox Film Corporation,Marvel ...",2016,13.5


In [3]:
def peliculas_duracion(pelicula: str):
    '''Ingresas la película, retornando la duración y el año'''
    pelicula_data = votadas_df[votadas_df['title'] == pelicula]
    if pelicula_data.empty:
        return {'error': 'Película no encontrada'}
    else:
        
        duracion = pelicula_data['runtime'].iloc[0]
        anio = pelicula_data['release_year'].iloc[0]

     

        return {'pelicula': pelicula, 'duracion': duracion, 'anio': anio}


In [4]:
peliculas_duracion("Toy Story")

{'pelicula': 'Toy Story', 'duracion': 81.0, 'anio': 1995}

In [5]:

def peliculas_pais(pais: str):
    '''Se ingresa un país, retornando la cantidad de películas producidas en el mismo.'''
    try:
        # Un ejemplo simple de mapeo de palabras clave a nombres de países
        country_mapping = {
        'United States':'United States of America',
        'eeuu': 'United States of America',
        'usa': 'United States of America',
        'francia': 'France',
        'Francia': 'France',
        'alemania': 'Germany',
        'Alemania': 'Germany',
        'UK': 'United Kingdom',
    # Agrega más mapeos aquí según tus necesidades
}           
        # Busca en el mapeo de países y obtén el nombre completo del país
        full_country_name = country_mapping.get(pais.lower(), pais)
        
        cantidad_peliculas = votadas_df[votadas_df['production_countries'].str.contains(full_country_name, case=False)].shape[0]
        return {'pais': full_country_name, 'cantidad': cantidad_peliculas}
    except Exception as e:
        return {'error': 'Ocurrió un error al procesar la solicitud', 'detalle': str(e)}

In [6]:
votadas_df.isna().any()

budget                     False
id_pelicula                False
original_language          False
overview                    True
popularity                 False
release_date               False
revenue                    False
runtime                    False
status                     False
tagline                     True
title                      False
vote_average               False
vote_count                 False
genres_ok                   True
spoken_languages_ok         True
production_countries        True
belong_to_collection        True
production_companies_ok     True
release_year               False
return                     False
dtype: bool

In [7]:
# Reemplazar valores nulos en columnas seleccionadas con un valor predeterminado (por ejemplo, "")
columns_to_fill = ['overview', 'tagline', 'genres_ok', 'spoken_languages_ok', 'production_countries', 'production_companies_ok', 'belong_to_collection']
votadas_df[columns_to_fill] = votadas_df[columns_to_fill].fillna("")

In [8]:
votadas_df.isna().any()

budget                     False
id_pelicula                False
original_language          False
overview                   False
popularity                 False
release_date               False
revenue                    False
runtime                    False
status                     False
tagline                    False
title                      False
vote_average               False
vote_count                 False
genres_ok                  False
spoken_languages_ok        False
production_countries       False
belong_to_collection       False
production_companies_ok    False
release_year               False
return                     False
dtype: bool

In [20]:
votadas_df.to_csv('votadas_df.csv', index=False)

In [10]:
peliculas_pais("United States")

{'pais': 'United States', 'cantidad': 4043}

In [11]:
# Función para obtener el revenue total y la cantidad de películas de una productora específica

def productoras_exitosas(productora: str):
    '''Se ingresa una productora, entregando el revenue total y la cantidad de películas que realizó.'''
    try:
        productora_data = votadas_df[votadas_df['production_companies_ok'].str.contains(productora, case=False)]
        if productora_data.empty:
            return {'error': 'Productora no encontrada'}
        
        revenue_total = productora_data['revenue'].sum()
        cantidad_peliculas = productora_data.shape[0]
        
        return {
            'productora': productora,
            'revenue_total': revenue_total,
            'cantidad_peliculas': cantidad_peliculas
        }
    except Exception as e:
        return {'error': 'Ocurrió un error al procesar la solicitud', 'detalle': str(e)}


In [12]:
productoras_exitosas("Pixar Animation Studios")

{'productora': 'Pixar Animation Studios',
 'revenue_total': 11188533734.0,
 'cantidad_peliculas': 36}