# Ejercicio Formativo 2 Capítulo 1

20 de Marzo 2025

Juan Pablo Tapia

jp.tapia@uc.cl

## Descripción de los datos

In [37]:
import json
with open('movies.json', encoding = 'utf8') as movies_file:
  movies = json.load(movies_file)

In [38]:
print(f"El tipo de movies es {type(movies)}")
print(f"Movies tiene {len(movies)} elementos")
print(f"El primer elemento de movies es {movies[0]}")
print(f"El primer elemento es del tipo {type(movies[0])}")

El tipo de movies es <class 'list'>
Movies tiene 28795 elementos
El primer elemento de movies es {'title': 'After Dark in Central Park', 'year': 1900, 'cast': [], 'genres': []}
El primer elemento es del tipo <class 'dict'>


## Misión 1: modelación de entidades

In [39]:
class Actor:
    def __init__(self, full_name, start_career):
        self.full_name = full_name
        self.n_movies = 0
        self.start_career = start_career
        self.end_career = start_career

    def update_track_record(self, year):
        if self.start_career > year:
            self.start_career = year
        if self.end_career < year:
            self.end_career = year

    def years_track_record(self):
        return self.end_career - self.start_career

    def __repr__(self):
        return f"{self.full_name}"

class Genre:
    def __init__(self, name):
        self.name = name
        self.n_movies = 0

    def __repr__(self):
        return f"{self.name}"

class Movie:
    def __init__(self, title, year, cast, genres):
        self.title = title
        self.year = year
        self.cast = cast
        self.genres = genres
        self.add_info()

    def add_info(self):
        for actor in self.cast:
            actor.n_movies += 1
        for genre in self.genres:
            genre.n_movies += 1

    def __repr__(self):
        return f"{self.title} ({self.year}) - {self.cast} - {self.genres}"

## Misión 2: carga de datos

In [40]:
actors_dict = {}
genres_dict = {}
movies_dict = {}

for movie in movies:
    cast = []
    genres = []
    for actor in movie["cast"]:
        if actor not in actors_dict:
            actors_dict[actor] = Actor(actor, movie["year"])
        else:
            actors_dict[actor].update_track_record(movie["year"])
        cast.append(actors_dict[actor])
    for genre in movie["genres"]:
        if genre not in genres_dict:
            genres_dict[genre] = Genre(genre)
        genres.append(genres_dict[genre])
    if (movie["title"], movie["year"],tuple(cast)) not in movies_dict:
        movies_dict[(movie["title"], movie["year"], tuple(cast))] = Movie(movie["title"], movie["year"], tuple(cast), genres)
    else:
        print("*"*80)
        print(f"Película duplicada: {movie['title']} - ({movie['year']}) - {tuple(cast)} - {genres}")
        movie_found = movies_dict[(movie["title"], movie["year"], tuple(cast))]
        print(f"En el diccionario ya está: {movie_found}")
        print("*"*80)

********************************************************************************
Película duplicada: The Prince and Betty - (1919) - (William Desmond, Mary Thurman) - [Comedy]
En el diccionario ya está: The Prince and Betty (1919) - (William Desmond, Mary Thurman) - [Comedy]
********************************************************************************
********************************************************************************
Película duplicada: The Virtuous Thief - (1919) - (Enid Bennett, Niles Welch) - [Drama]
En el diccionario ya está: The Virtuous Thief (1919) - (Enid Bennett, Niles Welch) - [Drama]
********************************************************************************
********************************************************************************
Película duplicada: The Wise Kid - (1922) - (Gladys Walton, David Butler) - [Comedy]
En el diccionario ya está: The Wise Kid (1922) - (Gladys Walton, David Butler) - [Comedy]
********************************************

## Misión 3: Consultas sobre los datos

### Encuentra los 5 géneros más populares

In [41]:
def popular_genres(genres_dict):
    sorted_list_genres = sorted(genres_dict.values(), key=lambda x: x.n_movies, reverse=True)
    most_popular_genres = sorted_list_genres[:5]
    print("Los 5 géneros más populares son:")
    for genre in most_popular_genres:
        print(f"{genre.name} hay {genre.n_movies} películas de este género")
popular_genres(genres_dict)

Los 5 géneros más populares son:
Drama hay 8742 películas de este género
Comedy hay 7361 películas de este género
Western hay 3011 películas de este género
Crime hay 1499 películas de este género
Horror hay 1166 películas de este género


### Encuentra los 3 años con más películas estrenadas

In [42]:
def years_most_premiers(movies_dict):
    premiers_dict = {}
    for movie in movies_dict.values():
        if movie.year not in premiers_dict:
            premiers_dict[movie.year] = 0
        premiers_dict[movie.year] += 1
    sorted_list_years = sorted(premiers_dict.items(), key=lambda x: x[1], reverse=True)
    list_years = sorted_list_years[:3]
    print("Los 3 años con más películas estrenadas son:")
    for data in list_years:
        print(f"El año {data[0]} con {data[1]} películas producidas")
years_most_premiers(movies_dict)

Los 3 años con más películas estrenadas son:
El año 1919 con 632 películas producidas
El año 1925 con 572 películas producidas
El año 1936 con 504 películas producidas


### Encuentra los 5 actores con la trayectoria más larga

In [43]:
def longer_track_record(actors_dict):
    sorted_list_actors = sorted(actors_dict.values(), key=lambda x: x.years_track_record(), reverse=True)
    list_actors = sorted_list_actors[:5]
    print("Los 5 actores con trayectoria más larga son:")
    for actor in list_actors:
        print(f"{actor.full_name} con {actor.years_track_record()} años de trayectoria")
longer_track_record(actors_dict)

Los 5 actores con trayectoria más larga son:
. con 101 años de trayectoria
and con 98 años de trayectoria
Harrison Ford con 98 años de trayectoria
Gloria Stuart con 80 años de trayectoria
Lillian Gish con 75 años de trayectoria


### Encuentra el reparto que más se ha repetido en otras películas

In [45]:
def most_repeated_casts(movies_dict):
    cast_dict = {}
    for movie in movies_dict.values():
        if len(movie.cast) >= 2:
            if movie.cast not in cast_dict:
                cast_dict[movie.cast] = 0
            cast_dict[movie.cast] += 1
        else:
            continue
    max_value = max(cast_dict.items(), key=lambda x: x[1])
    print(f"El reparto de una película que más se ha repetido es {max_value[0]} con {max_value[1]} repeticiones")

most_repeated_casts(movies_dict)

El reparto de una película que más se ha repetido es (Harold Lloyd, Bebe Daniels) con 44 repeticiones
