# Examen: Construyendo el Sistema de Recomendación de PythonFlix

*Contexto*: Eres parte del equipo de ingeniería de PythonFlix, una plataforma de streaming que necesita construir y mejorar su sistema de recomendación. Vas a trabajar con estructuras de datos como listas, tuplas, diccionarios y sets para procesar ratings, historiales y perfiles de usuario.


1. Catálogo de contenido (Listas y tuplas)
Tienes una tupla inmutable con las series más vistas:

```
catalogo_popular = ("Breaking Python", "Data Science 101", "Machine Love", "Debug Wars")
```

Convierte esta tupla en una lista y realiza lo siguiente:

●	Agrega una nueva serie: "Neural Networks"

●	Reemplaza "Debug Wars" por "AI Rebellion"

●	Ordena la lista alfabéticamente


In [None]:
catalogo_popular = ("Breaking Python", "Data Science 101", "Machine Love", "Debug Wars")

# To list

catalogo_popular_list = list(catalogo_popular)

# adding new series

catalogo_popular_list.append("Neural Networks")

# replace Debug Wars for AI Rebelion

catalogo_popular_list[3] = "AI Rebelion"

# order the list alphabetical order

ordered_list = sorted(catalogo_popular_list)

# print the list

print(f"Previous list: {catalogo_popular_list}")
print(f"Ordered list: {ordered_list}")

Previous list: ['Breaking Python', 'Data Science 101', 'Machine Love', 'AI Rebelion', 'Neural Networks']
Ordered list: ['AI Rebelion', 'Breaking Python', 'Data Science 101', 'Machine Love', 'Neural Networks']


2. Filtrado de géneros (Slicing)
Tienes una lista con los géneros disponibles:

```
generos = ["Drama", "Comedia", "Acción", "Sci-Fi", "Documental", "Terror", "Romance"]
```

Realiza:

●	Un slicing que obtenga los géneros del medio

●	Un slicing que obtenga los tres primeros géneros

●	Los géneros ordenados en orden inverso (usando slicing)


In [17]:
generos = ["Drama", "Comedia", "Acción", "Sci-Fi", "Documental", "Terror", "Romance"]


# Get the genders of the middle

## get one if len is odd
## get two if len is even

middle = generos[len(generos) // 2] if len(generos) % 2 == 1 else generos[len(generos) // 2 - 1:len(generos) // 2 + 1]

print(f"{middle}")

# Get the first 3

first_three = generos[:3]
print(f"{first_three}")

# Order in reverse

print(f"{generos[::-1]}")


Sci-Fi
['Drama', 'Comedia', 'Acción']
['Romance', 'Terror', 'Documental', 'Sci-Fi', 'Acción', 'Comedia', 'Drama']


3. Puntajes de usuarios (Listas por comprensión)
Tienes una lista de ratings otorgados por un usuario a distintas series:

```
ratings = [4.5, 3.0, 5.0, 2.5, 4.0, 1.5]
```

Con listas por comprensión, crea:

●	Una lista con solo los ratings mayores a 3.5

●	Una lista con los ratings convertidos a una escala del 1 al 100

●	Una lista de strings que diga "Alta" si rating > 4, "Media" si entre 3 y 4, "Baja" si menor


In [None]:
ratings = [4.5, 3.0, 5.0, 2.5, 4.0, 1.5]

# list with ratings bigger that 3.5

ratings_bigger_than_3_5 = [rating for rating in ratings if rating > 3.5]
print(f"Ratings bigger than 3.5: {ratings_bigger_than_3_5}")

# list with ratings converted to 1 to 100 scale

old_min, old_max = 1, 5      
new_min, new_max = 1, 100 

# relative position * length of new range + new min (1 in this case to have 1 as minimum)

scaled = [((r - old_min) / (old_max - old_min)) * (new_max - new_min) + new_min for r in ratings]

print(f"Scaled ratings: {scaled}")

# List with Aalta, Media and Baja

categorical_rating = ["Alta" if rating > 4 else "Media" if rating >= 3.0 and rating < 4 else "Baja" for rating in ratings]
print(f"Categorical rating: {categorical_rating}")



Ratings bigger than 3.5: [4.5, 5.0, 4.0]
Scaled ratings: [87.625, 50.5, 100.0, 38.125, 75.25, 13.375]
Categorical rating: ['Alta', 'Media', 'Alta', 'Baja', 'Baja', 'Baja']


4. Historial de visualización (Diccionarios)
Tienes un diccionario que representa el historial de un usuario:

```
historial = {
  "Breaking Python": 3,
  "Machine Love": 5,
  "Data Science 101": 2
}
```

Realiza lo siguiente:

●	Aumenta en 1 la cantidad de veces que vio "Data Science 101"

●	Añade la serie "AI Rebellion" con 1 visualización

●	Elimina "Machine Love" del historial

●	Muestra todas las series que el usuario vio más de 2 veces


In [30]:
historial = {
  "Breaking Python": 3,
  "Machine Love": 5,
  "Data Science 101": 2
}

# augment in 1 the times we see Data Science 101

historial["Data Science 101"] += 1
print(f"Data Science 101: {historial['Data Science 101']} times")

# add a new serie to the history

historial.setdefault("AI Rebelion", 1)
print(f"AI Rebelion: {historial['AI Rebelion']} times")

# remove Machine Love from the history

del historial["Machine Love"]
print(f"Machine Love: {historial.get('Machine Love', 'No data')} times")

# Show all the series that the user saw more than 2 times

most_saw_series = [serie for serie, times in historial.items() if times > 2]
print(f"Most saw series: {most_saw_series}")



Data Science 101: 3 times
AI Rebelion: 1 times
Machine Love: No data times
Most saw series: ['Breaking Python', 'Data Science 101']


5. Usuarios únicos por serie (Sets)
Tienes la siguiente información:

```
usuarios_serie_A = {"ana", "luis", "pedro", "maria"}
usuarios_serie_B = {"maria", "pedro", "carla", "lucas"}
```

Usando sets:

●	Encuentra qué usuarios vieron ambas series

●	Qué usuarios vieron solo la serie A

●	Qué usuarios únicos vieron al menos una de las dos


In [38]:
usuarios_serie_A = {"ana", "luis", "pedro", "maria"}
usuarios_serie_B = {"maria", "pedro", "carla", "lucas"}

# find users that saw both series

both_series = usuarios_serie_A.intersection(usuarios_serie_B) 
print(f"Users that saw both series: {both_series}")

# which users only saw A

only_A = usuarios_serie_A - usuarios_serie_B
print(f"Users that only saw A: {only_A}")

# which users saw at least one of the two series

at_least_one = usuarios_serie_A.union(usuarios_serie_B)
print(f"Users that saw at least one of the two series: {at_least_one}")


Users that saw both series: {'maria', 'pedro'}
Users that only saw A: {'ana', 'luis'}
Users that saw at least one of the two series: {'ana', 'luis', 'maria', 'pedro', 'lucas', 'carla'}


6. Recomendaciones compartidas (Diccionario + Sets)
Tienes una estructura con recomendaciones por usuario:

```
recomendaciones = {
  "ana": {"Machine Love", "AI Rebellion"},
  "luis": {"AI Rebellion", "Debug Wars"},
  "pedro": {"Debug Wars", "Machine Love"}
}
``` 

Encuentra con código:

●	Las series que fueron recomendadas a todos

●	Las series recomendadas a al menos dos personas

●	Las series recomendadas solo a una persona


In [64]:
recomendaciones = {
  "ana": {"Machine Love", "AI Rebellion"},
  "luis": {"AI Rebellion", "Debug Wars"},
  "pedro": {"Debug Wars", "Machine Love"}
}

# recommended series to all

all_recommendations = [item for series in recomendaciones.values() for item in series]

print(f"All recommendations: {all_recommendations}")

# recommended series to at least two users

unique_values = set(all_recommendations)

## Create a counts dictionary

recomendations_count = {item: all_recommendations.count(item) for item in unique_values}

## Get the ones that have at least 2 counts

recommended_to_two = {item for item, count in recomendations_count.items() if count >= 2}
print(f"Recommended series to at least two users: {recommended_to_two}")


# recommended series to a single user

one_user = {item for series in recomendaciones.values() for item in series}
print(f"Recommended series to a single user: {one_user}")


All recommendations: ['AI Rebellion', 'Machine Love', 'Debug Wars', 'AI Rebellion', 'Debug Wars', 'Machine Love']
Recommended series to at least two users: {'AI Rebellion', 'Debug Wars', 'Machine Love'}
Recommended series to a single user: {'Debug Wars', 'AI Rebellion', 'Machine Love'}


7. Transformar ratings (Tuplas + comprensión de diccionario)
Tienes una lista de tuplas con (serie, rating):

```
puntuaciones = [("Breaking Python", 4.0), ("AI Rebellion", 5.0), ("Debug Wars", 2.0)]
```

Crea un diccionario en el formato:

```
{
  "Breaking Python": "Buena",
  "AI Rebellion": "Excelente",
  "Debug Wars": "Regular"
}
```

Regla:

●	Rating >= 4.5 → "Excelente"

●	3 <= rating < 4.5 → "Buena"

●	< 3 → "Regular"


In [67]:
puntuaciones = [("Breaking Python", 4.0), ("AI Rebellion", 5.0), ("Debug Wars", 2.0)]

# Dict comprehension

puntuaciones_dict = {serie: rating for serie, rating in puntuaciones}
print(f"Ratings dictionary: {puntuaciones_dict}")

# New categorized dict

puntuaciones_categorized = {serie: "Alta" if rating >= 4.5 else "Media" if rating >= 3.0 and rating < 4.5 else "Baja" for serie, rating in puntuaciones}
print(f"Categorized ratings: {puntuaciones_categorized}")



Ratings dictionary: {'Breaking Python': 4.0, 'AI Rebellion': 5.0, 'Debug Wars': 2.0}
Categorized ratings: {'Breaking Python': 'Media', 'AI Rebellion': 'Alta', 'Debug Wars': 'Baja'}


8. Usuarios y géneros favoritos (Diccionario + slicing)
Cada usuario tiene una lista de sus géneros preferidos (ordenados por preferencia):

``` 
gustos = {
  "ana": ["Sci-Fi", "Drama", "Documental"],
  "luis": ["Comedia", "Acción", "Sci-Fi"],
  "pedro": ["Drama", "Sci-Fi", "Romance"]
}
```

Realiza:

●	Una lista con el primer género favorito de cada usuario

●	Una lista con todos los géneros mencionados sin repeticiones

●	¿Cuál género aparece más veces en la primera posición?


In [90]:
gustos = {
  "ana": ["Sci-Fi", "Drama", "Documental"],
  "luis": ["Comedia", "Acción", "Sci-Fi"],
  "pedro": ["Drama", "Sci-Fi", "Romance"]
}

# A list with the first gender for each user

first_gender_list = [gustos[user][0] for user in gustos]
print(f"First user gender list: {first_gender_list}")


# A list with all the mentioned genders

all_genders = list(values for key, values in gustos.items())

## A trick from itertools 

from itertools import chain

all_genders_unnested = list(set(list(chain.from_iterable(all_genders))))
print(f"All genders: {all_genders_unnested}")

# Which gender appears the most on the first position

unique_values = set(first_gender_list)

count_dict =  {item: first_gender_list.count(item) for item in unique_values}

print(f"All appears one time: {count_dict}")



First user gender list: ['Sci-Fi', 'Comedia', 'Drama']
All genders: ['Sci-Fi', 'Documental', 'Romance', 'Comedia', 'Acción', 'Drama']
All appears one time: {'Sci-Fi': 1, 'Drama': 1, 'Comedia': 1}


9. Resumen de votos por serie (Diccionario + listas)
Tienes una lista de votos como pares (serie, puntaje):

```
votos = [("Breaking Python", 5), ("AI Rebellion", 4), ("Breaking Python", 4), ("Debug Wars", 3), ("AI Rebellion", 5)]
```

Crea un diccionario donde la clave sea la serie y el valor una lista con todos sus votos. Ejemplo:
{
  "Breaking Python": [5, 4],
  ...
}

Luego, calcula el promedio de rating de cada serie.


In [92]:
votos = [("Breaking Python", 5), ("AI Rebellion", 4), ("Breaking Python", 4), ("Debug Wars", 3), ("AI Rebellion", 5)]

# Create a dictionary with the average rating for each series
from collections import defaultdict

ratings_dict = defaultdict(list)
for serie, rating in votos:
    ratings_dict[serie].append(rating)

    
average_ratings = {
    serie: sum(ratings) / len(ratings) 
    for serie, ratings in ratings_dict.items()
}

print(f"Average ratings: {average_ratings}")

Average ratings: {'Breaking Python': 4.5, 'AI Rebellion': 4.5, 'Debug Wars': 3.0}


10. Motor básico de recomendaciones (Integrador)
Define una función recomendar_series(usuario, historial, catalogo) que:

●	Reciba el nombre de usuario, su historial en forma de diccionario {serie: vistas} y un catálogo con todas las series disponibles.

●	Devuelva una lista de series del catálogo que no haya visto aún.

Ejemplo:

```
usuario = "ana"
historial = {"AI Rebellion": 3, "Debug Wars": 1}
catalogo = ["AI Rebellion", "Debug Wars", "Machine Love", "Data Science 101"]
```

Resultado:
["Machine Love", "Data Science 101"]


In [93]:
usuario = "ana"
historial = {"AI Rebellion": 3, "Debug Wars": 1}
catalogo = ["AI Rebellion", "Debug Wars", "Machine Love", "Data Science 101"]


# Check if the user has seen all the series in the catalog

def recomedar_series(usuario, historial, catalogo):
    
    user_seen = set(historial.keys())
    catalogo_set = set(catalogo)

    not_seen = catalogo_set - user_seen

    if not_seen:
        print(f"{usuario} has not seen: {', '.join(not_seen)}")
    else:
        print(f"{usuario} has seen all the series in the catalog")

recomedar_series(usuario, historial, catalogo)

ana has not seen: Data Science 101, Machine Love
