<a href="https://colab.research.google.com/github/davidlealo/sistema-recomendacion/blob/main/recomendacion_genero_por_artista.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Recomendación de género a través de artistas

Sistema que busca identificar un género o grupo de estilos musicales para un usuario a través de una aplicación aque correrá en Google Colab o soluciones similares

### Instalar librerias

In [2]:
!pip install scikit-surprise

Collecting scikit-surprise
  Downloading scikit_surprise-1.1.4.tar.gz (154 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m154.4/154.4 kB[0m [31m1.0 MB/s[0m eta [36m0:00:00[0m
[?25h  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
Building wheels for collected packages: scikit-surprise
  Building wheel for scikit-surprise (pyproject.toml) ... [?25l[?25hdone
  Created wheel for scikit-surprise: filename=scikit_surprise-1.1.4-cp310-cp310-linux_x86_64.whl size=2357276 sha256=84528274db37ffbdfa47e92c89782cc1374a4afa720c5bcc0693d6c0a69bf1a5
  Stored in directory: /root/.cache/pip/wheels/4b/3f/df/6acbf0a40397d9bf3ff97f582cc22fb9ce66adde75bc71fd54
Successfully built scikit-surprise
Installing collected packages: scikit-surprise
Successfully installed scikit-surprise-1.1.4


### Recuperar datos

In [3]:
import os
import zipfile
import requests
import pandas as pd
from surprise import Dataset, Reader

# URL del dataset
url = "https://files.grouplens.org/datasets/hetrec2011/hetrec2011-lastfm-2k.zip"
zip_file = "hetrec2011-lastfm-2k.zip"
extract_dir = "hetrec2011-lastfm-2k"

# Descargar el dataset
if not os.path.exists(zip_file):
    print("Descargando dataset...")
    response = requests.get(url)
    with open(zip_file, 'wb') as f:
        f.write(response.content)
    print("Descarga completa.")

# Descomprimir el dataset
if not os.path.exists(extract_dir):
    print("Descomprimiendo dataset...")
    with zipfile.ZipFile(zip_file, 'r') as zip_ref:
        zip_ref.extractall(extract_dir)
    print("Descompresión completa.")

Descargando dataset...
Descarga completa.
Descomprimiendo dataset...
Descompresión completa.


### Cargar cada archivo en un dataframe

In [4]:
# user_artists.dat - Relación entre usuarios y artistas
user_artists_path = os.path.join(extract_dir, 'user_artists.dat')
df_user_artists = pd.read_csv(user_artists_path, sep='\t')
print("Datos de user_artists:")
print(df_user_artists.head())

# artists.dat - Información sobre los artistas
artists_path = os.path.join(extract_dir, 'artists.dat')
df_artists = pd.read_csv(artists_path, sep='\t')
print("Datos de artists:")
print(df_artists.head())

# tags.dat - Información sobre las etiquetas
# Cargar el archivo tags.dat usando una codificación alternativa
tags_path = os.path.join(extract_dir, 'tags.dat')
try:
    df_tags = pd.read_csv(tags_path, sep='\t', encoding='latin1')  # Cambiar la codificación a latin1
    print("Datos de tags:")
    print(df_tags.head())
except UnicodeDecodeError as e:
    print(f"Error de decodificación: {e}")


# user_friends.dat - Relación de amistad entre usuarios
user_friends_path = os.path.join(extract_dir, 'user_friends.dat')
df_user_friends = pd.read_csv(user_friends_path, sep='\t')
print("Datos de user_friends:")
print(df_user_friends.head())

# user_taggedartists-timestamps.dat - Etiquetas de los usuarios a los artistas con marcas de tiempo
user_taggedartists_timestamps_path = os.path.join(extract_dir, 'user_taggedartists-timestamps.dat')
df_user_taggedartists_timestamps = pd.read_csv(user_taggedartists_timestamps_path, sep='\t')
print("Datos de user_taggedartists_timestamps:")
print(df_user_taggedartists_timestamps.head())

# user_taggedartists.dat - Etiquetas de los usuarios a los artistas
user_taggedartists_path = os.path.join(extract_dir, 'user_taggedartists.dat')
df_user_taggedartists = pd.read_csv(user_taggedartists_path, sep='\t')
print("Datos de user_taggedartists:")
print(df_user_taggedartists.head())

# Preparar los datos para Surprise (usaremos user_artists.dat para recomendaciones)

reader = Reader(rating_scale=(df_user_artists['weight'].min(), df_user_artists['weight'].max()))
data = Dataset.load_from_df(df_user_artists[['userID', 'artistID', 'weight']], reader)

Datos de user_artists:
   userID  artistID  weight
0       2        51   13883
1       2        52   11690
2       2        53   11351
3       2        54   10300
4       2        55    8983
Datos de artists:
   id               name                                         url  \
0   1       MALICE MIZER       http://www.last.fm/music/MALICE+MIZER   
1   2    Diary of Dreams    http://www.last.fm/music/Diary+of+Dreams   
2   3  Carpathian Forest  http://www.last.fm/music/Carpathian+Forest   
3   4       Moi dix Mois       http://www.last.fm/music/Moi+dix+Mois   
4   5        Bella Morte        http://www.last.fm/music/Bella+Morte   

                                          pictureURL  
0    http://userserve-ak.last.fm/serve/252/10808.jpg  
1  http://userserve-ak.last.fm/serve/252/3052066.jpg  
2  http://userserve-ak.last.fm/serve/252/40222717...  
3  http://userserve-ak.last.fm/serve/252/54697835...  
4  http://userserve-ak.last.fm/serve/252/14789013...  
Datos de tags:
   tagID     

In [5]:
from surprise import SVD, KNNBasic
from surprise.model_selection import train_test_split, cross_validate

# Crear un set de entrenamiento y prueba
trainset, testset = train_test_split(data, test_size=0.25)

# Usar SVD para el modelo de recomendación
algo = SVD()

# Entrenar el modelo
algo.fit(trainset)

# Evaluar el modelo
predictions = algo.test(testset)

### Entrenamiento y evaluación utilizando Surprise

In [6]:
from surprise import Dataset, Reader, SVD, KNNBasic
from surprise.model_selection import train_test_split, cross_validate

# Preparación de los datos para Surprise
reader = Reader(rating_scale=(df_user_artists['weight'].min(), df_user_artists['weight'].max()))
data = Dataset.load_from_df(df_user_artists[['userID', 'artistID', 'weight']], reader)

# Dividir el conjunto de datos en entrenamiento y prueba
trainset, testset = train_test_split(data, test_size=0.25)

# Usar el algoritmo SVD para crear el modelo de recomendación
modelo_svd = SVD()

# Entrenar el modelo SVD
modelo_svd.fit(trainset)

# Evaluar el modelo SVD
predictions_svd = modelo_svd.test(testset)

# Mostrar algunas predicciones SVD
print("\nAlgunas predicciones SVD:")
for prediction in predictions_svd[:5]:
    print(prediction)

# Usar el algoritmo KNNBasic para crear el modelo de recomendación
modelo_knn = KNNBasic()

# Entrenar el modelo KNNBasic
modelo_knn.fit(trainset)

# Evaluar el modelo KNNBasic
predictions_knn = modelo_knn.test(testset)

# Mostrar algunas predicciones KNNBasic
print("\nAlgunas predicciones KNNBasic:")
for prediction in predictions_knn[:5]:
    print(prediction)

# Evaluar el rendimiento de ambos modelos usando validación cruzada
print("\nEvaluación usando validación cruzada:")
cross_validate(modelo_svd, data, measures=['RMSE', 'MAE'], cv=5, verbose=True)
cross_validate(modelo_knn, data, measures=['RMSE', 'MAE'], cv=5, verbose=True)


Algunas predicciones SVD:
user: 1614       item: 3200       r_ui = 851.00   est = 352698.00   {'was_impossible': False}
user: 334        item: 3467       r_ui = 656.00   est = 352698.00   {'was_impossible': False}
user: 842        item: 1613       r_ui = 211.00   est = 352698.00   {'was_impossible': False}
user: 1952       item: 417        r_ui = 198.00   est = 352698.00   {'was_impossible': False}
user: 1108       item: 12360      r_ui = 106.00   est = 352698.00   {'was_impossible': False}
Computing the msd similarity matrix...
Done computing similarity matrix.

Algunas predicciones KNNBasic:
user: 1614       item: 3200       r_ui = 851.00   est = 242.82   {'actual_k': 40, 'was_impossible': False}
user: 334        item: 3467       r_ui = 656.00   est = 176.29   {'actual_k': 3, 'was_impossible': False}
user: 842        item: 1613       r_ui = 211.00   est = 694.71   {'actual_k': 20, 'was_impossible': False}
user: 1952       item: 417        r_ui = 198.00   est = 732.45   {'was_impossi

{'test_rmse': array([3052.50264999, 4382.33275007, 4535.08046407, 5370.9125418 ,
        4546.94875751]),
 'test_mae': array([728.38149886, 780.09948299, 774.40759619, 812.4440421 ,
        809.15973089]),
 'fit_time': (0.3776543140411377,
  0.4290144443511963,
  0.4625542163848877,
  0.46065807342529297,
  0.4421422481536865),
 'test_time': (2.8351075649261475,
  1.9222657680511475,
  1.9478178024291992,
  1.9879100322723389,
  2.6771671772003174)}

### Predicciones

In [7]:
# Realizar una predicción para un usuario específico y un artista específico usando el modelo SVD
user_id = 2  # ID del usuario
artist_id = 51  # ID del artista

# Hacer la predicción con el modelo SVD
pred_svd = modelo_svd.predict(user_id, artist_id)
print(f"Predicción SVD para el usuario {user_id} y el artista {artist_id}: {pred_svd.est}")

# Hacer la predicción con el modelo KNNBasic
pred_knn = modelo_knn.predict(user_id, artist_id)
print(f"Predicción KNNBasic para el usuario {user_id} y el artista {artist_id}: {pred_knn.est}")

Predicción SVD para el usuario 2 y el artista 51: 352698
Predicción KNNBasic para el usuario 2 y el artista 51: 4070.209266409252


### Recomendaciones para usuarios y artistas definidos por el programa de prueba

In [9]:
# Obtener todos los artistID únicos desde el DataFrame de artistas
all_artist_ids = df_artists['id'].unique()

# Obtener el ID del usuario para el cual deseas hacer la recomendación (puedes cambiar el ID)
user_id = 2  # Cambia esto por el ID del usuario que te interesa

# Predecir para todos los artistas que el usuario no ha escuchado
predictions = []
for artist_id in all_artist_ids:
    if artist_id not in df_user_artists[df_user_artists['userID'] == user_id]['artistID'].values:
        # Hacer la predicción con el modelo
        pred = modelo_svd.predict(user_id, artist_id)
        predictions.append((artist_id, pred.est))

# Ordenar las predicciones de mayor a menor
predictions.sort(key=lambda x: x[1], reverse=True)

# Mostrar las 5 mejores recomendaciones de artistas junto con su nombre y estilos de música
print("\nTop 5 recomendaciones de artistas para el usuario:")
for artist_id, rating in predictions[:5]:
    # Obtener el nombre del artista
    artist_name = df_artists[df_artists['id'] == artist_id]['name'].values[0]
    # Obtener los estilos de música del artista
    #artist_tags = artist_styles.get(artist_id, "No disponible")

    #print(f"Artista: {artist_name}, Predicción de rating: {rating}, Estilos: {artist_tags}")



Top 5 recomendaciones de artistas para el usuario:


## Aplicación

### Versión 1

In [10]:
import random
from IPython.display import Javascript, display
from google.colab.output import eval_js
import pandas as pd
import numpy as np
from surprise import Dataset, Reader, SVD

# Normalizar 'weight' a una escala de 1 a 5
min_weight = df_user_artists['weight'].min()
max_weight = df_user_artists['weight'].max()

df_user_artists['rating'] = 1 + 4 * (df_user_artists['weight'] - min_weight) / (max_weight - min_weight)

# Convertir el DataFrame en el formato esperado por Surprise
reader = Reader(rating_scale=(1, 5))
data = Dataset.load_from_df(df_user_artists[['userID', 'artistID', 'rating']], reader)

# Entrenar el modelo con Surprise
trainset = data.build_full_trainset()
modelo_svd = SVD()
modelo_svd.fit(trainset)

# Función para obtener recomendaciones basadas en predicciones
def get_top_artists_for_user(user_id, last_liked_artist_id=None, n=5):
    # Obtener todos los artistas que el usuario no ha escuchado
    unheard_artists = set(df_artists['id']) - set(df_user_artists[df_user_artists['userID'] == user_id]['artistID'])

    # Predecir ratings para estos artistas usando el modelo de Surprise
    predictions = [(artist_id, modelo_svd.predict(user_id, artist_id).est) for artist_id in unheard_artists]

    # Si hay un artista que le gustó, filtrar por similitud
    if last_liked_artist_id is not None:
        # Filtrar los artistas que tengan un score más cercano al último artista que le gustó
        similar_artists = [(artist_id, score) for artist_id, score in predictions if abs(score - modelo_svd.predict(user_id, last_liked_artist_id).est) < 0.1]
        predictions = similar_artists if similar_artists else predictions  # Si no hay similares, usar todos

    # Ordenar por rating predicho y devolver los top n
    return sorted(predictions, key=lambda x: x[1], reverse=True)[:n]

# Inicializar lista de artistas recomendados para un usuario aleatorio
def inicializar_recomendaciones():
    global user_id, recommended_artists, current_index, last_liked_artist_id
    user_id = random.choice(df_user_artists['userID'].unique())  # Seleccionar un usuario al azar
    recommended_artists = get_top_artists_for_user(user_id)
    current_index = 0
    last_liked_artist_id = None  # Reiniciar el último artista que le gustó

inicializar_recomendaciones()  # Generar la primera recomendación

liked_artists = []  # Lista para almacenar artistas que le gustan
like_count = 0  # Contador de "me gusta"

def create_buttons(artist_name):
    artist_name_escaped = artist_name.replace("'", "\\'").replace('"', '\\"')  # Escapar caracteres
    display(Javascript(f'''
        var div = document.createElement('div');
        var btn1 = document.createElement('button');
        btn1.innerHTML = 'Me gusta: {artist_name_escaped}';
        btn1.onclick = function() {{
          google.colab.kernel.invokeFunction('notebook.callback', ['Me gusta', '{artist_name_escaped}'], {{}});
        }};

        var btn2 = document.createElement('button');
        btn2.innerHTML = 'No me gusta: {artist_name_escaped}';
        btn2.onclick = function() {{
          google.colab.kernel.invokeFunction('notebook.callback', ['No me gusta', '{artist_name_escaped}'], {{}});
        }};

        div.appendChild(btn1);
        div.appendChild(btn2);
        document.body.appendChild(div);
    '''))

def handle_choice(choice, artist_name):
    global user_id, recommended_artists, current_index, last_liked_artist_id, liked_artists, like_count

    print(f'Has elegido: {choice} para {artist_name}')

    if choice == 'Me gusta':
        last_liked_artist_id = df_artists[df_artists['name'] == artist_name]['id'].values[0]  # Guardar el último artista que le gustó
        liked_artists.append(artist_name)  # Agregar el artista a la lista de artistas que le gustan
        like_count += 1  # Incrementar el contador de "me gusta"

        # Verificar si ha alcanzado 6 "me gusta"
        if like_count >= 6:
            print("Te gustan los siguientes artistas:")
            for artist in liked_artists:
                print(artist)
            return  # Termina el programa

        current_index += 1
        if current_index < len(recommended_artists):
            next_artist_id, next_score = recommended_artists[current_index]
            next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
            print(f"Artista recomendado: {next_artist_name}, score: {next_score}")
            create_buttons(next_artist_name)
        else:
            print("No hay más artistas en la lista de recomendaciones. Seleccionando un nuevo usuario.")
            inicializar_recomendaciones()
            next_artist_id, next_score = recommended_artists[current_index]
            next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
            print(f"Nuevo usuario seleccionado. Artista recomendado: {next_artist_name}, score: {next_score}")
            create_buttons(next_artist_name)
    else:
        # Seleccionar un nuevo artista si elige 'No me gusta'
        unheard_artists = set(df_artists['id']) - set(df_user_artists[df_user_artists['userID'] == user_id]['artistID'])
        next_artist_id = random.choice(list(unheard_artists))
        next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
        next_score = modelo_svd.predict(user_id, next_artist_id).est
        print(f"Nuevo artista recomendado: {next_artist_name}, score: {next_score}")
        create_buttons(next_artist_name)

# Registrar la función en Google Colab
from google.colab import output
output.register_callback('notebook.callback', handle_choice)

# Mostrar el primer artista recomendado
first_artist_id, first_score = recommended_artists[current_index]
first_artist_name = df_artists[df_artists['id'] == first_artist_id]['name'].values[0]
print(f"Artista recomendado: {first_artist_name}, score: {first_score}")
create_buttons(first_artist_name)


Artista recomendado: S.I.R. Remixes, score: 1.372215193832603


<IPython.core.display.Javascript object>

Has elegido: No me gusta para S.I.R. Remixes
Nuevo artista recomendado: Riceboy Sleeps, score: 1.0177130009518889


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Riceboy Sleeps
Nuevo artista recomendado: Afro Celt Sound System, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Afro Celt Sound System
Nuevo artista recomendado: Barilari, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Barilari
Nuevo artista recomendado: Espíritu, score: 1.0784590618118353


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Espíritu
Nuevo artista recomendado: Daddy Yankee, score: 1.0046636421626365


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Daddy Yankee
Artista recomendado: Unleashed, score: 1.3591860430075082


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Unleashed
Nuevo artista recomendado: Lycia, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Lycia
Nuevo artista recomendado: Dianna Agron, score: 1.1104133226134276


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Dianna Agron
Nuevo artista recomendado: Uchpa, score: 1.0154186446424405


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Uchpa
Nuevo artista recomendado: William Basinski, score: 1.0366336320497853


<IPython.core.display.Javascript object>

Has elegido: No me gusta para William Basinski
Nuevo artista recomendado: Rick Aziago, score: 1.005207514233679


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Rick Aziago
Nuevo artista recomendado: Woe Is Me, score: 1.154151993412755


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Woe Is Me
Nuevo artista recomendado: O Bando do Velho Jack, score: 1.0351960948693548


<IPython.core.display.Javascript object>

Has elegido: No me gusta para O Bando do Velho Jack
Nuevo artista recomendado: Cellmod, score: 1.0006555089456


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Cellmod
Nuevo artista recomendado: Afrojack ft. Eva Simons, score: 1.196088208405622


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Afrojack ft. Eva Simons
Nuevo artista recomendado: TEX RODGERS, score: 1


<IPython.core.display.Javascript object>

Has elegido: Me gusta para TEX RODGERS
Artista recomendado: Jonny Lang, score: 1.3471393844916342


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Jonny Lang
Artista recomendado: Hightide Hotel, score: 1.3373371403442327


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Hightide Hotel
Artista recomendado: Metamatics, score: 1.331050585743906


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Metamatics
No hay más artistas en la lista de recomendaciones. Seleccionando un nuevo usuario.
Nuevo usuario seleccionado. Artista recomendado: Maeror Tri, score: 1.3040587034116795


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Maeror Tri
Te gustan los siguientes artistas:
Daddy Yankee
TEX RODGERS
Jonny Lang
Hightide Hotel
Metamatics
Maeror Tri
Has elegido: Me gusta para Maeror Tri
Te gustan los siguientes artistas:
Daddy Yankee
TEX RODGERS
Jonny Lang
Hightide Hotel
Metamatics
Maeror Tri
Maeror Tri


### Versión 2

In [11]:
import random
from IPython.display import Javascript, display, HTML
from google.colab.output import eval_js
import pandas as pd
import numpy as np
from surprise import Dataset, Reader, SVD

# Normalizar 'weight' a una escala de 1 a 5
min_weight = df_user_artists['weight'].min()
max_weight = df_user_artists['weight'].max()

df_user_artists['rating'] = 1 + 4 * (df_user_artists['weight'] - min_weight) / (max_weight - min_weight)

# Convertir el DataFrame en el formato esperado por Surprise
reader = Reader(rating_scale=(1, 5))
data = Dataset.load_from_df(df_user_artists[['userID', 'artistID', 'rating']], reader)

# Entrenar el modelo con Surprise
trainset = data.build_full_trainset()
modelo_svd = SVD()
modelo_svd.fit(trainset)

# Función para obtener recomendaciones basadas en predicciones
def get_top_artists_for_user(user_id, last_liked_artist_id=None, n=5):
    # Obtener todos los artistas que el usuario no ha escuchado
    unheard_artists = set(df_artists['id']) - set(df_user_artists[df_user_artists['userID'] == user_id]['artistID'])

    # Predecir ratings para estos artistas usando el modelo de Surprise
    predictions = [(artist_id, modelo_svd.predict(user_id, artist_id).est) for artist_id in unheard_artists]

    # Si hay un artista que le gustó, filtrar por similitud
    if last_liked_artist_id is not None:
        # Filtrar los artistas que tengan un score más cercano al último artista que le gustó
        similar_artists = [(artist_id, score) for artist_id, score in predictions if abs(score - modelo_svd.predict(user_id, last_liked_artist_id).est) < 0.1]
        predictions = similar_artists if similar_artists else predictions  # Si no hay similares, usar todos

    # Ordenar por rating predicho y devolver los top n
    return sorted(predictions, key=lambda x: x[1], reverse=True)[:n]

# Inicializar lista de artistas recomendados para un usuario aleatorio
def inicializar_recomendaciones():
    global user_id, recommended_artists, current_index, last_liked_artist_id
    user_id = random.choice(df_user_artists['userID'].unique())  # Seleccionar un usuario al azar
    recommended_artists = get_top_artists_for_user(user_id)
    current_index = 0
    last_liked_artist_id = None  # Reiniciar el último artista que le gustó

inicializar_recomendaciones()  # Generar la primera recomendación

liked_artists = []  # Lista para almacenar artistas que le gustan
like_count = 0  # Contador de "me gusta"

def create_buttons(artist_name):
    artist_name_escaped = artist_name.replace("'", "\\'").replace('"', '\\"')  # Escapar caracteres
    display(Javascript(f'''
        var div = document.createElement('div');
        var btn1 = document.createElement('button');
        btn1.innerHTML = 'Me gusta: {artist_name_escaped}';
        btn1.onclick = function() {{
          google.colab.kernel.invokeFunction('notebook.callback', ['Me gusta', '{artist_name_escaped}'], {{}});
        }};

        var btn2 = document.createElement('button');
        btn2.innerHTML = 'No me gusta: {artist_name_escaped}';
        btn2.onclick = function() {{
          google.colab.kernel.invokeFunction('notebook.callback', ['No me gusta', '{artist_name_escaped}'], {{}});
        }};

        div.appendChild(btn1);
        div.appendChild(btn2);
        document.body.appendChild(div);
    '''))

def handle_choice(choice, artist_name):
    global user_id, recommended_artists, current_index, last_liked_artist_id, liked_artists, like_count

    print(f'Has elegido: {choice} para {artist_name}')

    if choice == 'Me gusta':
        last_liked_artist_id = df_artists[df_artists['name'] == artist_name]['id'].values[0]  # Guardar el último artista que le gustó
        liked_artists.append(artist_name)  # Agregar el artista a la lista de artistas que le gustan
        like_count += 1  # Incrementar el contador de "me gusta"

        # Verificar si ha alcanzado 6 "me gusta"
        if like_count >= 6:
            # Mostrar mensaje final en rojo
            final_message = "<h2 style='color: red;'>Te gustan los siguientes artistas:</h2><ul>"
            final_message += ''.join(f"<li style='color: red;'>{artist}</li>" for artist in liked_artists)
            final_message += "</ul>"
            display(HTML(final_message))
            return  # Termina el programa

        current_index += 1
        if current_index < len(recommended_artists):
            next_artist_id, next_score = recommended_artists[current_index]
            next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
            print(f"Artista recomendado: {next_artist_name}, score: {next_score}")
            create_buttons(next_artist_name)
        else:
            print("No hay más artistas en la lista de recomendaciones. Seleccionando un nuevo usuario.")
            inicializar_recomendaciones()
            next_artist_id, next_score = recommended_artists[current_index]
            next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
            print(f"Nuevo usuario seleccionado. Artista recomendado: {next_artist_name}, score: {next_score}")
            create_buttons(next_artist_name)
    else:
        # Seleccionar un nuevo artista si elige 'No me gusta'
        unheard_artists = set(df_artists['id']) - set(df_user_artists[df_user_artists['userID'] == user_id]['artistID'])
        next_artist_id = random.choice(list(unheard_artists))
        next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
        next_score = modelo_svd.predict(user_id, next_artist_id).est
        print(f"Nuevo artista recomendado: {next_artist_name}, score: {next_score}")
        create_buttons(next_artist_name)

# Registrar la función en Google Colab
from google.colab import output
output.register_callback('notebook.callback', handle_choice)

# Mostrar el primer artista recomendado
first_artist_id, first_score = recommended_artists[current_index]
first_artist_name = df_artists[df_artists['id'] == first_artist_id]['name'].values[0]
print(f"Artista recomendado: {first_artist_name}, score: {first_score}")
create_buttons(first_artist_name)


Artista recomendado: Мара, score: 1.39184579181805


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Мара
Nuevo artista recomendado: Spok Frevo Orquestra, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Spok Frevo Orquestra
Nuevo artista recomendado: A.D.D., score: 1.0033822506644716


<IPython.core.display.Javascript object>

Has elegido: No me gusta para A.D.D.
Nuevo artista recomendado: Jane Birkin, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Jane Birkin
Nuevo artista recomendado: The Foreshadowing, score: 1.1140145242999016


<IPython.core.display.Javascript object>

Has elegido: No me gusta para The Foreshadowing
Nuevo artista recomendado: Vision Divine, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Vision Divine
Nuevo artista recomendado: Vinicius de Moraes, score: 1.0183941945850707


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Vinicius de Moraes
Nuevo artista recomendado: Arthur H, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Arthur H
Nuevo artista recomendado: Calexico, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Calexico
Nuevo artista recomendado: Amy Millan, score: 1.2223847300530934


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Amy Millan
Nuevo artista recomendado: Stiff Little Fingers, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Stiff Little Fingers
Nuevo artista recomendado: IceSixxx, score: 1.1461363335870256


<IPython.core.display.Javascript object>

Has elegido: No me gusta para IceSixxx
Nuevo artista recomendado: Men Without Hats, score: 1.024820187513011


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Men Without Hats
Nuevo artista recomendado: Lina Morgana, score: 1.0499257081354505


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Lina Morgana
Nuevo artista recomendado: Betraying The Martyrs, score: 1.035049452861577


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Betraying The Martyrs
Nuevo artista recomendado: Jūdas graši, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Jūdas graši
Nuevo artista recomendado: Marion Meadows, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Marion Meadows
Nuevo artista recomendado: DJ Messiah, 50 Cent And Eminem, score: 1


<IPython.core.display.Javascript object>

Has elegido: Me gusta para DJ Messiah, 50 Cent And Eminem
Artista recomendado: Halovox, score: 1.3813007604993022


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Halovox
Nuevo artista recomendado: Kesha ft. 30H!3, score: 1.049740464385732


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Kesha ft. 30H!3
Artista recomendado: Histeria, score: 1.369200758671429


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Histeria
Artista recomendado: Darko Rundek, score: 1.3594753534338904


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Darko Rundek
Artista recomendado: Quiet Riot, score: 1.3439705153696855


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Quiet Riot
No hay más artistas en la lista de recomendaciones. Seleccionando un nuevo usuario.
Nuevo usuario seleccionado. Artista recomendado: Щурците, score: 1.363838126180154


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Щурците
Nuevo artista recomendado: Boney neM, score: 1.0629636226706198


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Boney neM
Nuevo artista recomendado: The Vengers, score: 1


<IPython.core.display.Javascript object>

Has elegido: Me gusta para The Vengers


### Versión 3

#### DataFrame para versión 3

In [None]:
# Crear nuevo df merge df_artists (id) y df_user_taggedartists (artistID)
new_artists_user_taggedartists = pd.merge(df_artists, df_user_taggedartists, left_on='id', right_on='artistID')

# Eliminar variables no útiles para el programa
new_artists_user_taggedartists = new_artists_user_taggedartists.drop(columns=['id', 'pictureURL', 'userID', 'day', 'month', 'year'])

# Eliminar en new_artists_user_taggedartists los artistID repetidos
new_artists_user_taggedartists = new_artists_user_taggedartists.drop_duplicates(subset=['artistID'])

# merge new_artists_user_taggedartists (artistID) con df_tags (tagValue)
new_artists_user_taggedartists = pd.merge(new_artists_user_taggedartists, df_tags, left_on='tagID', right_on='tagID')

In [21]:
import random
from IPython.display import Javascript, display, HTML
from google.colab.output import eval_js
import pandas as pd
import numpy as np
from surprise import Dataset, Reader, SVD

# Asumimos que df_user_artists, df_artists y new_artists_user_taggedartists ya están cargados

# Normalizar 'weight' a una escala de 1 a 5
min_weight = df_user_artists['weight'].min()
max_weight = df_user_artists['weight'].max()

df_user_artists['rating'] = 1 + 4 * (df_user_artists['weight'] - min_weight) / (max_weight - min_weight)

# Convertir el DataFrame en el formato esperado por Surprise
reader = Reader(rating_scale=(1, 5))
data = Dataset.load_from_df(df_user_artists[['userID', 'artistID', 'rating']], reader)

# Entrenar el modelo con Surprise
trainset = data.build_full_trainset()
modelo_svd = SVD()
modelo_svd.fit(trainset)

# Función para obtener recomendaciones basadas en predicciones
def get_top_artists_for_user(user_id, last_liked_artist_id=None, n=5):
    # Obtener todos los artistas que el usuario no ha escuchado
    unheard_artists = set(df_artists['id']) - set(df_user_artists[df_user_artists['userID'] == user_id]['artistID'])

    # Predecir ratings para estos artistas usando el modelo de Surprise
    predictions = [(artist_id, modelo_svd.predict(user_id, artist_id).est) for artist_id in unheard_artists]

    # Si hay un artista que le gustó, filtrar por similitud
    if last_liked_artist_id is not None:
        # Filtrar los artistas que tengan un score más cercano al último artista que le gustó
        similar_artists = [(artist_id, score) for artist_id, score in predictions if abs(score - modelo_svd.predict(user_id, last_liked_artist_id).est) < 0.1]
        predictions = similar_artists if similar_artists else predictions  # Si no hay similares, usar todos

    # Ordenar por rating predicho y devolver los top n
    return sorted(predictions, key=lambda x: x[1], reverse=True)[:n]

# Inicializar lista de artistas recomendados para un usuario aleatorio
def inicializar_recomendaciones():
    global user_id, recommended_artists, current_index, last_liked_artist_id
    user_id = random.choice(df_user_artists['userID'].unique())  # Seleccionar un usuario al azar
    recommended_artists = get_top_artists_for_user(user_id)
    current_index = 0
    last_liked_artist_id = None  # Reiniciar el último artista que le gustó

inicializar_recomendaciones()  # Generar la primera recomendación

liked_artists = []  # Lista para almacenar artistas que le gustan
like_count = 0  # Contador de "me gusta"

def create_buttons(artist_name):
    artist_name_escaped = artist_name.replace("'", "\\'").replace('"', '\\"')  # Escapar caracteres
    display(Javascript(f'''
        var div = document.createElement('div');
        var btn1 = document.createElement('button');
        btn1.innerHTML = 'Me gusta: {artist_name_escaped}';
        btn1.onclick = function() {{
          google.colab.kernel.invokeFunction('notebook.callback', ['Me gusta', '{artist_name_escaped}'], {{}});
        }};

        var btn2 = document.createElement('button');
        btn2.innerHTML = 'No me gusta: {artist_name_escaped}';
        btn2.onclick = function() {{
          google.colab.kernel.invokeFunction('notebook.callback', ['No me gusta', '{artist_name_escaped}'], {{}});
        }};

        div.appendChild(btn1);
        div.appendChild(btn2);
        document.body.appendChild(div);
    '''))

def handle_choice(choice, artist_name):
    global user_id, recommended_artists, current_index, last_liked_artist_id, liked_artists, like_count

    print(f'Has elegido: {choice} para {artist_name}')

    if choice == 'Me gusta':
        # Obtener el ID del artista
        artist_id = df_artists[df_artists['name'] == artist_name]['id'].values[0]

        # Intentar obtener el tagValue, si existe
        tag_value = "Desconocido"
        if artist_id in new_artists_user_taggedartists['artistID'].values:
            tag_value = new_artists_user_taggedartists[new_artists_user_taggedartists['artistID'] == artist_id]['tagValue'].values[0]

        # Guardar el último artista que le gustó y su etiqueta
        last_liked_artist_id = artist_id
        liked_artists.append((artist_name, tag_value))  # Guardar artista y etiqueta como una tupla
        like_count += 1  # Incrementar el contador de "me gusta"

        # Verificar si ha alcanzado 6 "me gusta"
        if like_count >= 6:
            # Crear el mensaje final con los artistas y sus etiquetas
            final_message = "<h2 style='color: red;'>Te gustan los siguientes artistas:</h2><ul>"
            final_message += ''.join(f"<li style='color: red;'>{artist[0]} - {artist[1]}</li>" for artist in liked_artists)
            final_message += "</ul>"

            # Contar la frecuencia de los tags para sugerir el estilo preferido
            tag_frequencies = pd.Series([artist[1] for artist in liked_artists if artist[1] != "Desconocido"]).value_counts()
            if not tag_frequencies.empty:
                favorite_tag = tag_frequencies.idxmax()
                final_message += f"<h3 style='color: yellow;'>Tu estilo de música preferido es: {favorite_tag}</h3>"
            else:
                final_message += "<h3>No se pudo determinar un estilo de música preferido</h3>"

            display(HTML(final_message))
            return  # Termina el programa

        current_index += 1
        if current_index < len(recommended_artists):
            next_artist_id, next_score = recommended_artists[current_index]
            next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
            print(f"Artista recomendado: {next_artist_name}, score: {next_score}")
            create_buttons(next_artist_name)
        else:
            print("No hay más artistas en la lista de recomendaciones. Seleccionando un nuevo usuario.")
            inicializar_recomendaciones()
            next_artist_id, next_score = recommended_artists[current_index]
            next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
            print(f"Nuevo usuario seleccionado. Artista recomendado: {next_artist_name}, score: {next_score}")
            create_buttons(next_artist_name)
    else:
        # Seleccionar un nuevo artista si elige 'No me gusta'
        unheard_artists = set(df_artists['id']) - set(df_user_artists[df_user_artists['userID'] == user_id]['artistID'])
        next_artist_id = random.choice(list(unheard_artists))
        next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
        next_score = modelo_svd.predict(user_id, next_artist_id).est
        print(f"Nuevo artista recomendado: {next_artist_name}, score: {next_score}")
        create_buttons(next_artist_name)

# Registrar la función en Google Colab
from google.colab import output
output.register_callback('notebook.callback', handle_choice)

# Mostrar el primer artista recomendado
first_artist_id, first_score = recommended_artists[current_index]
first_artist_name = df_artists[df_artists['id'] == first_artist_id]['name'].values[0]
print(f"Artista recomendado: {first_artist_name}, score: {first_score}")
create_buttons(first_artist_name)

Artista recomendado: Adanowsky, score: 1.3468145048647624


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Adanowsky
Artista recomendado: Benassi Bros., score: 1.310705558317253


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Benassi Bros.
Artista recomendado: Daedelus, score: 1.3035738644653734


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Daedelus
Artista recomendado: Pentagram, score: 1.3014873235558315


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Pentagram
Artista recomendado: Liquido, score: 1.297431626438922


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Liquido
No hay más artistas en la lista de recomendaciones. Seleccionando un nuevo usuario.
Nuevo usuario seleccionado. Artista recomendado: Chelsie Boyd, score: 1.3555689647508382


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Chelsie Boyd
