<a href="https://colab.research.google.com/github/davidlealo/sistema-recomendacion/blob/main/recomendacion_genero_por_artista.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Recomendación de género a través de artistas

Sistema que busca identificar un género o grupo de estilos musicales para un usuario a través de una aplicación aque correrá en Google Colab o soluciones similares

### Instalar librerias

In [23]:
!pip install scikit-surprise



### Recuperar datos

In [24]:
import os
import zipfile
import requests
import pandas as pd
from surprise import Dataset, Reader

# URL del dataset
url = "https://files.grouplens.org/datasets/hetrec2011/hetrec2011-lastfm-2k.zip"
zip_file = "hetrec2011-lastfm-2k.zip"
extract_dir = "hetrec2011-lastfm-2k"

# Descargar el dataset
if not os.path.exists(zip_file):
    print("Descargando dataset...")
    response = requests.get(url)
    with open(zip_file, 'wb') as f:
        f.write(response.content)
    print("Descarga completa.")

# Descomprimir el dataset
if not os.path.exists(extract_dir):
    print("Descomprimiendo dataset...")
    with zipfile.ZipFile(zip_file, 'r') as zip_ref:
        zip_ref.extractall(extract_dir)
    print("Descompresión completa.")

### Cargar cada archivo en un dataframe

In [25]:
# user_artists.dat - Relación entre usuarios y artistas
user_artists_path = os.path.join(extract_dir, 'user_artists.dat')
df_user_artists = pd.read_csv(user_artists_path, sep='\t')
print("Datos de user_artists:")
print(df_user_artists.head())

# artists.dat - Información sobre los artistas
artists_path = os.path.join(extract_dir, 'artists.dat')
df_artists = pd.read_csv(artists_path, sep='\t')
print("Datos de artists:")
print(df_artists.head())

# tags.dat - Información sobre las etiquetas
# Cargar el archivo tags.dat usando una codificación alternativa
tags_path = os.path.join(extract_dir, 'tags.dat')
try:
    df_tags = pd.read_csv(tags_path, sep='\t', encoding='latin1')  # Cambiar la codificación a latin1
    print("Datos de tags:")
    print(df_tags.head())
except UnicodeDecodeError as e:
    print(f"Error de decodificación: {e}")


# user_friends.dat - Relación de amistad entre usuarios
user_friends_path = os.path.join(extract_dir, 'user_friends.dat')
df_user_friends = pd.read_csv(user_friends_path, sep='\t')
print("Datos de user_friends:")
print(df_user_friends.head())

# user_taggedartists-timestamps.dat - Etiquetas de los usuarios a los artistas con marcas de tiempo
user_taggedartists_timestamps_path = os.path.join(extract_dir, 'user_taggedartists-timestamps.dat')
df_user_taggedartists_timestamps = pd.read_csv(user_taggedartists_timestamps_path, sep='\t')
print("Datos de user_taggedartists_timestamps:")
print(df_user_taggedartists_timestamps.head())

# user_taggedartists.dat - Etiquetas de los usuarios a los artistas
user_taggedartists_path = os.path.join(extract_dir, 'user_taggedartists.dat')
df_user_taggedartists = pd.read_csv(user_taggedartists_path, sep='\t')
print("Datos de user_taggedartists:")
print(df_user_taggedartists.head())

# Preparar los datos para Surprise (usaremos user_artists.dat para recomendaciones)

reader = Reader(rating_scale=(df_user_artists['weight'].min(), df_user_artists['weight'].max()))
data = Dataset.load_from_df(df_user_artists[['userID', 'artistID', 'weight']], reader)

Datos de user_artists:
   userID  artistID  weight
0       2        51   13883
1       2        52   11690
2       2        53   11351
3       2        54   10300
4       2        55    8983
Datos de artists:
   id               name                                         url  \
0   1       MALICE MIZER       http://www.last.fm/music/MALICE+MIZER   
1   2    Diary of Dreams    http://www.last.fm/music/Diary+of+Dreams   
2   3  Carpathian Forest  http://www.last.fm/music/Carpathian+Forest   
3   4       Moi dix Mois       http://www.last.fm/music/Moi+dix+Mois   
4   5        Bella Morte        http://www.last.fm/music/Bella+Morte   

                                          pictureURL  
0    http://userserve-ak.last.fm/serve/252/10808.jpg  
1  http://userserve-ak.last.fm/serve/252/3052066.jpg  
2  http://userserve-ak.last.fm/serve/252/40222717...  
3  http://userserve-ak.last.fm/serve/252/54697835...  
4  http://userserve-ak.last.fm/serve/252/14789013...  
Datos de tags:
   tagID     

In [26]:
from surprise import SVD, KNNBasic
from surprise.model_selection import train_test_split, cross_validate

# Crear un set de entrenamiento y prueba
trainset, testset = train_test_split(data, test_size=0.25)

# Usar SVD para el modelo de recomendación
algo = SVD()

# Entrenar el modelo
algo.fit(trainset)

# Evaluar el modelo
predictions = algo.test(testset)

### Entrenamiento y evaluación utilizando Surprise

In [27]:
from surprise import Dataset, Reader, SVD, KNNBasic
from surprise.model_selection import train_test_split, cross_validate

# Preparación de los datos para Surprise
reader = Reader(rating_scale=(df_user_artists['weight'].min(), df_user_artists['weight'].max()))
data = Dataset.load_from_df(df_user_artists[['userID', 'artistID', 'weight']], reader)

# Dividir el conjunto de datos en entrenamiento y prueba
trainset, testset = train_test_split(data, test_size=0.25)

# Usar el algoritmo SVD para crear el modelo de recomendación
modelo_svd = SVD()

# Entrenar el modelo SVD
modelo_svd.fit(trainset)

# Evaluar el modelo SVD
predictions_svd = modelo_svd.test(testset)

# Mostrar algunas predicciones SVD
print("\nAlgunas predicciones SVD:")
for prediction in predictions_svd[:5]:
    print(prediction)

# Usar el algoritmo KNNBasic para crear el modelo de recomendación
modelo_knn = KNNBasic()

# Entrenar el modelo KNNBasic
modelo_knn.fit(trainset)

# Evaluar el modelo KNNBasic
predictions_knn = modelo_knn.test(testset)

# Mostrar algunas predicciones KNNBasic
print("\nAlgunas predicciones KNNBasic:")
for prediction in predictions_knn[:5]:
    print(prediction)

# Evaluar el rendimiento de ambos modelos usando validación cruzada
print("\nEvaluación usando validación cruzada:")
cross_validate(modelo_svd, data, measures=['RMSE', 'MAE'], cv=5, verbose=True)
cross_validate(modelo_knn, data, measures=['RMSE', 'MAE'], cv=5, verbose=True)


Algunas predicciones SVD:
user: 1974       item: 227        r_ui = 676.00   est = 352698.00   {'was_impossible': False}
user: 1513       item: 10491      r_ui = 170.00   est = 352698.00   {'was_impossible': False}
user: 208        item: 4269       r_ui = 195.00   est = 352698.00   {'was_impossible': False}
user: 1042       item: 328        r_ui = 295.00   est = 352698.00   {'was_impossible': False}
user: 1119       item: 12420      r_ui = 17.00   est = 352698.00   {'was_impossible': False}
Computing the msd similarity matrix...
Done computing similarity matrix.

Algunas predicciones KNNBasic:
user: 1974       item: 227        r_ui = 676.00   est = 422.83   {'actual_k': 40, 'was_impossible': False}
user: 1513       item: 10491      r_ui = 170.00   est = 378.00   {'actual_k': 1, 'was_impossible': False}
user: 208        item: 4269       r_ui = 195.00   est = 729.82   {'was_impossible': True, 'reason': 'Not enough neighbors.'}
user: 1042       item: 328        r_ui = 295.00   est = 283.1

{'test_rmse': array([4466.567735  , 4232.90351745, 4362.12097402, 4782.91682757,
        4235.54531037]),
 'test_mae': array([796.98510858, 787.91410122, 753.70707119, 812.25418551,
        750.07184896]),
 'fit_time': (0.4954235553741455,
  0.5557188987731934,
  0.662914514541626,
  0.527944803237915,
  0.43499255180358887),
 'test_time': (1.8554644584655762,
  2.2106130123138428,
  2.689832925796509,
  1.8961353302001953,
  2.0228426456451416)}

### Predicciones

In [28]:
# Realizar una predicción para un usuario específico y un artista específico usando el modelo SVD
user_id = 2  # ID del usuario
artist_id = 51  # ID del artista

# Hacer la predicción con el modelo SVD
pred_svd = modelo_svd.predict(user_id, artist_id)
print(f"Predicción SVD para el usuario {user_id} y el artista {artist_id}: {pred_svd.est}")

# Hacer la predicción con el modelo KNNBasic
pred_knn = modelo_knn.predict(user_id, artist_id)
print(f"Predicción KNNBasic para el usuario {user_id} y el artista {artist_id}: {pred_knn.est}")

Predicción SVD para el usuario 2 y el artista 51: 352698
Predicción KNNBasic para el usuario 2 y el artista 51: 3640.245146862614


## Aplicación

### Versión 1

In [30]:
import random
from IPython.display import Javascript, display
from google.colab.output import eval_js
import pandas as pd
import numpy as np
from surprise import Dataset, Reader, SVD

# Normalizar 'weight' a una escala de 1 a 5
min_weight = df_user_artists['weight'].min()
max_weight = df_user_artists['weight'].max()

df_user_artists['rating'] = 1 + 4 * (df_user_artists['weight'] - min_weight) / (max_weight - min_weight)

# Convertir el DataFrame en el formato esperado por Surprise
reader = Reader(rating_scale=(1, 5))
data = Dataset.load_from_df(df_user_artists[['userID', 'artistID', 'rating']], reader)

# Entrenar el modelo con Surprise
trainset = data.build_full_trainset()
modelo_svd = SVD()
modelo_svd.fit(trainset)

# Función para obtener recomendaciones basadas en predicciones
def get_top_artists_for_user(user_id, last_liked_artist_id=None, n=5):
    # Obtener todos los artistas que el usuario no ha escuchado
    unheard_artists = set(df_artists['id']) - set(df_user_artists[df_user_artists['userID'] == user_id]['artistID'])

    # Predecir ratings para estos artistas usando el modelo de Surprise
    predictions = [(artist_id, modelo_svd.predict(user_id, artist_id).est) for artist_id in unheard_artists]

    # Si hay un artista que le gustó, filtrar por similitud
    if last_liked_artist_id is not None:
        # Filtrar los artistas que tengan un score más cercano al último artista que le gustó
        similar_artists = [(artist_id, score) for artist_id, score in predictions if abs(score - modelo_svd.predict(user_id, last_liked_artist_id).est) < 0.1]
        predictions = similar_artists if similar_artists else predictions  # Si no hay similares, usar todos

    # Ordenar por rating predicho y devolver los top n
    return sorted(predictions, key=lambda x: x[1], reverse=True)[:n]

# Inicializar lista de artistas recomendados para un usuario aleatorio
def inicializar_recomendaciones():
    global user_id, recommended_artists, current_index, last_liked_artist_id
    user_id = random.choice(df_user_artists['userID'].unique())  # Seleccionar un usuario al azar
    recommended_artists = get_top_artists_for_user(user_id)
    current_index = 0
    last_liked_artist_id = None  # Reiniciar el último artista que le gustó

inicializar_recomendaciones()  # Generar la primera recomendación

liked_artists = []  # Lista para almacenar artistas que le gustan
like_count = 0  # Contador de "me gusta"

def create_buttons(artist_name):
    artist_name_escaped = artist_name.replace("'", "\\'").replace('"', '\\"')  # Escapar caracteres
    display(Javascript(f'''
        var div = document.createElement('div');
        var btn1 = document.createElement('button');
        btn1.innerHTML = 'Me gusta: {artist_name_escaped}';
        btn1.onclick = function() {{
          google.colab.kernel.invokeFunction('notebook.callback', ['Me gusta', '{artist_name_escaped}'], {{}});
        }};

        var btn2 = document.createElement('button');
        btn2.innerHTML = 'No me gusta: {artist_name_escaped}';
        btn2.onclick = function() {{
          google.colab.kernel.invokeFunction('notebook.callback', ['No me gusta', '{artist_name_escaped}'], {{}});
        }};

        div.appendChild(btn1);
        div.appendChild(btn2);
        document.body.appendChild(div);
    '''))

def handle_choice(choice, artist_name):
    global user_id, recommended_artists, current_index, last_liked_artist_id, liked_artists, like_count

    print(f'Has elegido: {choice} para {artist_name}')

    if choice == 'Me gusta':
        last_liked_artist_id = df_artists[df_artists['name'] == artist_name]['id'].values[0]  # Guardar el último artista que le gustó
        liked_artists.append(artist_name)  # Agregar el artista a la lista de artistas que le gustan
        like_count += 1  # Incrementar el contador de "me gusta"

        # Verificar si ha alcanzado 6 "me gusta"
        if like_count >= 6:
            print("Te gustan los siguientes artistas:")
            for artist in liked_artists:
                print(artist)
            return  # Termina el programa

        current_index += 1
        if current_index < len(recommended_artists):
            next_artist_id, next_score = recommended_artists[current_index]
            next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
            print(f"Artista recomendado: {next_artist_name}, score: {next_score}")
            create_buttons(next_artist_name)
        else:
            print("No hay más artistas en la lista de recomendaciones. Seleccionando un nuevo usuario.")
            inicializar_recomendaciones()
            next_artist_id, next_score = recommended_artists[current_index]
            next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
            print(f"Nuevo usuario seleccionado. Artista recomendado: {next_artist_name}, score: {next_score}")
            create_buttons(next_artist_name)
    else:
        # Seleccionar un nuevo artista si elige 'No me gusta'
        unheard_artists = set(df_artists['id']) - set(df_user_artists[df_user_artists['userID'] == user_id]['artistID'])
        next_artist_id = random.choice(list(unheard_artists))
        next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
        next_score = modelo_svd.predict(user_id, next_artist_id).est
        print(f"Nuevo artista recomendado: {next_artist_name}, score: {next_score}")
        create_buttons(next_artist_name)

# Registrar la función en Google Colab
from google.colab import output
output.register_callback('notebook.callback', handle_choice)

# Mostrar el primer artista recomendado
first_artist_id, first_score = recommended_artists[current_index]
first_artist_name = df_artists[df_artists['id'] == first_artist_id]['name'].values[0]
print(f"Artista recomendado: {first_artist_name}, score: {first_score}")
create_buttons(first_artist_name)


Artista recomendado: The Clarendonians, score: 1.396518653523977


<IPython.core.display.Javascript object>

Has elegido: No me gusta para The Clarendonians
Nuevo artista recomendado: Stephanie, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Stephanie
Nuevo artista recomendado: Rush of Fools, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Rush of Fools
Nuevo artista recomendado: Noycetm, score: 1.063161943590077


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Noycetm
Nuevo artista recomendado: Sub Focus, score: 1.250862535564551


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Sub Focus
Nuevo artista recomendado: La Dispute, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para La Dispute
Nuevo artista recomendado: KiEw, score: 1.037374823928576


<IPython.core.display.Javascript object>

Has elegido: No me gusta para KiEw
Nuevo artista recomendado: Adler's Appetite, score: 1.0704541666813652


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Adler's Appetite
Nuevo artista recomendado: Sr. Chinarro, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Sr. Chinarro
Nuevo artista recomendado: The Ditty Bops, score: 1.0071276744030875


<IPython.core.display.Javascript object>

Has elegido: No me gusta para The Ditty Bops
Nuevo artista recomendado: Wicked Original Broadway Cast, score: 1.1007845183141243


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Wicked Original Broadway Cast
Nuevo artista recomendado: Jokke & Valentinerne, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Jokke & Valentinerne
Nuevo artista recomendado: Sudden Weather Change, score: 1.1201734737176643


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Sudden Weather Change
Nuevo artista recomendado: Local H, score: 1.184687305361638


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Local H
Nuevo artista recomendado: Beatallica, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Beatallica
Nuevo artista recomendado: Braid, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Braid
Nuevo artista recomendado: Jeff Williams, score: 1.0435226444360297


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Jeff Williams
Artista recomendado: Mariottide, score: 1.3574470581800961


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Mariottide
Artista recomendado: Venus Hum, score: 1.35365525301915


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Venus Hum
Artista recomendado: Big Mike, score: 1.3445945950459655


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Big Mike
Artista recomendado: Frost, score: 1.3442864900742006


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Frost
No hay más artistas en la lista de recomendaciones. Seleccionando un nuevo usuario.
Nuevo usuario seleccionado. Artista recomendado: Мультfильмы, score: 1.284513593984831


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Мультfильмы
Nuevo artista recomendado: Evanescence, score: 1


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Evanescence
Te gustan los siguientes artistas:
Jeff Williams
Mariottide
Venus Hum
Big Mike
Frost
Evanescence


### Versión 2

In [31]:
import random
from IPython.display import Javascript, display, HTML
from google.colab.output import eval_js
import pandas as pd
import numpy as np
from surprise import Dataset, Reader, SVD

# Normalizar 'weight' a una escala de 1 a 5
min_weight = df_user_artists['weight'].min()
max_weight = df_user_artists['weight'].max()

df_user_artists['rating'] = 1 + 4 * (df_user_artists['weight'] - min_weight) / (max_weight - min_weight)

# Convertir el DataFrame en el formato esperado por Surprise
reader = Reader(rating_scale=(1, 5))
data = Dataset.load_from_df(df_user_artists[['userID', 'artistID', 'rating']], reader)

# Entrenar el modelo con Surprise
trainset = data.build_full_trainset()
modelo_svd = SVD()
modelo_svd.fit(trainset)

# Función para obtener recomendaciones basadas en predicciones
def get_top_artists_for_user(user_id, last_liked_artist_id=None, n=5):
    # Obtener todos los artistas que el usuario no ha escuchado
    unheard_artists = set(df_artists['id']) - set(df_user_artists[df_user_artists['userID'] == user_id]['artistID'])

    # Predecir ratings para estos artistas usando el modelo de Surprise
    predictions = [(artist_id, modelo_svd.predict(user_id, artist_id).est) for artist_id in unheard_artists]

    # Si hay un artista que le gustó, filtrar por similitud
    if last_liked_artist_id is not None:
        # Filtrar los artistas que tengan un score más cercano al último artista que le gustó
        similar_artists = [(artist_id, score) for artist_id, score in predictions if abs(score - modelo_svd.predict(user_id, last_liked_artist_id).est) < 0.1]
        predictions = similar_artists if similar_artists else predictions  # Si no hay similares, usar todos

    # Ordenar por rating predicho y devolver los top n
    return sorted(predictions, key=lambda x: x[1], reverse=True)[:n]

# Inicializar lista de artistas recomendados para un usuario aleatorio
def inicializar_recomendaciones():
    global user_id, recommended_artists, current_index, last_liked_artist_id
    user_id = random.choice(df_user_artists['userID'].unique())  # Seleccionar un usuario al azar
    recommended_artists = get_top_artists_for_user(user_id)
    current_index = 0
    last_liked_artist_id = None  # Reiniciar el último artista que le gustó

inicializar_recomendaciones()  # Generar la primera recomendación

liked_artists = []  # Lista para almacenar artistas que le gustan
like_count = 0  # Contador de "me gusta"

def create_buttons(artist_name):
    artist_name_escaped = artist_name.replace("'", "\\'").replace('"', '\\"')  # Escapar caracteres
    display(Javascript(f'''
        var div = document.createElement('div');
        var btn1 = document.createElement('button');
        btn1.innerHTML = 'Me gusta: {artist_name_escaped}';
        btn1.onclick = function() {{
          google.colab.kernel.invokeFunction('notebook.callback', ['Me gusta', '{artist_name_escaped}'], {{}});
        }};

        var btn2 = document.createElement('button');
        btn2.innerHTML = 'No me gusta: {artist_name_escaped}';
        btn2.onclick = function() {{
          google.colab.kernel.invokeFunction('notebook.callback', ['No me gusta', '{artist_name_escaped}'], {{}});
        }};

        div.appendChild(btn1);
        div.appendChild(btn2);
        document.body.appendChild(div);
    '''))

def handle_choice(choice, artist_name):
    global user_id, recommended_artists, current_index, last_liked_artist_id, liked_artists, like_count

    print(f'Has elegido: {choice} para {artist_name}')

    if choice == 'Me gusta':
        last_liked_artist_id = df_artists[df_artists['name'] == artist_name]['id'].values[0]  # Guardar el último artista que le gustó
        liked_artists.append(artist_name)  # Agregar el artista a la lista de artistas que le gustan
        like_count += 1  # Incrementar el contador de "me gusta"

        # Verificar si ha alcanzado 6 "me gusta"
        if like_count >= 6:
            # Mostrar mensaje final en rojo
            final_message = "<h2 style='color: red;'>Te gustan los siguientes artistas:</h2><ul>"
            final_message += ''.join(f"<li style='color: red;'>{artist}</li>" for artist in liked_artists)
            final_message += "</ul>"
            display(HTML(final_message))
            return  # Termina el programa

        current_index += 1
        if current_index < len(recommended_artists):
            next_artist_id, next_score = recommended_artists[current_index]
            next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
            print(f"Artista recomendado: {next_artist_name}, score: {next_score}")
            create_buttons(next_artist_name)
        else:
            print("No hay más artistas en la lista de recomendaciones. Seleccionando un nuevo usuario.")
            inicializar_recomendaciones()
            next_artist_id, next_score = recommended_artists[current_index]
            next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
            print(f"Nuevo usuario seleccionado. Artista recomendado: {next_artist_name}, score: {next_score}")
            create_buttons(next_artist_name)
    else:
        # Seleccionar un nuevo artista si elige 'No me gusta'
        unheard_artists = set(df_artists['id']) - set(df_user_artists[df_user_artists['userID'] == user_id]['artistID'])
        next_artist_id = random.choice(list(unheard_artists))
        next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
        next_score = modelo_svd.predict(user_id, next_artist_id).est
        print(f"Nuevo artista recomendado: {next_artist_name}, score: {next_score}")
        create_buttons(next_artist_name)

# Registrar la función en Google Colab
from google.colab import output
output.register_callback('notebook.callback', handle_choice)

# Mostrar el primer artista recomendado
first_artist_id, first_score = recommended_artists[current_index]
first_artist_name = df_artists[df_artists['id'] == first_artist_id]['name'].values[0]
print(f"Artista recomendado: {first_artist_name}, score: {first_score}")
create_buttons(first_artist_name)


Artista recomendado: AirFare, score: 1.3048191383346852


<IPython.core.display.Javascript object>

Has elegido: Me gusta para AirFare
Artista recomendado: Thomas Godoj, score: 1.2993083535309324


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Thomas Godoj
Artista recomendado: KSU, score: 1.2841511043834346


<IPython.core.display.Javascript object>

Has elegido: Me gusta para KSU
Artista recomendado: Nina Simone, score: 1.282563456749207


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Nina Simone
Artista recomendado: Lokua Kanza, score: 1.278412882756935


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Lokua Kanza
No hay más artistas en la lista de recomendaciones. Seleccionando un nuevo usuario.
Nuevo usuario seleccionado. Artista recomendado: Billy Crystal Meth, score: 1.3130230893722252


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Billy Crystal Meth


### Versión 3

#### DataFrame para versión 3

In [32]:
# Crear nuevo df merge df_artists (id) y df_user_taggedartists (artistID)
new_artists_user_taggedartists = pd.merge(df_artists, df_user_taggedartists, left_on='id', right_on='artistID')

# Eliminar variables no útiles para el programa
new_artists_user_taggedartists = new_artists_user_taggedartists.drop(columns=['id', 'pictureURL', 'userID', 'day', 'month', 'year'])

# Eliminar en new_artists_user_taggedartists los artistID repetidos
new_artists_user_taggedartists = new_artists_user_taggedartists.drop_duplicates(subset=['artistID'])

# merge new_artists_user_taggedartists (artistID) con df_tags (tagValue)
new_artists_user_taggedartists = pd.merge(new_artists_user_taggedartists, df_tags, left_on='tagID', right_on='tagID')

In [33]:
import random
from IPython.display import Javascript, display, HTML
from google.colab.output import eval_js
import pandas as pd
import numpy as np
from surprise import Dataset, Reader, SVD

# Asumimos que df_user_artists, df_artists y new_artists_user_taggedartists ya están cargados

# Normalizar 'weight' a una escala de 1 a 5
min_weight = df_user_artists['weight'].min()
max_weight = df_user_artists['weight'].max()

df_user_artists['rating'] = 1 + 4 * (df_user_artists['weight'] - min_weight) / (max_weight - min_weight)

# Convertir el DataFrame en el formato esperado por Surprise
reader = Reader(rating_scale=(1, 5))
data = Dataset.load_from_df(df_user_artists[['userID', 'artistID', 'rating']], reader)

# Entrenar el modelo con Surprise
trainset = data.build_full_trainset()
modelo_svd = SVD()
modelo_svd.fit(trainset)

# Función para obtener recomendaciones basadas en predicciones
def get_top_artists_for_user(user_id, last_liked_artist_id=None, n=5):
    # Obtener todos los artistas que el usuario no ha escuchado
    unheard_artists = set(df_artists['id']) - set(df_user_artists[df_user_artists['userID'] == user_id]['artistID'])

    # Predecir ratings para estos artistas usando el modelo de Surprise
    predictions = [(artist_id, modelo_svd.predict(user_id, artist_id).est) for artist_id in unheard_artists]

    # Si hay un artista que le gustó, filtrar por similitud
    if last_liked_artist_id is not None:
        # Filtrar los artistas que tengan un score más cercano al último artista que le gustó
        similar_artists = [(artist_id, score) for artist_id, score in predictions if abs(score - modelo_svd.predict(user_id, last_liked_artist_id).est) < 0.1]
        predictions = similar_artists if similar_artists else predictions  # Si no hay similares, usar todos

    # Ordenar por rating predicho y devolver los top n
    return sorted(predictions, key=lambda x: x[1], reverse=True)[:n]

# Inicializar lista de artistas recomendados para un usuario aleatorio
def inicializar_recomendaciones():
    global user_id, recommended_artists, current_index, last_liked_artist_id
    user_id = random.choice(df_user_artists['userID'].unique())  # Seleccionar un usuario al azar
    recommended_artists = get_top_artists_for_user(user_id)
    current_index = 0
    last_liked_artist_id = None  # Reiniciar el último artista que le gustó

inicializar_recomendaciones()  # Generar la primera recomendación

liked_artists = []  # Lista para almacenar artistas que le gustan
like_count = 0  # Contador de "me gusta"

def create_buttons(artist_name):
    artist_name_escaped = artist_name.replace("'", "\\'").replace('"', '\\"')  # Escapar caracteres
    display(Javascript(f'''
        var div = document.createElement('div');
        var btn1 = document.createElement('button');
        btn1.innerHTML = 'Me gusta: {artist_name_escaped}';
        btn1.onclick = function() {{
          google.colab.kernel.invokeFunction('notebook.callback', ['Me gusta', '{artist_name_escaped}'], {{}});
        }};

        var btn2 = document.createElement('button');
        btn2.innerHTML = 'No me gusta: {artist_name_escaped}';
        btn2.onclick = function() {{
          google.colab.kernel.invokeFunction('notebook.callback', ['No me gusta', '{artist_name_escaped}'], {{}});
        }};

        div.appendChild(btn1);
        div.appendChild(btn2);
        document.body.appendChild(div);
    '''))

def handle_choice(choice, artist_name):
    global user_id, recommended_artists, current_index, last_liked_artist_id, liked_artists, like_count

    print(f'Has elegido: {choice} para {artist_name}')

    if choice == 'Me gusta':
        # Obtener el ID del artista
        artist_id = df_artists[df_artists['name'] == artist_name]['id'].values[0]

        # Intentar obtener el tagValue, si existe
        tag_value = "Desconocido"
        if artist_id in new_artists_user_taggedartists['artistID'].values:
            tag_value = new_artists_user_taggedartists[new_artists_user_taggedartists['artistID'] == artist_id]['tagValue'].values[0]

        # Guardar el último artista que le gustó y su etiqueta
        last_liked_artist_id = artist_id
        liked_artists.append((artist_name, tag_value))  # Guardar artista y etiqueta como una tupla
        like_count += 1  # Incrementar el contador de "me gusta"

        # Verificar si ha alcanzado 6 "me gusta"
        if like_count >= 6:
            # Crear el mensaje final con los artistas y sus etiquetas
            final_message = "<h2 style='color: red;'>Te gustan los siguientes artistas:</h2><ul>"
            final_message += ''.join(f"<li style='color: red;'>{artist[0]} - {artist[1]}</li>" for artist in liked_artists)
            final_message += "</ul>"

            # Contar la frecuencia de los tags para sugerir el estilo preferido
            tag_frequencies = pd.Series([artist[1] for artist in liked_artists if artist[1] != "Desconocido"]).value_counts()
            if not tag_frequencies.empty:
                favorite_tag = tag_frequencies.idxmax()
                final_message += f"<h3 style='color: yellow;'>Tu estilo de música preferido es: {favorite_tag}</h3>"
            else:
                final_message += "<h3>No se pudo determinar un estilo de música preferido</h3>"

            display(HTML(final_message))
            return  # Termina el programa

        current_index += 1
        if current_index < len(recommended_artists):
            next_artist_id, next_score = recommended_artists[current_index]
            next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
            print(f"Artista recomendado: {next_artist_name}, score: {next_score}")
            create_buttons(next_artist_name)
        else:
            print("No hay más artistas en la lista de recomendaciones. Seleccionando un nuevo usuario.")
            inicializar_recomendaciones()
            next_artist_id, next_score = recommended_artists[current_index]
            next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
            print(f"Nuevo usuario seleccionado. Artista recomendado: {next_artist_name}, score: {next_score}")
            create_buttons(next_artist_name)
    else:
        # Seleccionar un nuevo artista si elige 'No me gusta'
        unheard_artists = set(df_artists['id']) - set(df_user_artists[df_user_artists['userID'] == user_id]['artistID'])
        next_artist_id = random.choice(list(unheard_artists))
        next_artist_name = df_artists[df_artists['id'] == next_artist_id]['name'].values[0]
        next_score = modelo_svd.predict(user_id, next_artist_id).est
        print(f"Nuevo artista recomendado: {next_artist_name}, score: {next_score}")
        create_buttons(next_artist_name)

# Registrar la función en Google Colab
from google.colab import output
output.register_callback('notebook.callback', handle_choice)

# Mostrar el primer artista recomendado
first_artist_id, first_score = recommended_artists[current_index]
first_artist_name = df_artists[df_artists['id'] == first_artist_id]['name'].values[0]
print(f"Artista recomendado: {first_artist_name}, score: {first_score}")
create_buttons(first_artist_name)

Artista recomendado: LAREINE, score: 1.3808486882266593


<IPython.core.display.Javascript object>

Has elegido: No me gusta para LAREINE
Nuevo artista recomendado: Xavier Baumaxa, score: 1.1936162842018185


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Xavier Baumaxa
Nuevo artista recomendado: Boban Marković Orkestar, score: 1.0495974677118025


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Boban Marković Orkestar
Nuevo artista recomendado: Lori Meyers, score: 1.035813164838491


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Lori Meyers
Nuevo artista recomendado: Cowboy Junkies, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Cowboy Junkies
Nuevo artista recomendado: 串田アキラ, score: 1.1185701872785918


<IPython.core.display.Javascript object>

Has elegido: No me gusta para 串田アキラ
Nuevo artista recomendado: Eyedea & Abilities, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Eyedea & Abilities
Nuevo artista recomendado: iron jesus (featuring jahlili), score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para iron jesus (featuring jahlili)
Nuevo artista recomendado: The Mothers of Invention, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para The Mothers of Invention
Nuevo artista recomendado: Ehron Vonallen, score: 1.0124260365600175


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Ehron Vonallen
Nuevo artista recomendado: ＰＥＲＥＳＴＲＯＩＫＡ, score: 1.1657511294340608


<IPython.core.display.Javascript object>

Has elegido: No me gusta para ＰＥＲＥＳＴＲＯＩＫＡ
Nuevo artista recomendado: Tribuzy, score: 1.0205907616757688


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Tribuzy
Nuevo artista recomendado: Silence Dead, score: 1.0209707247484794


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Silence Dead
Nuevo artista recomendado: Guilherme Zucconi, score: 1.0941284837286358


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Guilherme Zucconi
Nuevo artista recomendado: Ian Brown, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Ian Brown
Nuevo artista recomendado: Слон, score: 1.0160242633971348


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Слон
Nuevo artista recomendado: Skip James, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Skip James
Nuevo artista recomendado: The Perishers, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para The Perishers
Nuevo artista recomendado: Peter Hammill, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Peter Hammill
Nuevo artista recomendado: art doom, score: 1.0218079648269882


<IPython.core.display.Javascript object>

Has elegido: No me gusta para art doom
Nuevo artista recomendado: Domantas Razauskas, score: 1.0027837624847216


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Domantas Razauskas
Nuevo artista recomendado: Armand Amar, score: 1.067566925845202


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Armand Amar
Nuevo artista recomendado: Cassandra Steen, score: 1.07873172351932


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Cassandra Steen
Nuevo artista recomendado: Duran Duran, score: 1.0497481629409504


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Duran Duran
Artista recomendado: Paquita La Del Barrio, score: 1.3695440595331982


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Paquita La Del Barrio
Nuevo artista recomendado: Мумий Тролль, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Мумий Тролль
Nuevo artista recomendado: Emily Powers, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Emily Powers
Nuevo artista recomendado: Pete Vyler, score: 1.0724512449860035


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Pete Vyler
Nuevo artista recomendado: Scanners, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Scanners
Nuevo artista recomendado: Hour of Penance, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Hour of Penance
Nuevo artista recomendado: Ian McCulloch, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Ian McCulloch
Nuevo artista recomendado: Rick Ross, score: 1.0129894329617517


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Rick Ross
Nuevo artista recomendado: RJD2, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para RJD2
Nuevo artista recomendado: V Factory, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para V Factory
Nuevo artista recomendado: Judas Iscariot, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Judas Iscariot
Nuevo artista recomendado: Texas, score: 1


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Texas
Artista recomendado: Matt Willis, score: 1.3165365973337226


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Matt Willis
Nuevo artista recomendado: The Good, the Bad & the Queen, score: 1.1313230107689132


<IPython.core.display.Javascript object>

Has elegido: No me gusta para The Good, the Bad & the Queen
Nuevo artista recomendado: This Romantic Tragedy, score: 1.0273503960851997


<IPython.core.display.Javascript object>

Has elegido: No me gusta para This Romantic Tragedy
Nuevo artista recomendado: DaizyStripper, score: 1.0940949381923346


<IPython.core.display.Javascript object>

Has elegido: No me gusta para DaizyStripper
Nuevo artista recomendado: Pan.Thy.Monium, score: 1.046720781503817


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Pan.Thy.Monium
Nuevo artista recomendado: BOAT, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para BOAT
Nuevo artista recomendado: Sleep Parade, score: 1.0077929309238043


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Sleep Parade
Nuevo artista recomendado: The Murmurs, score: 1.0202167265492244


<IPython.core.display.Javascript object>

Has elegido: No me gusta para The Murmurs
Nuevo artista recomendado: Red Mountain Church, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Red Mountain Church
Nuevo artista recomendado: Angels and Airwaves, score: 1.0649150219531123


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Angels and Airwaves
Nuevo artista recomendado: Hot Hot Heat, score: 1.0306697883031721


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Hot Hot Heat
Nuevo artista recomendado: Angel Taylor, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Angel Taylor
Nuevo artista recomendado: Buraka Som Sistema, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Buraka Som Sistema
Nuevo artista recomendado: Zeplin, score: 1.033648721421261


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Zeplin
Artista recomendado: Data 80, score: 1.316144888128583


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Data 80
Nuevo artista recomendado: Pontiak, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Pontiak
Nuevo artista recomendado: The Peacocks, score: 1.170342843139836


<IPython.core.display.Javascript object>

Has elegido: Me gusta para The Peacocks
Artista recomendado: 川井憲次, score: 1.31019131964761


<IPython.core.display.Javascript object>

Has elegido: No me gusta para 川井憲次
Nuevo artista recomendado: Cybophonia, score: 1.0616399297148282


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Cybophonia
Nuevo artista recomendado: I Am Robot and Proud, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para I Am Robot and Proud
Nuevo artista recomendado: Marine Research, score: 1.007034306604562


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Marine Research
Nuevo artista recomendado: Bend and Break, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Bend and Break
Nuevo artista recomendado: Julio Sosa, score: 1


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Julio Sosa
No hay más artistas en la lista de recomendaciones. Seleccionando un nuevo usuario.
Nuevo usuario seleccionado. Artista recomendado: The Band, score: 1.3868361639099158


<IPython.core.display.Javascript object>

Has elegido: No me gusta para The Band
Nuevo artista recomendado: Amy Diamond, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Amy Diamond
Nuevo artista recomendado: Turbo, score: 1.0238903037604519


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Turbo
Nuevo artista recomendado: Fuel, score: 1.0823849051982333


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Fuel


Has elegido: No me gusta para Fuel
Nuevo artista recomendado: Iron Fire, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Iron Fire
Nuevo artista recomendado: Dert Floyd, score: 1


<IPython.core.display.Javascript object>

Has elegido: No me gusta para Dert Floyd
Nuevo artista recomendado: Tom Jones, score: 1


<IPython.core.display.Javascript object>

Has elegido: Me gusta para Tom Jones
