<h1> <center> Sistema de recomendación de canciones para Spotify </h1></center>

Elaborado por:
- Sebastian Gil
- Jhon Ramírez Daza
- Nicolás Rodríguez



<center> <img src = 'https://www.muycomputer.com/wp-content/uploads/2023/02/Spotify-1.jpg'> </center>

<center><H2> Introducción </H2></center> 

La música es una de las formas de entretenimiento más populares en todo el mundo. En la actualidad, plataformas de streaming como Spotify ofrecen acceso a millones de canciones en línea, lo que hace que los usuarios tengan muchas opciones a la hora de escuchar música. Sin embargo, encontrar nuevas canciones que se adapten a los gustos y preferencias de cada usuario puede ser un reto, y es por ello que los sistemas de recomendación de canciones pueden ser de gran ayuda.

En este proyecto se propone el desarrollo de un sistema de recomendación de canciones para Spotify utilizando técnicas de inteligencia artificial. El objetivo principal es crear un modelo de aprendizaje automático que pueda analizar el historial de reproducción del usuario y ofrecer sugerencias de canciones que se adapten a sus gustos y preferencias.

<center><H2> Objetivos </H2></center>   

El objetivo principal del proyecto es desarrollar un sistema de recomendación de canciones para Spotify utilizando técnicas de inteligencia artificial. Para lograr este objetivo se plantean los siguientes objetivos específicos:

1. Recopilar y procesar datos de historial de reproducción de usuarios de Spotify.
2. Analizar y visualizar los datos de historial de reproducción.
3. Seleccionar y entrenar modelos de aprendizaje automático para el sistema de recomendación de canciones.
4. Evaluar y comparar el rendimiento de los modelos propuestos.

<center><H2> Metodología </H2></center>   

La metodología a seguir en el proyecto se divide en las siguientes etapas:

1. Recopilación y procesamiento de datos: se recopilarán datos de historial de reproducción de usuarios de Spotify utilizando la API de Spotify. Estos datos se procesarán para su posterior análisis y entrenamiento de modelos.

2. Análisis exploratorio de datos: se realizará un análisis exploratorio de datos para comprender mejor los patrones y tendencias en el historial de reproducción de los usuarios. Se utilizarán técnicas de visualización de datos para identificar las relaciones y correlaciones entre las variables.

3. Selección y entrenamiento de modelos: se seleccionarán y entrenarán modelos de aprendizaje automático para el sistema de recomendación de canciones. Se utilizarán técnicas de aprendizaje supervisado y no supervisado para entrenar modelos que puedan predecir las canciones que un usuario podría querer escuchar.

4. Evaluación y comparación de modelos: se evaluarán los modelos propuestos utilizando métricas de rendimiento como precisión, recall y F1-score. Se compararán los modelos para determinar cuál es el mejor para el sistema de recomendación de canciones.

<center><H2> Problemas </H2></center>

-  **Conseguir datos para el entrenamiento :**
Para entrenar un modelo de reconocimiento de texto manual, necesitamos un conjunto de datos que contenga imágenes de texto manuscrito y las correspondientes transcripciones de texto.

-  **Problemas de compatibilidad de datos**: Es posible que los datos del historial de reproducción no sean compatibles con el formato de entrada requerido por el modelo de recomendación. Esto podría ser fácilmente resuelto mediante la conversión o la normalización de los datos.

- **Extracción de características:**
La siguiente etapa es extraer características de las imágenes. Hay muchas técnicas diferentes que se pueden utilizar para extraer características, como la Transformada de Fourier, la Transformada Wavelet, etc.

- **Entrenamiento del modelo:**
 Una vez extraídas las características de las canciones (género, duración, país de origen de los artistas, entre otros) se tiene que entrenar un modelo de aprendizaje automático.

- **Dificultades en la interpretación de resultados:** El modelo de recomendación es difícil de interpretar debido a la complejidad de los algoritmos de aprendizaje automático utilizados. Será necesario proporcionar explicaciones y visualizaciones para que los usuarios comprendan cómo se generan las recomendaciones.



<img src = 'https://revista.jovenclub.cu/wp-content/uploads/2015/09/SR-copia.png'>


<center> <h2>  Datos disponibles </h2></center>
Contamos con los datos originales y actualizado de *Spotify* luego de contar con una cuenta de desarrollador en la empresa.

* https://developer.spotify.com/


<h3> Referencias: </h3>

- https://www.kaggle.com/code/vatsalmavani/music-recommendation-system-using-spotify-dataset/notebook
- https://spotipy.readthedocs.io/en/2.22.1/#

# Importación y visualización de los datos
 ## Spotify
 La mayoría del trabajo _descriptivo_ fue realizado principalmente con las herramientas que nos brinda la librería spotipy. De entre estas facilidades es importante las que nos dan la posibilidad de obtener datos de artistas, álbumes, playlist y canciones que son los que se usarán para la realización general del trabajo.

 La forma en la que spotify nos permite obtener información de su API es mediante una **cuenta de desarrollador** que nos da acceso a dos tokens con los cuales obtenemos los datos ejecutando simples sentencias de consulta acompañados de la clave para cada  álbum, artista, playlist o canción.

In [None]:
!pip install spotipy 

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting spotipy
  Downloading spotipy-2.23.0-py3-none-any.whl (29 kB)
Collecting redis>=3.5.3
  Downloading redis-4.5.5-py3-none-any.whl (240 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m240.3/240.3 kB[0m [31m6.5 MB/s[0m eta [36m0:00:00[0m
Collecting async-timeout>=4.0.2
  Downloading async_timeout-4.0.2-py3-none-any.whl (5.8 kB)
Installing collected packages: async-timeout, redis, spotipy
Successfully installed async-timeout-4.0.2 redis-4.5.5 spotipy-2.23.0


In [None]:
import os
import numpy as np
import pandas as pd

import seaborn as sns
import plotly.express as px
import matplotlib.pyplot as plt
%matplotlib inline

from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import Pipeline
from sklearn.manifold import TSNE
from sklearn.decomposition import PCA
from sklearn.metrics import euclidean_distances
from scipy.spatial.distance import cdist

import warnings
warnings.filterwarnings("ignore")

CLIENT_ID="fbb716a64f9f4a0897a0c1f0ff5d8c8a"# tokens de acceso spotify#
CLIENT_SECRET="d4e4797721244914a849dbe8ceaba1ae"
import spotipy
from spotipy.oauth2 import SpotifyClientCredentials

In [None]:
data = pd.read_csv("/content/data.csv")
genre_data = pd.read_csv('/content/data_by_genres.csv')
year_data = pd.read_csv('/content/data_by_year.csv')

FileNotFoundError: ignored

In [None]:
print(data.info())
print(genre_data.info())
print(year_data.info())

In [None]:
CLIENT_ID="fbb716a64f9f4a0897a0c1f0ff5d8c8a"# tokens de acceso spotify#
CLIENT_SECRET="d4e4797721244914a849dbe8ceaba1ae"
import spotipy
from spotipy.oauth2 import SpotifyClientCredentials

elCuar_uri = 'spotify:artist:13JJKrUewC1CJYmIDXQNoH'# clave unica para artista#
spotify = spotipy.Spotify(client_credentials_manager=SpotifyClientCredentials(CLIENT_ID,CLIENT_SECRET))

results = spotify.artist_albums(elCuar_uri, album_type='album')
albums = results['items']
while results['next']:
    results = spotify.next(results)
    albums.extend(results['items'])

for album in albums:
    print(album['name'])

ModuleNotFoundError: ignored

In [None]:
CLIENT_ID="fbb716a64f9f4a0897a0c1f0ff5d8c8a"
CLIENT_SECRET="d4e4797721244914a849dbe8ceaba1ae"
import spotipy
from spotipy.oauth2 import SpotifyClientCredentials

La_oreja= 'spotify:artist:4U7lXyKdSf1JbM1aXvsodC'
spotify = spotipy.Spotify(client_credentials_manager=SpotifyClientCredentials(CLIENT_ID,CLIENT_SECRET))

results = spotify.artist_albums(La_oreja, album_type='album')
albums = results['items']
while results['next']:
    results = spotify.next(results)
    albums.extend(results['items'])

for album in albums:
    print(album['name'])

In [None]:
CLIENT_ID="fbb716a64f9f4a0897a0c1f0ff5d8c8a"
CLIENT_SECRET="d4e4797721244914a849dbe8ceaba1ae"
import spotipy
from spotipy.oauth2 import SpotifyClientCredentials

La_oreja= 'spotify:artist:4U7lXyKdSf1JbM1aXvsodC'
spotify = spotipy.Spotify(client_credentials_manager=SpotifyClientCredentials(CLIENT_ID,CLIENT_SECRET))

results = spotify.artist_albums(La_oreja, album_type='album')
albums = results['items']
while results['next']:
    results = spotify.next(results)
    albums.extend(results['items'])

for album in albums:
    print(album['id'])

In [None]:
idartista=['spotify:artist:4U7lXyKdSf1JbM1aXvsodC','spotify:artist:13JJKrUewC1CJYmIDXQNoH']
CLIENT_ID="fbb716a64f9f4a0897a0c1f0ff5d8c8a"
CLIENT_SECRET="d4e4797721244914a849dbe8ceaba1ae"
import spotipy
sp = spotipy.Spotify()
from spotipy.oauth2 import SpotifyClientCredentials

for id in idartista:
    artista=id
    spotify = spotipy.Spotify(client_credentials_manager=SpotifyClientCredentials(CLIENT_ID,CLIENT_SECRET))
    results = spotify.artist_albums(artista, album_type='album')
    albums = results['items']
    while results['next']:
        results = spotify.next(results)
        albums.extend(results['items'])
    for album in albums:
            print(album['name'])

In [None]:
def artista_album(id_artista):
    CLIENT_ID="fbb716a64f9f4a0897a0c1f0ff5d8c8a"
    CLIENT_SECRET="d4e4797721244914a849dbe8ceaba1ae"
    import spotipy
    from spotipy.oauth2 import SpotifyClientCredentials
    for id in id_artista:
        artista=id
        spotify = spotipy.Spotify(client_credentials_manager=SpotifyClientCredentials(CLIENT_ID,CLIENT_SECRET))
        results = spotify.artist_albums(artista, album_type='album')
        albums = results['items']
        infoArtista = spotify.artist(id_artista)
        print(infoArtista['name'])
        while results['next']:
            results = spotify.next(results)
            albums.extend(results['items'])
        for album in albums:
            print(album['name'])

idartista=['spotify:artist:4U7lXyKdSf1JbM1aXvsodC','spotify:artist:13JJKrUewC1CJYmIDXQNoH']
artista_album(idartista)

ModuleNotFoundError: ignored