<a href="https://colab.research.google.com/github/DanielDialektico/machine-learning-practices/blob/main/notebooks/Otros/Tutorial_API_de_Spotify.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<img src="https://dialektico.com/wp-content/uploads/2023/03/MiniLogoW4.png" alt="Dial√©ktico Logo" />

# **Consumo de API de Spotify con Python usando Spotipy üéº**

# **Introducci√≥n**

En este **notebook** pondremos en pr√°ctica c√≥mo consumir la **API** de **Spotify** usando la librer√≠a Spotipy de Python, donde obtendremos datos de canciones y artistas, y los ordenaremos en formato tabular para finalmente almacenar la informaci√≥n en un CSV.

Este notebook es parte del [tutorial de c√≥mo consumir la API de Spotify con Python](https://dialektico.com/tutorial-api-spotify-python/), donde se pueden hallar instrucciones m√°s detalladas.

<br>
<center><img src="https://dialektico.com/wp-content/uploads/2025/01/APIS_colab.jpg" width="300" /></center>

<br>
<center><img src="https://dialektico.com/wp-content/uploads/2025/01/APIS_Colab_obj.jpg" width="300" /></center>

<br>

# **Instalaci√≥n de librer√≠as**

Instalamos la librer√≠as:

***Nota*:** *Las instalaciones se realizan a pesar de que algunas librer√≠as ya est√°n integradas de forma nativa en Colab, esto para asegurar que el Notebook no presente problemas de ejecuci√≥n si se dan cambios de sintaxis entre versiones de librer√≠as.*

In [None]:
!pip install pandas==2.2.2
!pip install tqdm==4.67.1
!pip install spotipy==2.25.0

<br>

# **Se a√±aden las credenciales de autenticaci√≥n**

Se declaran las variables con las **credenciales** ([ver tutorial](https://dialektico.com/tutorial-api-spotify-python/)).

In [None]:
# Se importan las librer√≠as necesarias.
import warnings
import spotipy
from spotipy.oauth2 import SpotifyClientCredentials
import pandas as pd
from tqdm import tqdm

# Se filtran las advertencias.
warnings.filterwarnings('ignore')

# Se declara el ID del cliente.
client_id = 'A√±ade tu Client ID'

# Se declara el valor del secret client.
client_secret = 'A√±ade tu Client Secret'

client_credentials_manager = SpotifyClientCredentials(client_id, client_secret)

<br>

# **Usando Spotipy para extraer datos**

Comenzamos creando el objeto que nos permitir√° consumir los endpoints de la API.

In [None]:
# Se crea el cliente que se utilizar√° para consumir la API.
sp = spotipy.Spotify(client_credentials_manager=client_credentials_manager)

Probamos utilizando la funci√≥n search, la cual permite obtener informaci√≥n del cat√°logo de Spotify sobre **√°lbumes**, **artistas**,** listas de reproducci√≥n**, **canciones**, **programas**, **episodios** o **audiolibros** que coincidan con una cadena de palabras clave (es decir, buscar√° y traer√° informaci√≥n sobre alg√∫n elemento especificado).

Visualizamos el formato en el que se entrega la informaci√≥n, haciendo una b√∫squeda de datos de la agrupaci√≥n **Blackpink**.

In [None]:
# Se busca informaci√≥n sobre Blackpink.
result = sp.search(q='Blackpink', type='artist', limit=1)

# Se imprime el resultado.
result

Ahora accedemos a un elemento en particular del diccionario, en este caso, al **n√∫mero total de seguidores** del grupo en la plataforma:

In [None]:
# Se imprime el n√∫mero de seguidores de Blackpink.
result['artists']['items'][0]['followers']['total']

Obtenemos el top de 10 canciones m√°s populares de la banda utilizando el m√©todo [artist_top_tracks](https://spotipy.readthedocs.io/en/2.22.1/#spotipy.client.Spotify.artist_top_tracks):

In [None]:
# Se obtiene ID de Blackpink de la informaci√≥n antes extra√≠da.
blackpink_id = result['artists']['items'][0]['id']

# Se obtienen las 10 canciones m√°s escuchadas de Blackpink.
results = sp.artist_top_tracks(blackpink_id)

# Se imprime el nombre de las canciones.
for track in results['tracks']:
    print(track['name'])

<br>

## **Extrayendo datos en tablas**

Creamos una funci√≥n para la extracci√≥n de 50 canciones de un **g√©nero** definido (par√°metro de entrada), sus caracter√≠sticas, y ordena la informaci√≥n en un dataFrame de **Pandas**:

In [None]:
def get_tracks_by_genre(genre):
    """
    Funci√≥n que obtiene informaci√≥n de 50 canciones de un g√©nero musical de
    Spotify y organiza la informaci√≥n de un Pandas dataframe.
    """

    # Se buscan 50 canciones del g√©nero especificado.
    results = sp.search(q=f'genre:{genre}', type='track', limit=50)

    # Se extraen los IDs de las canciones.
    track_ids = [track['id'] for track in results['tracks']['items']]

    # Se obtienen detalles de las canciones.
    tracks_info = sp.tracks(tracks=track_ids)

    # Se crea una lista para almacenar los datos.
    track_data = []

    # Se obtienen los datos de cada canci√≥n y se a√±aden a la lista.
    for track in tracks_info['tracks']:
        track_data.append({
            'genre': genre,
            'name': track['name'],
            'artists_name': ', '.join([artist['name'] for artist in track['artists']]),  # Si hay varios artistas
            'album_name': track['album']['name'],
            'album_release_date': track['album']['release_date'],
            'duration_ms': track['duration_ms'],
            'popularity': track['popularity'],
            'track_number': track['track_number'],
            'uri': track['uri']
        })

    # Se convierte la lista en un DataFrame de pandas.
    df = pd.DataFrame(track_data)

    return df

Probamos la funci√≥n con el g√©nero **Rock**:

In [None]:
# Ejemplo de uso con el g√©nero 'rock'.
genre = "rock"
get_tracks_by_genre(genre)

**Nota**: una lista de los g√©neros disponibles se puede consultar en [https://everynoise.com/everynoise1d.html](https://everynoise.com/everynoise1d.html)

Ahora creamos un bucle que obtenga estos datos para cada g√©nero especificado de una **lista**, y concatenamos las **tablas** resultantes para obtener un conjunto de datos:

In [None]:
# Se crea una lista con los g√©neros musicales deseados.
genres_list = ['world-music', 'salsa', 'rock-n-roll', 'reggae', 'reggaeton', 'pop', 'black-metal', 'k-pop', 'hip-hop', 'electronic']

# Se itera sobre esta lista utilizando sus elementos como entradas de la funci√≥n creada.
tables = []

for item in tqdm(genres_list, desc = 'Creando conjunto de datos:'):
  table = get_tracks_by_genre(item)
  tables.append(table)

# Se concatenan las tablas y se imprime el resultado.
dataset = pd.concat(tables)
dataset

Por √∫ltimo se descarga en formato CSV:

In [None]:
# Se convierte a formato CSV.
dataset.to_csv('dataset.csv', index=False)

# Se descarga el CSV.
from google.colab import files
files.download('dataset.csv')

O en formato XLS:

In [None]:
# Se convierte a formato Excel.
dataset.to_excel('dataset.xlsx', index=False)

# Se descarga el Excel.
from google.colab import files
files.download('dataset.xlsx')

No olvides que puedes encontrar m√°s t√≥picos como este en https://dialektico.com/.

‚ñ∂ [Regresar al tutorial](https://dialektico.com/tutorial-api-spotify-python/) üìï

<br>

In [None]:
# Dialektico Machine learning practices ¬© 2024 by Daniel Antonio Garc√≠a Escobar
# is licensed under CC BY-NC 4.0. To view a copy of this license,
# visit https://creativecommons.org/licenses/by-nc/4.0/

# Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International
# Public License