In [1]:
import requests
import re
import pandas as pd
import spotipy
from spotipy.oauth2 import SpotifyClientCredentials

In [2]:
# Coloca tus credenciales aquí
CLIENT_ID = "90527396d8f84493aae641a416e24f17"
CLIENT_SECRET = "0d68e0bcec03408890499dcb774bd3f6"

# Autenticación
auth_manager = SpotifyClientCredentials(client_id=CLIENT_ID, client_secret=CLIENT_SECRET)
sp = spotipy.Spotify(auth_manager=auth_manager)

In [3]:
def rastreo_global(year, limit=50, market='ES', max_results=500):
    """rastreo_global:Realiza una búsqueda global de canciones de un género en Spotify y con un año determinado.

    Arguments:
        año (int o str) -- Año específico para filtrar 

    Keyword Arguments:
        limit {int} -- Número de canciones por solicitud (máx. 50). (default: {50})
        market {str} -- Mercado donde se puede escuchar cada canción (default: {'ES'})
        max_results {int} -- Número total de resultados deseados (default: {500})

    Returns:
        datos {dict} -- lista de dicionarios de canciones con información relevante 
    """
    
    generos = ['reggaeton', 'pop', 'rap', 'indie']
    resultados_por_genero = {}

    # Iterar sobre los géneros
    for genero in generos:
        print(f"Buscando canciones del género {genero}...")

        datos = []  # Lista donde almacenaremos los resultados
        offset = 0  # Para la paginación
        
        while len(datos) < max_results:
            # Realizar la búsqueda en Spotify por género y año
            query = f"genre:{genero} year:{year}"
            busqueda = sp.search(q=query, limit=limit, offset=offset, type='track', market=market)
            
            # Obtener los resultados
            items = busqueda['tracks']['items']
            
            # Si no hay más resultados, salir del bucle
            if not items:
                break

            # Procesar los resultados
            for item in items:
                track_info = {
                    'track_name': item['name'],
                    'artist_name': ', '.join([artist['name'] for artist in item['artists']]),  # Todos los artistas
                    'release_date': item['album']['release_date'],
                    'id_track': item['id'],
                    'popularity': item['popularity'],
                    'genero': genero  # Añadimos el género
                }
                datos.append(track_info)

                # Si alcanzamos el máximo de resultados, detenemos la búsqueda
                if len(datos) >= max_results:
                    break

            # Aumentamos el offset para la siguiente paginación
            offset += limit
        
        # Almacenamos los resultados de este género en el diccionario
        resultados_por_genero[genero] = datos

    return resultados_por_genero


In [4]:
resultados = rastreo_global (year = 2021)

Buscando canciones del género reggaeton...
Buscando canciones del género pop...
Buscando canciones del género rap...
Buscando canciones del género indie...


In [5]:
resultados

{'reggaeton': [{'track_name': 'Ley Seca',
   'artist_name': 'JHAYCO, Anuel AA',
   'release_date': '2021-09-03',
   'id_track': '3JCaq3KDSROg3TXhdiDa9n',
   'popularity': 68,
   'genero': 'reggaeton'},
  {'track_name': 'La Old Skul',
   'artist_name': 'Rauw Alejandro',
   'release_date': '2021-12-10',
   'id_track': '4Z8HZSApeddaRM2ovivUj4',
   'popularity': 75,
   'genero': 'reggaeton'},
  {'track_name': 'ALMAS GEMELAS',
   'artist_name': 'Myke Towers',
   'release_date': '2021-07-22',
   'id_track': '2KcNrONbZ0hvBPjvrDO2tx',
   'popularity': 67,
   'genero': 'reggaeton'},
  {'track_name': 'Desesperados',
   'artist_name': 'Rauw Alejandro, Chencho Corleone',
   'release_date': '2021-12-10',
   'id_track': '6mmPpaltUZK7xjNlBPQQ0p',
   'popularity': 74,
   'genero': 'reggaeton'},
  {'track_name': 'Todo De Ti',
   'artist_name': 'Rauw Alejandro',
   'release_date': '2021-12-10',
   'id_track': '3rdAz1fbUfZxYgaCviYhRo',
   'popularity': 76,
   'genero': 'reggaeton'},
  {'track_name': 'Cúr

In [6]:
len (resultados)

4

In [7]:
type (resultados)

dict

In [8]:
resultados.keys ()

dict_keys(['reggaeton', 'pop', 'rap', 'indie'])

In [9]:
resultados ['pop']

[{'track_name': 'Tiroteo - Remix',
  'artist_name': 'Marc Seguí, Rauw Alejandro, Pol Granch',
  'release_date': '2021-04-01',
  'id_track': '4OwhwvKESFtuu06dTgct7i',
  'popularity': 78,
  'genero': 'pop'},
 {'track_name': 'Mon Amour - Remix',
  'artist_name': 'zzoilo, Aitana',
  'release_date': '2021-08-18',
  'id_track': '5TMLavqGRKNxgzMBrVpC9R',
  'popularity': 72,
  'genero': 'pop'},
 {'track_name': 'La Old Skul',
  'artist_name': 'Rauw Alejandro',
  'release_date': '2021-12-10',
  'id_track': '4Z8HZSApeddaRM2ovivUj4',
  'popularity': 75,
  'genero': 'pop'},
 {'track_name': 'Desesperados',
  'artist_name': 'Rauw Alejandro, Chencho Corleone',
  'release_date': '2021-12-10',
  'id_track': '6mmPpaltUZK7xjNlBPQQ0p',
  'popularity': 74,
  'genero': 'pop'},
 {'track_name': 'Todo De Ti',
  'artist_name': 'Rauw Alejandro',
  'release_date': '2021-12-10',
  'id_track': '3rdAz1fbUfZxYgaCviYhRo',
  'popularity': 76,
  'genero': 'pop'},
 {'track_name': 'Cúrame',
  'artist_name': 'Rauw Alejandro

In [11]:
df_resultados_pop = pd.DataFrame (resultados ['pop'])
df_resultados_pop.to_csv("pop2021.csv")

In [10]:
df_resultados_indie = pd.DataFrame (resultados ['indie'])
df_resultados_indie

Unnamed: 0,track_name,artist_name,release_date,id_track,popularity,genero
0,Exoplaneta,Arde Bogotá,2021-05-07,68PEuXNjodWFts3Ph4BPVv,56,indie
1,La Gent Que Estimo,"Oques Grasses, Rita Payés",2021-05-28,2aTvlIMGoo2L9x5YzJNjj5,57,indie
2,Cariño,Arde Bogotá,2021-05-07,7uWmMWEBGlBAm5B0oMpcs8,54,indie
3,Elefants,Oques Grasses,2021-05-28,7aMxgxCCbkmtRpNNB5OWgY,54,indie
4,Te debo una canción,Shinova,2021-02-26,6E4Z9YuZz9VA7NxXxshXQx,52,indie
...,...,...,...,...,...,...
495,Cheer Up Baby,Inhaler,2021-07-09,4jwrBNhvazRacmab5ArWSZ,49,indie
496,DRUGS,Tai Verdes,2021-05-20,4tVASOccgcigdCfwUamZCh,54,indie
497,Ritchie Sacramento,Mogwai,2021-02-19,7yBwhVl7W0YT5cCMw8MOjW,40,indie
498,Square One,Caamp,2021-02-26,5taOnvtHJUxuaqaLdMNqFd,48,indie


In [11]:
df_resultados_indie.to_csv("indie2021.csv")

In [12]:
df_resultados_rap = pd.DataFrame (resultados ['rap'])
df_resultados_rap

Unnamed: 0,track_name,artist_name,release_date,id_track,popularity,genero
0,Piel de Cordero,"Quevedo, La Pantera",2021-08-07,04d4GpLedinwpfctvgOIhY,63,rap
1,Ahora y Siempre,"Quevedo, Linton",2021-12-11,4iaNmAvcZ6sPGvgZ6vQQdx,64,rap
2,Otra cama,"Hard GZ, Dualy",2021-04-30,5HKnmHBpjIXnSSXlJmrLAQ,56,rap
3,Tu Y Yo (feat. Los del Control),"Cano, Los del Control",2021-10-29,5pVEORKrVAtcWOEMJlZCFB,54,rap
4,Blin Blin,"Bad Gyal, Juanka",2021-03-18,4OWPAMZcoRwAmMA971KBTh,59,rap
...,...,...,...,...,...,...
495,Street Runner,Rod Wave,2021-03-26,5iMRhOHzze2CujxHiJ6cRL,67,rap
496,Yeah - bonus,Mac Miller,2021-10-15,7b8aKAUn1BB2k1clevj4aB,53,rap
497,Boombarrio,"Chystemc, Macrodee",2021-02-26,0san1KUetFkSctwivThY7z,47,rap
498,Sharing Locations (feat. Lil Baby & Lil Durk),"Meek Mill, Lil Durk, Lil Baby",2021-08-27,3J4VKkUpLvomXJbn9ZAypO,53,rap


In [13]:
df_resultados_rap.to_csv("rap2021.csv")

In [13]:
df_resultados_reggaeton = pd.DataFrame (resultados ['reggaeton'])
df_resultados_reggaeton

Unnamed: 0,track_name,artist_name,release_date,id_track,popularity,genero
0,Ley Seca,"JHAYCO, Anuel AA",2021-09-03,3JCaq3KDSROg3TXhdiDa9n,68,reggaeton
1,La Old Skul,Rauw Alejandro,2021-12-10,4Z8HZSApeddaRM2ovivUj4,75,reggaeton
2,ALMAS GEMELAS,Myke Towers,2021-07-22,2KcNrONbZ0hvBPjvrDO2tx,67,reggaeton
3,Desesperados,"Rauw Alejandro, Chencho Corleone",2021-12-10,6mmPpaltUZK7xjNlBPQQ0p,74,reggaeton
4,Todo De Ti,Rauw Alejandro,2021-12-10,3rdAz1fbUfZxYgaCviYhRo,76,reggaeton
...,...,...,...,...,...,...
495,Batman en Can Am,Arcángel,2021-09-17,06xqvKWGYnt3XpCgTpEhCC,35,reggaeton
496,Pa' Guayarte,"J Balvin, Ozuna",2021-09-10,77J8t2pFJYI8k4tZgJ3ybY,37,reggaeton
497,Peligrosa,Maluma,2021-01-28,0iZiKRyiDMhdo7dxDhRuRL,37,reggaeton
498,Tu Veneno,J Balvin,2021-12-10,591Jlv0BcckG5YwEH4yAY2,38,reggaeton


In [14]:
df_resultados_reggaeton.to_csv("reggaeton2021.csv")