# <center> Tutorial API Spotify </center>


![logo%20migliore.png](attachment:logo%20migliore.png)

### Realizzato da Marco Ardizzone
### X81001077


## Perchè analizzare Spotify? Un semplice servizio di streaming musicale....
Spotity con oltre 50 milioni di brani è la piattaforma più grande al mondo per lo streaming di musica.
Si _stima_ che nel primo trimestre del 2020 abbia avuto 286 milioni di utenti attivi, di cui 130 mln iscritti a Premium.
> fonte: https://www.businessofapps.com/data/spotify-statistics/ 

Analizzare *bene* i dati da Spotify permetterebbe ad un artista di sapere quali caratteristiche hanno le canzoni di maggior successo, in modo da poter creare brani che rispecchino i gusti della maggior parte delle persone.

## Come accedere alle API?

Per l'accesso alle API ufficiali è necessario creare un account Spotify's Developer.
Per fare ciò bisogna:

    * Fare login oppure creare un account, qualora non se ne avesse uno
    * Accettare i termini di servizio


![termini.di.servizio.jpg](attachment:termini.di.servizio.jpg)

Una volta *letto* e accettato i termini di servizio si arriverà alla Dashboard, dove sarà possibile creare la propria applicazione.



![dashboard.jpg](attachment:dashboard.jpg)

<p>Bisognerà dare un nome, una breve descrizione ed accettare gli ulteriori termini di servizio imposti da Spotify.</p>

![create.an.app.compilato.jpg](attachment:create.an.app.compilato.jpg)

<p>Sarà adesso possibile visualizzare la Dashboard della App, che presenterà il nome, la descrizione, **Client ID** e **Client Secret**, fondamentali per poter accedere ai dati.</p>

![dashboard.app.jpg](attachment:dashboard.app.jpg)

Adesso che abbiamo il Client ID e Client Secret possiamo scrivere il codice che permetterà di connetterci a Spotify

Innanzitutto bisogna installare il modulo ***request*** mediante **pip install requests**, il che ci permetterà di mandare richieste HTTP e ricevere dati in formato JSON

In [1]:
import requests
import datetime
from urllib.parse import urlencode
import base64

In [2]:
#inserisco client ID e client Secret che mi permetteranno di accedere alle API
client_id = '39a9b81916fa4fd8b19775b13a8d0788'
client_secret = '1e3f3dec8c63431baf90d47df9f01f00'

In [3]:
#creo la classe SpotifyAPI per permettere l'autenticazione e l'accesso a Spotify
class SpotifyAPI(object):
    access_token = None
    access_token_expires = datetime.datetime.now() #se esiste un token, deve scadere
    access_token_did_expire = True                 #di default il token è scaduto
    client_id = None
    client_secret = None
    token_url = "https://accounts.spotify.com/api/token"
    
    def __init__(self, client_id, client_secret, *args, **kwargs):
        super().__init__(*args, **kwargs)
        self.client_id = client_id
        self.client_secret = client_secret

    def get_client_credentials(self):
        """
        Ritorna una stringa codificata in Base64
        """
        client_id = self.client_id
        client_secret = self.client_secret
        if client_secret == None or client_id == None:
            raise Exception("Devi inserire un client_id e un client_secret valido")
        client_creds = f"{client_id}:{client_secret}"
        client_creds_b64 = base64.b64encode(client_creds.encode())
        return client_creds_b64.decode()
    
    def get_token_headers(self):
        client_creds_b64 = self.get_client_credentials()
        return {
            "Authorization": f"Basic {client_creds_b64}"
        }
    
    def get_token_data(self):
        return {
            "grant_type": "client_credentials"
        } 
    
    def perform_auth(self):
        token_url = self.token_url
        token_data = self.get_token_data()
        token_headers = self.get_token_headers()
        r = requests.post(token_url, data=token_data, headers=token_headers) #faccio una richiesta POST
        if r.status_code not in range(200, 299): #se lo status è compreso tra 200 e 299 la richiesta è andata a buon fine
            raise Exception("Autenticazione fallita")
        data = r.json() #ottengo le informazioni dalla richiesta POST in formato JSON
        now = datetime.datetime.now()
        access_token = data['access_token']
        expires_in = data['expires_in'] # seconds
        expires = now + datetime.timedelta(seconds=expires_in) #calcolo quando il token scadrà
        self.access_token = access_token
        self.access_token_expires = expires
        self.access_token_did_expire = expires < now #verifico se il token è scaduto o meno
        return True
    
    def get_access_token(self):
        token = self.access_token
        expires = self.access_token_expires
        now = datetime.datetime.now()
        if expires < now:
            self.perform_auth()
            return self.get_access_token()
        elif token == None:
            self.perform_auth()
            return self.get_access_token() 
        return token
    
    def get_resource_header(self):
        access_token = self.get_access_token()
        headers = {
            "Authorization": f"Bearer {access_token}"
        }
        return headers
        
        
    def get_resource(self, lookup_id, resource_type='albums', version='v1'):
        endpoint = f"https://api.spotify.com/{version}/{resource_type}/{lookup_id}"
        headers = self.get_resource_header()
        r = requests.get(endpoint, headers=headers)
        if r.status_code not in range(200, 299):
            return {}
        return r.json()
    
    def get_album(self, _id):
        return self.get_resource(_id, resource_type='albums')
    
    def get_artist(self, _id):
        return self.get_resource(_id, resource_type='artists')
    
    def base_search(self, query_params): # type
        headers = self.get_resource_header()
        endpoint = "https://api.spotify.com/v1/search"
        lookup_url = f"{endpoint}?{query_params}" #la url da cercare
        r = requests.get(lookup_url, headers=headers)
        if r.status_code not in range(200, 299):  #se il codice è tra 200 e 299 la richiesta è andata a buon fine
            return {}
        return r.json()
    
    def search(self, query=None, operator=None, operator_query=None, search_type='artist' ):
        if query == None:
            raise Exception("Query non valida")
        if isinstance(query, dict):
            query = " ".join([f"{k}:{v}" for k,v in query.items()])
        if operator != None and operator_query != None:
            if operator.lower() == "or" or operator.lower() == "not":
                operator = operator.upper()
                if isinstance(operator_query, str):
                    query = f"{query} {operator} {operator_query}"
        query_params = urlencode({"q": query, "type": search_type.lower()})
        #print(query_params) ritorna il formato della query
        return self.base_search(query_params)

Adesso che abbiamo creato la classe SpotifyAPI, creiamo un oggetto per fare una ricerca:

In [4]:
spotify = SpotifyAPI(client_id, client_secret)
spotify.search(query="Danger", operator="NOT", operator_query="Beyonce", search_type='track')

{'tracks': {'href': 'https://api.spotify.com/v1/search?query=Danger+NOT+Beyonce&type=track&offset=0&limit=20',
  'items': [{'album': {'album_type': 'album',
     'artists': [{'external_urls': {'spotify': 'https://open.spotify.com/artist/4MCBfE4596Uoi2O4DtmEMz'},
       'href': 'https://api.spotify.com/v1/artists/4MCBfE4596Uoi2O4DtmEMz',
       'id': '4MCBfE4596Uoi2O4DtmEMz',
       'name': 'Juice WRLD',
       'type': 'artist',
       'uri': 'spotify:artist:4MCBfE4596Uoi2O4DtmEMz'}],
     'available_markets': ['AD',
      'AE',
      'AL',
      'AR',
      'AT',
      'AU',
      'BA',
      'BE',
      'BG',
      'BH',
      'BO',
      'BR',
      'BY',
      'CA',
      'CH',
      'CL',
      'CO',
      'CR',
      'CY',
      'CZ',
      'DE',
      'DK',
      'DO',
      'DZ',
      'EC',
      'EE',
      'EG',
      'ES',
      'FI',
      'FR',
      'GB',
      'GR',
      'GT',
      'HK',
      'HN',
      'HR',
      'HU',
      'ID',
      'IE',
      'IL',
      'IN'

> Esempio di una query strutturata in cui cerchiamo il brano 'Danger' che non sia quello di 'Beyonce'

Questo codice ci permette già di effettuare analisi sui dati di Spotify, ma ci rendiamo conto che il codice non è semplicissimo.
Esistono delle librerie di terze parti che permettono di accedere ai dati di Spotify in maniera più semplice.

## Spotipy: A lighweight Python library for the Spotify Web API


![spotify.logo.png](attachment:spotify.logo.png)

Spotipy è una libreria di terze parti che gestisce in modo rapido e veloce l'accesso alle API di Spotify e mette a disposizione diverse funzioni per accedere ai dati.

Per utilizzare Spotipy bisogna prima installare e importare le librerie.


Si usa **pip install spotipy** per installare Spotipy e poterlo importare successivamente nel codice

In [5]:
import spotipy
from spotipy.oauth2 import SpotifyClientCredentials
import pandas as pd
import time

#inserisco client_id e client_secret
client_id = '39a9b81916fa4fd8b19775b13a8d0788'
client_secret = '1e3f3dec8c63431baf90d47df9f01f00'

client_credentials_manager = SpotifyClientCredentials(client_id, client_secret)
sp = spotipy.Spotify(client_credentials_manager = client_credentials_manager)

Notiamo subito che Spotipy ci permette di connetterci alle API in sole 2 righe, a differenza delle decine di righe di codice di cui si ha bisogno per connettersi senza utilizzare librerie esterne.

In [6]:
#definiamo ora una funzione che scorra tutti gli ID di una determinata playlist
def getTrackIDs(user, playlist_id):
    ids = []
    playlist = sp.user_playlist(user, playlist_id)
    for item in playlist['tracks']['items']:
        track = item['track']
        ids.append(track['id'])
    return ids

ids= getTrackIDs('YzNr5nACTJ2-F97nCGEk5w', '37i9dQZF1DX0XUsuxWHRQd')

Adesso testiamo il metodo con la playlist "Rap Caviar" di Spotify.
Per ottenere user e playlist_id bisogna andare nella playlist, fare tasto destro e copiare il link della playlist.

![come.prendere.playlist.jpg](attachment:come.prendere.playlist.jpg)

Il link della playlist si presenta nel seguente modo: https//open.spotifydotcom/playlist/**37i9dQZF1DX0XUsuxWHRQd**?si=**lNtOMLmxQWKNgw0J5zTQlA**


Il primo codice è l'ID della playlist, mentre il secondo è l'ID dell'utente che ha creato la playlist (Spotify, in questo caso)

In [7]:
#scriviamo ora una funzione che prenda informazioni da tutte le canzoni di una playlist
def getTrackFeatures(id):
    meta = sp.track(id) #meta conterrà tutti i meta-dati della traccia
    features = sp.audio_features(id) #features conterrà tutte le caratteristiche della traccia
    
    #metadati
    name = meta['name']
    album = meta['album']['name']
    artist = meta['album']['artists'][0]['name']
    release_date = meta['album']['release_date']
    lenght = meta['duration_ms']
    popularity = meta['popularity']
    
    #features
    acousticness = features[0]['acousticness']
    danceability = features[0]['danceability']
    energy = features[0]['energy']
    instrumentalness = features[0]['instrumentalness']
    liveness = features[0]['liveness']
    loudness = features[0]['loudness']
    speechiness = features[0]['speechiness']
    tempo = features[0]['tempo']
    time_signature = features[0]['time_signature']
    
    #compongo "track" con tutte le sue caratteristiche
    track = [name, album, artist, release_date, lenght, popularity, danceability, acousticness, danceability, energy, instrumentalness, liveness, loudness, speechiness, tempo, time_signature]
    return track

    

In [8]:
#definiamo ora una funzione che scorra ogni traccia di una playlist e ritorni le informazioni in formato csv (tramite pandas)
tracks = []
for i in range(len(ids)):
    time.sleep(.5)
    track = getTrackFeatures(ids[i])
    tracks.append(track)
    
    #creiamo ora un dataframe tramite pandas per visualizzare i dati esportando in .csv
    df = pd.DataFrame(tracks, columns = ['name', 'album', 'artist', 'release_date', 'lenght', 'popularity', 'danceability', 'acousticness', 'danceability', 'energy', 'instrumentalness', 'liveness', 'loudness', 'speechiness', 'tempo', 'time_signature'])
    #df.to_csv("spotify.csv", sep= ',')

In [9]:
df.head()

Unnamed: 0,name,album,artist,release_date,lenght,popularity,danceability,acousticness,danceability.1,energy,instrumentalness,liveness,loudness,speechiness,tempo,time_signature
0,Tyler Herro,Tyler Herro,Jack Harlow,2020-10-22,156497,86,0.794,0.11,0.794,0.756,0.0,0.247,-7.16,0.136,123.066,4
1,"Lemonade (feat. Gunna, Don Toliver & NAV)",B4 The Storm,Internet Money,2020-08-28,195428,90,0.8,0.25,0.8,0.658,0.0,0.111,-6.142,0.079,140.042,4
2,Moonwalking in Calabasas (feat. Blueface) - Remix,Moonwalking in Calabasas (feat. Blueface) [Remix],DDG,2020-10-30,170232,83,0.928,0.0614,0.928,0.341,0.0,0.162,-10.196,0.103,129.966,4
3,Runnin,SAVAGE MODE II,21 Savage,2020-10-02,195906,87,0.819,0.00748,0.819,0.626,0.101,0.167,-4.574,0.202,143.01,4
4,Onna Come Up,Onna Come Up,Lil Eazzyy,2020-06-05,128078,67,0.793,0.382,0.793,0.571,5e-06,0.101,-9.247,0.249,150.052,4


## Che fare con questi dati?
<p>Con i dati che abbiamo ottenuto possiamo adesso effettuare varie analisi. </p>
<p>Ad esempio, potremmo monitorare che caratteristiche hanno i brani di maggior successo e suggerire ad un determinato artista quali sono le caratteristiche di un brano di successo, in modo da poter realizzare brani che siano conformi con i gusti degli utenti.</p>