# Student Tutorial - Spotify API

### Tutorial di Francesco Petrosino X81000533


![spotify.jpg](img/spotify.jpg)

<br>

## Cos'è Spotify

> **Spotify** è un servizio musicale svedese che offre lo *streaming on demand* di una selezione di brani di varie case discografiche ed etichette indipendenti, incluse *Sony, EMI, Warner Music Group e Universal*. Lanciato nell'ottobre 2008 dalla startup svedese Spotify AB, il servizio ha oltre 75 milioni di utenti al 10 giugno 2015. Il 14 dicembre 2016 vengono raggiunti i 40 milioni di utenti paganti, acquisendo in soli sei mesi 10 milioni di abbonati. Ha registrato più di 140 milioni di utenti attivi mensili nel giugno 2017 e più di 70 milioni di abbonati nel gennaio 2018.<br><br>
*Spotify* è disponibile in versione gratuita e a pagamento, nella maggior parte dei Paesi dell'Europa, nella quasi totalità delle Americhe, in Australia, in Nuova Zelanda e in alcuni Paesi dell'Asia. Il servizio è fruibile attraverso Microsoft Windows, macOS, GNU/Linux (solo per Debian e Ubuntu e senza supporto tecnico), Google Chrome OS, Telia Digital-tv e i dispositivi mobili equipaggiati con iOS (iPod/iPhone/iPad), Android, BlackBerry (in versione beta limitata), Windows Mobile, Windows Phone, S60 (Symbian), webOS, Squeezebox, Boxee, Sonos, Playstation 3, PlayStation 4, PlayStation 5, Xbox One, WD TV e MeeGo.<br><br>
La musica può essere visualizzata per artista, album, etichetta, genere o playlist così come grazie a ricerche dirette. Sui dispositivi desktop un collegamento permette all'ascoltatore di acquistare materiale selezionato presso venditori di terze parti.<br>

Da <a>https://it.wikipedia.org/wiki/Spotify</a>

## API di Spotify

Le API ufficiali fornite da Spotify permettono di ottenere informazioni sulle tracce per conoscere la loro valenza, numero di ascolti, numero di mi piace, e molto altro. Per casi d'uso più avanzati, è possibile ottenere dati di analisi approfonditi su tracce come: segmenti, tatums, bars, beats, pitches, e altro.<br>
I clients dovranno autenticarsi attraverso OAuth2.

![Spotify doc](img/spotify_doc.jpg)

Link alla documentazione: <a>https://developer.spotify.com/documentation/</a>

## Accesso alle API

Le API fornite da Spotify sono accessibili solamente attraverso un account Spotify Developer ed è quindi necessario sottoiscriversi a __[Spotify Developer Dashboard](https://developer.spotify.com/)__ per ottenere un token di autenticazione.

![Spotify developer](img/spotify_developer.JPG)

Per questo **Student Tutorial**, l'app si chiamerà *ProgettoSMM* (da Social Media Management) e sarà un piccolo script in Python per ottenere un semplice riepilogo dell'attività di un account Spotify e inoltre visualizzare informazioni sulle sue 30 tracks più ascoltate.<br>
Una volta cliccato su *create an app* la schermata si richiede alcune informazioni necessarie per poi restituirti una piccola dashboard personale.

![Spotify developer](img/spotify_developer_2.JPG)

Creata l'app, prendere nota di *Client ID* e *Client Secret*. Fatto ciò cliccare su **Edit Settings** ed aggiungere un *Redirect URIs* (ad es: http://localhost:8080). Cliccando su *Save* avremo tutto il necessario per procedere con il tutorial.

Per interagire con le **API REST** fornite dalla piattaforma Spotify stessa, utilizzeremo la libreria **requests** di python.

In [1]:
import requests

Prima di poter richiedere qualsiasi dato, dovremmo ottenere un **access token** tramite l'apposita API *https://accounts.spotify.com/api/token* impostando tra i parametri dell'header le credenziali ottenute nei passaggi precedenti di questo tutorial, come **client_id** e **client_secret**

In [2]:
SPOTIFY_CLIENT_ID='b48898f561ab4533b7396439e6610ff4'
SPOTIFY_CLIENT_SECRET='******************'
REDIRECT_URI='http://localhost:8080'

In [3]:
# richiesta access token
auth_response = requests.post('https://accounts.spotify.com/api/token', {
    'grant_type': 'client_credentials',
    'client_id': SPOTIFY_CLIENT_ID,
    'client_secret': SPOTIFY_CLIENT_SECRET
})

# risposta in JSON
auth_response_data = auth_response.json()
print(auth_response_data)

# access token
headers = {
    'Authorization': 'Bearer {token}'.format(token=auth_response_data['access_token'])
}

{'access_token': 'BQB2MxhIk8vfeGw-oIlyUxfeU8zU3MNWD65adE5JCw42Vh5NH7cm7XjOhltNnLHzA6WzjiA6QyLVkW6K2Vo9mIUas2G8BKQs5GuSdOG7FUIjV_0NDl3Q', 'token_type': 'Bearer', 'expires_in': 3600}


Una volta ottenuto l'**access token** valido per 1 ora dalla richiesta, sarà possibile interagire con le varie API disponibili. <br>
Ad esempio, tramite l'API *https://open.spotify.com/artist/6eUKZXaKkcviH0Ku9w2n3V*, dove "*6eUKZXaKkcviH0Ku9w2n3V*" indica l'identificativo univoco di **Ed Sheeran** sulla piattaforma di Spotify, ottenendo così le sue informazioni

In [4]:
artist_id = '6eUKZXaKkcviH0Ku9w2n3V'

# richiesta informazioni dell'artista
response = requests.get(
    'https://api.spotify.com/v1/artists/' + artist_id,
    headers=headers,
    params={'limit': 50}
)

# risposta
response.json()

{'external_urls': {'spotify': 'https://open.spotify.com/artist/6eUKZXaKkcviH0Ku9w2n3V'},
 'followers': {'href': None, 'total': 111754254},
 'genres': ['pop', 'uk pop'],
 'href': 'https://api.spotify.com/v1/artists/6eUKZXaKkcviH0Ku9w2n3V',
 'id': '6eUKZXaKkcviH0Ku9w2n3V',
 'images': [{'height': 640,
   'url': 'https://i.scdn.co/image/ab6761610000e5eb9e690225ad4445530612ccc9',
   'width': 640},
  {'height': 320,
   'url': 'https://i.scdn.co/image/ab676161000051749e690225ad4445530612ccc9',
   'width': 320},
  {'height': 160,
   'url': 'https://i.scdn.co/image/ab6761610000f1789e690225ad4445530612ccc9',
   'width': 160}],
 'name': 'Ed Sheeran',
 'popularity': 91,
 'type': 'artist',
 'uri': 'spotify:artist:6eUKZXaKkcviH0Ku9w2n3V'}

Un'altra API "*https://api.spotify.com/v1/tracks/0tgVpDi06FyKpA1z0VMD4v*" permette di ottenere le informazioni relative alla track audio **Perfect** con codice univoco "*0tgVpDi06FyKpA1z0VMD4v*"

In [5]:
track_id = '0tgVpDi06FyKpA1z0VMD4v'

# richiesta delle informazioni della traccia audio
response = requests.get(
    'https://api.spotify.com/v1/tracks/' + track_id,
    headers=headers
)

# risposta
response.json()

{'album': {'album_group': 'album',
  'album_type': 'album',
  'artists': [{'external_urls': {'spotify': 'https://open.spotify.com/artist/6eUKZXaKkcviH0Ku9w2n3V'},
    'href': 'https://api.spotify.com/v1/artists/6eUKZXaKkcviH0Ku9w2n3V',
    'id': '6eUKZXaKkcviH0Ku9w2n3V',
    'name': 'Ed Sheeran',
    'type': 'artist',
    'uri': 'spotify:artist:6eUKZXaKkcviH0Ku9w2n3V'}],
  'available_markets': ['AD',
   'AE',
   'AG',
   'AL',
   'AM',
   'AO',
   'AR',
   'AT',
   'AU',
   'AZ',
   'BA',
   'BB',
   'BD',
   'BE',
   'BF',
   'BG',
   'BH',
   'BI',
   'BJ',
   'BN',
   'BO',
   'BR',
   'BS',
   'BT',
   'BW',
   'BY',
   'BZ',
   'CA',
   'CD',
   'CG',
   'CH',
   'CI',
   'CL',
   'CM',
   'CO',
   'CR',
   'CV',
   'CW',
   'CY',
   'CZ',
   'DE',
   'DJ',
   'DK',
   'DM',
   'DO',
   'DZ',
   'EC',
   'EE',
   'EG',
   'ES',
   'ET',
   'FI',
   'FJ',
   'FM',
   'FR',
   'GA',
   'GB',
   'GD',
   'GE',
   'GH',
   'GM',
   'GN',
   'GQ',
   'GR',
   'GT',
   'GW',
   'GY',
  

## API Wrapper: SPOTIPY

Il wrapper usato in questo tutorial è __[Python Spotify API Wrapper](https://spotipy.readthedocs.io/en/2.22.0/)__. Si tratta di un pacchetto per Python il cui scopo è fornire un metodo di accesso semplice alle API di Spotify. L'obiettivo di SPOTIPY è infatti fornire strumenti facili da usare e nel rispetto di tutte le regole d'accesso alle API.

### SPOTIPY Quick Start

Iniziamo il tutorial installando le librerie python richieste, tramite il seguente comando.

In [None]:
pip install spotipy

Come spiegato nella guida __[Quick Start di SPOTIPY](https://spotipy.readthedocs.io/en/2.22.0/#installation)__ creiamo un'instanza per poter contattare i vari metodi esposti dalla libreria, tramite i seguenti comandi:

In [6]:
import spotipy
from spotipy.oauth2 import SpotifyOAuth

Creiamo una nuova istanza - autenticata - così da poterla riutilizzare per richiamare i vari metodi della libreria **spotipy**.<br>
Il parametro **scope** indica le autorizzazioni che verranno concesse solo per accedere alle informazioni pubblicamente disponibili, ovvero solo alle informazioni normalmente visibili nelle piattaforme web e mobile di Spotify.

In [7]:
scope = [
    'user-top-read'
]

# riferimento all'istanza SpotifyOAuth
auth_manager = SpotifyOAuth(
    client_id=SPOTIFY_CLIENT_ID,
    client_secret=SPOTIFY_CLIENT_SECRET,
    redirect_uri=REDIRECT_URI,
    scope=scope
)

# riferimento al client Spotify API
sp = spotipy.Spotify(auth_manager=auth_manager)

È possibile verificare l'identità dell'utente con cui si è effettuato l'accesso attraverso il metodo *current_user()* restituendo in questo caso il nome dell'account

In [8]:
# recupero le informazioni dell'utente correntemente autorizzato con l'istanza SpotifyOAuth
current_user = sp.current_user()

if current_user :
    print('Wellcome,', current_user['display_name'])

Wellcome, Francesco Petrosino


Avendo così configurato tutto, è finalmente possibile arrivare all'obiettivo del tutorial.

## Ottenere le 30 tracks più ascoltate e le informazioni più rilevanti

Questo piccolo progetto fornisce un esempio di uso delle API di Spotify, mostrando alcune delle funzionalità offerte. Lo scopo di questo script è, come illustrato precedentemente, mostrare un piccolo resoconto di un qualunque account utente sulla piattaforma e una lista contenente le tracks più ascoltate al momento e alcune informazioni rilevanti.

Prima di procedere però, importiamo la libreria **pandas** necessaria per la manipolazione dei dati.<br>
> **Pandas** è una libreria di alto livello che mette a disposizione diversi strumenti e strutture dati per l'analisi dei dati. In particolare, Pandas è molto utile per caricare, manipolare e visualizzare i dati in maniera veloce e conveniente prima di passare all'analisi vera e propria.

In [9]:
import pandas

Definendo un dataframe, potremmo ispezionare alcune delle informazioni rilevanti delle varie tracks..<br>
> Un **DataFrame** è una tabella di dati in cui ogni riga rappresenta un elemento "sotto esame" della lista, e ogni colonna invece rappresenta una particolare informazione di quell'elemento.

Per esempio, l'utente che abbiamo scelto per il tutorial ha queste informazioni:

In [10]:
user = {
    'display_name': current_user['display_name'],
    'followers_num': current_user['followers']['total'],
    'profile_link': current_user['href'],
    'id': current_user['id'],
    'images': current_user['images'],
    'type': current_user['type'],
    'uri': current_user['uri']
}

# creo un dataframe con le informazioni dell'utente
user_df = pandas.DataFrame([user], index=['current_user'])

# risposta
user_df

Unnamed: 0,display_name,followers_num,profile_link,id,images,type,uri
current_user,Francesco Petrosino,12,https://api.spotify.com/v1/users/21ktslj6lkgx6...,21ktslj6lkgx6wswmfwu5cwuq,"[{'height': None, 'url': 'https://platform-loo...",user,spotify:user:21ktslj6lkgx6wswmfwu5cwuq


Per ottenere le tracks ascoltate di frequente dall'utente corrente, andremo a richiamare l'apposito metodo *current_user_top_tracks()*

In [11]:
# limite delle tracks da ricevere
tracks_take = 30

# richiesta delle top tracks dell'utente corrente
raw_result = sp.current_user_top_tracks(time_range='medium_term', limit=tracks_take)

Costruiamo adesso un dataframe a partire dal risultato visto in precedenza, scremando la lista con le informazioni più utili e descrittive, come il *nome dell'artista*, *il titolo della traccia audio*, *la popolarità*, *il nome dell'album* e molto altro.

In [12]:
tracks = []
columns_df = ['Id', 'Name', 'Artist name', 'Artist uri', 'Album name', 'Album release date', 'Album total tracks', 'Album uri', 'Disc number', 'Duration (ms)', 'Explicit', 'Href', 'Popularity', 'Uri']

for track in raw_result['items'] :
    tracks.append([
        track['id'],
        track['name'],
        track['artists'][0]['name'],
        track['artists'][0]['uri'],
        track['album']['name'],
        track['album']['release_date'],
        track['album']['total_tracks'],
        track['album']['uri'],
        track['disc_number'],
        track['duration_ms'],
        track['explicit'],
        track['href'],
        track['popularity'],
        track['uri']
    ])
    
tracks_df = pandas.DataFrame(tracks, columns = columns_df)

tracks_df

Unnamed: 0,Id,Name,Artist name,Artist uri,Album name,Album release date,Album total tracks,Album uri,Disc number,Duration (ms),Explicit,Href,Popularity,Uri
0,0O6u0VJ46W86TxN9wgyqDj,I Like You (A Happier Song) (with Doja Cat),Post Malone,spotify:artist:246dkjvS1zLTtiykXe5h60,Twelve Carat Toothache,2022-06-03,14,spotify:album:3HHNR44YbP7XogMVwzbodx,1,192840,True,https://api.spotify.com/v1/tracks/0O6u0VJ46W86...,87,spotify:track:0O6u0VJ46W86TxN9wgyqDj
1,21jGcNKet2qwijlDFuPiPb,Circles,Post Malone,spotify:artist:246dkjvS1zLTtiykXe5h60,Hollywood's Bleeding,2019-09-06,17,spotify:album:4g1ZRSobMefqF6nelkgibi,1,215280,False,https://api.spotify.com/v1/tracks/21jGcNKet2qw...,87,spotify:track:21jGcNKet2qwijlDFuPiPb
2,0e7ipj03S05BNilyu5bRzt,rockstar (feat. 21 Savage),Post Malone,spotify:artist:246dkjvS1zLTtiykXe5h60,beerbongs & bentleys,2018-04-27,18,spotify:album:6trNtQUgC8cgbWcqoMYkOR,1,218146,True,https://api.spotify.com/v1/tracks/0e7ipj03S05B...,85,spotify:track:0e7ipj03S05BNilyu5bRzt
3,1nltpRhEiXikwDlVn4UADk,One Right Now (with The Weeknd),Post Malone,spotify:artist:246dkjvS1zLTtiykXe5h60,Twelve Carat Toothache,2022-06-03,14,spotify:album:3HHNR44YbP7XogMVwzbodx,1,192721,True,https://api.spotify.com/v1/tracks/1nltpRhEiXik...,76,spotify:track:1nltpRhEiXikwDlVn4UADk
4,3a1lNhkSLSkpJE4MSHpDu9,Congratulations,Post Malone,spotify:artist:246dkjvS1zLTtiykXe5h60,Stoney (Deluxe),2016-12-09,18,spotify:album:5s0rmjP8XOPhP6HhqOhuyC,1,220293,True,https://api.spotify.com/v1/tracks/3a1lNhkSLSkp...,83,spotify:track:3a1lNhkSLSkpJE4MSHpDu9
5,4zN21mbAuaD0WqtmaTZZeP,Ferrari,James Hype,spotify:artist:43BxCL6t4c73BQnIJtry5v,Ferrari,2022-04-01,1,spotify:album:6moZ4sNThthUAwCklyuPY8,1,186661,False,https://api.spotify.com/v1/tracks/4zN21mbAuaD0...,85,spotify:track:4zN21mbAuaD0WqtmaTZZeP
6,0RiRZpuVRbi7oqRdSMwhQY,Sunflower - Spider-Man: Into the Spider-Verse,Post Malone,spotify:artist:246dkjvS1zLTtiykXe5h60,Hollywood's Bleeding,2019-09-06,17,spotify:album:4g1ZRSobMefqF6nelkgibi,1,157560,False,https://api.spotify.com/v1/tracks/0RiRZpuVRbi7...,83,spotify:track:0RiRZpuVRbi7oqRdSMwhQY
7,0tgVpDi06FyKpA1z0VMD4v,Perfect,Ed Sheeran,spotify:artist:6eUKZXaKkcviH0Ku9w2n3V,÷ (Deluxe),2017-03-03,16,spotify:album:3T4tUhGYeRNVUGevb0wThu,1,263400,False,https://api.spotify.com/v1/tracks/0tgVpDi06FyK...,90,spotify:track:0tgVpDi06FyKpA1z0VMD4v
8,0t3ZvGKlmYmVsDzBJAXK8C,Goodbyes (feat. Young Thug),Post Malone,spotify:artist:246dkjvS1zLTtiykXe5h60,Hollywood's Bleeding,2019-09-06,17,spotify:album:4g1ZRSobMefqF6nelkgibi,1,174853,True,https://api.spotify.com/v1/tracks/0t3ZvGKlmYmV...,80,spotify:track:0t3ZvGKlmYmVsDzBJAXK8C
9,1jP8Nvxt2umNxMKQwf0Jpa,Levels,Angemi,spotify:artist:3q5DAsSH8efMqNxjxbdpGx,Levels,2022-04-29,1,spotify:album:08iZBVp03FkrNY9n9aOeic,1,159383,False,https://api.spotify.com/v1/tracks/1jP8Nvxt2umN...,19,spotify:track:1jP8Nvxt2umNxMKQwf0Jpa


Una volta ottenuta la lista desiderata, potremmo scorrere lungo il dataframe e per ogni elemento richiedere ad esempio ulteriori informazioni più dettagliate, grazie all'apposita API **audio_features** mostrata di seguito

In [13]:
# richiesta delle features di una track
audio_features = sp.audio_features(tracks=[tracks_df.loc[0, 'Id']])

# risposta
audio_features

[{'danceability': 0.733,
  'energy': 0.67,
  'key': 5,
  'loudness': -6.009,
  'mode': 1,
  'speechiness': 0.0751,
  'acousticness': 0.121,
  'instrumentalness': 0,
  'liveness': 0.121,
  'valence': 0.472,
  'tempo': 100.964,
  'type': 'audio_features',
  'id': '0O6u0VJ46W86TxN9wgyqDj',
  'uri': 'spotify:track:0O6u0VJ46W86TxN9wgyqDj',
  'track_href': 'https://api.spotify.com/v1/tracks/0O6u0VJ46W86TxN9wgyqDj',
  'analysis_url': 'https://api.spotify.com/v1/audio-analysis/0O6u0VJ46W86TxN9wgyqDj',
  'duration_ms': 192841,
  'time_signature': 4}]

Le informazioni appena ritornate indicano attributi specifici della traccia audio, come:

- **Speechiness**: indica quanto una traccia contiene parole rispetto alla musica. 
- **Acousticness**: indica quanto una traccia è acustica rispetto all'uso di strumenti elettronici.
- **Instrumentalness**: indica quanto una traccia contiene parti strumentali rispetto alla presenza di voci.
- **Liveness**: indica quanto una traccia è stata registrata dal vivo rispetto a una registrazione in studio.
- **Valence**: indica la positività o negatività percepita della traccia.
- **Tempo**: indica il ritmo della traccia espresso in BPM (battiti per minuto).
- **Loudness**: indica il volume medio della traccia in decibel (dB).
- **Energy**: indica la quantità di energia percepita nella traccia. 

Queste informazioni sono spesso utilizzate per classificare e catalogare le tracce musicali in base alle loro caratteristiche sonore. Ad esempio, una traccia con un alto valore di acousticness e un basso valore di instrumentalness potrebbe essere considerata una canzone acustica tradizionale, mentre una traccia con un alto valore di energy e loudness potrebbe essere considerata una canzone adatta a ballare.

## Conclusione

Questo student tutorial si pone come piccola guida di introduzione allo sviluppo di applicazioni per l'analisi dati e di statistica, illustrando i passaggi per ottenere l'autenticazione e presentando in breve le API ufficiali.<br><br>
Per approfondimenti, visitare la documentazione ufficiale delle API di Spotify: <a>https://developer.spotify.com/documentation/</a>