<div style="display: flex; align-items: center;">
    <img src="static/logo.png" width="120" height="120">
    <h1>Spotify Web API Tutorial</h1>
</div>

<p>
    The Spotify Web API allows the creation of applications that can interact with Spotify's streaming service, such as retrieving metadata about content, getting recommendations, creating and managing playlists, or controlling playback.
</p>

<h2>Table of Contents</h2>
<ol>
    <li><a href="#preamble">Preamble</a></li>
    <li><a href="#introduction">Introduction</a></li>
    <li><a href="#profile-and-application">Profile and Application</a></li>
    <li><a href="#api-access">API Access</a></li>
    <li><a href="#using-restful-apis">Using RESTful APIs</a></li>
    <li><a href="#spotify-python-api">Spotify Python API</a></li>
    <li><a href="#data-extraction-and-analysis">Data Extraction and Analysis</a></li>
    <li><a href="#conclusion">Conclusion</a></li>
</ol>

<section id="preamble">
    <h2>1. Preamble</h2>
    <h3>Creating a Virtual Environment</h3>
</section>

<p>
    Before you begin, it's advisable to create a virtual environment for your project.
    You can do this using either `virtualenv` or `conda`, depending on your preference. Here is an example using `conda`:
</p>

<ul>
    <li>Ensure you have `conda` installed. If not, you can install Miniconda or Anaconda from their respective websites.</li>
    <li>Open your terminal and create a new conda environment by running the following command:</li>
</ul>

<code>conda create --name myenv python=3.9</code>

<ul>
    <li>Activate the environment:</li>
</ul>

<code>conda activate myenv</code>

<ul>
    <li>Deactivate the environment:</li>
</ul>

<code>conda deactivate</code>

<p>Replace <span style="font-style: italic; font-size: 15px;"><i>"myenv"</i></span> with the name you want to give your virtual environment.</p>

<div style="display: flex; align-items: center;">
    <img src="static/Screen/Screen_1.png" width="900" height="600">
</div>

<section id="introduction">
    <h2>2. Introduction</h2>
</section>

<div style="display: flex; align-items: center;">
    <h3>Before we start... what is Spotify!? </h3>
    <img src="static/emoji.png" width="80" height="80">
</div>  
Spotify is a <strong>music streaming</strong> platform that offers users a vast catalog of music tracks, podcasts, and more. Founded in 2006 in Sweden, Spotify has quickly gained popularity worldwide as one of the leading music streaming services.

Key features of Spotify:
- <strong>Music Streaming:</strong> Users can access millions of tracks from artists around the world. The music library is extensive and covers a wide range of genres and styles.

- <strong>Personalized Playlists:</strong> Spotify offers advanced recommendation features that create personalized playlists based on users' musical tastes. These playlists include "Discover Weekly" and "Release Radar."

- <strong>Podcasts:</strong> In addition to music, Spotify hosts a wide range of podcasts on topics ranging from popular culture to science, from politics to technology.

- <strong>Offline Mode:</strong> Users can download tracks and podcasts for offline listening, ideal for those who want to enjoy music without an internet connection.

- <strong>Social Sharing:</strong> Spotify allows users to share their playlists, favorite tracks, and musical activities on social media platforms, enabling easy and interactive sharing.

- <strong>Device Versatility:</strong> Spotify is accessible on a wide range of devices, including computers, smartphones, tablets, smart TVs, gaming consoles, and other streaming devices.

#### General Overview of What Spotify APIs Are:

The <i><strong>Spotify APIs</strong></i> are tools that allow developers to interact with Spotify's music platform and access various functionalities.<br>
These APIs provide a set of <strong>endpoints and methods</strong> that enable developers to retrieve information about tracks, artists, playlists, and much more. Essentially, they represent a bridge connecting the capabilities of the Spotify platform with developers' creative ideas.

#### Importance of APIs for Creating Music Apps:<br>
The <i><strong>Spotify APIs</strong></i> are essential for creating music apps as they provide developers with access to a vast music catalog without having to build everything from scratch. This not only simplifies the development process but also allows developers to focus on creativity and innovation rather than managing complex music databases. APIs also enable integration of features such as track playback, personalized playlist creation, and more, enhancing the end-user experience.

#### Preview of Upcoming Steps:<br>
In the upcoming stages of the tutorial, we will explore in detail the various steps necessary to create your music app using the Spotify APIs. We will start with an introduction that lays the foundation, then move on to creating a developer profile and registering your application. Next, we will address the crucial process of accessing the APIs and learn how to use <strong>RESTful calls</strong> to obtain music information.<br>
At the heart of the tutorial, we will dive into the practical use of Spotify APIs with Python, opening up a world of creative possibilities.<br>
We will continue by exploring data extraction and analysis, and finally conclude our journey with a summary of the skills acquired and inspiration for future explorations.


<section id="profile-and-application">
    <h2>3. Profile and Application</h2>
</section>

The following steps will guide you through creating music apps using the API:
<div class="container">
    <p>Create an app and select "Web API" when it asks which APIs you intend to use.</p>
    <a href="https://developer.spotify.com/documentation/web-api" target="_blank">
        <button style="background-color: #1DB954; color: #fff; padding: 10px 15px; border: none; border-radius: 5px; cursor: pointer;">
            Spotify Developer Dashboard
        </button>
    </a>
</div>

<div style="display: flex; align-items: center;">
    <img src="static/Screen/Screen_2.png">
</div>

- Once the application has been created, it will be available in the Dashboard

<div style="display: flex; align-items: center;">
    <img src="static/Screen/Screen_3.png">
</div>

- Once your app is created, you will have access to the app's credentials. These will be required for API authorisation to obtain an access token .

<div style="display: flex; align-items: center;">
    <img src="static/Screen/Screen_4.png">
</div>

- Nella pagina delle impostazioni dell'app, aggiungi una <strong>Redirect URI</strong>. Questo è l'URL a cui Spotify reindirizzerà l'utente dopo l'autenticazione. <br>
Puoi utilizzare http://localhost:5000/callback per scopi di sviluppo.

<div style="display: flex; align-items: center;">
    <img src="static/Screen/Screen_5.png" width="1200" height="600">
</div>

<section id="api-access">
    <h2>4. API Access</h2>
</section>

Spotify APIs are <strong>RESTful APIs</strong>. They follow the REST architectural style, which is based on the concept of resources identified by URIs and manipulated through standard HTTP methods such as GET, POST, PUT, DELETE, etc.

The process for obtaining an access token from Spotify involves making a POST request to the endpoint https://accounts.spotify.com/api/token.

In the case of Spotify's REST APIs, the request we discussed earlier to obtain the access token uses the POST method to send data to Spotify's authorization server. Authentication parameters (client ID and client secret) are included in the request header, while specific details of the request, such as the grant type, are included in the request body.

### OAuth 2.0 Authorization Flow:

- **Client Registration:**<br>The client registers with the Authorization Server, obtaining a client ID and a client secret.

- **User Redirection:**<br>The client redirects the user to the Authorization Server for authentication. In this step, the client can specify the type of access requested (e.g., read or write).

- **Authorization Grant:**<br>The user grants authorization to the application.

- **Receiving the Authorization Code:**<br>The Authorization Server redirects the user back to the client with an authorization code.

- **Exchanging the Code for an Access Token:**<br>The client sends the authorization code to the Authorization Server to obtain the Access Token.

- **Using the Access Token:**<br>The client uses the Access Token to access protected resources at the Resource Server.

- **HTTP Request for the Access Token:**<br>A POST request to the Authorization Server's endpoint is involved in the token exchange phase to obtain the Access Token.


<div style="display: flex; align-items: center;">
    <img src="static/Screen/Screen_6.png">
</div>

<p>Let's write a <strong>Python</strong> function that can be used to obtain a valid access token, which will then be used to <strong>authenticate requests to Spotify's APIs</strong>.</p>

In [1]:
import requests
import base64

def get_spotify_access_token(client_id, client_secret):
    url = 'https://accounts.spotify.com/api/token'
    headers = {
        'Authorization': 'Basic ' + base64.b64encode(f'{client_id}:{client_secret}'.encode()).decode()
    }
    data = {
        'grant_type': 'client_credentials'
    }
    
    try:
        response = requests.post(url, headers=headers, data=data)
        response.raise_for_status()  # Raises an exception for HTTP request errors
        token_data = response.json()
        
        if 'access_token' in token_data:
            return token_data['access_token']
        else:
            raise Exception(f"Error obtaining access token: {token_data.get('error', 'Unknown error')}")
            
    except requests.exceptions.RequestException as e:
        raise Exception(f"HTTP request error: {e}")

In [3]:
from dotenv import load_dotenv
import os

load_dotenv()

client_id = os.getenv('CLIENT_ID')
client_secret = os.getenv('CLIENT_SECRET')

access_token = get_spotify_access_token(client_id, client_secret) # obtain the access token
print(f"Access token: {access_token}")

Client ID: None
Client secret: None


Exception: HTTP request error: 400 Client Error: Bad Request for url: https://accounts.spotify.com/api/token

Now let's verify that the access token was obtained correctly.

<section id="using-restful-apis">
    <h2>5. Using RESTful APIs</h2>
</section>

Once you have acquired the access token, you are ready to authenticate and authorize requests to the APIs. Probably the first thing you might want to do with such an API is to search for a specific artist on Spotify to obtain all their information:

- Name
- ID
- Genre
- Popularity
- Followers
- Spotify URL
- Profile image

In [8]:
import requests

def search_artist(token, artist_name):
    url = "https://api.spotify.com/v1/search"
    headers = {
        "Authorization": f"Bearer {token}"
    }
    params = {
        "q": artist_name,
        "type": "artist",
        "limit": 1
    }
    
    try:
        response = requests.get(url, headers=headers, params=params)
        response.raise_for_status()  # Raises an exception for HTTP request errors
        data = response.json()
        artists = data.get("artists", {}).get("items", [])
        
        if artists:
            return artists[0]
        else:
            print(f"No artist found with the name '{artist_name}'.")
            return None
            
    except requests.exceptions.RequestException as e:
        print(f"HTTP request error: {e}")
        return None

<p>It can be useful to write auxiliary functions to:</p>
<ul>
    <li>Extract the Spotify link from the entity's <strong>"external_urls"</strong> dictionary;</li>
    <li>Make it accessible via a simple click to redirect to the page specified by the URL;</li>
    <li>Display various images from their URLs;</li>
    <li>Convert the durations (in ms) of tracks to minutes;</li>
    <li>Provide a function to make URLs in the global dataframe clickable;</li>
</ul>

In [16]:
from bs4 import BeautifulSoup

def extract_spotify_url(external_urls):
    return artist.get("external_urls", {}).get("spotify")
    
def make_clickable(link):
    return f'<a href="{link}" target="_blank">{link}</a>'

def display_image(image_url):
    return f'<img src="{image_url}" alt="Cover Image" style="max-height: 80px; max-width: 80px;">'

def convert_duration(duration_ms):
    duration_minutes = duration_ms / 60000
    return round(duration_minutes, 2)

def extract_href(html):
    soup = BeautifulSoup(html, 'html.parser', markupResemblesLocator=False)
    return soup.a['href']

In [18]:
import pandas as pd
from IPython.display import Image, display, HTML

# Example artist name
artist_name = "Emis Killa" 
artist = search_artist(access_token, artist_name)  # Obtain the artist

# Prepare artist data
artist_data = {
    "Name": artist["name"],
    "ID": artist["id"],
    "Genre": artist["genres"][0] if artist["genres"] else "Unknown",
    "Popularity": artist["popularity"],
    "Followers": artist["followers"]["total"],
    "Spotify URL": extract_spotify_url(artist),
    "Image": artist["images"][0]["url"] if artist["images"] else "No Image"
}

# Create a DataFrame
artist_data_frame = pd.DataFrame([artist_data])

# Apply auxiliary functions
artist_data_frame['Spotify URL'] = artist_data_frame['Spotify URL'].apply(make_clickable)
artist_data_frame['Image'] = artist_data_frame['Image'].apply(display_image)

# Print artist information
print(f"Artist found: {artist_name} (ID: {artist_data['ID']})\n") 

# Display the DataFrame with clickable links and images
display(HTML(artist_data_frame.to_html(escape=False)))

Artist found: Emis Killa (ID: 6FtwCmLY6L1sqvjaQ2lV6G)



Unnamed: 0,Name,ID,Genre,Popularity,Followers,Spotify URL,Image
0,Emis Killa,6FtwCmLY6L1sqvjaQ2lV6G,italian hip hop,68,1584871,https://open.spotify.com/artist/6FtwCmLY6L1sqvjaQ2lV6G,


In the following sections, we will delve into the use of data structures in Python, in particular Pandas DataFrames, for a detailed analysis of Spotify content.

We will use these powerful data structures to:

- Extract detailed data on tracks, artists and albums.
- Manipulate information in advanced ways.
- Visualise trends and relationships in Spotify information in a clear and understandable way.

We will start by analysing the artists' top charts, then explore the characteristics of the most popular tracks, obtain album details and present user listening statistics. We will exploit the full potential of the Python libraries and Spotify's API for a comprehensive and informative analysis.We will now verify the correct obtaining of the Access Token.

In [None]:
STOP

<section id="spotify-python-api">
    <h2>6. API Spotify Python</h2>
</section>

Risulta interessante anche chiedersi quali sono gli album dell'artista appena trovato. Anche questo può essere facilmente ottenuto grazzie all'uso delle API di Spotify, a partire dall'id dell'artista. In particolare prenderemo le informazioni rigurdanti :

- Nome
- ID
- Data di uscita
- Numero totale di tracce
- Immagine di copertina
- URL di Spotify 

In [None]:
def get_albums(token, artist_id):
    url = f'https://api.spotify.com/v1/artists/{artist_id}/albums'
    
    headers = {
        "Authorization": f"Bearer {token}"
    }
    params = {
        "market": "IT"
    }

    try:
        response = requests.get(url, headers=headers, params=params)
        response.raise_for_status()  # Solleva un'eccezione se la richiesta HTTP non ha successo
        data = response.json()
        
        return data.get("items", [])
        
    except requests.exceptions.RequestException as e:
        print(f"Errore nella richiesta HTTP: {e}")
        return []

In [None]:
artist_albums = get_albums(access_token, artist["id"])
album_data_frame = pd.DataFrame(artist_albums, columns=['name', 'id', 'release_date', 'total_tracks', 'images', 'external_urls'])

# Rinomina le colonne per chiarezza
album_data_frame = album_data_frame.rename(columns={'name': 'Titolo', 'id': 'ID', 'release_date': 'Data di uscita', 'total_tracks': 'No. Tracce', 'images': 'Copertina', 'external_urls': 'Spotify URL'})

# Visualizza l'immagine dell'album
album_data_frame['Copertina'] = album_data_frame['Copertina'].apply(lambda x: display_image(x[0]["url"]))

# Filtra gli album con un numero diverso da 1 di tracce
album_data_frame = album_data_frame[album_data_frame["No. Tracce"] != 1]

# Rendi cliccabili gli URL di Spotify
album_data_frame['Spotify URL'] = album_data_frame['Spotify URL'].apply(extract_spotify_url)
album_data_frame['Spotify URL'] = album_data_frame['Spotify URL'].apply(make_clickable)

print(f"Gli album dell'artista {artist_name} sono:\n")
display(HTML(album_data_frame.to_html(escape=False)))

Adesso che abbiamo ottenuto la discografia dell'artista, possiamo esaminare anche il contenuto dei suoi album.<br>
Possiamo esaminare un album in particolare specificandone l'ID ma risulta pià interessante esaminare l'intera discografia dell'artista.

Per ogni brano in particolare siamo interessati a :

- Titolo
- ID
- Data di uscita
- Numero totale di tracce
- Immagine di copertina
- Spotify URL

In [None]:
def get_album_tracks(token, album_id):
    url = f'https://api.spotify.com/v1/albums/{album_id}/tracks'
    
    headers = {
        "Authorization": f"Bearer {token}"
    }
    params = {
        "market": "IT"
    }

    try:
        response = requests.get(url, headers=headers, params=params)
        response.raise_for_status()  # Solleva un'eccezione se la richiesta HTTP non ha successo
        data = response.json()
        
        return data.get("items", [])
        
    except requests.exceptions.RequestException as e:
        print(f"Errore nella richiesta HTTP: {e}")
        return []

In [None]:
album_name = "Effetto notte"  
album_id = album_data_frame.loc[album_data_frame['Titolo'] == album_name, 'ID'].values[0]

album_tracks = get_album_tracks(access_token, album_id)
album_track_data_frame = pd.DataFrame(album_tracks, columns=['name','id','duration_ms','external_urls', 'uri'])
album_track_data_frame = album_track_data_frame.rename(columns={'name': 'Titolo', 'id': 'ID', 'duration_ms': 'Durata', 'external_urls': 'Spotify URL', 'uri': 'URI'})

album_track_data_frame['Durata'] = album_track_data_frame['Durata'].apply(convert_duration)
album_track_data_frame['Spotify URL'] = album_track_data_frame['Spotify URL'].apply(extract_spotify_url)
album_track_data_frame['Spotify URL'] = album_track_data_frame['Spotify URL'].apply(make_clickable)
album_track_data_frame['URI'] = album_track_data_frame['URI'].apply(lambda uri: uri.split(':')[-1])

print(f"Le tracce dell'album {album_name} sono:\n")
display(HTML(album_track_data_frame.to_html(escape=False)))

#### Si nota che durante l'iterazione su ogni brano di ogni album, viene inserita ogni traccia in un dataframe complessivo.
#### Questo ci sarà utile quando faremo statistiche nella <strong>sezione 7 del tutorial</strong>.

In [None]:
# Creazione del DataFrame complessivo utile per la sezione 7 del tutorial
discography_data_frames_list = []

for index, row in album_data_frame.iterrows():
    album_name = row['Titolo']
    album_id = row['ID']

    album_tracks = get_album_tracks(access_token, album_id)

    tracks_data_frame = pd.DataFrame(album_tracks, columns=['name', 'id', 'duration_ms','external_urls', 'uri'])
    tracks_data_frame = tracks_data_frame.rename(columns={'name': 'Titolo', 'id': 'ID', 'duration_ms': 'Durata', 'external_urls': 'Spotify URL', 'uri': 'URI'})

    tracks_data_frame['Durata'] = tracks_data_frame['Durata'].apply(convert_duration)
    tracks_data_frame['Spotify URL'] = tracks_data_frame['Spotify URL'].apply(extract_spotify_url)
    tracks_data_frame['Spotify URL'] = tracks_data_frame['Spotify URL'].apply(make_clickable)
    tracks_data_frame['URI'] = tracks_data_frame['URI'].apply(lambda uri: uri.split(':')[-1])
    tracks_data_frame['Album'] = album_name
    
    discography_data_frames_list.append(tracks_data_frame)

    print(f"\nLe tracce dell'album \"{album_name}\" sono:\n")
    display(HTML(tracks_data_frame.to_html(escape=False)))
    print('=' * 138)

discography_data_frame = pd.concat(discography_data_frames_list, ignore_index=True)
discography_data_frame['Spotify URL'] = discography_data_frame['Spotify URL'].apply(extract_href)
discography_data_frame['Spotify URL'] = discography_data_frame['Spotify URL'].apply(make_clickable)

- Si può anche visualizzare il dataframe globale e salvare in un apposito file csv:

In [None]:
print("\nDataFrame complessivo delle tracce:")
display(HTML(discography_data_frame.to_html(escape=False)))
discography_data_frame.to_csv('discography_data.csv', index=False)

Un'altra interessante funzionalità che possiamo sfruttare è quella di ottenere la top 10 dei brani di un artista arbitrario.<br>
In particolare siamo interessati ai seguenti campi:
- Titolo
- ID
- Popolarità
- Durata
- Data di rilascio
- Album
- Spotify URL

In [None]:
def get_top_tracks_artist(token, artist_id):
    url = f"https://api.spotify.com/v1/artists/{artist_id}/top-tracks?country=IT"
    headers = {
        "Authorization": f"Bearer {token}"
    }
    
    try:
        response = requests.get(url, headers=headers)
        response.raise_for_status()  
        data = response.json()["tracks"]
        return data
        
    except requests.exceptions.RequestException as e:
        print(f"Errore nella richiesta HTTP: {e}")
        return None

In [None]:
top_tracks = get_top_tracks_artist(access_token, artist_data['ID'])

top_tracks_data_frame = pd.DataFrame([{
    'Titolo': track['name'],
    'ID': track['id'],
    'Popolarità': track['popularity'],
    'Durata': convert_duration(track['duration_ms']),
    'Data di rilascio': track['album']['release_date'],
    'Album' : track["album"]["name"],
    'Spotify URL': track['external_urls']['spotify']
} for track in top_tracks])
top_tracks_data_frame['Spotify URL'] = top_tracks_data_frame['Spotify URL'].apply(make_clickable)

print(f"Top Tracks dell'artista {artist_name} :\n")
display(HTML(top_tracks_data_frame.to_html(escape=False)))

Possiamo usare le API REST di Spotify per ottenere anche informazioni sugli artisti correlati ad un artista in particolare

In [None]:
def get_artist_related(token, id):
    url = f"https://api.spotify.com/v1/artists/{id}/related-artists"
    headers = {
        "Authorization": f"Bearer {token}"
    }

    try:
        response = requests.get(url, headers=headers)
        response.raise_for_status() 
        data = response.json()["artists"]
        return data
    except requests.exceptions.RequestException as e:
        print(f"Errore nella richiesta HTTP: {e}")
        return None

In [None]:
artists = get_artist_related(access_token, artist_data['ID'])

artists_data = pd.DataFrame([{
    'Nome' : artist["name"],
    'ID': artist['id'],
    'Genere': artist['genres'][0],
    'Popolarità': artist['popularity'],
    'Followers' : artist["followers"]["total"],
    'Spotify URL': artist['external_urls']['spotify'],
    "Immagine": artist["images"][0]["url"]
} for artist in artists])

artists_data_frame = pd.DataFrame(artists_data)
artists_data_frame['Spotify URL'] = artists_data_frame['Spotify URL'].apply(make_clickable)
artists_data_frame['Immagine'] = artists_data_frame['Immagine'].apply(display_image)
artists_data_frame = artists_data_frame.sort_values(by='Followers',ascending=False)
artists_data_frame = artists_data_frame.reset_index(drop=True)

print(f'Artisti correlati:\n')
display(HTML(artists_data_frame.to_html(escape=False)))

Utilizzando gli <strong>ID</strong> delle singole canzoni, è possibile recuperare integralmente i dettagli di ciascun brano.<br>
Siamo interessati a :
- Titolo
- ID
- Durata
- Data di rilascio
- Popolarità
- Spotify URL
- Titolo dell'album di appartenenza
- Copertina dell'album di appartenenza

In [None]:
def get_track_details(access_token, track_id):
    url = f'https://api.spotify.com/v1/tracks/{track_id}'
    headers = {
        'Authorization': f'Bearer {access_token}'
    }

    try:
        response = requests.get(url, headers=headers)
        response.raise_for_status()  # Solleva un'eccezione se la richiesta HTTP non ha successo
        track_data = response.json()
        return track_data

    except requests.exceptions.RequestException as e:
        raise Exception(f"Errore nella richiesta HTTP: {e}")

In [None]:
track_name = "Mercurio"
track_id = discography_data_frame.loc[discography_data_frame['Titolo'] == track_name, 'ID'].values[0]

track_details = get_track_details(access_token, track_id)

track_data_frame = pd.DataFrame({
    'Titolo': [track_details['name']],
    'ID': [track_details['id']],
    'Durata': [convert_duration(track_details['duration_ms'])],  # Applica la conversione della durata
    'Data di rilascio': [track_details['album']['release_date']],
    'Popolarità': [track_details['popularity']],
    'Spotify URL': [extract_spotify_url(track_details['external_urls'])],
    'Album': [track_details['album']['name']],
    'Copertina': [track_details['album']['images'][0]['url']]
})

track_data_frame['Spotify URL'] = track_data_frame['Spotify URL'].apply(make_clickable)
track_data_frame['Copertina'] = track_data_frame['Copertina'].apply(display_image)

print(f'Traccia {track_name}:\n')
HTML(track_data_frame.to_html(escape=False))

Statistiche.

In [None]:
import urllib.parse
import secrets
from datetime import datetime
import webbrowser

# Definizione delle costanti
REDIRECT_URI = "http://localhost:5000/callback"
TOKEN_URL = "https://accounts.spotify.com/api/token"
AUTH_URL = "https://accounts.spotify.com/authorize"
API_BASE_URL = "https://api.spotify.com/v1/"

# Generazione di uno stato sicuro
state = secrets.token_urlsafe(16)

# Definizione dello scope
scope = 'user-read-private user-top-read user-read-email user-follow-read playlist-modify-private playlist-modify-public user-follow-modify user-library-read'

# Costruzione dei parametri per l'autorizzazione
auth_params = {
    'client_id': client_id,
    'response_type': 'code',
    'scope': scope,
    'redirect_uri': REDIRECT_URI,
    'show_dialog': True,
    'state': state
}

# Costruzione dell'URL di autorizzazione
auth_url = f"{AUTH_URL}?{urllib.parse.urlencode(auth_params)}"

# Apertura automatica dell'URL nel browser
webbrowser.open(auth_url, new=2)

# Stampa di un messaggio informativo
print(f'Si aprirà una finestra del browser. Dopo aver autorizzato l\'app, copia l\'URL della pagina ed incollalo qui di seguito.')

# Ricezione dell'URL di callback in modo automatico
callback_url = input("Incolla l'URL della pagina qui: ")
url_components = urllib.parse.urlparse(callback_url)
query_params = urllib.parse.parse_qs(url_components.query)

# Rimuovi il messaggio informativo sulla finestra del browser
print('\033[F\033[F\033[F\033[F\033[F\033[F\033[F')

# Estrazione del codice di autorizzazione dalla risposta di callback
authorization_code = query_params.get('code')

# Costruzione del corpo della richiesta per ottenere il token di accesso
token_request_body = {
    'code': authorization_code,
    'grant_type': 'authorization_code',
    'redirect_uri': REDIRECT_URI,
    'client_id': client_id,
    'client_secret': client_secret
}

# Richiesta del token di accesso
token_response = requests.post(TOKEN_URL, data=token_request_body)
token_info = token_response.json()

# Estrazione delle informazioni dal token di accesso
access_token = token_info.get('access_token')
refresh_token = token_info.get('refresh_token')
expires_at = datetime.now().timestamp() + token_info.get('expires_in', 3600)

# Creazione dell'header di autorizzazione per le future richieste all'API di Spotify
headers = {
    'Authorization': f'Bearer {access_token}'
}

[F[F[F[F[F[F[F


Dopo aver eseguito l'autenticazione secondo le regole definite dal protocollo Oauth, sarà possibile accedere a molte altre funzionalità predisposte dalle API di Spotify. Iniziamo dall'ottenere banalmente il profilo dell'utente che si è autenticato, otterremo informazioni come :
- Nome
- ID
- E-mail
- Paese
- Followers

In [None]:
def get_current_user_profile(access_token):
    url = 'https://api.spotify.com/v1/me'
    
    headers = {
        'Authorization': f'Bearer {access_token}'
    }

    try:
        response = requests.get(url, headers=headers)
        response.raise_for_status()  # Solleva un'eccezione se la richiesta HTTP non ha successo

        user_data = response.json()
        return user_data

    except requests.exceptions.HTTPError as e:
        # Dettagli specifici sull'errore
        if response.status_code == 401:
            raise Exception("Accesso non autorizzato. L'access token potrebbe essere scaduto o non valido.")
        else:
            raise Exception(f"Errore nella richiesta HTTP: {e}")
    except requests.exceptions.RequestException as e:
        raise Exception(f"Errore nella richiesta HTTP: {e}")

In [None]:
user_details = get_current_user_profile(access_token)

user_data = {
    'Nome': user_details.get('display_name', ''),
    'ID': user_details.get('id', ''),
    'E-mail': user_details.get('email', ''),
    'Paese': user_details.get('country', ''),
    'Followers': user_details.get('followers', {}).get('total', 0),
    'Spotify URL': extract_spotify_url(user_details.get('external_urls', {}))
}

user_data_frame = pd.DataFrame([user_data], columns=['Nome', 'ID', 'E-mail', 'Paese', 'Followers', 'Spotify URL'])
user_data_frame['Spotify URL'] = user_data_frame['Spotify URL'].apply(make_clickable)

print(f'Utente corrente:\n')
HTML(user_data_frame.to_html(escape=False))

Una funzione un attimo più complessa potrebbe prevedere l'uso delle API di Spotify per l'ottenimento delle informazioni sulle playlists  seguite o create dall'utente. Siamo interessati a :
- Nome
- ID
- Spotify URL
- Numero di tracce
- Proprietario
- Descrizione
- Copertina

In [None]:
def get_user_playlists(access_token, user_id):
    url = f'https://api.spotify.com/v1/users/{user_id}/playlists'
    headers = {
        'Authorization': f'Bearer {access_token}'
    }

    try:
        response = requests.get(url, headers=headers)
        response.raise_for_status()  # Solleva un'eccezione se la richiesta HTTP non ha successo
        playlists_data = response.json()
        return playlists_data

    except requests.exceptions.RequestException as e:
        raise Exception(f"Errore nella richiesta HTTP: {e}")

In [None]:
playlists_data = get_user_playlists(access_token, user_data_frame['ID'][0])

playlists = []
for playlist in playlists_data['items']:
    playlist_data = {
        'Titolo': playlist['name'],
        'ID': playlist['id'],
        'Spotify URL': playlist['external_urls']['spotify'],
        'No. Tracce': playlist['tracks']['total'],
        'Proprietario': playlist['owner']['display_name'],
        'Descrizione': playlist['description'] if playlist['description'] != '' else 'Nessuna descrizione',
        'Copertina': playlist['images'][0]['url'] if playlist['images'] else None
    }
    playlists.append(playlist_data)
playlist_data_frame = pd.DataFrame(playlists)

playlist_data_frame = playlist_data_frame.sort_values(by='No. Tracce', ascending=False)
playlist_data_frame = playlist_data_frame.reset_index(drop=True)

playlist_data_frame['Spotify URL'] = playlist_data_frame['Spotify URL'].apply(make_clickable)
playlist_data_frame['Copertina'] = playlist_data_frame['Copertina'].apply(display_image)

user_name = user_data_frame['Nome'][0]
print(f'Playlist create o seguite dall\'utente {user_name}:\n')
HTML(playlist_data_frame.to_html(escape=False))

Possiamo definire anche una funzione che data una playlist fornisca quali sono i brani che la compongono. <br>Ci fermeremo ad ottenere i soli <strong>ID</strong> dei brani ed utilizzando la funzione scritta in precedenza possiamo ottenere i dettagli di tutte le tracce.

In [None]:
def get_playlist_track_ids(access_token, playlist_id):
    url = f'https://api.spotify.com/v1/playlists/{playlist_id}/tracks'
    headers = {
        'Authorization': f'Bearer {access_token}'
    }

    try:
        response = requests.get(url, headers=headers)
        response.raise_for_status()
        playlist_tracks_data = response.json()
        track_ids = [track['track']['id'] for track in playlist_tracks_data['items']]
        return track_ids

    except requests.exceptions.RequestException as e:
        raise Exception(f"Errore nella richiesta HTTP: {e}")

In [None]:
playlist_name = playlist_data_frame['Titolo'][0]
playlist_id = playlist_data_frame['ID'][0]
playlist_track_ids = get_playlist_track_ids(access_token, playlist_id)

tracks_data = []
for track_id in playlist_track_ids:
    track_details = get_track_details(access_token, track_id)
    tracks_data.append({
        'Titolo': track_details['name'],
        'ID': track_details['id'],
        'Durata': convert_duration(track_details['duration_ms']),
        'Data di rilascio': track_details['album']['release_date'],
        'Popolarità': track_details['popularity'],
        'Spotify URL': extract_spotify_url(track_details['external_urls']),
        'Album': track_details['album']['name'],
        'Copertina': track_details['album']['images'][0]['url']
    })

tracks_data_frame = pd.DataFrame(tracks_data)
tracks_data_frame['Spotify URL'] = tracks_data_frame['Spotify URL'].apply(make_clickable)
tracks_data_frame['Copertina'] = tracks_data_frame['Copertina'].apply(display_image)

print(f'Tutti i brani della playlist {playlist_name} sono:\n')
HTML(tracks_data_frame.to_html(escape=False))

<section id="data-extraction-and-analysis">
    <h2>7. Estrazione dati e analisi</h2>
</section>

Iniziamo ora la sezione dedicata all'estrazione e all'analisi dei dati. Utilizzeremo librerie Python specializzate come <strong>Matplotlib</strong> e <strong>NumPy</strong> per semplificare il processo di creazione dei grafici. Useremo anche il modulo <strong>Seaborn</strong> per migliorare l'estetica dei grafici.

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns

In questa sezione saranno presenti analisi statistiche che portano alla luce osservazioni statistiche interessanti.<br>
Ricordi il file <strong>"discography_data.csv"</strong>? Bene, esploriamo la relazione tra la durata delle tracce e gli album di appartenenza. <br> In questo grafico a barre, presentiamo la durata media delle tracce per ciascun album. 

In [None]:
duration_per_album = discography_data_frame.groupby('Album')['Durata'].mean().reset_index()

sns.set_style("whitegrid")

plt.figure(figsize=(12, 8))
colors = sns.color_palette("viridis", len(duration_per_album))
barplot = plt.bar(duration_per_album['Album'], duration_per_album['Durata'], color=colors, width=0.5)

for bar, duration in zip(barplot, duration_per_album['Durata']):
    plt.text(bar.get_x() + bar.get_width() / 2, bar.get_height(), f'{duration:.2f}', ha='center', va='bottom', fontsize=10, color='black')

plt.xticks(rotation=45, ha='right')
plt.xlabel('Album')
plt.ylabel('Durata Media (m)')
plt.title('Durata Media delle Tracce per Album')

plt.tight_layout()
plt.show()

Apriamo questa sezione con un'analisi intrigante: <strong>la popolarità di un artista non segue necessariamente il numero di followers</strong>. Il grafico seguente mette in evidenza questo aspetto non scontato, mostrando un dettaglio interessante. <br>
Si osserva che artisti con un livello di popolarità più elevato possono avere meno followers rispetto a colleghi con un indice di popolarità notevolmente inferiore. <br>
Questo scenario sfida l'aspettativa comune e apre la strada a una riflessione più approfondita sulla dinamica tra popolarità e seguaci degli artisti.

Al fine di garantire una rappresentazione di valori comparabili, è indispensabile procedere con la riscala del numero di Followers su una **scala 1:10K**. Senza un processo di normalizzazione di questo tipo, i valori diverrebbero incommensurabili, compromettendo la validità del confronto e rendendo il grafico poco rappresentativo.

In [None]:
import pandas as pd

sns.set_style("whitegrid")

# Creiamo un barplot della popolarità e del numero di followers degli artisti correlati
plt.figure(figsize=(12, 8))
bar_width = 0.4

# Posizioni delle barre sull'asse x
r1 = range(len(artists_data_frame))
r2 = [x + bar_width for x in r1]

# Barre per la popolarità
plt.bar(r1, artists_data_frame['Popolarità'], color='skyblue', width=bar_width, edgecolor='grey', label='Popolarità')

# Barre per il numero di followers
plt.bar(r2, artists_data_frame['Followers']/10000, color='orange', width=bar_width, edgecolor='grey', label='Followers (10K)')

# Etichette con i valori di popolarità su ogni barra (troncati alla parte intera)
for i, popularity in enumerate(artists_data_frame['Popolarità']):
    plt.text(i, int(popularity), f'{int(popularity)}', ha='center', va='bottom', fontsize=10, color='black')

# Etichette con i valori di followers su ogni barra (troncati alla parte intera e in formato 10K)
for i, followers in enumerate(artists_data_frame['Followers']):
    plt.text(i + bar_width, followers/10000, f'{followers/1000:.0f}', ha='center', va='bottom', fontsize=10, color='black')

# Personalizziamo l'aspetto del grafico
plt.xticks([r + bar_width / 2 for r in range(len(artists_data_frame))], artists_data_frame['Nome'], rotation=45, ha='right')
plt.xlabel('Artista')
plt.ylabel('Valori')  # Modificato il testo per riflettere la rimozione della normalizzazione
plt.title('Popolarità e Followers degli Artisti Correlati')
plt.legend()

# Aggiungi etichette agli assi
plt.xlabel('Artista')
plt.ylabel('Popolarità e Followers (10K)')

plt.tight_layout()
plt.show()

A partire da dei file di testo che enumerano i nomi degli artisti per 10 diverse nazionalità, possiamo creare un DataFrame che raggruppa gli artisti per ciascuna nazione. Successivamente, aggiungiamo una colonna denominata <strong>"Nazionalità"</strong>, che sarà naturalmente uniforme per tutti gli artisti all'interno di ciascun DataFrame. <br>
Una volta completata questa fase, procederemo con la concatenazione di tutti questi DataFrame in un unico DataFrame, raccogliendo così un insieme di artisti internazionali.

- Iniziamo dagli artisti Italiani :

In [None]:
from tqdm import tqdm

with open('artists/italian.txt', 'r') as file:
    italian_artist_names = [line.strip() for line in file]

artists_data = []

# Usa tqdm per monitorare l'avanzamento del ciclo
for artist_name in tqdm(italian_artist_names, desc='Processing artists', unit='artist'):
    artist = search_artist(access_token, artist_name)
    
    artist_data = {
        "Nome": artist["name"],
        "ID": artist["id"],
        "Genere": artist["genres"][0] if artist["genres"] else None,
        "Popolarità": artist["popularity"],
        "Followers": artist["followers"]["total"],
        "Spotify URL": artist["external_urls"]["spotify"]
    }
    
    artists_data.append(artist_data)
    
italian_artists_data_frame = pd.DataFrame(artists_data)
italian_artists_data_frame['Spotify URL'] = italian_artists_data_frame['Spotify URL'].apply(make_clickable)
italian_artists_data_frame['Nazionalità'] = "Italiana" 

display(HTML(italian_artists_data_frame.to_html(escape=False)))

- Proseguiamo con quelli Americani:

In [None]:
with open('artists/american.txt', 'r') as file:
    american_artist_names = [line.strip() for line in file]

artists_data = []

# Usa tqdm per monitorare l'avanzamento del ciclo
for artist_name in tqdm(american_artist_names, desc='Processing artists', unit='artist'):
    artist = search_artist(access_token, artist_name)
    
    artist_data = {
        "Nome": artist["name"],
        "ID": artist["id"],
        "Genere": artist["genres"][0] if artist["genres"] else None,
        "Popolarità": artist["popularity"],
        "Followers": artist["followers"]["total"],
        "Spotify URL": artist["external_urls"]["spotify"]
    }
    
    artists_data.append(artist_data)
    
american_artists_data_frame = pd.DataFrame(artists_data)
american_artists_data_frame['Spotify URL'] = american_artists_data_frame['Spotify URL'].apply(make_clickable)
american_artists_data_frame['Nazionalità'] = "Americana" 

display(HTML(american_artists_data_frame.to_html(escape=False)))

- Artisti Francesi:

In [None]:
with open('artists/french.txt', 'r') as file:
    french_artist_names = [line.strip() for line in file]

artists_data = []

# Usa tqdm per monitorare l'avanzamento del ciclo
for artist_name in tqdm(french_artist_names, desc='Processing artists', unit='artist'):
    artist = search_artist(access_token, artist_name)
    
    artist_data = {
        "Nome": artist["name"],
        "ID": artist["id"],
        "Genere": artist["genres"][0] if artist["genres"] else None,
        "Popolarità": artist["popularity"],
        "Followers": artist["followers"]["total"],
        "Spotify URL": artist["external_urls"]["spotify"]
    }
    
    artists_data.append(artist_data)
    
french_artists_data_frame = pd.DataFrame(artists_data)
french_artists_data_frame['Spotify URL'] = french_artists_data_frame['Spotify URL'].apply(make_clickable)
french_artists_data_frame['Nazionalità'] = "Francese" 

display(HTML(french_artists_data_frame.to_html(escape=False)))

- Artisti Tedeschi:

In [None]:
with open('artists/german.txt', 'r') as file:
    german_artist_names = [line.strip() for line in file]

artists_data = []

# Usa tqdm per monitorare l'avanzamento del ciclo
for artist_name in tqdm(german_artist_names, desc='Processing artists', unit='artist'):
    artist = search_artist(access_token, artist_name)
    
    artist_data = {
        "Nome": artist["name"],
        "ID": artist["id"],
        "Genere": artist["genres"][0] if artist["genres"] else None,
        "Popolarità": artist["popularity"],
        "Followers": artist["followers"]["total"],
        "Spotify URL": artist["external_urls"]["spotify"]
    }
    
    artists_data.append(artist_data)
    
german_artists_data_frame = pd.DataFrame(artists_data)
german_artists_data_frame['Spotify URL'] = german_artists_data_frame['Spotify URL'].apply(make_clickable)
german_artists_data_frame['Nazionalità'] = "Tedesca" 

display(HTML(german_artists_data_frame.to_html(escape=False)))

- Artisti Cinesi:

In [None]:
with open('artists/chinese.txt', 'r') as file:
    chinese_artist_names = [line.strip() for line in file]

artists_data = []

# Usa tqdm per monitorare l'avanzamento del ciclo
for artist_name in tqdm(chinese_artist_names, desc='Processing artists', unit='artist'):
    artist = search_artist(access_token, artist_name)
    
    artist_data = {
        "Nome": artist["name"],
        "ID": artist["id"],
        "Genere": artist["genres"][0] if artist["genres"] else None,
        "Popolarità": artist["popularity"],
        "Followers": artist["followers"]["total"],
        "Spotify URL": artist["external_urls"]["spotify"]
    }
    
    artists_data.append(artist_data)
    
chinese_artists_data_frame = pd.DataFrame(artists_data)
chinese_artists_data_frame['Spotify URL'] = chinese_artists_data_frame['Spotify URL'].apply(make_clickable)
chinese_artists_data_frame['Nazionalità'] = "Cinese" 

display(HTML(chinese_artists_data_frame.to_html(escape=False)))

- Artisti Giapponesi:

In [None]:
with open('artists/japanese.txt', 'r') as file:
    japanese_artist_names = [line.strip() for line in file]

artists_data = []

# Usa tqdm per monitorare l'avanzamento del ciclo
for artist_name in tqdm(japanese_artist_names, desc='Processing artists', unit='artist'):
    artist = search_artist(access_token, artist_name)
    
    artist_data = {
        "Nome": artist["name"],
        "ID": artist["id"],
        "Genere": artist["genres"][0] if artist["genres"] else None,
        "Popolarità": artist["popularity"],
        "Followers": artist["followers"]["total"],
        "Spotify URL": artist["external_urls"]["spotify"]
    }
    
    artists_data.append(artist_data)
    
japanese_artists_data_frame = pd.DataFrame(artists_data)
japanese_artists_data_frame['Spotify URL'] = japanese_artists_data_frame['Spotify URL'].apply(make_clickable)
japanese_artists_data_frame['Nazionalità'] = "Giapponese" 

display(HTML(japanese_artists_data_frame.to_html(escape=False)))

- Artisti Rumeni:

In [None]:
with open('artists/romanian.txt', 'r') as file:
    romanian_artist_names = [line.strip() for line in file]

artists_data = []

# Usa tqdm per monitorare l'avanzamento del ciclo
for artist_name in tqdm(romanian_artist_names, desc='Processing artists', unit='artist'):
    artist = search_artist(access_token, artist_name)
    
    artist_data = {
        "Nome": artist["name"],
        "ID": artist["id"],
        "Genere": artist["genres"][0] if artist["genres"] else None,
        "Popolarità": artist["popularity"],
        "Followers": artist["followers"]["total"],
        "Spotify URL": artist["external_urls"]["spotify"]
    }
    
    artists_data.append(artist_data)
    
romanian_artists_data_frame = pd.DataFrame(artists_data)
romanian_artists_data_frame['Spotify URL'] = romanian_artists_data_frame['Spotify URL'].apply(make_clickable)
romanian_artists_data_frame['Nazionalità'] = "Rumena" 

display(HTML(romanian_artists_data_frame.to_html(escape=False)))

- Artisti Bulgari:

In [None]:
with open('artists/bulgarian.txt', 'r') as file:
    bulgarian_artist_names = [line.strip() for line in file]

artists_data = []

# Usa tqdm per monitorare l'avanzamento del ciclo
for artist_name in tqdm(bulgarian_artist_names, desc='Processing artists', unit='artist'):
    artist = search_artist(access_token, artist_name)
    
    artist_data = {
        "Nome": artist["name"],
        "ID": artist["id"],
        "Genere": artist["genres"][0] if artist["genres"] else None,
        "Popolarità": artist["popularity"],
        "Followers": artist["followers"]["total"],
        "Spotify URL": artist["external_urls"]["spotify"]
    }
    
    artists_data.append(artist_data)
    
bulgarian_artists_data_frame = pd.DataFrame(artists_data)
bulgarian_artists_data_frame['Spotify URL'] = bulgarian_artists_data_frame['Spotify URL'].apply(make_clickable)
bulgarian_artists_data_frame['Nazionalità'] = "Bulgara" 

display(HTML(bulgarian_artists_data_frame.to_html(escape=False)))

- Artisti Spagnoli:

In [None]:
with open('artists/spanish.txt', 'r') as file:
    spanish_artist_names = [line.strip() for line in file]

artists_data = []

# Usa tqdm per monitorare l'avanzamento del ciclo
for artist_name in tqdm(spanish_artist_names, desc='Processing artists', unit='artist'):
    artist = search_artist(access_token, artist_name)
    
    artist_data = {
        "Nome": artist["name"],
        "ID": artist["id"],
        "Genere": artist["genres"][0] if artist["genres"] else None,
        "Popolarità": artist["popularity"],
        "Followers": artist["followers"]["total"],
        "Spotify URL": artist["external_urls"]["spotify"]
    }
    
    artists_data.append(artist_data)
    
spanish_artists_data_frame = pd.DataFrame(artists_data)
spanish_artists_data_frame['Spotify URL'] = spanish_artists_data_frame['Spotify URL'].apply(make_clickable)
spanish_artists_data_frame['Nazionalità'] = "Spagnola" 

display(HTML(spanish_artists_data_frame.to_html(escape=False)))

- Artisti Corean:

In [None]:
with open('artists/corean.txt', 'r') as file:
    corean_artist_names = [line.strip() for line in file]

artists_data = []

# Usa tqdm per monitorare l'avanzamento del ciclo
for artist_name in tqdm(corean_artist_names, desc='Processing artists', unit='artist'):
    artist = search_artist(access_token, artist_name)
    
    artist_data = {
        "Nome": artist["name"],
        "ID": artist["id"],
        "Genere": artist["genres"][0] if artist["genres"] else None,
        "Popolarità": artist["popularity"],
        "Followers": artist["followers"]["total"],
        "Spotify URL": artist["external_urls"]["spotify"]
    }
    
    artists_data.append(artist_data)
    
corean_artists_data_frame = pd.DataFrame(artists_data)
corean_artists_data_frame['Spotify URL'] = corean_artists_data_frame['Spotify URL'].apply(make_clickable)
corean_artists_data_frame['Nazionalità'] = "Coreana" 

display(HTML(corean_artists_data_frame.to_html(escape=False)))

Adesso è il momento di unire tutti e 10 i dataframe in un'unico dataframe globale che contenga tutti i dati fin'ora ottenuti.
Il dataframe contiene le seguenti colonne:
- Nome
- ID 
- Genere 
- Popolarità
- Followers 
- Spotify URL 
- Nazionalità    

In [None]:
data_frames = [
    italian_artists_data_frame,
    american_artists_data_frame,
    french_artists_data_frame,
    german_artists_data_frame,
    chinese_artists_data_frame,
    japanese_artists_data_frame,
    romanian_artists_data_frame,
    bulgarian_artists_data_frame,
    spanish_artists_data_frame,
    corean_artists_data_frame
]

international_artists_data_frame = pd.concat(data_frames, ignore_index=True)

print("DataFrame complessivo degli artisti internazionali:")
display(HTML(international_artists_data_frame.to_html(escape=False)))

international_artists_data_frame.to_csv('international_artists_data.csv', index=False)

In [None]:
international_artists_data_frame.describe()

- Una volta ottenuto un dataframe contenente le informazioni sulla nazionalità di 1000 artisti, procediamo ora all'analisi della popolarità di ciascun artista in base alla propria nazione di appartenenza. È immediatamente evidente che, mantenendo costante il numero di artisti, coloro provenienti dagli Stati Uniti emergono come i più popolari.

In [None]:
mean_data = international_artists_data_frame.groupby('Nazionalità').agg({'Popolarità': 'mean', 'Followers': 'mean'}).reset_index()

sns.set_style("whitegrid")

plt.figure(figsize=(12, 6))
sns.barplot(data=mean_data, x='Nazionalità', y='Popolarità', palette='viridis', width=0.6)
plt.title('Popolarità media per nazionalità')
plt.xlabel('Nazionalità')
plt.ylabel('Popolarità media')

plt.show()

- Nel grafico, è chiaro che oltre una popolarità di 70, la crescita del numero di followers deve avvenire in modo esponenziale. <br>
La curva esponenziale mostra un <strong>punto di inflessione</strong> vicino a <strong>x=70</strong>, indicando un cambiamento significativo nella relazione tra popolarità e followers in quella gamma di valori.

In [None]:
sns.set_style("whitegrid")

plt.figure(figsize=(12, 8))
plt.scatter(international_artists_data_frame['Popolarità'], international_artists_data_frame['Followers'], alpha=0.5)
plt.axvline(x=70, color='r', linestyle='--', label='Punto di inflessione')

plt.xlabel('Popolarità')
plt.ylabel('Followers')
plt.title('Scatter Plot: Popolarità vs Followers')
plt.legend()

plt.show()

Per motivi di semplicità, proseguiremo le nostre analisi statistiche con un dataset reperito da una fonte esterna **(GitHub: @
jivanjotk)**

Il set di dati per questo progetto contiene un elenco completo delle **canzoni più famose del 2023** elencate su Spotify. Il set di dati offre una serie di caratteristiche che vanno oltre quelle tipicamente disponibili in set di dati simili. Fornisce informazioni sugli attributi, la popolarità e la presenza di ogni canzone su varie piattaforme musicali. 

Caratteristiche principali del dataset :
- track_name: nome del brano
- artist_name: nome dell'artista del brano
- artist_count: Numero di artisti che hanno contribuito al brano
- released_year: Anno di pubblicazione del brano
- released_month: Mese in cui il brano è stato pubblicato
- released_day: Giorno del mese in cui il brano è stato pubblicato
- in_spotify_playlists: Numero di playlist di Spotify in cui il brano è incluso
- in_spotify_charts: Presenza e posizione del brano nelle classifiche di Spotify
- streams: Numero totale di streaming su Spotify
- in_apple_playlists: Numero di playlist di Apple Music in cui è incluso il brano
- in_apple_charts: Presenza e posizione del brano nelle classifiche di Apple Music
- in_deezer_playlists: Numero di playlist Deezer in cui è incluso il brano
- in_deezer_charts: Presenza e posizione del brano nelle classifiche di Deezer
- in_shazam_charts: Presenza e posizione del brano nelle classifiche Shazam
- bpm: battiti al minuto, una misura del tempo del brano
- key: Chiave del brano
- mode: Modo della canzone (maggiore o minore)
- danceability_%: Percentuale che indica quanto la canzone è adatta al ballo
- valence_%: Positività del contenuto musicale della canzone
- energy_%: Livello di energia percepito della canzone
- acousticness_%: Quantità di suoni acustici nel brano
- instrumentalness_%: Quantità di contenuto strumentale nel brano
- liveness_%: Presenza di elementi di performance dal vivo
- speechiness_%: Quantità di parole parlate nel brano

In [None]:
file_path = 'most_streamed.csv'
most_streamed_data_frame = pd.read_csv(file_path, encoding='latin1')

most_streamed_data_frame

In [None]:
most_streamed_data_frame.describe()

- Il dataframe in questione racchiude le canzoni più celebri su Spotify durante l'intero anno 2023, senza limitazioni legate al genere musicale o alla nazionalità degli artisti. La metrica principale considerata è il numero di stream, che rappresenta le riproduzioni di ciascun brano. Questo parametro è analizzato in relazione alla **danceability percentuale**, una misura che quantifica quanto una canzone sia adatta al ballo.

- Come ci si potrebbe aspettare intuitivamente, si osserva un aumento del numero di stream all'aumentare della percentuale di danceability. Questo dato conduce a un'importante conclusione, evidenziando che la popolarità di una canzone è strettamente correlata alla sua capacità di suscitare il desiderio di ballare nel pubblico degli ascoltatori.

In [None]:
import warnings

warnings.filterwarnings("ignore")
sns.set_style("whitegrid")

plt.figure(figsize=(16, 8))
sns.histplot(data=most_streamed_data_frame, x='danceability_%', bins=30, hue='streams', multiple='stack', palette='viridis', legend=False)
plt.title('Distribuzione di danceability_%')
plt.xlabel('Danceability percentuale del brano')
plt.ylabel('Numero di stream')

plt.show()

In base all'analisi del grafico, emerge chiaramente che la distribuzione del numero di stream inizia a diminuire significativamente dopo aver raggiunto un livello di danceability del 80%. Questo fenomeno indica una caratteristica interessante dei brani musicali, poiché diventano eccessivamente specifici e tecnici. Di conseguenza, il loro grado di attrattività per il pubblico diminuisce, portando a una diminuzione delle riproduzioni.

Per supportare questa ipotesi, esaminiamo ora i brani musicali in cui la percentuale di danceability supera l'80%. Questa analisi approfondita ci consentirà di confermare se esiste effettivamente una correlazione negativa tra l'aumento della danceability e la diminuzione delle riproduzioni.

In [None]:
most_streamed_data_frame[most_streamed_data_frame['danceability_%'] >= 80]

<section id="conclusion">
    <h2>8. Conclusion</h2>
</section>

In questo tutorial abbiamo esplorato l'ampio spettro di possibilità offerto dall'**API Web di Spotify**, aprendo la porta a un mondo di interazioni creative con il rinomato servizio di streaming musicale. Attraverso i vari passaggi del nostro percorso, abbiamo appreso come recuperare i metadati dei contenuti, ottenere consigli personalizzati, creare e gestire playlist, nonché controllare la riproduzione di brani.

L'accesso alle API di Spotify non solo offre agli sviluppatori un potente strumento per arricchire le loro applicazioni con dati musicali di alta qualità, ma consente anche agli appassionati di musica di esplorare e sfruttare la vasta gamma di funzionalità offerte dalla piattaforma.

Affrontando le diverse fasi del tutorial, abbiamo fornito una guida dettagliata su come autenticarsi, utilizzare le API RESTful di Spotify e integrare efficacemente le API Python di Spotify nel processo di sviluppo. L'approfondita sezione sull'estrazione dati e analisi ci ha mostrato come tradurre i dati ottenuti in informazioni significative e utili.

In conclusione, l'API Web di Spotify si presenta come una risorsa indispensabile per gli sviluppatori e gli appassionati di musica desiderosi di sfruttare appieno le potenzialità offerte dal vasto e diversificato mondo musicale di Spotify. Sono sicuro che l'esperienza acquisita in questo tutorial aprirà nuove prospettive creative e consentirà di creare applicazioni musicali innovative e coinvolgenti.