**INTRODUÇÃO**

Nste notebook, acessamos a API do Spotify, por meio da biblioteca Spotipy, para coletar dados sobre as músicas de Gilberto Gil presentes na plataforma. Além das canções mais ouvidas de autoria ou com participação de Gil, acessamos os indicadores, criados pelo próprio Spotify, para reconhecer características das faixas.

**ÍNDICE**

1. [Instalação de bibliotecas e autenticação](#Inicio)
2. [Artista](#Artista)
3. [Top 10](#Top10)
4. [Artistas relacionados](#Relacionados)
5. [Álbuns](#Albuns)

  5.1 [Músicas por álbum](#Musicas)
6. [Audio features](#Audio_Features)

  6.1 [Top 10](#AF_Top10)

  6.2 [Todas](#AF_Todas)


**EXPEDIENTE**

**Edição DATADOC**

Thays Lavor

**Análise e visualização de dados**

Gabriela Custódio

## Instalação de bibliotecas e autenticação <a name="Inicio"></a>

In [None]:
!pip install spotipy

In [None]:
import pandas as pd
import spotipy
from spotipy.oauth2 import SpotifyClientCredentials

In [None]:
SPOTIPY_CLIENT_ID = 'client_id'
SPOTIPY_CLIENT_SECRET = 'client_secret'

In [None]:
auth_manager = SpotifyClientCredentials(client_id=SPOTIPY_CLIENT_ID, client_secret=SPOTIPY_CLIENT_SECRET)
sp = spotipy.Spotify(auth_manager=auth_manager)

## Artista <a name="Artista"></a>

In [None]:
gilberto_gil = sp.artist('7oEkUINVIj1Nr3Wnj8tzqr')

infos_gil = list()

artista = gilberto_gil['name']
id_artista = gilberto_gil['id']
perfil = gilberto_gil['external_urls']['spotify']
seguidores = gilberto_gil['followers']['total']
popularidade = gilberto_gil['popularity']
generos = gilberto_gil['genres']
imagem = gilberto_gil['images'][0]['url']

infos_gil.append((artista, id_artista, perfil, seguidores, popularidade, generos, imagem))

In [None]:
df_gilberto_gil = pd.DataFrame(infos_gil, index=None, columns=('artista', 'id_artista', 'perfil', 'seguidores', 'popularidade', 'generos', 'imagem'))

In [None]:
df_gilberto_gil

Unnamed: 0,artista,id_artista,perfil,seguidores,popularidade,generos,imagem
0,Gilberto Gil,7oEkUINVIj1Nr3Wnj8tzqr,https://open.spotify.com/artist/7oEkUINVIj1Nr3...,996329,61,"[bossa nova, mpb, samba, tropicalia, violao]",https://i.scdn.co/image/ab6761610000e5eb03b2a5...


## Top 10 <a name="Top10"></a>

In [None]:
# Id e uri do Gilberto Gil
artist_id = '7oEkUINVIj1Nr3Wnj8tzqr'
artist_uri = 'spotify:artist:' + artist_id

In [None]:
# top 10
top_music_gil = sp.artist_top_tracks(artist_id)['tracks']
len(top_music_gil)

10

In [None]:
lista_top_10 = list()

for i, music in enumerate(top_music_gil):
  nome_artista = music['artists'][0]['name']
  id_artista = music['artists'][0]['id']
  album = music['album']['name']
  id_album = music['album']['id']
  lancamento = music['album']['release_date']
  musica = music['name']
  id_musica = music['id']
  popularidade = music['popularity']
  if music['is_playable'] == True:
    preview_url = music['preview_url']
  if music['is_playable'] == False:
    preview_url = []
  imagem = music['album']['images'][0]['url']

  lista_top_10.append((nome_artista, id_artista, album, id_album, lancamento, musica, id_musica, popularidade, preview_url, imagem))

In [None]:
df_top_10 = pd.DataFrame(lista_top_10, index=None, columns=('artista', 'id_artista', 'album', 'id_album', 'lancamento', 'musica', 'id_musica', 'popularidade', 'preview_url', 'imagem'))

In [None]:
df_top_10['ano_lancamento'] = df_top_10['lancamento'].str.slice(start=0, stop=4)

In [None]:
df_top_10.to_csv('df_top_10.csv', index=False)

In [None]:
df_top_10

Unnamed: 0,artista,id_artista,album,id_album,lancamento,musica,id_musica,popularidade,preview_url,imagem,ano_lancamento
0,Gilberto Gil,7oEkUINVIj1Nr3Wnj8tzqr,"As canções de eu, tu, eles",5tPEQtkCVKj17B9RlxDIKC,2000-01-01,Esperando na janela,3zcBNmJH6ToRCI0WNEIuES,61,https://p.scdn.co/mp3-preview/336e9fd3080fd2e9...,https://i.scdn.co/image/ab67616d0000b273452e0f...,2000
1,Zeca Pagodinho,3qZ2n5keOAat1SoF6bHwmb,"Sambabook Zeca Pagodinho, Vol. 2",1SYy6QlPiObmtHW2PqpZWu,2014-03-20,Camarão Que Dorme a Onda Leva,7lzfMZak2HjNPXXSxksjPB,59,https://p.scdn.co/mp3-preview/62fa405294020f37...,https://i.scdn.co/image/ab67616d0000b273cc06ea...,2014
2,Gilberto Gil,7oEkUINVIj1Nr3Wnj8tzqr,Um banda um,3eXCgCBM4BS6H83xmxKdL6,1982,Andar com fé,2BvDFQOl4JieEGK2cgKOey,57,https://p.scdn.co/mp3-preview/6cf554392b2df4b5...,https://i.scdn.co/image/ab67616d0000b273369d09...,1982
3,Gilberto Gil,7oEkUINVIj1Nr3Wnj8tzqr,Realce,7dBoyhnlxf1DvmWxtgQPLr,1979-08-15,Toda Menina Baiana,0ENvhTTww1MVOulrzuxSmu,54,https://p.scdn.co/mp3-preview/fa0d8cb088326c5b...,https://i.scdn.co/image/ab67616d0000b273e0a1e9...,1979
4,Gilberto Gil,7oEkUINVIj1Nr3Wnj8tzqr,Gilbertos Samba,4CzqCaWsFEzNWWugq0EfUV,2014-01-31,Aos Pés da Cruz,1G3tT3xLodVLyZV7MQDXin,53,https://p.scdn.co/mp3-preview/4a660cde505324df...,https://i.scdn.co/image/ab67616d0000b273f7254e...,2014
5,Gilberto Gil,7oEkUINVIj1Nr3Wnj8tzqr,Luar,3qoUU8sm4eBT5POFHQSl5L,1981,Palco,2wL88cvKXUOfHuYVd62hji,52,https://p.scdn.co/mp3-preview/d15b78f91bf1e8f6...,https://i.scdn.co/image/ab67616d0000b27349870a...,1981
6,Emicida,2d9LRvQJnAXRijqIJDDs2K,É tudo pra ontem,0ucGkC2GM4IBycOIAw9eBj,2020-12-10,É tudo pra ontem,48QajhR9A10V7uM2UbIWxO,23,https://p.scdn.co/mp3-preview/a054ca225696af4c...,https://i.scdn.co/image/ab67616d0000b273628e3d...,2020
7,Gilberto Gil,7oEkUINVIj1Nr3Wnj8tzqr,Gilberto Gil (1969),53eqd316Rs3te41yGRovYz,1969-01-01,Aquele Abraço,7CjSjWTdVPD0ov82Qz55Xb,51,https://p.scdn.co/mp3-preview/5acedc0c6ba86b5a...,https://i.scdn.co/image/ab67616d0000b273736a08...,1969
8,Gilberto Gil,7oEkUINVIj1Nr3Wnj8tzqr,Unplugged (Ao vivo),525oSOShPTFiuHE1DIZttf,1994-01-01,A paz - Ao vivo,5jKg6K5LjLH4RkVpxXqO6W,50,https://p.scdn.co/mp3-preview/18f00e1265e9c9b6...,https://i.scdn.co/image/ab67616d0000b2734fb42a...,1994
9,Caetano Veloso,7HGNYPmbDrMkylWqeFCOIQ,Clássicos da Bossa Nova,2bq54CQ4KAtXnsvaSOeOQk,2020-03-20,Desde Que O Samba É Samba,021Ser4na0UMv7eMZFt9NI,38,,https://i.scdn.co/image/ab67616d0000b27333cb3a...,2020


## Artistas relacionados <a name="Relacionados"></a>

In [None]:
artistas_relacionados = sp.artist_related_artists('7oEkUINVIj1Nr3Wnj8tzqr')['artists']
artistas_relacionados[0]['id']

'1gIa65d5ICT2xVWiUJ3u27'

In [None]:
artistas_relacionados[0]['external_urls']['spotify']

'https://open.spotify.com/artist/1gIa65d5ICT2xVWiUJ3u27'

In [None]:
lista_artistas_relacionados = list()

for artista_relacionado in artistas_relacionados:
  artista = artista_relacionado['name']
  id_artista = artista_relacionado['id']
  perfil = artista_relacionado['external_urls']['spotify']
  seguidores = artista_relacionado['followers']['total']
  popularidade = artista_relacionado['popularity']
  generos = artista_relacionado['genres']
  imagem = artista_relacionado['images'][0]['url']

  lista_artistas_relacionados.append((artista, id_artista, perfil, seguidores, popularidade, generos, imagem))

In [None]:
df_art_relacionados = pd.DataFrame(lista_artistas_relacionados, index=None, columns=('artista', 'id_artista', 'perfil', 'seguidores', 'popularidade', 'generos', 'imagem'))

In [None]:
df_art_relacionados.sort_values(by='seguidores', ascending=False)

Unnamed: 0,artista,id_artista,perfil,seguidores,popularidade,generos,imagem
1,Caetano Veloso,7HGNYPmbDrMkylWqeFCOIQ,https://open.spotify.com/artist/7HGNYPmbDrMkyl...,1859017,64,"[bossa nova, mpb, samba de roda, tropicalia]",https://i.scdn.co/image/ab6761610000e5ebe98de5...
3,Jorge Ben Jor,5JYtpnUKxAzXfHEYpOeeit,https://open.spotify.com/artist/5JYtpnUKxAzXfH...,739524,60,"[bossa nova, manguebeat, mpb, samba, samba-roc...",https://i.scdn.co/image/a9c6a324c5f4a0f25bc711...
13,Milton Nascimento,3Bnq7jiU506HcPjRgQ43TM,https://open.spotify.com/artist/3Bnq7jiU506HcP...,689137,58,"[bossa nova, mpb, musica popular mineira]",https://i.scdn.co/image/ab6761610000e5eb8ed529...
5,Gal Costa,1b8kpp4DUwt1hWaxTiWQhD,https://open.spotify.com/artist/1b8kpp4DUwt1hW...,551355,57,"[bossa nova, mpb, samba, tropicalia]",https://i.scdn.co/image/ab6761610000e5eb706bb8...
19,Ney Matogrosso,2SFIMUkCdZowbeisskDdhn,https://open.spotify.com/artist/2SFIMUkCdZowbe...,506178,51,"[bossa nova, mpb, nova mpb, samba]",https://i.scdn.co/image/ab6761610000e5ebe1692c...
17,Cartola,0RSWHhBUwW7lhCqXqxKxWN,https://open.spotify.com/artist/0RSWHhBUwW7lhC...,497631,51,"[bossa nova, mpb, pagode, samba, velha guarda]",https://i.scdn.co/image/ab6761610000e5ebffc0e1...
15,Gonzaguinha,1LOFaxDBvn3YuvarTldGAe,https://open.spotify.com/artist/1LOFaxDBvn3Yuv...,493483,51,"[bossa nova, mpb, pagode, pop nacional antigas...",https://i.scdn.co/image/ab67616d0000b273ef28a6...
4,Novos Baianos,2ohBjgFT9V0LRDWO2wF9DJ,https://open.spotify.com/artist/2ohBjgFT9V0LRD...,385277,50,"[bossa nova, brazilian indie, mpb, psicodelia ...",https://i.scdn.co/image/ab6761610000e5eb6f2aa6...
2,Luiz Melodia,1zZjt7cDeeJSLWZYK34r7W,https://open.spotify.com/artist/1zZjt7cDeeJSLW...,381359,48,"[bossa nova, mpb, pagode, samba, velha guarda]",https://i.scdn.co/image/ab6761610000e5ebe59a96...
11,Secos & Molhados,4EKJxXaAZapG14Q5FTZoxm,https://open.spotify.com/artist/4EKJxXaAZapG14...,343869,46,"[bossa nova, mpb, psicodelia brasileira]",https://i.scdn.co/image/ab67616d0000b27370f4d5...


In [None]:
df_art_relacionados.to_csv('df_artistas_relacionados_spotify.csv', index=False)

In [None]:
lista_artistas_relacionados.append(infos_gil[0])

In [None]:
df_art_relacionados_e_gil = pd.DataFrame(lista_artistas_relacionados, index=None, columns=('artista', 'id_artista', 'perfil', 'seguidores', 'popularidade', 'generos', 'imagem'))

In [None]:
df_art_relacionados_e_gil.sort_values(by='seguidores', ascending=False).head(3)

Unnamed: 0,artista,id_artista,perfil,seguidores,popularidade,generos,imagem
1,Caetano Veloso,7HGNYPmbDrMkylWqeFCOIQ,https://open.spotify.com/artist/7HGNYPmbDrMkyl...,1859017,64,"[bossa nova, mpb, samba de roda, tropicalia]",https://i.scdn.co/image/ab6761610000e5ebe98de5...
20,Gilberto Gil,7oEkUINVIj1Nr3Wnj8tzqr,https://open.spotify.com/artist/7oEkUINVIj1Nr3...,996329,61,"[bossa nova, mpb, samba, tropicalia, violao]",https://i.scdn.co/image/ab6761610000e5eb03b2a5...
3,Jorge Ben Jor,5JYtpnUKxAzXfHEYpOeeit,https://open.spotify.com/artist/5JYtpnUKxAzXfH...,739524,60,"[bossa nova, manguebeat, mpb, samba, samba-roc...",https://i.scdn.co/image/a9c6a324c5f4a0f25bc711...


## Álbuns <a name="Albuns"></a>

In [None]:
lista_albuns = list()

results = sp.artist_albums(artist_uri, album_type='album')
albums = results['items']
while results['next']:
  results = sp.next(results)
  albums.extend(results['items'])

albums[0]['artists'][0]['name']
for album in albums:
  lista_albuns.append((album['name'], album['id'], len(album['available_markets']), album['available_markets'], album['release_date']))

In [None]:
df_lista_albuns = pd.DataFrame(lista_albuns, index=None, columns=('album', 'id_album', 'quantidade_paises', 'paises', 'lancamento'))

In [None]:
df_lista_albuns['ano_lancamento'] = df_lista_albuns['lancamento'].str.slice(start=0, stop=4)

In [None]:
print('Há', df_lista_albuns['id_album'].nunique(), 'álbuns de Gilberto Gil no Spotify')

Há 85 álbuns de Gilberto Gil no Spotify


In [None]:
paises_albuns = []

for lista in df_lista_albuns['paises']:
  for item in lista:
    paises_albuns.append(item)

In [None]:
df_mercado = pd.DataFrame(paises_albuns).rename(columns={0:'sigla'})
df_mercado['repeticao'] = 1

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [None]:
iso_code_list = pd.read_csv('../iso_3166_code.csv').rename(columns={'ISO 3166-2[3]':'sigla', 'ISO 3166[1]':'país', 'ISO 3166-1[2]': 'Sovereignty'})

In [None]:
iso_code_list = iso_code_list[['país', 'Sovereignty', 'sigla']]

In [None]:
df_mercado_albums = df_mercado.groupby('sigla').sum().sort_values(by='repeticao', ascending=False).reset_index()

In [None]:
df_paises_albuns_gil = iso_code_list.merge(df_mercado_albums, on='sigla').sort_values(by='repeticao', ascending=False)

In [None]:
df_paises_albuns_gil.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 181 entries, 80 to 75
Data columns (total 4 columns):
 #   Column       Non-Null Count  Dtype 
---  ------       --------------  ----- 
 0   país         181 non-null    object
 1   Sovereignty  181 non-null    object
 2   sigla        181 non-null    object
 3   repeticao    181 non-null    int64 
dtypes: int64(1), object(3)
memory usage: 7.1+ KB


In [None]:
df_paises_albuns_gil.head(20)

Unnamed: 0,país,Sovereignty,sigla,repeticao
80,Curaçao,Netherlands,CW,76
156,Brazil,UN member state,BR,76
31,Singapore,UN member state,SG,76
0,Israel,UN member state,IL,75
118,Albania,UN member state,AL,75
110,Latvia,UN member state,LV,75
111,Paraguay,UN member state,PY,75
113,Papua New Guinea,UN member state,PG,75
114,Peru,UN member state,PE,75
115,Australia [b],UN member state,AU,75


In [None]:
df_lista_albuns['id_album'].nunique()

85

In [None]:
print(df_lista_albuns['ano_lancamento'].max())
print(df_lista_albuns['ano_lancamento'].min())

2022
1962


### Músicas por álbum <a name="Musicas"></a>

In [None]:
musicas_album = []
for id_album in df_lista_albuns['id_album']:
  album_music = sp.album_tracks(id_album)
  musicas_album += album_music['items']

In [None]:
musicas_gil = []
for musica in musicas_album:
  numero_album = musica['disc_number']
  nome_artista = musica['artists'][0]['name']
  nome_musica = musica['name']
  id_musica = musica['id']
  numero_musica = musica['track_number']
  mercados = musica['available_markets']
  musicas_gil.append((numero_album, nome_artista, nome_musica, id_musica, numero_musica, mercados))

In [None]:
df_lista_musicas = pd.DataFrame(musicas_gil, index=None, columns=('numero_album', 'nome_artista', 'nome_musica', 'id_musica', 'numero_musica', 'mercados_disponíveis'))

In [None]:
print('No Spotify, há', df_lista_musicas['id_musica'].nunique(), 'músicas de Gilberto Gil')
print('Destas,', df_lista_musicas['nome_musica'].nunique(), 'têm nomes únicos')
print('As outras', df_lista_musicas['id_musica'].nunique() - df_lista_musicas['nome_musica'].nunique(), 'são títulos repetidos')

No Spotify, há 1267 músicas de Gilberto Gil
Destas, 994 têm nomes únicos
As outras 273 são títulos repetidos


In [None]:
# encontrar quantas vezes as músicas se repetem
musicas_repetidas = df_lista_musicas[df_lista_musicas['nome_musica'].duplicated(keep=False)][['nome_musica', 'id_musica']].groupby(by='nome_musica').nunique().sort_values(by='id_musica', ascending=False).reset_index()
musicas_repetidas['repeticoes'] = musicas_repetidas['id_musica']-1
musicas_repetidas

Unnamed: 0,nome_musica,id_musica,repeticoes
0,Expresso 2222 - Ao Vivo,6,5
1,Domingo no Parque - Ao Vivo,6,5
2,Procissão,6,5
3,"São João, Xangô Menino - Ao Vivo",6,5
4,Tres Palabras - Ao Vivo,5,4
...,...,...,...
171,Fé na Festa (Ao Vivo),2,1
172,Guerra santa,2,1
173,Is This Love - Ao vivo,2,1
174,It's Good To Be Alive,2,1


In [None]:
df_lista_musicas02 = df_lista_musicas[['numero_album', 'nome_artista', 'nome_musica', 'id_musica', 'numero_musica']]
df_lista_musicas02 = df_lista_musicas02.melt(id_vars=['numero_album', 'nome_musica', 'nome_artista', 'numero_musica'])

In [None]:
df_lista_musicas02.groupby(['nome_musica', 'nome_artista', 'numero_musica', 'numero_album']).count().sort_values(by='variable', ascending=False).head(60)

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Unnamed: 3_level_0,variable,value
nome_musica,nome_artista,numero_musica,numero_album,Unnamed: 4_level_1,Unnamed: 5_level_1
"São João, Xangô Menino - Ao Vivo",Caetano Veloso,9,2,5,5
Nine Out of Ten - Ao Vivo,Caetano Veloso,10,1,4,4
Odeio - Ao Vivo,Caetano Veloso,11,1,4,4
Domingo no Parque - Ao Vivo,Caetano Veloso,14,2,4,4
Filhos de Gandhi - Ao Vivo,Caetano Veloso,12,2,4,4
Esotérico - Ao Vivo,Caetano Veloso,3,2,4,4
Come prima - Ao Vivo,Caetano Veloso,2,2,4,4
Desde Que o Samba é Samba - Ao Vivo,Caetano Veloso,13,2,4,4
Andar com Fé - Ao Vivo,Caetano Veloso,11,2,4,4
Coração Vagabundo - Ao Vivo,Caetano Veloso,2,1,4,4


In [None]:
df_lista_musicas[df_lista_musicas['nome_musica'] == 'São João, Xangô Menino - Ao Vivo']

Unnamed: 0,numero_album,nome_artista,nome_musica,id_musica,numero_musica,mercados_disponíveis
137,2,Caetano Veloso,"São João, Xangô Menino - Ao Vivo",7jb5jTsbWfLTaFMuC0OQNJ,9,"[CA, US]"
165,2,Caetano Veloso,"São João, Xangô Menino - Ao Vivo",5dzlVFOxQu66Tuu3ImOwSf,9,[ES]
193,2,Caetano Veloso,"São João, Xangô Menino - Ao Vivo",2ymBUfxwzY2fiOAf94VwL3,9,"[AD, AE, AL, AM, AO, AT, AU, AZ, BA, BD, BE, B..."
221,2,Caetano Veloso,"São João, Xangô Menino - Ao Vivo",2jm6AeNpRn83t5QpZXM9LD,9,"[AG, AR, BB, BO, BS, BZ, CL, CO, CR, CW, DM, D..."
249,2,Caetano Veloso,"São João, Xangô Menino - Ao Vivo",6KPs7gMKeIUBxqZYFQJo9R,9,[BR]
977,1,Gilberto Gil,"São João, Xangô Menino - Ao Vivo",15cCbnk9OKfd3eEPzvzC71,3,"[AD, AE, AG, AL, AM, AO, AR, AT, AU, AZ, BA, B..."


In [None]:
df_lista_musicas[df_lista_musicas['nome_musica'].str.contains('Aquele abraço - Ao vivo')]

Unnamed: 0,numero_album,nome_artista,nome_musica,id_musica,numero_musica,mercados_disponíveis
461,1,Gilberto Gil,Aquele abraço - Ao vivo,0fu5MT8XW6lxaKZp7lEeyo,8,"[AD, AE, AG, AL, AM, AO, AR, AT, AU, AZ, BA, B..."
750,1,Gilberto Gil,Aquele abraço - Ao vivo,1A46STanraigBtVHIHtOdm,13,"[AD, AE, AG, AL, AM, AO, AR, AT, AU, AZ, BA, B..."
827,1,Gilberto Gil,Aquele abraço - Ao vivo,4fdGpjaGGQ4AC7XBY0tOqM,4,"[AD, AE, AG, AL, AM, AO, AR, AT, AU, AZ, BA, B..."
900,1,Gilberto Gil,Aquele abraço - Ao vivo,5cXRPk5jc3K7yCMesHPiJH,4,"[AD, AE, AG, AL, AM, AO, AR, AT, AU, AZ, BA, B..."


In [None]:
# encontrar países em que as faixas estão disponíveis

mercados_faixas = []
for faixa in musicas_album:
  nome_musica = faixa['name']
  id_musica = faixa['id']
  mercado_musica = faixa['available_markets']
  mercados_faixas.append((nome_musica, id_musica, mercado_musica))

In [None]:
df_mercados_faixas = pd.DataFrame(mercados_faixas, index=None, columns=('nome_musica', 'id_musica', 'mercado_musica'))

In [None]:
paises_faixas = []

for lista in df_mercados_faixas['mercado_musica']:
  for item in lista:
    paises_faixas.append(item)

In [None]:
df_paises_faixas = pd.DataFrame(paises_faixas).rename(columns={0:'sigla'})
df_paises_faixas['repeticao'] = 1

In [None]:
df_paises_faixas_groupby = df_paises_faixas.groupby('sigla').sum().sort_values(by='repeticao', ascending=False).reset_index()

In [None]:
df_paises_faixas_gil = iso_code_list.merge(df_paises_faixas_groupby, on='sigla').sort_values(by='repeticao', ascending=False)
df_paises_faixas_gil

Unnamed: 0,país,Sovereignty,sigla,repeticao
80,Curaçao,Netherlands,CW,1097
31,Singapore,UN member state,SG,1089
109,New Zealand,UN member state,NZ,1084
156,Brazil,UN member state,BR,1081
118,Albania,UN member state,AL,1069
...,...,...,...,...
149,Micronesia (Federated States of),UN member state,FM,1053
93,Seychelles,UN member state,SC,1053
92,Algeria,UN member state,DZ,1053
75,Eswatini [j],UN member state,SZ,1053


## Audio features <a name="Audio_Features"></a>

-----

##### com base nesse tutorial: [Hands-on Lab: Develop music analytics app with Spotify API in Python](https://www.youtube.com/watch?v=oNyaiWgqKDI)
##### nessa análise: [API Spotify: passo a passo de como utilizar e possíveis análises de playlists](https://matheusduzzi.medium.com/api-spotify-passo-a-passo-de-como-utilizar-e-poss%C3%ADveis-an%C3%A1lises-de-playlists-3984e0c46704)

-----

**Track's Audio Features**

Fonte: [Documentação da API do Spotify](https://developer.spotify.com/documentation/web-api/reference/#/operations/get-audio-features)

*acousticness*

A confidence measure from 0.0 to 1.0 of whether the track is acoustic. 1.0 represents high confidence the track is acoustic.

*danceability*

Danceability describes how suitable a track is for dancing based on a combination of musical elements including tempo, rhythm stability, beat strength, and overall regularity. A value of 0.0 is least danceable and 1.0 is most danceable.

*energy*

Energy is a measure from 0.0 to 1.0 and represents a perceptual measure of intensity and activity. Typically, energetic tracks feel fast, loud, and noisy. For example, death metal has high energy, while a Bach prelude scores low on the scale. Perceptual features contributing to this attribute include dynamic range, perceived loudness, timbre, onset rate, and general entropy.

*instrumentalness*

Predicts whether a track contains no vocals. "Ooh" and "aah" sounds are treated as instrumental in this context. Rap or spoken word tracks are clearly "vocal". The closer the instrumentalness value is to 1.0, the greater likelihood the track contains no vocal content. Values above 0.5 are intended to represent instrumental tracks, but confidence is higher as the value approaches 1.0.

*liveness*

Detects the presence of an audience in the recording. Higher liveness values represent an increased probability that the track was performed live. A value above 0.8 provides strong likelihood that the track is live.

*valence*

A measure from 0.0 to 1.0 describing the musical positiveness conveyed by a track. Tracks with high valence sound more positive (e.g. happy, cheerful, euphoric), while tracks with low valence sound more negative (e.g. sad, depressed, angry).

### Top 10 <a name="AF_Top10"></a>

In [None]:
features_df = pd.DataFrame()
for id in df_top_10['id_musica'].iteritems():
  track_id = id[1]
  audio_features = sp.audio_features(track_id)
  local_features = pd.DataFrame(audio_features, index=[0])
  features_df = features_df.append(local_features)

In [None]:
features_df.columns

Index(['danceability', 'energy', 'key', 'loudness', 'mode', 'speechiness',
       'acousticness', 'instrumentalness', 'liveness', 'valence', 'tempo',
       'type', 'id', 'uri', 'track_href', 'analysis_url', 'duration_ms',
       'time_signature'],
      dtype='object')

In [None]:
top10_features = features_df[['id', 'acousticness', 'danceability', 'energy', 'instrumentalness', 'liveness', 'valence', 'speechiness', 'duration_ms']].rename(columns={'id': 'id_musica'})
top10_features = df_top_10.merge(top10_features, on='id_musica', how='left')

In [None]:
top10_features

Unnamed: 0,artista,id_artista,album,id_album,lancamento,musica,id_musica,popularidade,preview_url,imagem,ano_lancamento,acousticness,danceability,energy,instrumentalness,liveness,valence,speechiness,duration_ms
0,Gilberto Gil,7oEkUINVIj1Nr3Wnj8tzqr,"As canções de eu, tu, eles",5tPEQtkCVKj17B9RlxDIKC,2000-01-01,Esperando na janela,3zcBNmJH6ToRCI0WNEIuES,61,https://p.scdn.co/mp3-preview/336e9fd3080fd2e9...,https://i.scdn.co/image/ab67616d0000b273452e0f...,2000,0.201,0.653,0.647,0.0,0.0753,0.936,0.0437,256693
1,Zeca Pagodinho,3qZ2n5keOAat1SoF6bHwmb,"Sambabook Zeca Pagodinho, Vol. 2",1SYy6QlPiObmtHW2PqpZWu,2014-03-20,Camarão Que Dorme a Onda Leva,7lzfMZak2HjNPXXSxksjPB,59,https://p.scdn.co/mp3-preview/62fa405294020f37...,https://i.scdn.co/image/ab67616d0000b273cc06ea...,2014,0.313,0.723,0.694,0.0,0.052,0.739,0.0802,168948
2,Gilberto Gil,7oEkUINVIj1Nr3Wnj8tzqr,Um banda um,3eXCgCBM4BS6H83xmxKdL6,1982,Andar com fé,2BvDFQOl4JieEGK2cgKOey,57,https://p.scdn.co/mp3-preview/6cf554392b2df4b5...,https://i.scdn.co/image/ab67616d0000b273369d09...,1982,0.47,0.774,0.647,0.000569,0.46,0.965,0.0514,200960
3,Gilberto Gil,7oEkUINVIj1Nr3Wnj8tzqr,Realce,7dBoyhnlxf1DvmWxtgQPLr,1979-08-15,Toda Menina Baiana,0ENvhTTww1MVOulrzuxSmu,54,https://p.scdn.co/mp3-preview/fa0d8cb088326c5b...,https://i.scdn.co/image/ab67616d0000b273e0a1e9...,1979,0.236,0.692,0.897,4e-06,0.116,0.968,0.0398,226640
4,Gilberto Gil,7oEkUINVIj1Nr3Wnj8tzqr,Gilbertos Samba,4CzqCaWsFEzNWWugq0EfUV,2014-01-31,Aos Pés da Cruz,1G3tT3xLodVLyZV7MQDXin,53,https://p.scdn.co/mp3-preview/4a660cde505324df...,https://i.scdn.co/image/ab67616d0000b273f7254e...,2014,0.9,0.725,0.299,0.107,0.118,0.527,0.113,195200
5,Gilberto Gil,7oEkUINVIj1Nr3Wnj8tzqr,Luar,3qoUU8sm4eBT5POFHQSl5L,1981,Palco,2wL88cvKXUOfHuYVd62hji,52,https://p.scdn.co/mp3-preview/d15b78f91bf1e8f6...,https://i.scdn.co/image/ab67616d0000b27349870a...,1981,0.489,0.734,0.787,0.0461,0.329,0.757,0.0461,266173
6,Emicida,2d9LRvQJnAXRijqIJDDs2K,É tudo pra ontem,0ucGkC2GM4IBycOIAw9eBj,2020-12-10,É tudo pra ontem,48QajhR9A10V7uM2UbIWxO,23,https://p.scdn.co/mp3-preview/a054ca225696af4c...,https://i.scdn.co/image/ab67616d0000b273628e3d...,2020,0.769,0.641,0.522,0.0,0.394,0.627,0.369,310400
7,Gilberto Gil,7oEkUINVIj1Nr3Wnj8tzqr,Gilberto Gil (1969),53eqd316Rs3te41yGRovYz,1969-01-01,Aquele Abraço,7CjSjWTdVPD0ov82Qz55Xb,51,https://p.scdn.co/mp3-preview/5acedc0c6ba86b5a...,https://i.scdn.co/image/ab67616d0000b273736a08...,1969,0.14,0.446,0.793,0.0,0.573,0.901,0.115,323773
8,Gilberto Gil,7oEkUINVIj1Nr3Wnj8tzqr,Unplugged (Ao vivo),525oSOShPTFiuHE1DIZttf,1994-01-01,A paz - Ao vivo,5jKg6K5LjLH4RkVpxXqO6W,50,https://p.scdn.co/mp3-preview/18f00e1265e9c9b6...,https://i.scdn.co/image/ab67616d0000b2734fb42a...,1994,0.717,0.626,0.219,0.00513,0.702,0.267,0.0315,293053
9,Caetano Veloso,7HGNYPmbDrMkylWqeFCOIQ,Clássicos da Bossa Nova,2bq54CQ4KAtXnsvaSOeOQk,2020-03-20,Desde Que O Samba É Samba,021Ser4na0UMv7eMZFt9NI,38,,https://i.scdn.co/image/ab67616d0000b27333cb3a...,2020,0.933,0.635,0.239,0.027,0.114,0.327,0.0383,311307


In [None]:
df_top10_features_infoviz = top10_features[['artista', 'album', 'musica', 'ano_lancamento', 'acousticness', 'danceability', 'energy', 'instrumentalness', 'liveness', 'valence']]
df_top10_features_infoviz.rename(columns={
    'artista': 'Artistas',
    'musica': 'Nome da música',
    'album': 'Nome do álbum',
    'ano_lancamento': 'Ano de lançamento',
    'acousticness': 'Acústica',
    'danceability': 'Dançabilidade',
    'energy': 'Energia',
    'instrumentalness': 'Instrumentalidade',
    'liveness': 'Vivência',
    'valence': 'Valência'
}, inplace=True)

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  errors=errors,


In [None]:
df_top10_features_infoviz.to_csv('df_top10_features_infoviz02.csv', index=False)

In [None]:
print('Estatísticas das músicas mais populares de Gilberto Gil no Spotify')
print('--------------------------------------')
print('Média de acústica:', round(df_top10_features['acousticness'].mean(),4))
print('Mediana de acústica:', round(df_top10_features['acousticness'].median(),4))
print('--------------------------------------')
print('Média de dançabilidade:', round(df_top10_features['danceability'].mean(),4))
print('Mediana de dançabilidade:', round(df_top10_features['danceability'].median(),4))
print('--------------------------------------')
print('Média de energia:', round(df_top10_features['energy'].mean(),4))
print('Mediana de energia:', round(df_top10_features['energy'].median(),4))
print('--------------------------------------')
print('Média de instrumentalidade:', round(df_top10_features['instrumentalness'].mean(),4))
print('Mediana de instrumentalidade:', round(df_top10_features['instrumentalness'].median(),4))
print('--------------------------------------')
print('Média de vivência:', round(df_top10_features['liveness'].mean(),4))
print('Mediana de vivência:', round(df_top10_features['liveness'].median(),4))
print('--------------------------------------')
print('Média de valência:', round(df_top10_features['valence'].mean(),4))
print('Mediana de valência:', round(df_top10_features['valence'].median(),4))

Estatísticas das músicas mais populares de Gilberto Gil no Spotify
--------------------------------------
Média de acústica: 0.5168
Mediana de acústica: 0.4795
--------------------------------------
Média de dançabilidade: 0.6649
Mediana de dançabilidade: 0.6725
--------------------------------------
Média de energia: 0.5744
Mediana de energia: 0.647
--------------------------------------
Média de instrumentalidade: 0.0186
Mediana de instrumentalidade: 0.0003
--------------------------------------
Média de vivência: 0.2933
Mediana de vivência: 0.2235
--------------------------------------
Média de valência: 0.7014
Mediana de valência: 0.748


In [None]:
df_mediana_caracteristicas_top10 = df_top10_features[['acousticness', 'danceability', 'energy', 'instrumentalness', 'liveness', 'valence']].median().reset_index().rename(columns={'index': 'característica', 0: 'mediana'})
df_mediana_caracteristicas_top10.T

Unnamed: 0,0,1,2,3,4,5
característica,acousticness,danceability,energy,instrumentalness,liveness,valence
mediana,0.4795,0.6725,0.647,0.000286,0.2235,0.748


In [None]:
df_top10_features_infoviz.median()

  """Entry point for launching an IPython kernel.


Ano de lançamento    1997.000000
Acústica                0.479500
Dançabilidade           0.672500
Energia                 0.647000
Instrumentalidade       0.000286
Vivência                0.223500
Valência                0.748000
dtype: float64

### Todas <a name="AF_Todas"></a>

In [None]:
df_lista_musicas.head(2)

Unnamed: 0,numero_album,nome_artista,nome_musica,id_musica,numero_musica,mercados_disponíveis
0,1,Gilberto Gil,Palco,0tsKcJOfkaQoeKMGegN0Qi,1,"[TO, WS, FJ, KI, MH, NR, NZ, TV]"
1,1,Gilberto Gil,Barato Total,6zz0dj3H9Q7JJlB6BHIhva,2,"[TO, WS, FJ, KI, MH, NR, NZ, TV]"


In [None]:
total_features_df = pd.DataFrame()
for id in df_lista_musicas['id_musica'].iteritems():
  track_id = id[1]
  audio_features = sp.audio_features(track_id)
  total_musicas_features = pd.DataFrame(audio_features, index=[0])
  total_features_df = total_features_df.append(total_musicas_features)

In [None]:
total_features_df.rename(columns={'id': 'id_musica'}, inplace=True)

In [None]:
df_total_musicas_features = df_lista_musicas.merge(total_features_df, on='id_musica', how='left')

In [None]:
print('Estatísticas do total de músicas de Gilberto Gil no Spotify')
print('--------------------------------------')
print('Média de acústica:', round(df_total_musicas_features['acousticness'].mean(),4))
print('Mediana de acústica:', round(df_total_musicas_features['acousticness'].median(),4))
print('--------------------------------------')
print('Média de dançabilidade:', round(df_total_musicas_features['danceability'].mean(),4))
print('Mediana de dançabilidade:', round(df_total_musicas_features['danceability'].median(),4))
print('--------------------------------------')
print('Média de energia:', round(df_total_musicas_features['energy'].mean(),4))
print('Mediana de energia:', round(df_total_musicas_features['energy'].median(),4))
print('--------------------------------------')
print('Média de instrumentalidade:', round(df_total_musicas_features['instrumentalness'].mean(),4))
print('Mediana de instrumentalidade:', round(df_total_musicas_features['instrumentalness'].median(),4))
print('--------------------------------------')
print('Média de vivência:', round(df_total_musicas_features['liveness'].mean(),4))
print('Mediana de vivência:', round(df_total_musicas_features['liveness'].median(),4))
print('--------------------------------------')
print('Média de valência:', round(df_total_musicas_features['valence'].mean(),4))
print('Mediana de valência:', round(df_total_musicas_features['valence'].median(),4))

Estatísticas do total de músicas de Gilberto Gil no Spotify
--------------------------------------
Média de acústica: 0.5794
Mediana de acústica: 0.618
--------------------------------------
Média de dançabilidade: 0.607
Mediana de dançabilidade: 0.613
--------------------------------------
Média de energia: 0.5213
Mediana de energia: 0.519
--------------------------------------
Média de instrumentalidade: 0.086
Mediana de instrumentalidade: 0.0016
--------------------------------------
Média de vivência: 0.4127
Mediana de vivência: 0.243
--------------------------------------
Média de valência: 0.5805
Mediana de valência: 0.609


In [None]:
df_media_caracteristicas = df_total_musicas_features[['acousticness', 'danceability', 'energy', 'instrumentalness', 'liveness', 'valence']].mean().reset_index().rename(columns={'index': 'característica', 0: 'média'})

In [None]:
df_mediana_caracteristicas = df_total_musicas_features[['acousticness', 'danceability', 'energy', 'instrumentalness', 'liveness', 'valence']].median().reset_index().rename(columns={'index': 'característica', 0: 'mediana'})

In [None]:
df_mediana_caracteristicas

Unnamed: 0,característica,mediana
0,acousticness,0.618
1,danceability,0.613
2,energy,0.519
3,instrumentalness,0.0016
4,liveness,0.243
5,valence,0.609


In [None]:
df_caracteristicas_total_musicas = df_media_caracteristicas.merge(df_mediana_caracteristicas, on='característica', how='right')

In [None]:
# df_caracteristicas_total_musicas.to_csv('df_caracteristicas_total_musicas.csv', index=False)

In [None]:
df_total_musicas_features_infoviz = df_total_musicas_features[['nome_musica', 'id_musica', 'acousticness', 'danceability', 'energy', 'instrumentalness', 'liveness', 'valence']]
df_total_musicas_features_infoviz.rename(columns={'acousticness': 'Acústica',
                                                  'danceability': 'Dançabilidade',
                                                  'energy': 'Energia',
                                                  'instrumentalness': 'Instrumentalidade',
                                                  'liveness': 'Vivência',
                                                  'valence': 'Valência'},inplace=True)
df_total_musicas_features_infoviz.head()

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  errors=errors,


Unnamed: 0,nome_musica,id_musica,Acústica,Dançabilidade,Energia,Instrumentalidade,Vivência,Valência
0,Palco,0tsKcJOfkaQoeKMGegN0Qi,0.723,0.734,0.522,0.0126,0.0972,0.579
1,Barato Total,6zz0dj3H9Q7JJlB6BHIhva,0.651,0.53,0.652,0.00011,0.0914,0.968
2,Back In Bahia,7hKfP4PNOGY0OPMAelK08x,0.723,0.768,0.533,8.2e-05,0.11,0.774
3,Esotérico,3ccMMKCMt5r862FRQ3oF3L,0.679,0.795,0.467,0.014,0.192,0.667
4,Queremos Saber,1Xy64RMKevhY2fi9a0bSPP,0.917,0.516,0.178,0.0,0.102,0.315


In [None]:
df_total_musicas_features_infoviz_sem_duplicadas = df_total_musicas_features_infoviz.drop_duplicates(subset='nome_musica', keep='first')

In [None]:
df_total_musicas_features_infoviz_tidy = df_total_musicas_features_infoviz_sem_duplicadas.melt(id_vars=['nome_musica', 'id_musica'])
df_total_musicas_features_infoviz_tidy.rename(columns={'nome_musica': 'Nome da música', 'id_musica': 'Id da música', 'variable': 'Características', 'value': 'Valores'}, inplace=True)

In [None]:
df_total_musicas_features_infoviz_tidy['Nome da música'].nunique()

994

In [None]:
df_total_musicas_features_infoviz_tidy.to_csv('df_total_musicas_features_infoviz_tidy_sem_duplicacao.csv', index=False)