<h1>

<h1>Explicação das métricas</h1>

Os dados utilizados nesse projeto são provenientes da API Spotify for developers, que trás as seguintes métricas:

- <b>Acousticness</b> <br>
    Uma medida entre 0.0 e 1.0 que representa qual a confiança de que a faixa em questão é acústica. Um valor de 1.0 representa alta confiança.

- <b>Danceability</b> <br>
    Essa métrica, que varia entre 0.0 e 1.0, descreve quanto uma música é adequada para dançar, baseada em elementos como tempo, estabilidade do ritmo, força do beat e regularidade geral. 0.0 representa uma música que é o menos "dançável" possível e 1.0 o mais "dançável" possível.

- <b>Energy</b> <br>
    Energy varia de 0.0 a 1.0 e representa uma medida perceptiva de intensidade e atividade. Por exemplo: death metal teria um alto score nesta métrica, enquanto um prelúdio de Bach teria um baixo score.

- <b>Instrumentalness</b> <br>
    Métrica que varia entre 0.0 e 1.0 e preve se uma faixa contém vocais ou não. 'Ooh's e 'aah's são tratados como sons instrumentais neste contexto. Valores acima de 0.5 provavelmente irão representar faixas instrumentais, mas a confiança aumenta à medida que o valor se aproxima de 1.0.

- <b>Liveness</b> <br>
    Uma medida entre 0.0 e 1.0 que detecta a presença de audiência na gravação. Valores mais altos indicam uma probabilidade maior de que a gravação foi realizada ao vivo. Um valor acima de 0.8 é um indicativo forte de que a gravação foi realizada ao vivo.

- <b>Loudness</b> <br>
    Indica quão 'barulhenta' é a faixa, medida através da intensidade média do volume, em dB.

- <b>Mode</b> <br>
    Indica a modalidade de uma faixa (maior ou menor). Maior é representa por 1 e menor por 0.

- <b>Speechiness</b> <br>
    Medida entre 0.0 e 1.0 que identifica a presença de palavras faladas em uma faixa. Quanto mais uma faixa tem apenas palavras faladas (por exemplo um podcast), mas essa métrica se aproxima de 1.0. Valores acima de 0.66 provavelmente descrevem faixa feitas somente de palavras faladas, valores entre 0.33 e 0.66 provavelmente descrevem faixas com músicas e palavras faladas e valores abaixo de 0.33 provavelmente descrevem músicas.

- <b>Tempo</b> <br>
    Descreve o andamento da música em bpms.

- <b>Time signature</b> <br>
    Descreve quantos beats existem em um compasso. Seu valor varia de 3 a 7, indicando compassos 3/4 à 7/4.

- <b>Valence</b> <br>
    Uma medida entre 0.0 e 1.0 que representa qual a 'positividade' da faixa. Faixas com valores altos soam mais positivas (alegres, eufóricas), enquanto faixas com valores baixos soam mais negativas (tristes, depressivas, raivosas).


In [55]:
# Importação das bibliotecas a serem utilizadas
import pandas as pd
import numpy as np
import plotly.express as px
import plotly.graph_objects as go

<h1>Tratando as bases de dados</h1>

In [56]:
base_totais = pd.read_csv(r'Dados/Dados_totais.csv')
base_genero = pd.read_csv(r'Dados/data_by_genres.csv')
base_ano = pd.read_csv(r'Dados/data_by_year.csv')

In [57]:
base_totais.head()

Unnamed: 0,valence,year,acousticness,artists,danceability,duration_ms,energy,explicit,id,instrumentalness,key,liveness,loudness,mode,name,popularity,speechiness,tempo,artists_song
0,0.285,2000,0.00239,Coldplay,0.429,266773,0.661,0,3AJwUDP919kvQ9QcozQPxg,0.000121,11,0.234,-7.227,1,Yellow,84,0.0281,173.372,Coldplay - Yellow
1,0.613,2000,0.143,OutKast,0.843,270507,0.806,1,0I3q5fE6wg7LIfHGngUTnV,0.0,4,0.0771,-5.946,0,Ms. Jackson,80,0.269,94.948,OutKast - Ms. Jackson
2,0.4,2000,0.00958,Linkin Park,0.556,216880,0.864,0,60a0Rd6pjrkxjPbaKzXjfq,0.0,3,0.209,-5.87,0,In the End,84,0.0584,105.143,Linkin Park - In the End
3,0.543,2000,0.00664,3 Doors Down,0.545,233933,0.865,0,6ZOBP3NvffbU4SZcrnt1k6,1.1e-05,11,0.168,-5.708,0,Kryptonite,78,0.0286,99.009,3 Doors Down - Kryptonite
4,0.76,2000,0.0302,Eminem,0.949,284200,0.661,1,3yfqSUWxFvZELEM4PmlwIR,0.0,5,0.0454,-4.244,0,The Real Slim Shady,80,0.0572,104.504,Eminem - The Real Slim Shady


In [58]:
# Removendo colunas desnecessárias da base de dados totais

base_totais = base_totais.drop(['mode','explicit', 'key'], axis = 1)

In [59]:
base_genero.head()

Unnamed: 0,mode,genres,acousticness,danceability,duration_ms,energy,instrumentalness,liveness,loudness,speechiness,tempo,valence,popularity,key
0,1,21st century classical,0.979333,0.162883,160297.7,0.071317,0.606834,0.3616,-31.514333,0.040567,75.3365,0.103783,27.833333,6
1,1,432hz,0.49478,0.299333,1048887.0,0.450678,0.477762,0.131,-16.854,0.076817,120.285667,0.22175,52.5,5
2,1,8-bit,0.762,0.712,115177.0,0.818,0.876,0.126,-9.18,0.047,133.444,0.975,48.0,7
3,1,[],0.651417,0.529093,232880.9,0.419146,0.205309,0.218696,-12.288965,0.107872,112.857352,0.513604,20.859882,7
4,1,a cappella,0.676557,0.538961,190628.5,0.316434,0.003003,0.172254,-12.479387,0.082851,112.110362,0.448249,45.820071,7


In [60]:
# Removendo colunas desnecessárias da base de dados genero

base_genero = base_genero.drop(['mode','key'], axis = 1)

In [61]:
base_ano.head()

Unnamed: 0,mode,year,acousticness,danceability,duration_ms,energy,instrumentalness,liveness,loudness,speechiness,tempo,valence,popularity,key
0,1,1921,0.886896,0.418597,260537.166667,0.231815,0.344878,0.20571,-17.048667,0.073662,101.531493,0.379327,0.653333,2
1,1,1922,0.938592,0.482042,165469.746479,0.237815,0.434195,0.24072,-19.275282,0.116655,100.884521,0.535549,0.140845,10
2,1,1923,0.957247,0.577341,177942.362162,0.262406,0.371733,0.227462,-14.129211,0.093949,114.01073,0.625492,5.389189,0
3,1,1924,0.9402,0.549894,191046.707627,0.344347,0.581701,0.235219,-14.231343,0.092089,120.689572,0.663725,0.661017,10
4,1,1925,0.962607,0.573863,184986.92446,0.278594,0.418297,0.237668,-14.146414,0.111918,115.521921,0.621929,2.604317,5


In [62]:
# Removendo colunas desnecessárias da base de dados ano

base_ano = base_ano.drop(['mode','key'], axis = 1).loc[base_ano['year']>=2000]

<h1>Análise gráfica</h1>

In [63]:
fig = px.line(base_ano, x='year', y='loudness', markers = True, title = 'Loudness por ano')
fig.show()

In [64]:
fig2 = go.Figure()

fig2.add_trace(go.Scatter(x=base_ano['year'], y=base_ano['acousticness'], name = 'Acousticness'))
fig2.add_trace(go.Scatter(x=base_ano['year'], y=base_ano['valence'], name = 'Valence'))
fig2.add_trace(go.Scatter(x=base_ano['year'], y=base_ano['danceability'], name = 'Danceability'))
fig2.add_trace(go.Scatter(x=base_ano['year'], y=base_ano['energy'], name = 'Energy'))
fig2.add_trace(go.Scatter(x=base_ano['year'], y=base_ano['instrumentalness'], name = 'Instrumentalness'))
fig2.add_trace(go.Scatter(x=base_ano['year'], y=base_ano['liveness'], name = 'Liveness'))
fig2.add_trace(go.Scatter(x=base_ano['year'], y=base_ano['speechiness'], name = 'Speechiness'))

fig2.show()

In [65]:
fig3 = go.Figure(data = go.Heatmap(z = base_totais.corr(numeric_only = True), x = base_totais.corr(numeric_only = True).columns, y = base_totais.corr(numeric_only = True).index,
                                   text = base_totais.corr(numeric_only = True).values.round(2), 
                                   texttemplate="%{text}", 
                                   textfont={"size":12},
                                   hovertemplate='%{x}<br>%{y}<br>%{z}<extra></extra>'))
fig3.update_layout(height=500, width=800)
fig3.show()