## Case Curso de Python: 🐍 Análise de Dados das Músicas Mais Tocadas no Spotify (2023) 🎵

### Instruções:

Bem-vindos ao desafio de análise de dados das músicas mais bombásticas no Spotify em 2023! 🚀 Neste case, jogaremos uma base de dados nas suas mãos para que você mostre toda a sua magia com Python. Essa é a sua chance de brilhar e impressionar com suas habilidades analíticas.

**Desenvolvemos *quatro* hipóteses que vão ativar o seu espírito de detetive e levar você a descobrir os segredos escondidos nos dados.** 🕵️‍♂️

<br>

**Dá uma olhada nas hipóteses abaixo e vamos mergulhar nesse universo musical!** 🎉🔍

### Hipóteses 🕵️‍♂️📊

<br>

1. **Vibes Positivas na Pista de Dança:** Será que as músicas mais dançáveis e energéticas são também as mais positivas, com letras cheias de vida? 💃🎶

<br>

2. **Festas e Hits Top 10:** Será que os maiores sucessos do Spotify em 2023 estão alinhados com os períodos festivos, como Natal e Ano Novo? 🎄🎉

<br>

3. **Acelera o BPM:** Será que as top 10 músicas mais tocadas têm um ritmo mais acelerado, ultrapassando a média de BPM das outras músicas? 🚀🔊

<br>

4. **Batalha Épica:** Top 10 vs. Bottom 10: Vamos comparar as top 10 músicas MAIS tocadas com as top 10 músicas MENOS tocadas no Spotify! 🏆🎵

<br>

Hora de decifrar os mistérios dos dados e revelar o que está por trás dos hits de 2023! Boa sorte! 🚀🔍

### Colunas do DataFrame e Suas Respectivas Explicações 📊🎶

<br>

>* **track_name:** Nome da música
>* **artist(s)_name:** Nome do(s) artista(s) da música
>* **artist_count:** Número de artistas contribuindo para a música
>* **released_year:** Ano de lançamento da música
>* **released_month:** Mês de lançamento da música
>* **released_day:** Dia do mês de lançamento da música
>* **in_spotify_playlists:** Número de playlists do Spotify em que a música está incluída
>* **in_spotify_charts:** Presença e posição da música nos charts do Spotify
>* **streams:** Número total de reproduções no Spotify
>* **in_apple_playlists:** Número de playlists do Apple Music em que a música está incluída
>* **in_apple_charts:** Presença e posição da música nos charts do Apple Music
>* **in_deezer_playlists:** Número de playlists do Deezer em que a música está incluída
>* **in_deezer_charts:** Presença e posição da música nos charts do Deezer
>* **in_shazam_charts:** Presença e posição da música nos charts do Shazam
>* **bpm:** Batidas por minuto, medida de ritmo da música
>* **key:** Tonalidade da música
>* **mode:** Modo da música (maior ou menor)
>* **danceability_%:** Percentual indicando a adequação da música para dançar
>* **valence_%:** Positividade do conteúdo musical da música
>* **energy_%:** Nível percebido de energia da música
>* **acousticness_%:** Quantidade de som acústico na música
>* **instrumentalness_%:** Quantidade de conteúdo instrumental na música
>* **liveness_%:** Presença de elementos de performance ao vivo
>* **speechiness_%:** Quantidade de palavras faladas na música

<br>

Vamos desbravar essas colunas e extrair as histórias por trás dos números! 🕵️‍♂️🔍

In [1]:
# ====== Carregando o dataset ====== #

import pandas as pd

df = pd.read_csv('spotify-2023.csv', encoding='latin-1')
display(df.head())

Unnamed: 0,track_name,artist(s)_name,artist_count,released_year,released_month,released_day,in_spotify_playlists,in_spotify_charts,streams,in_apple_playlists,...,bpm,key,mode,danceability_%,valence_%,energy_%,acousticness_%,instrumentalness_%,liveness_%,speechiness_%
0,Seven (feat. Latto) (Explicit Ver.),"Latto, Jung Kook",2,2023,7,14,553,147,141381703,43,...,125,B,Major,80,89,83,31,0,8,4
1,LALA,Myke Towers,1,2023,3,23,1474,48,133716286,48,...,92,C#,Major,71,61,74,7,0,10,4
2,vampire,Olivia Rodrigo,1,2023,6,30,1397,113,140003974,94,...,138,F,Major,51,32,53,17,0,31,6
3,Cruel Summer,Taylor Swift,1,2019,8,23,7858,100,800840817,116,...,170,A,Major,55,58,72,11,0,11,15
4,WHERE SHE GOES,Bad Bunny,1,2023,5,18,3133,50,303236322,84,...,144,A,Minor,65,23,80,14,63,11,6


In [58]:
colunas = df.select_dtypes(include='number').columns
df1 = df.head(10)
df2 = df.tail(50)

for coluna in colunas:
    dif = df1[coluna].mean() - df2[coluna].mean()
    print(f" A diferença da coluna {coluna} é {dif:.2f}")

 A diferença da coluna artist_count é -0.08
 A diferença da coluna released_year é 2.48
 A diferença da coluna released_month é -3.76
 A diferença da coluna released_day é 2.76
 A diferença da coluna in_spotify_playlists é 165.46
 A diferença da coluna in_spotify_charts é 74.50
 A diferença da coluna in_apple_playlists é 35.82
 A diferença da coluna in_apple_charts é 156.90
 A diferença da coluna in_deezer_charts é 12.44
 A diferença da coluna bpm é 10.30
 A diferença da coluna danceability_% é 3.72
 A diferença da coluna valence_% é 11.10
 A diferença da coluna energy_% é 8.14
 A diferença da coluna acousticness_% é 0.82
 A diferença da coluna instrumentalness_% é 0.56
 A diferença da coluna liveness_% é -4.82
 A diferença da coluna speechiness_% é -2.38


In [42]:
df[["danceability_%", "valence_%", "energy_%"]].describe()

Unnamed: 0,danceability_%,valence_%,energy_%
count,953.0,953.0,953.0
mean,66.96957,51.43127,64.279119
std,14.63061,23.480632,16.550526
min,23.0,4.0,9.0
25%,57.0,32.0,53.0
50%,69.0,51.0,66.0
75%,78.0,70.0,77.0
max,96.0,97.0,97.0
