# 🎧 Spotify Top Hits (2000–2019) – Dashboard Exploratório
Este notebook explora o dataset com as músicas mais populares do Spotify entre 2000 e 2019, fornecendo visualizações e análises úteis para entender os padrões musicais ao longo do tempo.

In [None]:
# Instalar bibliotecas necessárias
!pip install pandas matplotlib seaborn

In [None]:
# Importar bibliotecas
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
# Fazer upload do arquivo CSV
from google.colab import files
uploaded = files.upload()

In [None]:
# Carregar o dataset
df = pd.read_csv("top50.csv", encoding="ISO-8859-1")
df.head()

## 🔍 Informações gerais do dataset

In [None]:
sns.set(style="whitegrid")
print("Formato do dataset:", df.shape)
print("\nColunas disponíveis:", df.columns)
print("\nInformações gerais:")
print(df.info())

## 🎵 Gêneros Mais Populares

In [None]:
plt.figure(figsize=(12,6))
sns.countplot(data=df, y="Genre", order=df["Genre"].value_counts().index)
plt.title("🎶 Gêneros Mais Populares (2000-2019)")
plt.xlabel("Número de Músicas")
plt.ylabel("Gênero")
plt.show()

## 📈 Número de Músicas por Ano

In [None]:
plt.figure(figsize=(10,5))
sns.histplot(data=df, x="Year", bins=20, kde=False)
plt.title("📅 Número de Músicas por Ano")
plt.xlabel("Ano")
plt.ylabel("Quantidade de Músicas")
plt.xticks(rotation=45)
plt.show()

## 👨‍🎤 Artistas com Mais Músicas

In [None]:
top_artists = df['Artist.Name'].value_counts().head(10)

plt.figure(figsize=(12,6))
sns.barplot(x=top_artists.values, y=top_artists.index)
plt.title("👨‍🎤 Artistas com Mais Músicas no Top 50 (2000–2019)")
plt.xlabel("Número de Músicas")
plt.ylabel("Artista")
plt.show()

## 🎧 Artistas Mais Ouvintes (Popularidade Média)

In [None]:
top_listened = df.groupby("Artist.Name")["Popularity"].mean().sort_values(ascending=False).head(10)

plt.figure(figsize=(12,6))
sns.barplot(x=top_listened.values, y=top_listened.index)
plt.title("🎧 Artistas Mais Ouvintes (Popularidade Média)")
plt.xlabel("Popularidade Média")
plt.ylabel("Artista")
plt.show()

## 🔁 Correlação entre Variáveis Numéricas

In [None]:
plt.figure(figsize=(8,6))
sns.heatmap(df.select_dtypes(include='number').corr(), annot=True, cmap="YlGnBu")
plt.title("🔗 Correlação entre Variáveis Numéricas")
plt.show()