# Título: Classificação de popularidade de músicas usando PyTorch

## Descrição:
Neste exercício, você será desafiado a aplicar o PyTorch para construir um modelo de classificação capaz de prever a popularidade de músicas com base em seus recursos. Para isso, utilizaremos um conjunto de dados que contém informações sobre as melhores músicas do Spotify de 2000 a 2023.

### O conjunto de dados possui as seguintes colunas relevantes para nosso problema:

- artist: o artista da música
- top genre: o gênero musical predominante da música
- bpm: batidas por minuto da música
- energy: energia da música
- dB: decibéis da música
- liveness: probabilidade de ser uma gravação ao vivo
- valence: valência emocional da música
- acousticness: probabilidade de ser uma música acústica
- danceability: capacidade de dançar ao ritmo da música
- duration: duração da música em segundos
- speechiness: probabilidade de conter palavras faladas na música
- popularity: popularidade da música (variando de 0 a 100)


Seu objetivo é treinar um modelo de classificação usando PyTorch que seja capaz de prever a popularidade de uma música com base em seus recursos.

### Sugestão de passos a seguir:

1. Faça a importação do conjunto de dados a partir do dataset fornecido.
2. Importe as bibliotecas necessárias: pandas, numpy, torch, torchvision, etc.
3. Carregue o conjunto de dados usando a biblioteca Pandas.
4. Realize o pré-processamento necessário no conjunto de dados, incluindo a categorização dos valores da coluna "popularity" em três classes (0, 1 e 2) usando a função pd.cut.
5. Realize a codificação one-hot das colunas "artist" e "top genre" usando a função onehot_encode.
6. Separe o conjunto de dados em recursos (X) e rótulos de destino (y). Descarte as colunas irrelevantes para o modelo.
7. Converta os dados para tensores do PyTorch.
8. Crie uma classe CTDataset que herda torch.utils.data.Dataset e implemente os métodos __init__, __len__ e __getitem__ para representar o conjunto de dados.
7. Divida o conjunto de dados em conjuntos de treinamento, validação e teste usando a função random_split do PyTorch, de acordo com as proporções especificadas.
8. Crie carregadores de dados (DataLoader) para cada conjunto, com um tamanho de lote (batch size) adequado.
9. Defina a arquitetura da rede neural no PyTorch, incluindo as camadas Linear necessárias.
10. Defina a função de perda (loss function) como CrossEntropyLoss e o otimizador como Adam.
11. Mova o modelo para a GPU, se disponível, para acelerar o treinamento.
12. Execute o treinamento do modelo por um número específico de épocas, calculando a perda média ao longo das iterações de treinamento.
13. Avalie o desempenho do modelo nos conjuntos de validação e teste, calculando a acurácia, precisão, recall e exibindo o relatório de classificação.
15. Discuta as descobertas e faça uma reflexão sobre a aplicação do PyTorch em problemas de classificação de dados do mundo real.

**O objetivo é alcançar a melhor precisão possível na classificação da popularidade das músicas. Experimente diferentes arquiteturas de rede neural, funções de ativação, hiperparâmetros e técnicas de regularização para obter resultados ainda melhores.**

**Você pode utilizar as bibliotecas matplotlib ou outras ferramentas de visualização para analisar os resultados e apresentar gráficos informativos.**



In [5]:
import pandas as pd
df = pd.read_csv('Best Songs on Spotify from 2000-2023.csv', delimiter=';')
df.head()

Unnamed: 0,title,artist,top genre,year,bpm,energy,danceability,dB,liveness,valence,duration,acousticness,speechiness,popularity
0,Flowers,Miley Cyrus,pop,2023,118,68,71,-4,3,65,200,6,7,98
1,Cupid - Twin Ver.,FIFTY FIFTY,k-pop girl group,2023,120,59,78,-8,35,73,174,44,3,97
2,BESO,ROSALÍA,pop,2023,95,64,77,-7,17,53,195,74,14,96
3,Boy's a liar Pt. 2,PinkPantheress,bronx drill,2023,133,81,70,-8,25,86,131,25,5,96
4,Creepin' (with The Weeknd & 21 Savage),Metro Boomin,rap,2022,98,62,72,-6,8,17,222,42,5,96
