In [1]:
import pandas as pd
from tensorflow import keras
from sklearn.preprocessing import LabelEncoder, MinMaxScaler
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
from re import sub

names_label_encoder = LabelEncoder()
names_label_scaler = MinMaxScaler()
artists_label_encoder = LabelEncoder()
artists_label_scaler = MinMaxScaler()

spotify_data = pd.read_csv("data.csv")
spotify_data["duration_sec"] = spotify_data.duration_ms/1000

spotify_data.name = names_label_encoder.fit_transform(spotify_data.name)
spotify_data.name = names_label_scaler.fit_transform(spotify_data.name.values.reshape(-1, 1))
spotify_data.artists = spotify_data.artists.apply(lambda artists: sub(r"([\[|\]|\'])", "", artists))
spotify_data.artists = artists_label_encoder.fit_transform(spotify_data.artists)
spotify_data.artists = artists_label_scaler.fit_transform(spotify_data.artists.values.reshape(-1, 1))

spotify_data.drop(columns = ["id", "release_date", "duration_ms"], inplace = True)

X_train, X_test, y_train, y_test = train_test_split(spotify_data.drop(columns = ["popularity"]),
                                                    spotify_data.popularity, test_size = 0.01, random_state = 123)

In [None]:
#criação de um modelo sequencial
model = keras.Sequential([
    #criação de uma camada oculta com 40 neurônios, funçao de ativação relu e 
    #que recebe como entrada 16 variáveis                   
    keras.layers.Dense(40, activation='relu', input_shape=(16,)),
    #criação de uma camada oculta com 20 neurônios e funçao de ativação relu    
    keras.layers.Dense(20, activation='relu'),
    #criação de uma camada oculta com 10 neurônios e funçao de ativação relu    
    keras.layers.Dense(10, activation='relu'),
    #criação de uma camada de saída com 1 neurônio   
    keras.layers.Dense(1)
  ])

#definição de como o erro é calculado e definição da função de custo
model.compile(loss='mse',
                optimizer="adam",
                metrics=['mae','mse'])

#treinamento do modelo usando dados de treino, repetindo o processo 100 vezes e 
#separando 1% da base de treino para avaliar a performace durante o treinamento.
model.fit(X_train, y_train, epochs=100, validation_split = 0.01, verbose=1)

#predição para os valores de treino e teste
y_train_pred = model.predict(X_train)
y_test_pred = model.predict(X_test)
train_rmse = mean_squared_error(y_train, y_train_pred)**(1/2)
test_rmse = mean_squared_error(y_test, y_test_pred)**(1/2)

print("{} de RMSE para o conjunto de treino".format(train_rmse))
print("{} de RMSE para o conjunto de teste".format(test_rmse))

In [None]:
#criação de um modelo sequencial
model = keras.Sequential([
    #criação de uma camada oculta com 40 neurônios, funçao de ativação relu e 
    #que recebe como entrada 16 variáveis                   
    keras.layers.Dense(40, activation='relu', input_shape=(16,), kernel_initializer = keras.initializers.RandomNormal(stddev=0.01)),
    #criação de uma camada oculta com 20 neurônios e funçao de ativação relu    
    keras.layers.Dense(20, activation='relu', kernel_initializer = keras.initializers.RandomNormal(stddev=0.01)),
    #criação de uma camada oculta com 10 neurônios e funçao de ativação relu    
    keras.layers.Dense(10, activation='relu', kernel_initializer = keras.initializers.RandomNormal(stddev=0.01)),
    #criação de uma camada de saída com 1 neurônio   
    keras.layers.Dense(1)
  ])

#definição de como o erro é calculado e definição da função de custo
model.compile(loss='mse',
                optimizer="adam",
                metrics=['mae','mse'])

#treinamento do modelo usando dados de treino, repetindo o processo 100 vezes e 
#separando 1% da base de treino para avaliar a performace durante o treinamento.
model.fit(X_train, y_train, epochs=100, validation_split = 0.01, verbose=0)

#predição para os valores de treino e teste
y_train_pred = model.predict(X_train)
y_test_pred = model.predict(X_test)
train_rmse = mean_squared_error(y_train, y_train_pred)**(1/2)
test_rmse = mean_squared_error(y_test, y_test_pred)**(1/2)

print("{} de RMSE para o conjunto de treino".format(train_rmse))
print("{} de RMSE para o conjunto de teste".format(test_rmse))

10.706676376062438 de RMSE para o conjunto de treino
10.525687867875227 de RMSE para o conjunto de teste


In [11]:
#criação de um modelo sequencial
model = keras.Sequential([
    #criação de uma camada oculta com 40 neurônios, funçao de ativação relu e 
    #que recebe como entrada 16 variáveis                   
    keras.layers.Dense(40, activation='relu', input_shape=(16,), kernel_initializer = keras.initializers.RandomNormal(stddev=0.01),
                       kernel_regularizer=keras.regularizers.l2(l=0.001)),
    #criação de uma camada oculta com 20 neurônios e funçao de ativação relu    
    keras.layers.Dense(20, activation='relu', kernel_initializer = keras.initializers.RandomNormal(stddev=0.01)),
    #criação de uma camada oculta com 10 neurônios e funçao de ativação relu    
    keras.layers.Dense(10, activation='relu', kernel_initializer = keras.initializers.RandomNormal(stddev=0.01)),
    #criação de uma camada de saída com 1 neurônio   
    keras.layers.Dense(1)
  ])

#definição de como o erro é calculado e definição da função de custo
model.compile(loss='mse',
                optimizer="adam",
                metrics=['mae','mse'])

#treinamento do modelo usando dados de treino, repetindo o processo 100 vezes e 
#separando 1% da base de treino para avaliar a performace durante o treinamento.
model.fit(X_train, y_train, epochs=100, validation_split = 0.01, verbose=0)

#predição para os valores de treino e teste
y_train_pred = model.predict(X_train)
y_test_pred = model.predict(X_test)
train_rmse = mean_squared_error(y_train, y_train_pred)**(1/2)
test_rmse = mean_squared_error(y_test, y_test_pred)**(1/2)

print("{} de RMSE para o conjunto de treino".format(train_rmse))
print("{} de RMSE para o conjunto de teste".format(test_rmse))

10.10830100378831 de RMSE para o conjunto de treino
9.994143622624032 de RMSE para o conjunto de teste


In [8]:
#criação de um modelo sequencial
model = keras.Sequential([
    #criação de uma camada oculta com 40 neurônios, funçao de ativação relu e 
    #que recebe como entrada 16 variáveis                   
    keras.layers.Dense(40, activation='relu', input_shape=(16,), kernel_initializer = keras.initializers.RandomNormal(stddev=0.01)),
    keras.layers.Dropout(0.2),
    #criação de uma camada oculta com 20 neurônios e funçao de ativação relu    
    keras.layers.Dense(20, activation='relu', kernel_initializer = keras.initializers.RandomNormal(stddev=0.01)),
    #criação de uma camada oculta com 10 neurônios e funçao de ativação relu    
    keras.layers.Dense(10, activation='relu', kernel_initializer = keras.initializers.RandomNormal(stddev=0.01)),
    #criação de uma camada de saída com 1 neurônio   
    keras.layers.Dense(1)
  ])

#definição de como o erro é calculado e definição da função de custo
model.compile(loss='mse',
                optimizer="adam",
                metrics=['mae','mse'])

#treinamento do modelo usando dados de treino, repetindo o processo 100 vezes e 
#separando 1% da base de treino para avaliar a performace durante o treinamento.
model.fit(X_train, y_train, epochs=100, validation_split = 0.01, verbose=0)

#predição para os valores de treino e teste
y_train_pred = model.predict(X_train)
y_test_pred = model.predict(X_test)
train_rmse = mean_squared_error(y_train, y_train_pred)**(1/2)
test_rmse = mean_squared_error(y_test, y_test_pred)**(1/2)

print("{} de RMSE para o conjunto de treino".format(train_rmse))
print("{} de RMSE para o conjunto de teste".format(test_rmse))

36.77317909535623 de RMSE para o conjunto de treino
36.5346780744086 de RMSE para o conjunto de teste
