# Analisis de Base de datos de música


![](https://c.tenor.com/iczjaEFdW20AAAAC/spotify-music.gif)

# español
Detalles del Conjunto de Datos\
Conjunto de Datos de las Canciones más Escuchadas en Spotify
Este conjunto de datos contiene información exhaustiva sobre algunas de las canciones más escuchadas en Spotify, enriquecida con información adicional de otras plataformas de streaming populares como Apple Music, Deezer y Shazam. Es ideal para analistas musicales, científicos de datos y entusiastas del aprendizaje automático que estén interesados en explorar tendencias y características de las canciones populares.

## Características del Conjunto de Datos

### Información Básica de la Canción:
- track_name: Nombre de la canción.
- artist(s)_name: Nombre del artista o artistas que interpretan la canción.
- artist_count: Número de artistas que contribuyen a la canción.
- released_year, released_month, released_day: Detalles de la fecha de lanzamiento.

### Métricas de Streaming:
- in_spotify_playlists: Número de listas de reproducción de Spotify en las que se incluye la canción.
- in_spotify_charts: Rango de la canción en las listas de éxitos de Spotify.
- streams: Número total de reproducciones en Spotify.
- in_apple_playlists, in_apple_charts: Presencia en listas de reproducción y listas de éxitos de Apple Music.
- in_deezer_playlists, in_deezer_charts: Presencia en listas de reproducción y listas de éxitos de Deezer.
- in_shazam_charts: Rango en las listas de éxitos de Shazam.
Atributos Musicales:
- bpm: Tiempo por minuto, que representa el ritmo de la canción.
- key: Tono de la canción.
- mode: Indica si la canción está en modo mayor o menor.
- danceability_%: Aptitud de la canción para bailar.
- valence_%: Positividad del contenido musical de la canción.
- energy_%: Nivel de energía percibida de la canción.
- acousticness_%: Presencia de sonido acústico en la canción.
- instrumentalness_%: Proporción de contenido instrumental en la pista.
- liveness_%: Presencia de elementos de actuación en vivo.
- speechiness_%: Cantidad de palabras habladas en la canción.


Fuente: Kaggle<div style="text-align: center; margin: 20px;">  
  <a href="https://www.kaggle.com/datasets/abdulszz/spotify-most-streamed-songs" target="_blank" style="font-size: 24px; font-weight: bold; color: blue;">Dataset de Spotify</a>  
</div>


In [9]:
# @title Conexión con la base de datos desde una URL
# URL = 'https://drive.google.com/file/d/1RXbptbwk6z1vbqqB5chvs6_JROb-or8D/view?usp=sharing'
# Definir el ID del archivo de Google Drive
FILEID = '1RXbptbwk6z1vbqqB5chvs6_JROb-or8D'
nombre_archivo = 'Spotify_Most_Streamed_Songs.csv'

# Descargar el archivo usando wget, gestionando las cookies
# Se usa --load-cookies para cargar las cookies guardadas temporalmente en /tmp/cookies.txt
# Se hace una primera solicitud con wget para obtener el token de confirmación que Google Drive envía cuando el archivo es grande o muy accedido
# El token se extrae usando sed (una utilidad para filtrar y procesar texto), que busca el patrón "confirm=" y captura el valor del token
# Una vez obtenido el token de confirmación, se realiza la descarga completa del archivo
# --no-check-certificate es usado para evitar errores de SSL (certificados) en entornos no seguros
# El archivo se guarda como "Spotify_Most_Streamed_Songs.csv" . indicado con el nombre del archivo en la variable "nombre_archivo"
# Finalmente, se eliminan las cookies temporales almacenadas en /tmp/cookies.txt

!wget --load-cookies /tmp/cookies.txt "https://docs.google.com/uc?export=download&confirm=$(wget --quiet --save-cookies /tmp/cookies.txt --keep-session-cookies --no-check-certificate 'https://docs.google.com/uc?export=download&id='$FILEID -O- | sed -rn 's/.*confirm=([0-9A-Za-z_]+).*/\1\n/p')&id="$FILEID -O $nombre_archivo && rm -rf /tmp/cookies.txt


--2024-10-17 02:13:37--  https://docs.google.com/uc?export=download&confirm=&id=1RXbptbwk6z1vbqqB5chvs6_JROb-or8D
Resolving docs.google.com (docs.google.com)... 74.125.201.102, 74.125.201.101, 74.125.201.100, ...
Connecting to docs.google.com (docs.google.com)|74.125.201.102|:443... connected.
HTTP request sent, awaiting response... 303 See Other
Location: https://drive.usercontent.google.com/download?id=1RXbptbwk6z1vbqqB5chvs6_JROb-or8D&export=download [following]
--2024-10-17 02:13:37--  https://drive.usercontent.google.com/download?id=1RXbptbwk6z1vbqqB5chvs6_JROb-or8D&export=download
Resolving drive.usercontent.google.com (drive.usercontent.google.com)... 108.177.121.132, 2607:f8b0:4001:c19::84
Connecting to drive.usercontent.google.com (drive.usercontent.google.com)|108.177.121.132|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 156547 (153K) [application/octet-stream]
Saving to: ‘Spotify_Most_Streamed_Songs.csv’


2024-10-17 02:13:39 (68.8 MB/s) - ‘Spotif

# Desglose:

- FILEID = '1RXbptbwk6z1vbqqB5chvs6_JROb-or8D': El ID del archivo de Google Drive que se desea descargar.
- Primera llamada wget:
Obtiene un token de confirmación cuando Google Drive requiere verificación extra para archivos grandes o descargados muchas veces.\
Usa sed para buscar y extraer el token de la respuesta de Google Drive.
- Segunda llamada wget:
Con el token, se realiza la descarga final del archivo.\
rm -rf /tmp/cookies.txt: Limpia las cookies temporales después de completar la descarga.

In [10]:
# @title Carga de librerias
# Bibliotecas utilizadas
# ----------------------------------------------------------------------------
# pandas (pd): librería para el análisis de datos
# matplotlib (plt): librería para crear gráficos
# seaborn (sns): librería para visualizar datos de manera estética
# Sweetviz (sw): Una biblioteca de análisis y visualización de datos en Python.
# files : Importa la función para subir y descargar archivos en Google Colab.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from google.colab import files
import numpy as np

El método que convierte variables categóricas en variables numéricas se llama codificación one-hot (One-Hot Encoding). En este enfoque, se crean columnas binarias (dummies) para cada categoría única de la variable original.

¿Qué es One-Hot Encoding?

- Dada una variable categórica con n categorías distintas, el método one-hot encoding genera n nuevas columnas.
- En cada columna, se asigna un valor de 1 si la observación pertenece a esa categoría y 0 en caso contrario.


# One-Hot Encoding (Codificación binaria)

Convierte cada categoría en una columna binaria (como vimos antes). Es útil para categorías sin orden específico (por ejemplo, ciudades, colores).

In [11]:
# Ejempo de One-Hot Encoding

# Crear un DataFrame con una variable categórica
data = {'Ciudad': ['Bogotá', 'Medellín', 'Cali', 'Bogotá', 'Medellín']}
df = pd.DataFrame(data)

# Aplicar One-Hot Encoding usando pandas.get_dummies()
df_encoded = pd.get_dummies(df, columns=['Ciudad'])

print(df_encoded)


   Ciudad_Bogotá  Ciudad_Cali  Ciudad_Medellín
0           True        False            False
1          False        False             True
2          False         True            False
3           True        False            False
4          False        False             True


Explicación:

- En este ejemplo, la variable categórica "Ciudad" tiene tres categorías: Bogotá, Medellín y Cali.
- El método pd.get_dummies() crea una columna binaria para cada ciudad, donde un 1 indica que la observación pertenece a esa categoría y un 0 que no.

Aplicaciones en Modelos de Machine Learning

- Regresión y Clasificación: Muchos algoritmos de machine learning (como la regresión lineal o K-means) requieren variables numéricas, por lo que es esencial convertir las variables categóricas en formato numérico.

- Evitación de multicolinealidad: En algunos casos, se puede eliminar una de las columnas resultantes (conocido como encoding con drop-first) para evitar redundancia.

In [12]:
# One-Hot Encoding con eliminación de la primera categoría
df_encoded = pd.get_dummies(df, columns=['Ciudad'], drop_first=True)
print(df_encoded)

   Ciudad_Cali  Ciudad_Medellín
0        False            False
1        False             True
2         True            False
3        False            False
4        False             True


# Label Encoding

Cada categoría recibe un número entero. Es útil para modelos que pueden interpretar relaciones ordinales (como árboles de decisión). Sin embargo, puede inducir sesgo si las categorías no tienen un orden natural.

In [13]:
# Ejemplo de Label Encoding
from sklearn.preprocessing import LabelEncoder

data = {'Ciudad': ['Bogotá', 'Medellín', 'Cali', 'Bogotá']}
df = pd.DataFrame(data)

# Label Encoding
le = LabelEncoder()
df['Ciudad_encoded'] = le.fit_transform(df['Ciudad'])
print(df)


     Ciudad  Ciudad_encoded
0    Bogotá               0
1  Medellín               2
2      Cali               1
3    Bogotá               0


# Ordinal Encoding

Asigna valores enteros a las categorías según un orden específico (por ejemplo, bajo, medio, alto). Si el orden es significativo, este método es preferible.

In [14]:
from sklearn.preprocessing import OrdinalEncoder

data = {'Nivel': ['bajo', 'alto', 'medio', 'alto']}
df = pd.DataFrame(data)

# Definimos el orden manualmente
encoder = OrdinalEncoder(categories=[['bajo', 'medio', 'alto']])
df['Nivel_encoded'] = encoder.fit_transform(df[['Nivel']])
print(df)


   Nivel  Nivel_encoded
0   bajo            0.0
1   alto            2.0
2  medio            1.0
3   alto            2.0


# Target Encoding

Reemplaza cada categoría con la media de la variable objetivo asociada con esa categoría. Es útil para reducir la dimensionalidad en casos con muchas categorías. Sin embargo, puede causar overfitting si se usa sin validación adecuada.

In [15]:
import pandas as pd

data = {'Ciudad': ['Bogotá', 'Medellín', 'Cali', 'Bogotá'],
        'Ventas': [100, 200, 150, 90]}
df = pd.DataFrame(data)

# Calcular la media de ventas por ciudad
target_mean = df.groupby('Ciudad')['Ventas'].mean()

# Reemplazar cada ciudad por la media correspondiente
df['Ciudad_encoded'] = df['Ciudad'].map(target_mean)
print(df)


     Ciudad  Ventas  Ciudad_encoded
0    Bogotá     100            95.0
1  Medellín     200           200.0
2      Cali     150           150.0
3    Bogotá      90            95.0


# Binary Encoding

Convierte las categorías en códigos binarios. Es útil para manejar muchas categorías sin crear demasiadas columnas (reduce la dimensionalidad comparado con One-Hot Encoding).

In [16]:
!pip install category_encoders

import pandas as pd
import category_encoders as ce

data = {'Ciudad': ['Bogotá', 'Medellín', 'Cali', 'Bogotá']}
df = pd.DataFrame(data)

# Binary Encoding
encoder = ce.BinaryEncoder(cols=['Ciudad'])
df_encoded = encoder.fit_transform(df)
print(df_encoded)


   Ciudad_0  Ciudad_1
0         0         1
1         1         0
2         1         1
3         0         1


¿Qué método utilizar?

- One-Hot Encoding: Si las categorías no tienen un orden y la dimensionalidad no es un problema.

- Label Encoding: Para algoritmos como árboles de decisión o si hay un orden subyacente.

- Ordinal Encoding: Si las categorías tienen un orden lógico.

- Target Encoding: Útil para reducir dimensionalidad en problemas supervisados, pero requiere validación cuidadosa.

- Binary Encoding: Para reducir dimensionalidad con muchas categorías.

# Proceso de Codificación

Para elegir la codificación adecuada para las columnas artist(s)_name, key, y mode del conjunto de datos de Spotify, veamos el tipo de cada una:

- artist(s)_name: Es una variable categórica nominal (sin orden específico).
- key: Representa el tono de la canción (esencialmente un valor categórico ordinal, ya que los tonos pueden tener cierta relación entre sí).
- mode: Indica si la canción está en modo mayor o menor, lo que es una variable categórica binaria (solo tiene dos categorías: Minor o Major).

Recomendación de Codificaciones
- artist(s)_name → Target Encoding o Binary Encoding (si hay demasiados artistas, estos métodos evitan una alta dimensionalidad).
- key → Ordinal Encoding (porque hay una relación implícita entre los valores de tono).
- mode → Label Encoding (ya que solo tiene dos valores: 0 o 1, indicando modo menor/mayor).

In [17]:
import pandas as pd
from sklearn.preprocessing import OrdinalEncoder, LabelEncoder
import category_encoders as ce  # BinaryEncoder y TargetEncoder

data = {
    'artist(s)_name': ['Adele', 'Drake', 'Taylor Swift', 'Adele'],
    'key': ['C', 'C#', 'E', 'G'],
    'mode': ['Major', 'Minor', 'Major', 'Minor']
}

spotify_df = pd.DataFrame(data)

# 1. Binary Encoding para 'artist(s)_name'
binary_encoder = ce.BinaryEncoder(cols=['artist(s)_name'])
spotify_df_encoded = binary_encoder.fit_transform(spotify_df)

# 2. Ordinal Encoding para 'key'
ordinal_encoder = OrdinalEncoder()
spotify_df_encoded['key_encoded'] = ordinal_encoder.fit_transform(spotify_df[['key']])

# 3. Label Encoding para 'mode'
label_encoder = LabelEncoder()
spotify_df_encoded['mode_encoded'] = label_encoder.fit_transform(spotify_df['mode'])

# Mostrar el DataFrame final con las codificaciones
spotify_df_encoded


Unnamed: 0,artist(s)_name_0,artist(s)_name_1,key,mode,key_encoded,mode_encoded
0,0,1,C,Major,0.0,0
1,1,0,C#,Minor,1.0,1
2,1,1,E,Major,2.0,0
3,0,1,G,Minor,3.0,1


- artist(s)_name:
Se utiliza Binary Encoding para evitar la explosión de columnas al tener varios artistas.

- key:
Ordinal Encoding se aplica porque hay un orden natural entre los tonos. Definimos explícitamente ese orden para que la codificación sea consistente.

- mode: Label Encoding convierte 'Major' a 1 y 'Minor' a 0. Esta opción es adecuada si solo necesitamos una columna para representar el modo.
One-Hot Encoding crea dos columnas (mode_Major y mode_Minor), que es útil si quieres representar cada categoría de manera explícita.


In [26]:
import pandas as pd
from sklearn.preprocessing import OrdinalEncoder, OneHotEncoder, LabelEncoder
import category_encoders as ce  # Para BinaryEncoder y otros métodos

# Datos de ejemplo
data = {
    'artist(s)_name': ['Adele', 'Drake', 'Taylor Swift', 'Adele'],
    'key': ['C', 'C#', 'E', 'G'],
    'mode': ['Major', 'Minor', 'Major', 'Minor']
}

spotify_df = pd.DataFrame(data)

# 1. Binary Encoding para 'artist(s)_name'
binary_encoder = ce.BinaryEncoder(cols=['artist(s)_name'])
spotify_df_encoded = binary_encoder.fit_transform(spotify_df)

# 2. Ordinal Encoding para 'key'
key_order = [['C', 'C#', 'D', 'D#', 'E', 'F', 'F#', 'G', 'G#', 'A', 'A#', 'B']]
ordinal_encoder = OrdinalEncoder(categories=key_order)
spotify_df_encoded['key_encoded'] = ordinal_encoder.fit_transform(spotify_df[['key']])

# 3. Label Encoding para 'mode'
label_encoder = LabelEncoder()
spotify_df_encoded['mode_encoded'] = label_encoder.fit_transform(spotify_df['mode'])

# Alternativa: One-Hot Encoding para 'mode'
onehot_encoder = OneHotEncoder(sparse_output=False)  # Ajuste aquí
mode_encoded = onehot_encoder.fit_transform(spotify_df[['mode']])
mode_df = pd.DataFrame(mode_encoded, columns=onehot_encoder.get_feature_names_out(['mode']))

# Combinar con el DataFrame codificado
spotify_df_encoded = pd.concat([spotify_df_encoded, mode_df], axis=1)

# Mostrar el DataFrame final
spotify_df_encoded


Unnamed: 0,artist(s)_name_0,artist(s)_name_1,key,mode,key_encoded,mode_encoded,mode_Major,mode_Minor
0,0,1,C,Major,0.0,0,1.0,0.0
1,1,0,C#,Minor,1.0,1,0.0,1.0
2,1,1,E,Major,4.0,0,1.0,0.0
3,0,1,G,Minor,7.0,1,0.0,1.0


Conclusión

- Label Encoding es más compacto pero adecuado solo si las categorías son binarias.

- One-Hot Encoding es más interpretativo y útil si hay más de dos categorías.

Elige el método de codificación que mejor se ajuste a las necesidades de tu modelo

# Aplicar a Base de datos

In [27]:
# @title Cargar el archivo CSV de canciones de Spotify
file_path = 'Spotify_Most_Streamed_Songs.csv'
spotify_df = pd.read_csv(file_path)

# Mostrar las primeras filas del archivo para ver cómo están organizados los datos
print("Primeras 5 filas de los datos de Spotify:")
spotify_df.head()


Primeras 5 filas de los datos de Spotify:


Unnamed: 0,track_name,artist(s)_name,artist_count,released_year,released_month,released_day,in_spotify_playlists,in_spotify_charts,streams,in_apple_playlists,...,key,mode,danceability_%,valence_%,energy_%,acousticness_%,instrumentalness_%,liveness_%,speechiness_%,cover_url
0,Seven (feat. Latto) (Explicit Ver.),"Latto, Jung Kook",2,2023,7,14,553,147,141381703,43,...,B,Major,80,89,83,31,0,8,4,Not Found
1,LALA,Myke Towers,1,2023,3,23,1474,48,133716286,48,...,C#,Major,71,61,74,7,0,10,4,https://i.scdn.co/image/ab67616d0000b2730656d5...
2,vampire,Olivia Rodrigo,1,2023,6,30,1397,113,140003974,94,...,F,Major,51,32,53,17,0,31,6,https://i.scdn.co/image/ab67616d0000b273e85259...
3,Cruel Summer,Taylor Swift,1,2019,8,23,7858,100,800840817,116,...,A,Major,55,58,72,11,0,11,15,https://i.scdn.co/image/ab67616d0000b273e787cf...
4,WHERE SHE GOES,Bad Bunny,1,2023,5,18,3133,50,303236322,84,...,A,Minor,65,23,80,14,63,11,6,https://i.scdn.co/image/ab67616d0000b273ab5c9c...


In [28]:
spotify_df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 953 entries, 0 to 952
Data columns (total 25 columns):
 #   Column                Non-Null Count  Dtype 
---  ------                --------------  ----- 
 0   track_name            953 non-null    object
 1   artist(s)_name        953 non-null    object
 2   artist_count          953 non-null    int64 
 3   released_year         953 non-null    int64 
 4   released_month        953 non-null    int64 
 5   released_day          953 non-null    int64 
 6   in_spotify_playlists  953 non-null    int64 
 7   in_spotify_charts     953 non-null    int64 
 8   streams               953 non-null    object
 9   in_apple_playlists    953 non-null    int64 
 10  in_apple_charts       953 non-null    int64 
 11  in_deezer_playlists   953 non-null    object
 12  in_deezer_charts      953 non-null    int64 
 13  in_shazam_charts      903 non-null    object
 14  bpm                   953 non-null    int64 
 15  key                   858 non-null    ob

In [29]:
# Verificar las columnas de tipo objeto (categóricas)
object_columns = spotify_df.select_dtypes(include=['object']).columns

print("Columnas de tipo objeto (categóricas):")
print(object_columns)

Columnas de tipo objeto (categóricas):
Index(['track_name', 'artist(s)_name', 'streams', 'in_deezer_playlists',
       'in_shazam_charts', 'key', 'mode', 'cover_url'],
      dtype='object')


In [33]:
spotify_df.track_name.nunique()

943

In [32]:
spotify_df[object_columns]#.isna().sum()

Unnamed: 0,track_name,artist(s)_name,streams,in_deezer_playlists,in_shazam_charts,key,mode,cover_url
0,Seven (feat. Latto) (Explicit Ver.),"Latto, Jung Kook",141381703,45,826,B,Major,Not Found
1,LALA,Myke Towers,133716286,58,382,C#,Major,https://i.scdn.co/image/ab67616d0000b2730656d5...
2,vampire,Olivia Rodrigo,140003974,91,949,F,Major,https://i.scdn.co/image/ab67616d0000b273e85259...
3,Cruel Summer,Taylor Swift,800840817,125,548,A,Major,https://i.scdn.co/image/ab67616d0000b273e787cf...
4,WHERE SHE GOES,Bad Bunny,303236322,87,425,A,Minor,https://i.scdn.co/image/ab67616d0000b273ab5c9c...
...,...,...,...,...,...,...,...,...
948,My Mind & Me,Selena Gomez,91473363,37,0,A,Major,https://i.scdn.co/image/ab67616d0000b2730f5397...
949,Bigger Than The Whole Sky,Taylor Swift,121871870,8,0,F#,Major,https://i.scdn.co/image/ab67616d0000b273e0b60c...
950,A Veces (feat. Feid),"Feid, Paulo Londra",73513683,7,0,C#,Major,Not Found
951,En La De Ella,"Feid, Sech, Jhayco",133895612,17,0,C#,Major,Not Found


In [34]:
object_columns = ['artist(s)_name', 'key', 'mode']

In [35]:
spotify_df[object_columns].info() # verificar completitud de la base de datos

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 953 entries, 0 to 952
Data columns (total 3 columns):
 #   Column          Non-Null Count  Dtype 
---  ------          --------------  ----- 
 0   artist(s)_name  953 non-null    object
 1   key             858 non-null    object
 2   mode            953 non-null    object
dtypes: object(3)
memory usage: 22.5+ KB


In [36]:
spotify_df.dropna(inplace=True) # eliminar campos vacios de toda la base de datos y quedarse con los registros completos

In [37]:
spotify_df[object_columns].info() # verificar completitud luego de la limpieza

<class 'pandas.core.frame.DataFrame'>
Index: 817 entries, 0 to 952
Data columns (total 3 columns):
 #   Column          Non-Null Count  Dtype 
---  ------          --------------  ----- 
 0   artist(s)_name  817 non-null    object
 1   key             817 non-null    object
 2   mode            817 non-null    object
dtypes: object(3)
memory usage: 25.5+ KB


In [38]:
import pandas as pd
from sklearn.preprocessing import OrdinalEncoder, OneHotEncoder, LabelEncoder
import category_encoders as ce  # Para BinaryEncoder y otros métodos

# 1. Binary Encoding para 'artist(s)_name'
binary_encoder = ce.BinaryEncoder(cols=['artist(s)_name'])
spotify_df_encoded = binary_encoder.fit_transform(spotify_df)

# 2. Ordinal Encoding para 'key'
key_order = [['C', 'C#', 'D', 'D#', 'E', 'F', 'F#', 'G', 'G#', 'A', 'A#', 'B']]
ordinal_encoder = OrdinalEncoder(categories=key_order)
spotify_df_encoded['key_encoded'] = ordinal_encoder.fit_transform(spotify_df[['key']])

# 3. Label Encoding para 'mode'
label_encoder = LabelEncoder()
spotify_df_encoded['mode_encoded'] = label_encoder.fit_transform(spotify_df['mode'])

# Alternativa: One-Hot Encoding para 'mode'
onehot_encoder = OneHotEncoder(sparse_output=False)  # Ajuste aquí
mode_encoded = onehot_encoder.fit_transform(spotify_df[['mode']])
mode_df = pd.DataFrame(mode_encoded, columns=onehot_encoder.get_feature_names_out(['mode']))

# Combinar con el DataFrame codificado
spotify_df_encoded = pd.concat([spotify_df_encoded, mode_df], axis=1)

# Mostrar el DataFrame final
spotify_df_encoded.head()


Unnamed: 0,track_name,artist(s)_name_0,artist(s)_name_1,artist(s)_name_2,artist(s)_name_3,artist(s)_name_4,artist(s)_name_5,artist(s)_name_6,artist(s)_name_7,artist(s)_name_8,...,energy_%,acousticness_%,instrumentalness_%,liveness_%,speechiness_%,cover_url,key_encoded,mode_encoded,mode_Major,mode_Minor
0,Seven (feat. Latto) (Explicit Ver.),0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,...,83.0,31.0,0.0,8.0,4.0,Not Found,11.0,0.0,1.0,0.0
1,LALA,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,...,74.0,7.0,0.0,10.0,4.0,https://i.scdn.co/image/ab67616d0000b2730656d5...,1.0,0.0,1.0,0.0
2,vampire,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,...,53.0,17.0,0.0,31.0,6.0,https://i.scdn.co/image/ab67616d0000b273e85259...,5.0,0.0,1.0,0.0
3,Cruel Summer,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,...,72.0,11.0,0.0,11.0,15.0,https://i.scdn.co/image/ab67616d0000b273e787cf...,9.0,0.0,1.0,0.0
4,WHERE SHE GOES,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,...,80.0,14.0,63.0,11.0,6.0,https://i.scdn.co/image/ab67616d0000b273ab5c9c...,9.0,1.0,0.0,1.0
