# Data Set Spotify
* Archivo en -> [Spotify 2010 - 2019 Top 100.csv](https://www.kaggle.com/datasets/muhmores/spotify-top-100-songs-of-20152019)

1. Se quiere reemplazar los nombres de los géneros a title case exceptuando las palabras con iniciales.
2. Se utilizarán como datos de las tarjetas “Top Genre”, “Year Released”, “BPM”, “Top Year” y “Artist Type”. Como dato a adivinar se utilizará “Artist”. 
3. El archivo resultante tiene las columnas “Top Genre”, “Artist Type”, “Year Released”, “Top Year”, “BPM” y “Artist” en este orden.
___

* Imports necesarios para resolver el problema.

In [2]:
import os
import csv

* Para cambiar los nombres de los géneros creo una función que contenga las palabras con iniciales que se quiere poner en mayúsculas y el resto de géneros se pasan a title case.

In [3]:
def title_case(genero):
    """
    Función para cambiar los géneros de las canciones.
    :param genero: el género de la canción en string.
    :return: el género con title_case.
    """
    mayusculas = ['edm', 'dfw', 'uk', 'r&b', 'lgbtq+']
    titulo = map(lambda x: x.upper() if x in mayusculas else x.title(), genero.split(' '))
    return titulo

* Además, necesitamos cambiar el orden de las columnas del csv y quitando algunas, para eso recorremos el csv con la funciónrecorrer_procesando, que recibe el iterador del csv. Primero llama a la función title_case para cambiar los géneros y luego ordena las columnas y lo almacena en la variable a retornar datos_filt.

In [4]:
def recorrer_procesando(datos):
    """
    Función para recorrer el archivo csv de spotify.
    :param datos: los datos del csv reader.
    :return: la lista con los datos filtrados y con las columnas ordenadas.
    """
    datos_filt = []
    for linea in datos:
        # cambiar en nombre de genero a title_case
        linea[2] = title_case(linea[2])
        linea[2] = ' '.join(linea[2])
        # ordenar las columnas
        datos_filt.append([linea[2], linea[16], linea[3], linea[15], linea[5], linea[1]])
    return datos_filt

* Rutas de los archivos.

In [5]:
ruta_carpeta = os.path.join(os.getcwd(), '..')

# ruta del archivo csv con los datos de spotify
nombre_archivo = "Spotify 2010 - 2019 Top 100.csv"
ruta_completa = os.path.join(ruta_carpeta, 'csv_originales', nombre_archivo)

# ruta del nuevo archivo csv con los datos filtrados
nombre_nuevo = "dataset_spotify.csv"
nuevo_arch = os.path.join(ruta_carpeta, nombre_nuevo)

* Abrir el archivo a procesar en un try except verificando que se encontró el archivo, si no avisa del error.

In [6]:
try:
    with open(ruta_completa, 'r', encoding='utf-8') as spotify:
        csv_reader = csv.reader(spotify, delimiter=',')
        header_csv, datos_csv = next(csv_reader), list(csv_reader)
        datos_filtrados = recorrer_procesando(datos_csv)

    with open(nuevo_arch, 'w', encoding='utf-8', newline='') as columnas:
        csv_writer = csv.writer(columnas)
        csv_writer.writerow(['top genre', 'artist type', 'year released', 'top year', 'bpm', 'artist'])
        for linea in datos_filtrados:
            csv_writer.writerow(linea)
except FileNotFoundError:
    print('No se encontró el archivo "Spotify 2010 - 2019 Top 100.csv"')