# Primera parte
---
El siguiente archivo fue extraído de la API de Spotify **taylor_swift_spotify.json** y usted deberá crear un script en Python que lo procese y lo deje con el siguiente formato **dataset.csv** . Para esta primera parte de la prueba solo podrá usar Python y las librerías
Pandas y JSON.

Entregable: Archivo de Python con la solución del problema.

# Solución
Para solucionar este problema se hace uso de las librerias pandas y json. Por lo cual es necesario asegurarse de tenerlas instaladas en el entorno de trabajo, para esto se puede usar el siguiente comando en la terminal:
```
pip install pandas
pip install json
```
O bien podra instalar todas las librerias necesarias para este proyecto usando el siguiente comando:
```
pip install -r requirements.txt
```
Una vez instaladas las librerias, las importamos para hacer uso de ellas en el script:


In [2]:
#Import libraries
import pandas as pd
import json

Una vez importadas las librerias se hace uso de json para leer el archivo **taylor_swift_spotify.json**

In [3]:
#OPEN JSON FILE and save it in a variable named data
with open('./data/taylor_swift_spotify.json') as file:
    data=json.load(file)
type(data) #check the type of data as we expect it to be a python dictionary in consequence we can use the keys() method to see the keys of the dictionary
data.keys()

dict_keys(['artist_id', 'artist_name', 'artist_popularity', 'albums'])

Ahora se hace uso del metodo **json_normalize** para normalizar el archivo json y convertirlo en un dataframe de pandas, el cual se guarda en la variable **df**., recordando que el archivo json tiene una estructura de diccionario con listas anidadas, por lo cual se hace uso del parametro **record_path** para indicarle a la funcion que debe normalizar las listas anidadas y en el parametro **meta** se indica que debe normalizar el diccionario que se encuentra en la raiz del archivo json.

In [4]:
df=pd.json_normalize(data, record_path=['albums',['tracks']], meta=['artist_id','artist_name','artist_popularity',['albums','album_id'],['albums','album_name'],['albums','album_release_date'],['albums','album_total_tracks']])
df

Unnamed: 0,disc_number,duration_ms,explicit,track_number,track_popularity,track_id,track_name,audio_features.danceability,audio_features.energy,audio_features.key,...,audio_features.tempo,audio_features.id,audio_features.time_signature,artist_id,artist_name,artist_popularity,albums.album_id,albums.album_name,albums.album_release_date,albums.album_total_tracks
0,1,212600,False,1,77,4WUepByoeqcedHoYhSNHRt,Welcome To New York (Taylor's Version),0.757,0.610,7.0,...,116.998,4WUepByoeqcedHoYhSNHRt,4.0,06HL4z0CvFAxyc27GX,Taylor Swift,120,1o59UpKw81iHR0HPiSkJR0,1989 (Taylor's Version) [Deluxe],2023-10-27,22
1,1,231833,False,2,78,0108kcWLnn2HlH2kedi1gn,Blank Space (Taylor's Version),0.733,0.733,0.0,...,96.057,0108kcWLnn2HlH2kedi1gn,4.0,06HL4z0CvFAxyc27GX,Taylor Swift,120,1o59UpKw81iHR0HPiSkJR0,1989 (Taylor's Version) [Deluxe],2023-10-27,22
2,1,231000,False,3,79,3Vpk1hfMAQme8VJ0SNRSkd,Style (Taylor's Version),0.511,0.822,11.0,...,94.868,3Vpk1hfMAQme8VJ0SNRSkd,4.0,06HL4z0CvFAxyc27GX,Taylor Swift,120,1o59UpKw81iHR0HPiSkJR0,1989 (Taylor's Version) [Deluxe],2023-10-27,22
3,1,235800,False,4,78,1OcSfkeCg9hRC2sFKB4IMJ,Out Of The Woods (Taylor's Version),0.545,0.885,0.0,...,92.021,1OcSfkeCg9hRC2sFKB4IMJ,4.0,06HL4z0CvFAxyc27GX,Taylor Swift,120,1o59UpKw81iHR0HPiSkJR0,1989 (Taylor's Version) [Deluxe],2023-10-27,22
4,1,193289,False,5,77,2k0ZEeAqzvYMcx9Qt5aClQ,All You Had To Do Was Stay (Taylor's Version),0.588,0.721,0.0,...,96.997,2k0ZEeAqzvYMcx9Qt5aClQ,4.0,06HL4z0CvFAxyc27GX,Taylor Swift,120,1o59UpKw81iHR0HPiSkJR0,1989 (Taylor's Version) [Deluxe],2023-10-27,22
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
534,1,201106,False,11,70,1j6gmK6u4WNI33lMZ8dC1s,Our Song,0.668,0.672,2.0,...,89.011,1j6gmK6u4WNI33lMZ8dC1s,4.0,06HL4z0CvFAxyc27GX,Taylor Swift,120,5eyZZoQEFQWRHkV2xgAeBw,Taylor Swift,1989-10-24,Thirteen
535,1,213053,False,12,60,7CzxXgQXurKZCyHz9ufbo1,I'm Only Me When I'm With You,0.563,0.934,8.0,...,143.964,7CzxXgQXurKZCyHz9ufbo1,4.0,06HL4z0CvFAxyc27GX,Taylor Swift,120,5eyZZoQEFQWRHkV2xgAeBw,Taylor Swift,1989-10-24,Thirteen
536,1,203226,False,13,58,1k3PzDNjg38cWqOvL4M9vq,Invisible,0.612,0.394,7.0,...,96.001,1k3PzDNjg38cWqOvL4M9vq,4.0,06HL4z0CvFAxyc27GX,Taylor Swift,120,5eyZZoQEFQWRHkV2xgAeBw,Taylor Swift,1989-10-24,Thirteen
537,1,220146,False,14,58,0YgHuReCSPwTXYny7isLja,A Perfectly Good Heart,0.483,0.751,4.0,...,156.092,0YgHuReCSPwTXYny7isLja,4.0,06HL4z0CvFAxyc27GX,Taylor Swift,120,5eyZZoQEFQWRHkV2xgAeBw,Taylor Swift,1989-10-24,Thirteen


Por ultimo se guarda el dataframe en un archivo csv usando el metodo **to_csv** de pandas.

In [5]:
df.to_csv('./data/taylor_swift_spotify.csv', index=False) #save the dataframe as a csv file