# Introducción

Vamos a analizar un conjunto de datos de canciones y sus estadísticas por semanas: `listas_musica.csv`

Es un conjunto de datos que nos permite trabajar los conceptos de `pandas` y `numpy`.

El ejercicio será guiado aunque se permite no ver las soluciones para realizar las tareas.

Las columnas del `dataset` son:

* `date`:	Tipo `date` - Fecha de la lista.
* `rank`:	Tipo `int`	- Posición del ranking de la canción en esa fecha.
* `song`:	Tipo `str`	- Nombre de la canción.
* `artist`:	Tipo `str` - Artista.
* `last-week`:	Tipo `int` -	Posición en el ranking de la semana anterior.
* `peak-rank`: Tipo `int`	- La mejor posición de la canción en el ranking.
* `weeks-on-board`: Tipo `int` -	Número de semanas que la canción lleva en la lista.





# Carga de librerías

Cargue las librerías `numpy`, `pandas` y `os`.


### Solución

In [36]:
import numpy as np
import pandas as pd
import os 


# Carga del dataset

Lea el dataset y conviértalo en un `dataframe`.

Imprima el dataset una vez lo tenga.

### Solución

In [37]:
df = pd.read_csv('listas_musica.csv')  #Usamos la función df.read_cvs() para cargar el dataset y convertirlo en un DataFrame.
df

Unnamed: 0,date,rank,song,artist,last-week,peak-rank,weeks-on-board
0,2021-11-06,1,Easy On Me,Adele,1.0,1,3
1,2021-11-06,2,Stay,The Kid LAROI & Justin Bieber,2.0,1,16
2,2021-11-06,3,Industry Baby,Lil Nas X & Jack Harlow,3.0,1,14
3,2021-11-06,4,Fancy Like,Walker Hayes,4.0,3,19
4,2021-11-06,5,Bad Habits,Ed Sheeran,5.0,2,18
...,...,...,...,...,...,...,...
330082,1958-08-04,96,Over And Over,Thurston Harris,,96,1
330083,1958-08-04,97,I Believe In You,Robert & Johnny,,97,1
330084,1958-08-04,98,Little Serenade,The Ames Brothers,,98,1
330085,1958-08-04,99,I'll Get By (As Long As I Have You),Billy Williams,,99,1


# Limpieza de datos

Rellene con `0` usando `fillna()`.

### Solución

In [38]:
df.fillna(0, inplace=True)  #Utilizamos la función fillna() para rellenar usando 0, y realizamos un implace=True para que realice los cambios directamente sobre el DataFrame.
df


Unnamed: 0,date,rank,song,artist,last-week,peak-rank,weeks-on-board
0,2021-11-06,1,Easy On Me,Adele,1.0,1,3
1,2021-11-06,2,Stay,The Kid LAROI & Justin Bieber,2.0,1,16
2,2021-11-06,3,Industry Baby,Lil Nas X & Jack Harlow,3.0,1,14
3,2021-11-06,4,Fancy Like,Walker Hayes,4.0,3,19
4,2021-11-06,5,Bad Habits,Ed Sheeran,5.0,2,18
...,...,...,...,...,...,...,...
330082,1958-08-04,96,Over And Over,Thurston Harris,0.0,96,1
330083,1958-08-04,97,I Believe In You,Robert & Johnny,0.0,97,1
330084,1958-08-04,98,Little Serenade,The Ames Brothers,0.0,98,1
330085,1958-08-04,99,I'll Get By (As Long As I Have You),Billy Williams,0.0,99,1


# Imprima algunos valores de ejemplos

Use `tail()` para imprimir algunos valores.

Fíjese en las columnas del dataset.

### Solución

In [39]:
df.columns  #Realizamos un df.columns para observar las columnas del Dataset.

Index(['date', 'rank', 'song', 'artist', 'last-week', 'peak-rank',
       'weeks-on-board'],
      dtype='object')

In [40]:
df.tail(3)  #Utilzamos tail() para imprimir algunos valores del Dataset, en este caso 3 últimas filas.

Unnamed: 0,date,rank,song,artist,last-week,peak-rank,weeks-on-board
330084,1958-08-04,98,Little Serenade,The Ames Brothers,0.0,98,1
330085,1958-08-04,99,I'll Get By (As Long As I Have You),Billy Williams,0.0,99,1
330086,1958-08-04,100,Judy,Frankie Vaughan,0.0,100,1


# Calcule los top 30 artistas

Puede usar la función `value_counts()` y `head(...)`.

Fíjese en usar la columna correspondiente.

### Solución

In [41]:
top30_artistas = df['artist'].value_counts().head(30)   #Hacemos un value_counts() para ver cuantas veces se repite el nombre de los artistas, y un .head(30) para seleccionar los 30 primeros.
top30_artistas

artist
Taylor Swift             1023
Elton John                889
Madonna                   857
Drake                     787
Kenny Chesney             769
Tim McGraw                731
Keith Urban               673
Stevie Wonder             659
Rod Stewart               657
Mariah Carey              621
Michael Jackson           611
Chicago                   607
Rascal Flatts             604
Billy Joel                588
The Rolling Stones        585
The Beatles               585
Jason Aldean              572
Aretha Franklin           569
Rihanna                   566
P!nk                      564
Whitney Houston           561
Brad Paisley              559
Neil Diamond              553
George Strait             553
Luke Bryan                543
Carrie Underwood          541
Daryl Hall John Oates     540
The Beach Boys            531
Toby Keith                526
Bee Gees                  516
Name: count, dtype: int64

# Muestre el top 15 de canciones junto con su cantante

### Solución

In [42]:
topcanciones_cantantes = df[['song', 'artist']].value_counts().head(15)  #Seleccionamos la tabla 'song' y la tabla 'artist', para hacer un .value_counts() y un .head(15) 
topcanciones_cantantes                                                   #para mostrar el top 15 de caciones y sus respectivos cantantes.

song                                 artist                                   
Blinding Lights                      The Weeknd                                   90
Radioactive                          Imagine Dragons                              87
Sail                                 AWOLNATION                                   79
I'm Yours                            Jason Mraz                                   76
How Do I Live                        LeAnn Rimes                                  69
Counting Stars                       OneRepublic                                  68
Party Rock Anthem                    LMFAO Featuring Lauren Bennett & GoonRock    68
Rolling In The Deep                  Adele                                        65
Foolish Games/You Were Meant For Me  Jewel                                        65
Before He Cheats                     Carrie Underwood                             64
You And Me                           Lifehouse                         

# Muestre el top 10 de los artistas, canciones y su mejor posición

### Solución

In [43]:
top10artistas_bestranking = df[['artist', 'song', 'peak-rank']].value_counts().head(10)     #Le añadimos la variable 'Peak-rank' para saber su mejor ranking.
top10artistas_bestranking

artist                                     song                     peak-rank
The Weeknd                                 Blinding Lights          1            74
Ed Sheeran                                 Shape Of You             1            58
Jason Mraz                                 I'm Yours                6            56
LMFAO Featuring Lauren Bennett & GoonRock  Party Rock Anthem        1            54
The Black Eyed Peas                        I Gotta Feeling          1            54
Justin Timberlake                          Can't Stop The Feeling!  1            52
Taylor Swift                               Shake It Off             1            50
The Chainsmokers Featuring Halsey          Closer                   1            50
Post Malone                                Circles                  1            50
Mark Ronson Featuring Bruno Mars           Uptown Funk!             1            49
Name: count, dtype: int64

# Artistas más reproducidos por semanas

Transforme la columna `date` en `datetime`.

Use  `set_index` para crear un índice en la columna `date`.

Imprima el dataframe con el nuevo índice.

### Solución

In [44]:
df['date'] = pd.to_datetime(df['date'], format='%Y-%m-%d')        #Transformamos la columna Date en formato Datetime.
print(df.head(10))

        date  rank           song                               artist  \
0 2021-11-06     1     Easy On Me                                Adele   
1 2021-11-06     2           Stay        The Kid LAROI & Justin Bieber   
2 2021-11-06     3  Industry Baby              Lil Nas X & Jack Harlow   
3 2021-11-06     4     Fancy Like                         Walker Hayes   
4 2021-11-06     5     Bad Habits                           Ed Sheeran   
5 2021-11-06     6     Way 2 Sexy  Drake Featuring Future & Young Thug   
6 2021-11-06     7        Shivers                           Ed Sheeran   
7 2021-11-06     8       Good 4 U                       Olivia Rodrigo   
8 2021-11-06     9   Need To Know                             Doja Cat   
9 2021-11-06    10     Levitating                             Dua Lipa   

   last-week  peak-rank  weeks-on-board  
0        1.0          1               3  
1        2.0          1              16  
2        3.0          1              14  
3        4.0     

In [45]:
df.set_index('date', inplace=True)    #Usando .set_idex, establecemos la columna 'date' como índice del DataFrame. 
print(df.head(10))                    #Imprimimos el DataFrame con su nuevo índice.

            rank           song                               artist  \
date                                                                   
2021-11-06     1     Easy On Me                                Adele   
2021-11-06     2           Stay        The Kid LAROI & Justin Bieber   
2021-11-06     3  Industry Baby              Lil Nas X & Jack Harlow   
2021-11-06     4     Fancy Like                         Walker Hayes   
2021-11-06     5     Bad Habits                           Ed Sheeran   
2021-11-06     6     Way 2 Sexy  Drake Featuring Future & Young Thug   
2021-11-06     7        Shivers                           Ed Sheeran   
2021-11-06     8       Good 4 U                       Olivia Rodrigo   
2021-11-06     9   Need To Know                             Doja Cat   
2021-11-06    10     Levitating                             Dua Lipa   

            last-week  peak-rank  weeks-on-board  
date                                              
2021-11-06        1.0          1 

# Encuentre los más y menos escuchados según un intervalo de tiempo

Puede usar `resample(frecuencia)[columna]`. 

Las frecuencias que puede usar son:
* H - Horaria
* D - Diaria
* W - Semanal
* M - Mensual
* A - Anual

Puede usar `.agg([columnas])` para agregar los datos

### Solución

In [46]:
resample = df.resample('W').agg({        #Usamos resample para que encuentre los mas y menos escuchados, en frecuencia semanal.
    'rank':['min', 'max'],
    'song':'first',
    'artist':'first'
})
resample

Unnamed: 0_level_0,rank,rank,song,artist
Unnamed: 0_level_1,min,max,first,first
date,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2
1958-08-10,1,100,Poor Little Fool,Ricky Nelson
1958-08-17,1,100,Poor Little Fool,Ricky Nelson
1958-08-24,1,100,Nel Blu Dipinto Di Blu (Volaré),Domenico Modugno
1958-08-31,1,100,Little Star,The Elegants
1958-09-07,1,100,Nel Blu Dipinto Di Blu (Volaré),Domenico Modugno
...,...,...,...,...
2021-10-10,1,100,My Universe,Coldplay x BTS
2021-10-17,1,100,Stay,The Kid LAROI & Justin Bieber
2021-10-24,1,100,Industry Baby,Lil Nas X & Jack Harlow
2021-10-31,1,100,Easy On Me,Adele
