# Introducción

Vamos a analizar un conjunto de datos de canciones y sus estadísticas por semanas: `listas_musica.csv`

Es un conjunto de datos que nos permite trabajar los conceptos de `pandas` y `numpy`.

El ejercicio será guiado aunque se permite no ver las soluciones para realizar las tareas.

Las columnas del `dataset` son:

* `date`:	Tipo `date` - Fecha de la lista.
* `rank`:	Tipo `int`	- Posición del ranking de la canción en esa fecha.
* `song`:	Tipo `str`	- Nombre de la canción.
* `artist`:	Tipo `str` - Artista.
* `last-week`:	Tipo `int` -	Posición en el ranking de la semana anterior.
* `peak-rank`: Tipo `int`	- La mejor posición de la canción en el ranking.
* `weeks-on-board`: Tipo `int` -	Número de semanas que la canción lleva en la lista.





# Carga de librerías

Cargue las librerías `numpy`, `pandas` y `os`.


### Solución

In [17]:
import numpy as np
import pandas as pd
import os

# Carga del dataset

Lea el dataset y conviértalo en un `dataframe`.

Imprima el dataset una vez lo tenga.

### Solución

In [18]:
music=pd.read_csv(r"E:\COPIA_DAWN\DAWN\CURSOSYLIBROS\Data\Upgrade Hub Data Analytics Bootcamp\Tareas\Module1_0_SoftSkillsProyecto\datos\listas_musica.csv")
music.head()

Unnamed: 0,date,rank,song,artist,last-week,peak-rank,weeks-on-board
0,2021-11-06,1,Easy On Me,Adele,1.0,1,3
1,2021-11-06,2,Stay,The Kid LAROI & Justin Bieber,2.0,1,16
2,2021-11-06,3,Industry Baby,Lil Nas X & Jack Harlow,3.0,1,14
3,2021-11-06,4,Fancy Like,Walker Hayes,4.0,3,19
4,2021-11-06,5,Bad Habits,Ed Sheeran,5.0,2,18


# Limpieza de datos

Rellene con `0` usando `fillna()`.

### Solución

In [19]:
music.isnull().sum()

date                  0
rank                  0
song                  0
artist                0
last-week         32312
peak-rank             0
weeks-on-board        0
dtype: int64

In [20]:
music=music.fillna(0)

In [21]:
music.isnull().sum()

date              0
rank              0
song              0
artist            0
last-week         0
peak-rank         0
weeks-on-board    0
dtype: int64

# Imprima algunos valores de ejemplos

Use `tail()` para imprimir algunos valores.

Fíjese en las columnas del dataset.

### Solución

In [22]:
music.tail()

Unnamed: 0,date,rank,song,artist,last-week,peak-rank,weeks-on-board
330082,1958-08-04,96,Over And Over,Thurston Harris,0.0,96,1
330083,1958-08-04,97,I Believe In You,Robert & Johnny,0.0,97,1
330084,1958-08-04,98,Little Serenade,The Ames Brothers,0.0,98,1
330085,1958-08-04,99,I'll Get By (As Long As I Have You),Billy Williams,0.0,99,1
330086,1958-08-04,100,Judy,Frankie Vaughan,0.0,100,1


# Calcule los top 30 artistas

Puede usar la función `value_counts()` y `head(...)`.

Fíjese en usar la columna correspondiente.

### Solución

In [23]:
top30=pd.DataFrame(music['artist'].value_counts(ascending=False)[:30]).reset_index()
top30.head()

Unnamed: 0,artist,count
0,Taylor Swift,1023
1,Elton John,889
2,Madonna,857
3,Drake,787
4,Kenny Chesney,769


# Muestre el top 15 de canciones junto con su cantante

### Solución

In [24]:
top15_songs=pd.DataFrame(music.groupby('song')['artist'].value_counts(ascending=False)[:15]).reset_index()
top15_songs.head()

Unnamed: 0,song,artist,count
0,"""B"" Girls",Young And Restless,15
1,"""Cherry Cherry"" from Hot August Night",Neil Diamond,10
2,"""Having A Party"" Medley",The Ovations (Featuring Louis Williams),9
3,"""Joy"" Pt. I",Isaac Hayes,9
4,"""Roots"" Medley",Quincy Jones,7


# Muestre el top 10 de los artistas, canciones y su mejor posición

### Solución

In [25]:
top10=pd.DataFrame(music.groupby('peak-rank')[['artist','song']].value_counts(ascending=False)[:10]).reset_index()
top10=top10[['artist','song','peak-rank','count']]
top10

Unnamed: 0,artist,song,peak-rank,count
0,The Weeknd,Blinding Lights,1,74
1,Ed Sheeran,Shape Of You,1,58
2,LMFAO Featuring Lauren Bennett & GoonRock,Party Rock Anthem,1,54
3,The Black Eyed Peas,I Gotta Feeling,1,54
4,Justin Timberlake,Can't Stop The Feeling!,1,52
5,Taylor Swift,Shake It Off,1,50
6,Post Malone,Circles,1,50
7,The Chainsmokers Featuring Halsey,Closer,1,50
8,Mark Ronson Featuring Bruno Mars,Uptown Funk!,1,49
9,Adele,Rolling In The Deep,1,48


# Artistas más reproducidos por semanas

Transforme la columna `date` en `datetime`.

Use  `set_index` para crear un índice en la columna `date`.

Imprima el dataframe con el nuevo índice.

### Solución

In [26]:
music['date']=pd.to_datetime(music['date'])
music.set_index('date', inplace=True)
music.head()

Unnamed: 0_level_0,rank,song,artist,last-week,peak-rank,weeks-on-board
date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2021-11-06,1,Easy On Me,Adele,1.0,1,3
2021-11-06,2,Stay,The Kid LAROI & Justin Bieber,2.0,1,16
2021-11-06,3,Industry Baby,Lil Nas X & Jack Harlow,3.0,1,14
2021-11-06,4,Fancy Like,Walker Hayes,4.0,3,19
2021-11-06,5,Bad Habits,Ed Sheeran,5.0,2,18


In [27]:
top_rep=music[['weeks-on-board','artist']].sort_values(by='weeks-on-board',ascending=False)[:10]
top_rep

Unnamed: 0_level_0,weeks-on-board,artist
date,Unnamed: 1_level_1,Unnamed: 2_level_1
2021-09-04,90,The Weeknd
2021-08-28,89,The Weeknd
2021-08-21,88,The Weeknd
2014-05-10,87,Imagine Dragons
2021-08-14,87,The Weeknd
2021-08-07,86,The Weeknd
2014-05-03,86,Imagine Dragons
2021-07-31,85,The Weeknd
2014-04-26,85,Imagine Dragons
2014-04-19,84,Imagine Dragons


# Encuentre los más y menos escuchados según un intervalo de tiempo

Puede usar `resample(frecuencia)[columna]`. 

Las frecuencias que puede usar son:
* H - Horaria
* D - Diaria
* W - Semanal
* M - Mensual
* A - Anual

Puede usar `.agg([columnas])` para agregar los datos

### Solución

In [28]:
artist=pd.DataFrame(music.resample('M')['artist'].value_counts())
artist.sort_values('count',ascending=False).head()

Unnamed: 0_level_0,Unnamed: 1_level_0,count
date,artist,Unnamed: 2_level_1
2018-07-31,Drake,55
1964-04-30,The Beatles,47
2021-06-30,Olivia Rodrigo,43
2021-07-31,Olivia Rodrigo,42
2021-09-30,Kanye West,38


In [29]:
artist.sort_values('count',ascending=False).tail()

Unnamed: 0_level_0,Unnamed: 1_level_0,count
date,artist,Unnamed: 2_level_1
2011-02-28,Ricky Martin Featuring Natalia Jimenez,1
2011-02-28,Rise Against,1
2011-02-28,Ronnie Dunn,1
2011-02-28,The Black Keys,1
2021-11-30,Zac Brown Band,1


In [31]:
top_last=music.resample('M')['artist'].agg(['first','last'])
top_last.head()

Unnamed: 0_level_0,first,last
date,Unnamed: 1_level_1,Unnamed: 2_level_1
1958-08-31,Ricky Nelson,Eileen Rodgers
1958-09-30,Domenico Modugno,Kalin Twins
1958-10-31,Tommy Edwards,The Tune Rockers
1958-11-30,Tommy Edwards,Peggy Lee
1958-12-31,The Teddy Bears,The Ames Brothers
