# Analysis MOST PLAYED


## Cargando Dataset y preparación inicial para análisis en ESPAÑA

In [173]:
import os
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import datetime
import altair as alt

# Configuración Jupyter
pd.set_option('display.max_columns', None)
sns.set_style("darkgrid")

# Cargamos el dataframe final de extracción, donde están todas las canciones
data_ana = pd.read_csv("data/data_top200_foranalisis.csv", sep = ',', usecols=['Track Name',
                                                                                 'Artist',
                                                                                 'Position',
                                                                                 'Streams_x',
                                                                                 'date',
                                                                                 'region',
                                                                                 'release_date_year',
                                                                                 'genre_depurated_final',
                                                                                 'artist_followers',
                                                                                 'year',
                                                                                 'spotify_id'], parse_dates=['release_date_year'])
print('Tamaño inicial: ',data_ana.shape)
data_ana.head(2)

# Selecciono la region de España
data_ana_es = data_ana[data_ana['region']== 'es']
print('Tamaño sólo España: ',data_ana_es.shape)
data_ana_es.head(5)

Tamaño inicial:  (94241, 11)
Tamaño sólo España:  (70656, 11)


Unnamed: 0,Track Name,Artist,Streams_x,date,region,spotify_id,year,release_date_year,artist_followers,genre_depurated_final,Position
0,Tusa,KAROL G,344475.0,2020-01-01,es,7k4t7uLgtOxPwTpFmtJNTY,2020,2019-01-01,16151805,latin and reggaeton,1
2,Tusa,KAROL G,436442.0,2020-01-02,es,7k4t7uLgtOxPwTpFmtJNTY,2020,2019-01-01,16151805,latin and reggaeton,1
4,Tusa,KAROL G,447837.0,2020-01-03,es,7k4t7uLgtOxPwTpFmtJNTY,2020,2019-01-01,16151805,latin and reggaeton,1
6,Tusa,KAROL G,442161.0,2020-01-04,es,7k4t7uLgtOxPwTpFmtJNTY,2020,2019-01-01,16151805,latin and reggaeton,1
8,Tusa,KAROL G,419754.0,2020-01-05,es,7k4t7uLgtOxPwTpFmtJNTY,2020,2019-01-01,16151805,latin and reggaeton,1


In [83]:
# La canción de Tusa ha estado 362 días en el top200 de lo más escuchado.
data_ana_es[data_ana_es['Track Name'] == 'Rojo']

Unnamed: 0,Track Name,Artist,Streams_x,date,region,spotify_id,year,release_date_year,artist_followers,genre_depurated_final,Position
15015,Rojo,J Balvin,264951.0,2020-02-28,es,4uziEsK1yiqdauKVDPsmVG,2020,2020-01-01,27495909,latin and reggaeton,9
15017,Rojo,J Balvin,296796.0,2020-02-29,es,4uziEsK1yiqdauKVDPsmVG,2020,2020-01-01,27495909,latin and reggaeton,13
15019,Rojo,J Balvin,281758.0,2020-03-01,es,4uziEsK1yiqdauKVDPsmVG,2020,2020-01-01,27495909,latin and reggaeton,9
15021,Rojo,J Balvin,341595.0,2020-03-02,es,4uziEsK1yiqdauKVDPsmVG,2020,2020-01-01,27495909,latin and reggaeton,7
15023,Rojo,J Balvin,371266.0,2020-03-03,es,4uziEsK1yiqdauKVDPsmVG,2020,2020-01-01,27495909,latin and reggaeton,6
...,...,...,...,...,...,...,...,...,...,...,...
15993,Rojo,J Balvin,40391.0,2020-12-22,es,380HmhwTE2NJgawn1NwkXi,2020,2020-01-01,27495909,latin and reggaeton,182
15994,Rojo,J Balvin,44466.0,2020-12-23,es,380HmhwTE2NJgawn1NwkXi,2020,2020-01-01,27495909,latin and reggaeton,178
15995,Rojo,J Balvin,38145.0,2020-12-26,es,380HmhwTE2NJgawn1NwkXi,2020,2020-01-01,27495909,latin and reggaeton,179
15996,Rojo,J Balvin,34687.0,2020-12-27,es,380HmhwTE2NJgawn1NwkXi,2020,2020-01-01,27495909,latin and reggaeton,181


In [81]:
# Las veces que sale Bad Bunny en el top200 del 2020
data_ana_es[data_ana_es['Artist'] == 'Bad Bunny'].count()

Track Name               3649
Artist                   3649
Streams_x                3649
date                     3649
region                   3649
spotify_id               3649
year                     3649
release_date_year        3649
artist_followers         3649
genre_depurated_final    3649
Position                 3649
dtype: int64

In [131]:
data_ana_es[data_ana_es['Track Name'] == 'Tusa'].count()

Track Name               363
Artist                   363
Streams_x                363
date                     363
region                   363
spotify_id               363
year                     363
release_date_year        363
artist_followers         363
genre_depurated_final    363
Position                 363
dtype: int64

In [130]:
data_ana_es[data_ana_es['Track Name'] == 'Soldadito marinero'].count()

Track Name               361
Artist                   361
Streams_x                361
date                     361
region                   361
spotify_id               361
year                     361
release_date_year        361
artist_followers         361
genre_depurated_final    361
Position                 361
dtype: int64

### Curiosidad ¿Cuántas artistas únicos y sus streams tenemos?

In [86]:
# Artistas con el más número de canciones que aparecen en el top200 del 2020
artist_unique = data_ana_es.groupby('Artist')['spotify_id'].count()
print(artist_unique.shape)
artist_unique.sort_values(ascending=False).head(10)

(399,)


Artist
Bad Bunny         3649
J Balvin          2279
Anuel AA          2168
Rauw Alejandro    2028
Myke Towers       1367
Aitana            1331
Beret             1302
Ozuna             1212
Sech              1165
Jhay Cortez       1133
Name: spotify_id, dtype: int64

In [87]:
# Artistas que tienen más canciones diferentes en el top200 del 2020
artist_unique = data_ana_es.groupby('Artist')['spotify_id'].nunique()
print(artist_unique.shape)
artist_unique.sort_values(ascending=False).head(10)

(399,)


Artist
Bad Bunny         49
Rauw Alejandro    29
Anuel AA          28
Ozuna             28
Jarabe De Palo    24
Myke Towers       21
Rels B            21
Aitana            20
Dua Lipa          19
Morad             19
Name: spotify_id, dtype: int64

In [93]:
# Las canciones más escuchadas y su artista en el 2020
artist_streams = data_ana_es.groupby(['Track Name', 'Artist'])['Streams_x'].sum()
print(artist_streams.shape)
artist_streams.sort_values(ascending=False).head(10)

(1209,)


Track Name                    Artist       
Tusa                          KAROL G          89674693.0
La Jeepeta - Remix            Nio Garcia       57073819.0
Se iluminaba                  Fred De Palma    56929220.0
La Curiosidad                 Jay Wheeler      52350972.0
Caramelo                      Ozuna            51517961.0
Mil Tequilas                  Chema Rivas      48051047.0
Hawái                         Maluma           46806258.0
Morado                        J Balvin         46639802.0
Safaera                       Bad Bunny        44904754.0
Mamichula - con Nicki Nicole  Trueno           43845623.0
Name: Streams_x, dtype: float64

In [67]:
# Los artistas con más reproducciones en total en 2020
artist_streams = data_ana_es.groupby('Artist')['Streams_x'].sum()
print(artist_streams.shape)
artist_streams.sort_values(ascending=False).head(10)

(399,)


Artist
Bad Bunny         450873777.0
Anuel AA          255946961.0
J Balvin          251309843.0
Rauw Alejandro    240438177.0
Ozuna             178398916.0
Sech              155677777.0
KAROL G           152210941.0
C. Tangana        119048990.0
Aitana            110884673.0
Camilo            108936995.0
Name: Streams_x, dtype: float64

In [97]:
# Los artistas que han estado más veces en el top200 en el 2020
artist_streams = data_ana_es.groupby('Track Name')['Position'].count()
print(artist_streams.shape)
artist_streams.sort_values(ascending=False).head(10)

(1191,)


Track Name
Alocao (With Bad Gyal)       363
Sueño (con Pablo Alborán)    363
Blinding Lights              363
Tusa                         363
Dance Monkey                 363
China                        363
Se iluminaba                 363
Prendio (Remix)              362
Don't Start Now              362
Soldadito marinero           361
Name: Position, dtype: int64

In [107]:
data_ana_es_top10 = data_ana_es[data_ana_es['Position'] > 10]
data_ana_es_top10

Unnamed: 0,Track Name,Artist,Streams_x,date,region,spotify_id,year,release_date_year,artist_followers,genre_depurated_final,Position
250,Tusa,KAROL G,229604.0,2020-05-05,es,7k4t7uLgtOxPwTpFmtJNTY,2020,2019-01-01,16151805,latin and reggaeton,11
252,Tusa,KAROL G,226742.0,2020-05-06,es,7k4t7uLgtOxPwTpFmtJNTY,2020,2019-01-01,16151805,latin and reggaeton,11
254,Tusa,KAROL G,219927.0,2020-05-07,es,7k4t7uLgtOxPwTpFmtJNTY,2020,2019-01-01,16151805,latin and reggaeton,11
256,Tusa,KAROL G,223616.0,2020-05-08,es,7k4t7uLgtOxPwTpFmtJNTY,2020,2019-01-01,16151805,latin and reggaeton,11
260,Tusa,KAROL G,191372.0,2020-05-10,es,7k4t7uLgtOxPwTpFmtJNTY,2020,2019-01-01,16151805,latin and reggaeton,21
...,...,...,...,...,...,...,...,...,...,...,...
94235,Frosty The Snowman,Ella Fitzgerald,33907.0,2020-12-25,es,65irrLqfCMRiO3p87P4C0D,2020,1960-01-01,1941093,"pop, new age and standards",186
94237,A Belén Pastores,Coro Infantil Monte Mijedo,54579.0,2020-12-24,es,6LwHkBKTn1zihz8LST9Y49,2020,2012-01-01,1827,latin and reggaeton,189
94238,No Te Enamores - Remix,Milly,43058.0,2020-12-26,es,2mM3gZ0BbPwPPMelbA8vgt,2020,2020-01-01,14741,latin and reggaeton,149
94239,No Te Enamores - Remix,Milly,45895.0,2020-12-27,es,2mM3gZ0BbPwPPMelbA8vgt,2020,2020-01-01,14741,latin and reggaeton,118


In [115]:
# Canciones que más veces han estado en el top10 de 2020
# Cojo solo los Top10
data_ana_es_top10 = data_ana_es[data_ana_es['Position'] < 10]

# Analizo
testing = data_ana_es_top10.groupby(['Track Name', 'Artist'])['Position'].count()
testing.sort_values(ascending=False).head(10)

Track Name                    Artist        
Tusa                          KAROL G           124
La Curiosidad                 Jay Wheeler       104
La Jeepeta - Remix            Nio Garcia         97
Caramelo                      Ozuna              89
Morado                        J Balvin           82
Hawái                         Maluma             76
La Nota                       Manuel Turizo      75
Mamichula - con Nicki Nicole  Trueno             73
Tattoo - Remix with Camilo    Rauw Alejandro     69
El Manual                     Anuel AA           69
Name: Position, dtype: int64

## Análisis de datos de música Rock

In [69]:
data_ana_es_rock = data_ana_es[data_ana_es['genre_depurated_final']== 'rock, country and indie']

In [117]:
# Las canciones de rock más escuchadas en el top200
artist_unique = data_ana_es_rock.groupby(['Track Name', 'Artist'])['Streams_x'].sum()
artist_unique.sort_values(ascending=False).head(10)

Track Name                                                Artist           
Una Foto en Blanco y Negro                                David Otero          19384149.0
Soldadito marinero                                        Fito y Fitipaldis    15987959.0
Princesas                                                 Pereza               13390366.0
Mi Persona Favorita                                       Alejandro Sanz        4583519.0
Un Planeta Llamado Nosotros                               Maldita Nerea         1915691.0
Por la boca vive el pez                                   Fito y Fitipaldis     1850898.0
No Puedo Vivir Sin Ti                                     Los Ronaldos          1547750.0
Mi accidente preferido (con Juancho Sidecars y Sidecars)  Despistaos            1084010.0
Copenhague                                                Vetusta Morla          698725.0
CANGURO                                                   WOS                    393077.0
Name: Streams_x, dtype: 

In [123]:
# Los artistas de rock más escuchadas en el top200
artist_unique = data_ana_es_rock.groupby(['Artist'])['Streams_x'].sum()
artist_unique.sort_values(ascending=False).head(10)

Artist
David Otero          19425284.0
Fito y Fitipaldis    17838857.0
Pereza               13390366.0
Alejandro Sanz        4583519.0
Maldita Nerea         1915691.0
Los Ronaldos          1547750.0
Vetusta Morla         1137327.0
Despistaos            1084010.0
Txarango               397211.0
WOS                    393077.0
Name: Streams_x, dtype: float64

In [132]:
# Las canciones de rock que más veces han estado en el Top200
artist_unique = data_ana_es_rock.groupby(['Track Name'])['release_date_year'].count()
artist_unique.sort_values(ascending=False).head(10)

Track Name
Soldadito marinero                                          361
Una Foto en Blanco y Negro                                  337
Princesas                                                   327
Mi Persona Favorita                                         115
Por la boca vive el pez                                      51
Un Planeta Llamado Nosotros                                  50
No Puedo Vivir Sin Ti                                        42
Mi accidente preferido (con Juancho Sidecars y Sidecars)     30
Copenhague                                                   18
CANGURO                                                      12
Name: release_date_year, dtype: int64

In [133]:
# Lo más alto que ha podido lleagr una canción de rock en el top200
data_ana_es_rock.sort_values(by=['Position'])

Unnamed: 0,Track Name,Artist,Streams_x,date,region,spotify_id,year,release_date_year,artist_followers,genre_depurated_final,Position
73812,"Los Abrazos Prohibidos (feat. Alice Wonder, An...",Vetusta Morla,114221.0,2020-05-08,es,3qKzESguQJ7GpqWf6K2hOE,2020,2020-01-01,581024,"rock, country and indie",47
94153,Happy Xmas (War Is Over) - Remastered 2010,John Lennon,139926.0,2020-12-24,es,27RYrbL6S02LNVhDWVl38b,2020,2010-01-01,4113066,"rock, country and indie",57
94155,Happy Xmas (War Is Over) - Remastered 2010,John Lennon,76380.0,2020-12-25,es,27RYrbL6S02LNVhDWVl38b,2020,2010-01-01,4113066,"rock, country and indie",63
82350,20 de abril,Celtas Cortos,68639.0,2020-04-20,es,7ifOnwJC0oH7cfbJQbUye1,2020,1991-01-01,174070,"rock, country and indie",65
94179,Wonderful Christmastime - Edited Version / Rem...,Paul McCartney,114152.0,2020-12-24,es,1SV1fxF65n9NhRHp3KlBuu,2020,1980-01-01,3481129,"rock, country and indie",67
...,...,...,...,...,...,...,...,...,...,...,...
64129,Por la boca vive el pez,Fito y Fitipaldis,32420.0,2020-07-12,es,24UStI5AYA7g5ufFDh3LH0,2020,2006-01-01,1228836,"rock, country and indie",200
73792,Believer,Imagine Dragons,29201.0,2020-01-19,es,0pqnGHJpmpxLKifKRmU6WP,2020,2017-01-01,33849018,"rock, country and indie",200
84424,Mundo imperfecto,Sidecars,40236.0,2020-09-04,es,2u0cV9ctd6AcnMBbDFk88b,2020,2020-01-01,157455,"rock, country and indie",200
67067,Mi Persona Favorita,Alejandro Sanz,33513.0,2020-03-17,es,1O4dGIPUXUanseRdv4fNzw,2020,2019-01-01,5059196,"rock, country and indie",200


In [136]:
# Las canciones más antiguas que han estado en el top200
data_ana_es_rock.sort_values(by=['release_date_year'])

Unnamed: 0,Track Name,Artist,Streams_x,date,region,spotify_id,year,release_date_year,artist_followers,genre_depurated_final,Position
66828,Bohemian Rhapsody - Remastered 2011,Queen,26475.0,2020-01-01,es,4u7EnebtmKWzUH433cf5Qv,2020,1975-01-01,33763966,"rock, country and indie",167
66830,Bohemian Rhapsody - Remastered 2011,Queen,29247.0,2020-01-06,es,4u7EnebtmKWzUH433cf5Qv,2020,1975-01-01,33763966,"rock, country and indie",180
81635,Al Alba - Remasterizado,Luis Eduardo Aute,35773.0,2020-04-05,es,0OXMtHq7Nnu3D5slUJHNn0,2020,1978-01-01,227540,"rock, country and indie",167
81634,Al Alba - Remasterizado,Luis Eduardo Aute,37421.0,2020-04-04,es,0OXMtHq7Nnu3D5slUJHNn0,2020,1978-01-01,227540,"rock, country and indie",171
94181,Wonderful Christmastime - Edited Version / Rem...,Paul McCartney,64080.0,2020-12-25,es,1SV1fxF65n9NhRHp3KlBuu,2020,1980-01-01,3481129,"rock, country and indie",81
...,...,...,...,...,...,...,...,...,...,...,...
74343,Una Foto en Blanco y Negro,David Otero,53291.0,2020-05-12,es,4BNqM0h2wukiQkAUKZjurV,2020,2020-01-01,133234,"rock, country and indie",111
74342,Una Foto en Blanco y Negro,David Otero,54398.0,2020-05-11,es,4BNqM0h2wukiQkAUKZjurV,2020,2020-01-01,133234,"rock, country and indie",116
74341,Una Foto en Blanco y Negro,David Otero,50818.0,2020-05-10,es,4BNqM0h2wukiQkAUKZjurV,2020,2020-01-01,133234,"rock, country and indie",113
74367,Una Foto en Blanco y Negro,David Otero,66061.0,2020-06-05,es,4BNqM0h2wukiQkAUKZjurV,2020,2020-01-01,133234,"rock, country and indie",107


In [162]:
# Los artistas de rock más antiguos y sus streams totales
# Trico apra pasarlo a dataframe: reset_index()
artist_unique = data_ana_es_rock.groupby(['Artist', 'Track Name','release_date_year'])['Streams_x'].sum().reset_index()
artist_unique.sort_values(by="release_date_year")

Unnamed: 0,Artist,Track Name,release_date_year,Streams_x
621,KAROL G,Tusa,2019-01-01,89674693.0
889,Nio Garcia,La Jeepeta - Remix,2020-01-01,57073819.0
483,Fred De Palma,Se iluminaba,2019-01-01,56929220.0
565,Jay Wheeler,La Curiosidad,2020-01-01,52350972.0
912,Ozuna,Caramelo,2020-01-01,51517961.0
...,...,...,...,...
336,DJ Snake,"Taki Taki (feat. Selena Gomez, Ozuna & Cardi B)",2019-01-01,23801.0
186,Becky G,DOLLAR,2019-01-01,23652.0
843,Myke Towers,Si Se Da,2019-01-01,23622.0
158,Bad Bunny,NI BIEN NI MAL,2018-01-01,23611.0


## Exportar las 10 canciones más escuchas en el 2020

In [170]:
# Las canciones más escuchadas y su artista en el 2020
mp_songs_2020 = data_ana_es.groupby(['Track Name', 'Artist'])['Streams_x'].sum().reset_index()
print(artist_streams.shape)
mp_songs_2020 = mp_songs_2020.sort_values(by="Streams_x", ascending=False)
mp_songs_2020_top10 = mp_songs_2020.head(10)
mp_songs_2020_top10 = mp_songs_2020_top10.rename(columns = {'Track Name': 'Track Name', 'Artist': 'Artist', 'Streams_x': 'Streams'})
mp_songs_2020_top10.to_csv("data/data_top200_es_mostplayedsongs_top10.csv", sep = ',')
mp_songs_2020_top10

(1209, 3)


Unnamed: 0,Track Name,Artist,Streams
1081,Tusa,KAROL G,89674693.0
551,La Jeepeta - Remix,Nio Garcia,57073819.0
960,Se iluminaba,Fred De Palma,56929220.0
544,La Curiosidad,Jay Wheeler,52350972.0
193,Caramelo,Ozuna,51517961.0
705,Mil Tequilas,Chema Rivas,48051047.0
462,Hawái,Maluma,46806258.0
718,Morado,J Balvin,46639802.0
938,Safaera,Bad Bunny,44904754.0
662,Mamichula - con Nicki Nicole,Trueno,43845623.0


## Cargando Dataset y preparación inicial para análisis en el MUNDO

In [175]:
import os
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import datetime
import altair as alt

# Configuración Jupyter
pd.set_option('display.max_columns', None)
sns.set_style("darkgrid")

# Cargamos el dataframe final de extracción, donde están todas las canciones
data_ana = pd.read_csv("data/data_top200_foranalisis.csv", sep = ',', usecols=['Track Name',
                                                                                 'Artist',
                                                                                 'Position',
                                                                                 'Streams_x',
                                                                                 'date',
                                                                                 'region',
                                                                                 'release_date_year',
                                                                                 'genre_depurated_final',
                                                                                 'artist_followers',
                                                                                 'year',
                                                                                 'spotify_id'], parse_dates=['release_date_year'])
print('Tamaño inicial: ',data_ana.shape)
data_ana.head(2)

# Selecciono la region del mundo
data_ana_global = data_ana[data_ana['region']== 'global']
print('Tamaño Mundo: ',data_ana_global.shape)
data_ana_global.head(5)

Tamaño inicial:  (94241, 11)
Tamaño Mundo:  (23585, 11)


Unnamed: 0,Track Name,Artist,Streams_x,date,region,spotify_id,year,release_date_year,artist_followers,genre_depurated_final,Position
1,Tusa,KAROL G,4017964.0,2020-01-01,global,7k4t7uLgtOxPwTpFmtJNTY,2020,2019-01-01,16151805,latin and reggaeton,1
3,Tusa,KAROL G,3838673.0,2020-01-02,global,7k4t7uLgtOxPwTpFmtJNTY,2020,2019-01-01,16151805,latin and reggaeton,1
5,Tusa,KAROL G,4137767.0,2020-01-03,global,7k4t7uLgtOxPwTpFmtJNTY,2020,2019-01-01,16151805,latin and reggaeton,1
7,Tusa,KAROL G,4194438.0,2020-01-04,global,7k4t7uLgtOxPwTpFmtJNTY,2020,2019-01-01,16151805,latin and reggaeton,1
9,Tusa,KAROL G,3871744.0,2020-01-05,global,7k4t7uLgtOxPwTpFmtJNTY,2020,2019-01-01,16151805,latin and reggaeton,1


In [176]:
# Las canciones más escuchadas y su artista en el 2020
artist_streams = data_ana_global.groupby(['Track Name', 'Artist'])['Streams_x'].sum()
print(artist_streams.shape)
artist_streams.sort_values(ascending=False).head(10)

(454,)


Track Name                        Artist       
Blinding Lights                   The Weeknd       1.633853e+09
Dance Monkey                      Tones And I      1.189940e+09
Don't Start Now                   Dua Lipa         1.018897e+09
Roses - Imanbek Remix             SAINt JHN        9.170399e+08
ROCKSTAR (feat. Roddy Ricch)      DaBaby           8.074115e+08
Someone You Loved                 Lewis Capaldi    7.630788e+08
Tusa                              KAROL G          7.615109e+08
The Box                           Roddy Ricch      7.399100e+08
Watermelon Sugar                  Harry Styles     6.283160e+08
death bed (coffee for your head)  Powfu            6.226067e+08
Name: Streams_x, dtype: float64