## Ejercicios de Pandas
___
___

Usaremos  el conjunto de datos `Spotify_Youtube.csv`. Incluye 26 variables para cada una de las canciones recogidas de spotify. Estas variables se describen brevemente a continuación:

- `Track`: nombre de la canción, tal y como aparece en la plataforma Spotify.
- `Artist`: nombre del artista.
- `Url_spotify`: Url de la canción.
- `Album`: el álbum en el que se encuentra la canción en Spotify.
- `Album_type`: indica si la canción se publica en Spotify como single o dentro de un álbum.
- `Uri`: un enlace de Spotify utilizado para encontrar la canción a través de la API.
-`Danceability`: describe lo adecuada que es una canción para bailar basándose en una combinación de elementos musicales como el tempo, la estabilidad del ritmo, la fuerza del compás y la regularidad general. Un valor de 0,0 es el menos bailable y 1,0 el más bailable.
- `Energy`: es una medida de 0,0 a 1,0 y representa una medida perceptiva de intensidad y actividad. Normalmente, las pistas energéticas son rápidas, ruidosas y ruidosas. Por ejemplo, el death metal tiene mucha energía, mientras que un preludio de Bach tiene una puntuación baja en la escala. Las características perceptivas que contribuyen a este atributo incluyen el rango dinámico, el volumen percibido, el timbre, la velocidad de inicio y la entropía general.
- `Key`: la clave de la pista. Los números enteros se asignan a los tonos utilizando la notación estándar Pitch Class. Por ejemplo, 0 = C, 1 = C♯/D♭, 2 = D, y así sucesivamente. Si no se detecta ninguna tonalidad, el valor es -1.
- `Loudness`: la sonoridad global de una pista en decibelios (dB). Los valores de sonoridad se promedian en toda la pista y son útiles para comparar la sonoridad relativa de las pistas. La sonoridad es la cualidad de un sonido que es el principal correlato psicológico de la fuerza física (amplitud). Los valores suelen oscilar entre -60 y 0 db.
- `Speechiness`: detecta la presencia de palabras habladas en una pista. Cuanto más exclusivamente hablada sea la grabación (por ejemplo, un programa de entrevistas, un audiolibro, poesía), más se acercará a 1,0 el valor del atributo. Los valores superiores a 0,66 describen pistas que probablemente estén compuestas en su totalidad por palabras habladas. Los valores entre 0,33 y 0,66 describen pistas que pueden contener tanto música como voz, ya sea en secciones o en capas, incluyendo casos como la música rap. Los valores por debajo de 0,33 representan probablemente música y otras pistas no habladas.
- `Acousticness`: una medida de confianza de 0,0 a 1,0 para determinar si la pista es acústica. 1,0 representa una confianza alta en que la pista es acústica.
- `Instrumentalness`: predice si una pista no contiene voces. Los sonidos "ooh" y "aah" se consideran instrumentales en este contexto. Las pistas de rap o spoken word son claramente "vocales". Cuanto más se acerque el valor de instrumental a 1,0, mayor será la probabilidad de que la canción no contenga voces. Los valores superiores a 0,5 representan pistas instrumentales, pero la confianza es mayor a medida que el valor se acerca a 1,0.
- `Liveness`: detecta la presencia de público en la grabación. Los valores más altos representan una mayor probabilidad de que la pista se haya interpretado en directo. Un valor superior a 0,8 proporciona una gran probabilidad de que la pista sea en directo.
- `Valence`: una medida de 0,0 a 1,0 que describe la positividad musical que transmite una pista. Las pistas con una valencia alta suenan más positivas (por ejemplo, felices, alegres, eufóricas), mientras que las pistas con una valencia baja suenan más negativas (por ejemplo, tristes, deprimidas, enfadadas).
- `Tempo`: el tempo global estimado de una pista en pulsaciones por minuto (BPM). En terminología musical, el tempo es la velocidad o el ritmo de una pieza determinada y se deriva directamente de la duración media de los tiempos.
- `Duration_ms`: duración de la pista en milisegundos.
- `Stream`: número de streams de la canción en Spotify.
- `Url_youtube`: url del vídeo enlazado a la canción en Youtube, si lo tiene.
- `Title`: título del videoclip en Youtube.
- `Channel`: nombre del canal que ha publicado el vídeo.
- `Views`: número de vistas.
- `Likes`: número de me gusta.
- `Comments`: número de comentarios.
- `Description`: descripción del vídeo en Youtube.
- `Licensed`: Indica si el vídeo representa contenido con licencia, lo que significa que el contenido fue subido a un canal vinculado a un socio de contenido de Youtube y luego reclamado por dicho socio.
- `Official_video`: valor booleano que indica si el vídeo encontrado es el vídeo oficial de la canción. ####  

___
___
### Ejercicios Exploración:
1. Importad Pandas

In [1]:
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

___
Exploración del conjunto de datos:
- Cargad el fichero, al cargarlo os aparecerá una columna llamada "Unnamed: 0". Cargad el dataset sin que aparezca esta columna. Además realizad un análisis exploratorio que incluya:
- Cuando leais el fichero, veremos que no podemos ver todas las columnas, utilizad el comando correcto para poder visualizarlas todas cuando hacemos un head.

In [2]:
df = pd.read_csv('../data/Spotify_Youtube.csv', index_col='Unnamed: 0')

pd.options.display.max_columns = None
df.head(2)

Unnamed: 0,Artist,Url_spotify,Track,Album,Album_type,Uri,Danceability,Energy,Key,Loudness,Speechiness,Acousticness,Instrumentalness,Liveness,Valence,Tempo,Duration_ms,Url_youtube,Title,Channel,Views,Likes,Comments,Description,Licensed,Official_video,Stream
0,Gorillaz,https://open.spotify.com/artist/3AA28KZvwAUcZu...,Feel Good Inc.,Demon Days,album,spotify:track:0d28khcov6AiegSCpG5TuT,818,705,60,-6679,177,836,233,0.613,0.772,138.559,222640.0,https://www.youtube.com/watch?v=HyHNuVaZJ-k,Gorillaz - Feel Good Inc. (Official Video),Gorillaz,693555221.0,6220896.0,169907.0,Official HD Video for Gorillaz' fantastic trac...,True,True,1040235000.0
1,Gorillaz,https://open.spotify.com/artist/3AA28KZvwAUcZu...,Rhinestone Eyes,Plastic Beach,album,spotify:track:1foMv2HQwfQ2vntFf9HFeG,676,703,80,-5815,302,869,687,0.0463,0.852,92.761,200173.0,https://www.youtube.com/watch?v=yYDmaexVHic,Gorillaz - Rhinestone Eyes [Storyboard Film] (...,Gorillaz,72011645.0,1079128.0,31003.0,The official video for Gorillaz - Rhinestone E...,True,True,310083700.0


- Primeras 5 filas del dataframe

In [3]:
df.head(5)

Unnamed: 0,Artist,Url_spotify,Track,Album,Album_type,Uri,Danceability,Energy,Key,Loudness,Speechiness,Acousticness,Instrumentalness,Liveness,Valence,Tempo,Duration_ms,Url_youtube,Title,Channel,Views,Likes,Comments,Description,Licensed,Official_video,Stream
0,Gorillaz,https://open.spotify.com/artist/3AA28KZvwAUcZu...,Feel Good Inc.,Demon Days,album,spotify:track:0d28khcov6AiegSCpG5TuT,818,705,60,-6679,177,836.0,233,0.613,0.772,138.559,222640.0,https://www.youtube.com/watch?v=HyHNuVaZJ-k,Gorillaz - Feel Good Inc. (Official Video),Gorillaz,693555221.0,6220896.0,169907.0,Official HD Video for Gorillaz' fantastic trac...,True,True,1040235000.0
1,Gorillaz,https://open.spotify.com/artist/3AA28KZvwAUcZu...,Rhinestone Eyes,Plastic Beach,album,spotify:track:1foMv2HQwfQ2vntFf9HFeG,676,703,80,-5815,302,869.0,687,0.0463,0.852,92.761,200173.0,https://www.youtube.com/watch?v=yYDmaexVHic,Gorillaz - Rhinestone Eyes [Storyboard Film] (...,Gorillaz,72011645.0,1079128.0,31003.0,The official video for Gorillaz - Rhinestone E...,True,True,310083700.0
2,Gorillaz,https://open.spotify.com/artist/3AA28KZvwAUcZu...,New Gold (feat. Tame Impala and Bootie Brown),New Gold (feat. Tame Impala and Bootie Brown),single,spotify:track:64dLd6rVqDLtkXFYrEUHIU,695,923,10,-393,522,425.0,469,0.116,0.551,108.014,215150.0,https://www.youtube.com/watch?v=qJa-VFwPpYA,Gorillaz - New Gold ft. Tame Impala & Bootie B...,Gorillaz,8435055.0,282142.0,7399.0,Gorillaz - New Gold ft. Tame Impala & Bootie B...,True,True,63063470.0
3,Gorillaz,https://open.spotify.com/artist/3AA28KZvwAUcZu...,On Melancholy Hill,Plastic Beach,album,spotify:track:0q6LuUqGLUiCPP1cbdwFs3,689,739,20,-581,26,0.00151,509,0.064,0.578,120.423,233867.0,https://www.youtube.com/watch?v=04mfKJWDSzI,Gorillaz - On Melancholy Hill (Official Video),Gorillaz,211754952.0,1788577.0,55229.0,Follow Gorillaz online:\nhttp://gorillaz.com \...,True,True,434663600.0
4,Gorillaz,https://open.spotify.com/artist/3AA28KZvwAUcZu...,Clint Eastwood,Gorillaz,album,spotify:track:7yMiX7n9SBvadzox8T5jzT,663,694,100,-8627,171,253.0,0,0.0698,0.525,167.953,340920.0,https://www.youtube.com/watch?v=1V_xRb0x9aw,Gorillaz - Clint Eastwood (Official Video),Gorillaz,618480958.0,6197318.0,155930.0,The official music video for Gorillaz - Clint ...,True,True,617259700.0


- Últimas 5 filas del dataframe

In [4]:
df.tail(5)

Unnamed: 0,Artist,Url_spotify,Track,Album,Album_type,Uri,Danceability,Energy,Key,Loudness,Speechiness,Acousticness,Instrumentalness,Liveness,Valence,Tempo,Duration_ms,Url_youtube,Title,Channel,Views,Likes,Comments,Description,Licensed,Official_video,Stream
20713,SICK LEGEND,https://open.spotify.com/artist/3EYY5FwDkHEYLw...,JUST DANCE HARDSTYLE,JUST DANCE HARDSTYLE,single,spotify:track:0RtcKQGyI4hr8FgFH1TuYG,582,926,50,-6344,328,448,0,0.0839,0.658,90.002,94667.0,https://www.youtube.com/watch?v=5SHmKFKlNqI,JUST DANCE HARDSTYLE,SICK LEGEND - Topic,71678.0,1113.0,0.0,Provided to YouTube by Routenote\n\nJUST DANCE...,True,True,9227144.0
20714,SICK LEGEND,https://open.spotify.com/artist/3EYY5FwDkHEYLw...,SET FIRE TO THE RAIN HARDSTYLE,SET FIRE TO THE RAIN HARDSTYLE,single,spotify:track:3rHvPA8lUnPBkaLyPOc0VV,531,936,40,-1786,137,28,0,0.0923,0.657,174.869,150857.0,https://www.youtube.com/watch?v=ocTH6KxllDQ,SET FIRE TO THE RAIN HARDSTYLE,SICK LEGEND - Topic,164741.0,2019.0,0.0,Provided to YouTube by Routenote\n\nSET FIRE T...,True,True,10898176.0
20715,SICK LEGEND,https://open.spotify.com/artist/3EYY5FwDkHEYLw...,OUTSIDE HARDSTYLE SPED UP,OUTSIDE HARDSTYLE SPED UP,single,spotify:track:4jk00YxPtPbhvHJE9N4ddv,443,83,40,-4679,647,243,0,0.154,0.419,168.388,136842.0,https://www.youtube.com/watch?v=5wFhE-HY0hg,OUTSIDE HARDSTYLE SPED UP,SICK LEGEND - Topic,35646.0,329.0,0.0,Provided to YouTube by Routenote\n\nOUTSIDE HA...,True,True,6226110.0
20716,SICK LEGEND,https://open.spotify.com/artist/3EYY5FwDkHEYLw...,ONLY GIRL HARDSTYLE,ONLY GIRL HARDSTYLE,single,spotify:track:5EyErbpsugWliX006eTDex,417,767,90,-4004,419,356,184,0.108,0.539,155.378,108387.0,https://www.youtube.com/watch?v=VMFLbFRNCn0,ONLY GIRL HARDSTYLE,SICK LEGEND - Topic,6533.0,88.0,0.0,Provided to YouTube by Routenote\n\nONLY GIRL ...,True,True,6873961.0
20717,SICK LEGEND,https://open.spotify.com/artist/3EYY5FwDkHEYLw...,MISS YOU HARDSTYLE,MISS YOU HARDSTYLE,single,spotify:track:6lOn0jz1QpjcWeXo1oMm0k,498,938,60,-4543,107,277,911,0.136,0.0787,160.067,181500.0,https://www.youtube.com/watch?v=zau0dckCFi0,MISS YOU HARDSTYLE,SICK LEGEND - Topic,158697.0,2484.0,0.0,Provided to YouTube by Routenote\n\nMISS YOU H...,True,True,5695584.0


- 10 filas aleatorias del dataframe

In [5]:
df.sample(10)

Unnamed: 0,Artist,Url_spotify,Track,Album,Album_type,Uri,Danceability,Energy,Key,Loudness,Speechiness,Acousticness,Instrumentalness,Liveness,Valence,Tempo,Duration_ms,Url_youtube,Title,Channel,Views,Likes,Comments,Description,Licensed,Official_video,Stream
3629,Bob Sinclar,https://open.spotify.com/artist/5YFS41yoX0YuFY...,World Hold On (Radio Edit) [Vintage Culture & ...,World Hold On (Radio Edit) [Vintage Culture & ...,single,spotify:track:0VdwHBLCTSdrTJFIjWOsEC,604,894,110,-3796,199,829,564.0,0.201,0.669,122.884,172073.0,https://www.youtube.com/watch?v=nhh0lYKTIxo,Bob Sinclar Ft. Steve Edwards - World Hold On ...,Bob Sinclar,601183.0,8693.0,104.0,Subscribe to this channel : http://bit.ly/BobS...,True,True,71570851.0
16141,Glass Animals,https://open.spotify.com/artist/4yvcSjfu4PC0CY...,Gooey,ZABA,album,spotify:track:1gk3FhAV07q9Jg77UxnVjX,487,369,110,-13424,406,736,0.00375,0.0925,0.106,183.114,289307.0,https://www.youtube.com/watch?v=IIA1XQnAv5s,Glass Animals - Gooey (Official Video),GlassAnimalsVEVO,20513451.0,153280.0,4167.0,‘dreamland IRL’ is out. it’s about revisiting ...,True,True,295935353.0
6935,Banda Machos,https://open.spotify.com/artist/7MyUjj79oHy7I8...,Chiquita bonita,Palabra de machos,album,spotify:track:1oyFVrHU6I2vRUSR1VVDKL,834,373,40,-14187,607,171,0.0,0.0784,0.888,115.794,148267.0,https://www.youtube.com/watch?v=dwwxNahEwnU,Chiquita bonita,Banda Machos - Topic,3553046.0,27084.0,75.0,Provided to YouTube by MCM Mexico/WMI\n\nChiqu...,True,True,13449872.0
5740,Lil' Kim,https://open.spotify.com/artist/5tth2a3v0sWwV1...,Queen Bitch,Hard Core,album,spotify:track:1LFqcpp3k7r9nHBH7Lsos4,787,773,20,-8533,328,732,102.0,0.105,0.844,85.658,197267.0,https://www.youtube.com/watch?v=FyL0w78Mge4,Lil' Kim - Queen Bitch (Music Video),TheHipHopSyko,69098.0,690.0,32.0,This is a Music Video I made for the Lil' Kim ...,False,False,8658237.0
12384,Klaas,https://open.spotify.com/artist/25sJFKMqDENdsT...,Voyage Voyage,Voyage Voyage,single,spotify:track:5ylF9jv5gKpPNXuhAuBwol,62,8,110,-6696,493,639,118.0,0.378,0.502,130.015,144462.0,https://www.youtube.com/watch?v=6u32z97BOJQ,Klaas - Voyage Voyage,You Love Dance.TV,99982.0,1919.0,82.0,Download: Klaas - Voyage Voyage\nStore: https:...,True,True,2844198.0
11664,Lady A,https://open.spotify.com/artist/32WkQRZEVKSzVA...,Just A Kiss,Own The Night,album,spotify:track:2OXidlnDThZR3zf36k6DVL,593,639,10,-5826,307,446,0.0,0.0998,0.332,142.881,218840.0,https://www.youtube.com/watch?v=v_yTphvyiPU,Lady Antebellum - Just A Kiss,LadyAVEVO,114374539.0,629298.0,17816.0,Purchase Lady Antebellum’s latest music: http:...,True,True,120367588.0
1672,Tears For Fears,https://open.spotify.com/artist/4bthk9UfsYUYdc...,Sowing The Seeds Of Love,The Seeds Of Love,album,spotify:track:0PbAyLrJRDxckQBLQ2Addc,209,795,0,-7241,443,109,0.00563,0.355,0.682,171.975,376733.0,https://www.youtube.com/watch?v=VAtGOESO7W8,Tears For Fears - Sowing The Seeds Of Love (Of...,TearsForFearsVEVO,38234996.0,224536.0,11525.0,REMASTERED IN HD!\nListen to more from Tears F...,True,True,70048954.0
18184,Damso,https://open.spotify.com/artist/2UwqpfQtNuhBwv...,BODIES (feat. Damso),KMT,album,spotify:track:3im90dPSC5z1PYJ305kgSy,906,518,10,-7104,18,864,174.0,0.0711,0.259,146.06,166373.0,https://www.youtube.com/watch?v=32GhHtIuXB0,GAZO - BODIES (Ft Damso) (Visualizer),GAZO OFFICIEL,4994033.0,71829.0,1689.0,,False,False,25492899.0
13327,Lykke Li,https://open.spotify.com/artist/6oBm8HB0yfrIc9...,No Rest for the Wicked,I Never Learn,album,spotify:track:2gCvWjrHt6PVJjIN1amlje,312,445,110,-7202,305,365,38.0,0.13,0.272,97.967,222719.0,https://www.youtube.com/watch?v=Hh-0y8Qe0Sw,Lykke Li - No Rest For The Wicked,Lykke Li,14474583.0,122810.0,2466.0,Director: Tarik Saleh\n\nI Never Learn. Out No...,False,True,45674541.0
11730,Palak Muchhal,https://open.spotify.com/artist/3yMmYEklQ7gLOZ...,"Kaun Tujhe (From ""M.S.Dhoni - The Untold Story"")",2016 Shinning Star - Palak Muchhal,compilation,spotify:track:5b7u3idwfY2LyqMQlCwscm,531,431,20,-8937,37,868,0.00247,0.127,0.19,107.99,241449.0,,,,,,,,,,63088791.0


- ¿Cuántas filas y columnas tenemos en el dataframe?

In [6]:
print(f'Tenemos {df.shape[0]} filas y {df.shape[1]} columnas.')

Tenemos 20718 filas y 27 columnas.


- ¿Cuáles son los tipos de los datos de cada columna del dataframe

In [7]:
df.dtypes

Artist               object
Url_spotify          object
Track                object
Album                object
Album_type           object
Uri                  object
Danceability         object
Energy               object
Key                  object
Loudness             object
Speechiness          object
Acousticness         object
Instrumentalness     object
Liveness            float64
Valence             float64
Tempo               float64
Duration_ms         float64
Url_youtube          object
Title                object
Channel              object
Views               float64
Likes               float64
Comments            float64
Description          object
Licensed             object
Official_video       object
Stream              float64
dtype: object

In [8]:
df.dtypes.value_counts()

object     19
float64     8
Name: count, dtype: int64

    -> Tenemos 19 columnas de tipo `string` y 8 de tipo `float`.

- ¿Cuántos valores nulos tenemos por columna?

In [9]:
df.isnull().sum()

Artist                0
Url_spotify           0
Track                 0
Album                 0
Album_type            0
Uri                   0
Danceability          2
Energy                2
Key                   2
Loudness              2
Speechiness           2
Acousticness          2
Instrumentalness      2
Liveness              2
Valence               2
Tempo                 2
Duration_ms           2
Url_youtube         470
Title               470
Channel             470
Views               470
Likes               541
Comments            569
Description         876
Licensed            470
Official_video      470
Stream              576
dtype: int64

- ¿Tenemos filas duplicadas en el dataframe?

In [10]:
df.duplicated().sum()

0

    -> No tenemos ninguna fila duplicada

- Muestra los principales estadísticos para las columnas numéricas del dataframe

In [11]:
df.describe().T

Unnamed: 0,count,mean,std,min,25%,50%,75%,max
Liveness,20716.0,0.193521,0.1685309,0.0145,0.0941,0.125,0.237,1.0
Valence,20716.0,0.5298533,0.2454408,0.0,0.339,0.537,0.72625,0.993
Tempo,20716.0,120.6383,29.57902,0.0,97.002,119.965,139.935,243.372
Duration_ms,20716.0,224717.6,124790.5,30985.0,180009.5,213284.5,252443.0,4676058.0
Views,20248.0,93937820.0,274644300.0,0.0,1826002.0,14501100.0,70399750.0,8079649000.0
Likes,20177.0,663341.1,1789324.0,0.0,21581.0,124481.0,522148.0,50788650.0
Comments,20149.0,27518.99,193234.7,0.0,509.0,3277.0,14360.0,16083140.0
Stream,20142.0,135942200.0,244132100.0,6574.0,17674860.0,49682980.0,138358100.0,3386520000.0


- Muestra los principales estadísticos para las columnas categóricas del dataframe

In [12]:
df.describe(include= object).T

Unnamed: 0,count,unique,top,freq
Artist,20718,2079,Gorillaz,10
Url_spotify,20718,2079,https://open.spotify.com/artist/3AA28KZvwAUcZu...,10
Track,20718,17841,El Ultimo Adiós - Varios Artistas Version,24
Album,20718,11937,Greatest Hits,30
Album_type,20718,3,album,14926
Uri,20718,18862,spotify:track:0tzixmHNQfE6S6SirSToxW,24
Danceability,20716,898,0687,78
Energy,20716,1268,0572,60
Key,20716,12,00,2305
Loudness,20716,9417,-7818,25
