# **Actividad: DASHboards y Plotly**

Equipo .team()

## **Librerías**

In [2]:
%pip install -r requirements.txt -q


Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 25.0.1 -> 25.3
[notice] To update, run: python.exe -m pip install --upgrade pip


In [3]:
import pandas as pd
import numpy as np
import plotly.express as px
import plotly.graph_objects as go
import dash

## **DataSet**

In [4]:
df = pd.read_csv('data/spotify_data clean.csv')
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 8582 entries, 0 to 8581
Data columns (total 15 columns):
 #   Column              Non-Null Count  Dtype  
---  ------              --------------  -----  
 0   track_id            8582 non-null   object 
 1   track_name          8582 non-null   object 
 2   track_number        8582 non-null   int64  
 3   track_popularity    8582 non-null   int64  
 4   explicit            8582 non-null   bool   
 5   artist_name         8579 non-null   object 
 6   artist_popularity   8582 non-null   int64  
 7   artist_followers    8582 non-null   int64  
 8   artist_genres       5221 non-null   object 
 9   album_id            8582 non-null   object 
 10  album_name          8582 non-null   object 
 11  album_release_date  8582 non-null   object 
 12  album_total_tracks  8582 non-null   int64  
 13  album_type          8582 non-null   object 
 14  track_duration_min  8582 non-null   float64
dtypes: bool(1), float64(1), int64(5), object(8)
memory usag

## **Esquemas de Color**

In [5]:
# Colores Monocromáticos
monocromaticos = ["#004f00", "#086c19", "#118a30", "#19a948",
                  "#3cc364", "#65d783", "#88eba2", "#a9ffc2"]

# Colores Complementarios
complementarios = ["#1DB954", "#B91D82"]

# Colores Triádicos
triadicos = ["#1db954", "#541db9", "#b9541d"]

## **Gráficos**

Gráfico 1: Top 10 Generos por Artista

In [57]:
top_generos = df["artist_genres"].value_counts().head(10)
title1="Top 10 Géneros Musicales"
fig1 = px.bar(top_generos, title=title1,
    color_discrete_sequence=triadicos)

fig1.show()

Gráfico 2: Top 5 artistas con mas canciones

In [58]:
grafico2_top = df["artist_name"].value_counts().head(10)
title2= "Top 10 Artistas con Más Canciones en el DataSet"
fig2 = px.bar(grafico2_top, title=title2,
    color_discrete_sequence=monocromaticos)

fig2.update_layout(showlegend=False)
fig2.show()

Gráfico 3: Tipo de Album

In [59]:
title3="Cantidad de Canciones por tipo de álbum (sencillo, album, complicación)"
fig3 = px.bar(df["album_type"].value_counts(), title=title3,
    color_discrete_sequence=complementarios)

fig3.update_layout(showlegend=False)
fig3.show()

Gráfica 4: Top 15 Años con más canciones

In [60]:
df["album_release_date"] #como se aprecia, hay que convertir esta fecha a datetime

0       2025-10-31
1       2025-10-31
2       2025-10-31
3       2025-10-31
4       2025-10-30
           ...    
8577    1959-06-30
8578    1959-06-30
8579    1959-02-11
8580    1958-01-01
8581    1952-09-12
Name: album_release_date, Length: 8582, dtype: object

In [54]:
df["año"] = pd.to_datetime(df.album_release_date).dt.year

top_years = df["año"].value_counts().head(15).reset_index().sort_values(by='año')
title4="Años con más canciones" 
fig4 = px.bar(
    top_years,
    x='año',
    y='count',
    title=title4,
    color='año',
    color_continuous_scale=monocromaticos)
fig4.update_layout(showlegend=False) #Quitarle la barra de color de la derecha también

fig4.show()

Gráfica 5: Top 10 Álbumes Más Escuchados por los Usuarios

In [None]:
title5="Top 10 Álbumes Más Escuchados por los Usuarios"
fig5 = px.bar(df["album_name"].value_counts().head(10), title=title5,
    orientation="h", color_discrete_sequence=monocromaticos)

fig5.update_layout(showlegend=False) 
fig5.show()

Gráfica 6: Canciones explicitas vs no explicitas

In [29]:
title6="Canciones Explícitas vs No Explícitas"
fig6 = px.pie(names=df["explicit"].value_counts().index, values=df["explicit"].value_counts().values,
    title=title6,
    color_discrete_sequence=complementarios)

fig6.show()

Gráfico 7

In [28]:
df["month"] = pd.to_datetime(df["album_release_date"]).dt.month

top_months = df["month"].value_counts().sort_index().reset_index()
title7 = "Cantidad de Canciones por Mes de lanzamiento"
fig7 = px.bar(top_months, x='month', y='count', title=title7,
              color="month",
              color_discrete_sequence=triadicos)
fig7.update_layout(showlegend=False)
fig7.show()

## Serialización de las gráficas

Realizamos listas para seleccionar las figuras que sí pasaran al dashboard

In [61]:
import pickle

# Listas con tus gráficas y títulos (en el mismo orden)
figs = [fig1, fig2, fig3, fig4, fig5, fig6, fig7]
titles = [title1, title2, title3, title4, title5, title6, title7]

grafs_dict = {}

for i in range(len(figs)):
    grafs_dict[f"graf{i+1}"] = {
        "title": titles[i],
        "figure": figs[i]
    }

# Guardarlo en pickle
with open("graficas.pkl", "wb") as f:
    pickle.dump(grafs_dict, f)
