In [1]:
import pandas as pd
import altair as alt

In [22]:
# Cargar dataset de Spotify
df = pd.read_csv('/content/spotify.csv')

# Vista rápida de columnas
print(df.columns)

Index(['Date', 'Shape of You', 'Despacito', 'Something Just Like This',
       'HUMBLE.', 'Unforgettable'],
      dtype='object')


In [23]:
df.head()

Unnamed: 0,Date,Shape of You,Despacito,Something Just Like This,HUMBLE.,Unforgettable
0,2017-01-06,12287078,,,,
1,2017-01-07,13190270,,,,
2,2017-01-08,13099919,,,,
3,2017-01-09,14506351,,,,
4,2017-01-10,14275628,,,,


In [14]:
# Paleta de colores Spotify
spotify_palette = ["#1DB954", "#1ED760", "#191414", "#E9E3E3", "#D7DAE5"]

In [24]:
# GRÁFICA 1: Top 5 canciones más populares
# Calcular el total de reproducciones para cada canción para determinar la popularidad
# Excluir la columna 'Date' y sumar las reproducciones de cada canción
song_streams = df.drop('Date', axis=1).sum().reset_index()
song_streams.columns = ['song_name', 'total_streams']

# Obtener las 5 canciones principales por el total de reproducciones
top10_songs = song_streams.sort_values('total_streams', ascending=False).head(10)

chart1 = alt.Chart(top10_songs).mark_bar().encode(
    x=alt.X('song_name:N', sort='-y', title='Canción'),
    y=alt.Y('total_streams:Q', title='Total de Reproducciones'), # Etiqueta cambiada a 'Total de Reproducciones'
    color=alt.Color('song_name:N', scale=alt.Scale(range=spotify_palette)),
    tooltip=['song_name', 'total_streams'] # Tooltip actualizado para reflejar los nuevos datos
).properties(
    width=650,
    height=400,
    title='Top 5 Canciones Más Populares en Spotify (por Total de Reproducciones)' # Título clarificado
).configure_title(
    fontSize=16,
    anchor='start'
).configure_axis(
    labelFontSize=11,
    titleFontSize=13
)
chart1

In [25]:
# GRÁFICA 2: Relación entre dos canciones (ejemplo debido a datos disponibles)

chart2 = alt.Chart(df).mark_circle(size=70).encode(
    x=alt.X('Shape of You:Q', title='Reproducciones de Shape of You'),
    y=alt.Y('Despacito:Q', title='Reproducciones de Despacito'),
    color=alt.Color('Shape of You:Q', scale=alt.Scale(range=spotify_palette)),
    tooltip=['Date', 'Shape of You', 'Despacito']
).properties(
    width=650,
    height=400,
    title='Relación de Reproducciones entre Shape of You y Despacito'
)

chart2

In [26]:
# Transformar los datos a formato largo para facilitar las gráficas
# Esto crea una columna 'Canción' y una columna 'Reproducciones'
df_long = df.melt(id_vars=['Date'], var_name='Canción', value_name='Reproducciones')

df_long['Date'] = pd.to_datetime(df_long['Date'])

In [27]:
# GRÁFICA 3: Serie de tiempo de las reproducciones diarias
chart3 = alt.Chart(df_long).mark_line().encode(
    x=alt.X('Date:T', title='Fecha'),
    y=alt.Y('Reproducciones:Q', title='Reproducciones Diarias'),
    color=alt.Color('Canción:N', scale=alt.Scale(range=spotify_palette), title='Canción'),
    tooltip=['Date', 'Canción', 'Reproducciones']
).properties(
    width=650,
    height=400,
    title='Evolución Diaria de Reproducciones por Canción'
).interactive()  # Permite hacer zoom y movernos en la gráfica

chart3

In [28]:
# GRÁFICA 4: Gráfico de Áreas Apiladas
# Muestra cómo contribuye cada canción al volumen total de reproducciones en el tiempo

chart4 = alt.Chart(df_long).mark_area().encode(
    x=alt.X('Date:T', title='Fecha'),
    y=alt.Y('Reproducciones:Q', title='Reproducciones Acumuladas'),
    color=alt.Color('Canción:N', scale=alt.Scale(range=spotify_palette), title='Canción'),
    tooltip=['Date', 'Canción', 'Reproducciones']
).properties(
    width=650,
    height=400,
    title='Contribución Diaria de cada Canción al Total de Reproducciones'
).interactive()

chart4