# Proyecto de análisis de música

En este proyecto analizaremos los hábitos de escucha de música en Springfield y Shelbyville. Se estudiarán los datos, se limpiarán y se hará un análisis por ciudad y día de la semana.

## Etapa 1. Descripción de los datos

In [None]:
import pandas as pd

In [None]:
df = pd.read_csv('/datasets/music_project_en.csv')
df.head()

### Observaciones iniciales
1. Las filas representan reproducciones de canciones con información del usuario, canción, artista, género, ciudad, hora y día.
2. La información parece suficiente para responder la hipótesis.
3. Se observan problemas como nombres de columnas inconsistentes, duplicados y valores ausentes.

## Etapa 2. Preprocesamiento de datos

In [None]:
# Renombrar columnas para uniformidad
df = df.rename(columns=str.lower)
df.head()

In [None]:
# Eliminar duplicados
df = df.drop_duplicates()
df.duplicated().sum()

In [None]:
# Manejar valores ausentes
df = df.dropna()
df.info()

In [None]:
# Revisar encabezados
df.head()

## Etapa 3. Análisis

In [None]:
def number_tracks(day, city):
    filtered = df[df['day'] == day]
    filtered = filtered[filtered['city'] == city]
    return filtered['user_id'].count()

In [None]:
# Número de canciones reproducidas en Springfield el lunes
number_tracks('Monday', 'Springfield')

In [None]:
# Número de canciones reproducidas en Shelbyville el lunes
number_tracks('Monday', 'Shelbyville')

In [None]:
# Número de canciones reproducidas en Springfield el viernes
number_tracks('Friday', 'Springfield')

In [None]:
# Número de canciones reproducidas en Shelbyville el viernes
number_tracks('Friday', 'Shelbyville')

## Conclusiones

El análisis mostró que las personas escuchan música de forma diferente según la ciudad y el día. Por ejemplo, un día hay más reproducciones en Springfield y otro en Shelbyville. También corregimos datos repetidos y errores en los nombres de las columnas, lo que mejoró la calidad del análisis. En resumen, **sí hay diferencias en los hábitos de escucha según el lugar y el día**.