# Análisis Histórico de TiempoCheck
Este notebook analiza los datos de navegación exportados desde TiempoCheck.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Cargar el dataset exportado
df = pd.read_csv('../ml/dataset/dataset_usuario_1.csv')
df.head()


## Distribución de tiempo por categoría

In [None]:
categoria_agrupada = df.groupby('categoria')['tiempo_minutos'].sum().sort_values(ascending=False)
categoria_agrupada.plot(kind='bar', title='Tiempo total por categoría', figsize=(10,5), color='skyblue')
plt.ylabel("Minutos")
plt.xticks(rotation=45)
plt.grid(axis='y')
plt.tight_layout()
plt.show()


## Análisis por hora del día

In [None]:
# Convertimos la hora de string a entero (solo hora sin minutos)
df['hora_num'] = pd.to_datetime(df['hora'], format='%H:%M').dt.hour
hora_agrupada = df.groupby('hora_num')['tiempo_minutos'].sum()
hora_agrupada.plot(kind='line', title='Actividad por hora del día', marker='o', figsize=(10,5))
plt.xlabel("Hora del día")
plt.ylabel("Minutos")
plt.grid(True)
plt.xticks(range(0, 24))
plt.tight_layout()
plt.show()


## Días más activos

In [None]:
df['fecha'] = pd.to_datetime(df['fecha'])
fecha_agrupada = df.groupby(df['fecha'].dt.date)['tiempo_minutos'].sum()
fecha_agrupada.plot(kind='bar', title='Tiempo total por día', figsize=(12,5), color='orange')
plt.ylabel("Minutos")
plt.xticks(rotation=45)
plt.grid(axis='y')
plt.tight_layout()
plt.show()


##  Observaciones y próximos pasos


- ¿A qué hora es más activo el usuario?
- ¿Qué categoría domina su día?
- ¿Hay días en los que no hay datos?
- Este análisis será la base para notificaciones inteligentes y entrenar IA futura.
