In [1]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import folium
import os

# Asegurar que existe el directorio de reportes
os.makedirs('../reportes', exist_ok=True)

# Cargar datos con mejor manejo de errores
try:
    df = pd.read_csv('../data/nyc_taxi_clean.csv')
    print("✅ Datos cargados exitosamente")
    print(f"Número de registros: {len(df)}")
except FileNotFoundError:
    print("❌ Error: No se encontró el archivo '../data/nyc_taxi_clean.csv'")
    raise
except Exception as e:
    print(f"❌ Error al leer el archivo: {str(e)}")
    raise

# Mapa de calor de pickups
print("\nCreando mapa de calor...")
m = folium.Map(location=[40.7128, -74.0060], zoom_start=12)
heat_data = [[row['pickup_latitude'], row['pickup_longitude']] for index, row in df.head(500).iterrows()]
from folium.plugins import HeatMap
HeatMap(heat_data).add_to(m)
m.save('../reportes/heatmap.html')
print("✅ Mapa de calor guardado en '../reportes/heatmap.html'")

# Distribución de horas de los viajes
print("\nCreando gráfico de distribución por hora...")
plt.figure(figsize=(10, 6))
sns.histplot(data=df, x='hour', bins=24)
plt.title("Demanda de taxis por hora")
plt.xlabel("Hora del día")
plt.ylabel("Cantidad de viajes")
plt.savefig('../reportes/distribucion_horas.png')
plt.close()
print("✅ Gráfico guardado en '../reportes/distribucion_horas.png'")

✅ Datos cargados exitosamente
Número de registros: 1456391

Creando mapa de calor...
✅ Mapa de calor guardado en '../reportes/heatmap.html'

Creando gráfico de distribución por hora...
✅ Gráfico guardado en '../reportes/distribucion_horas.png'
✅ Gráfico guardado en '../reportes/distribucion_horas.png'
