# üìä An√°lisis de Datos de Estaciones de Carga El√©ctrica - Oasis

## Resumen Ejecutivo para Presentaci√≥n

Este notebook presenta un an√°lisis completo de los datos de transacciones en estaciones de carga el√©ctrica, con visualizaciones dise√±adas para apoyar la toma de decisiones estrat√©gicas y operativas.

---

**Fecha:** Noviembre 2025  
**Autor:** An√°lisis de Datos Oasis  
**Objetivo:** Proporcionar insights accionables para optimizar operaciones y maximizar rentabilidad

## üìã Configuraci√≥n Inicial

In [2]:
# Importar librer√≠as necesarias
import pandas as pd
import sys
import os
import warnings
warnings.filterwarnings('ignore')

# Configurar rutas
current_dir = os.path.abspath('.')
if current_dir not in sys.path:
    sys.path.insert(0, current_dir)

# Agregar el directorio de gr√°ficos al path
graficos_dir = os.path.join(current_dir, 'graficos')
if graficos_dir not in sys.path:
    sys.path.insert(0, graficos_dir)

# Importar m√≥dulos de gr√°ficos
try:
    from graficos import grafico_01_barras_estaciones as g01
    from graficos import grafico_02_distribucion_usuarios as g02
    from graficos import grafico_03_segmentacion_rfm as g03
    from graficos import grafico_04_clv_segmentos as g04
    from graficos import grafico_05_ingresos_mensuales as g05
    from graficos import grafico_06_patrones_horarios as g06
    from graficos import grafico_07_heatmap_uso as g07
    from graficos import grafico_08_top_estaciones as g08
    from graficos import grafico_09_comparacion_t1_t2 as g09
    from graficos import grafico_10_energia_estaciones as g10
    from graficos import grafico_11_retencion_usuarios as g11
    from utils import cargar_datos
    print("‚úÖ M√≥dulos importados correctamente")
except Exception as e:
    print(f"‚ö†Ô∏è Error al importar m√≥dulos: {e}")
    print("Intentando cargar datos directamente...")
    from utils import cargar_datos

# Cargar datos
try:
    df = cargar_datos('data/df_oasis_clean.csv')
    # Normalizar columna de ingresos si no existe
    if 'ingresos_cop' not in df.columns:
        if 'amount_transaction_cop' in df.columns:
            df['ingresos_cop'] = df['amount_transaction_cop']
        elif 'amount_transaction' in df.columns:
            df['ingresos_cop'] = df['amount_transaction'] / 100
    
    # Normalizar columna de fechas
    if 'start_date_time' in df.columns:
        df['start_date_time'] = pd.to_datetime(df['start_date_time'], errors='coerce')
    
    print(f"‚úÖ Datos cargados: {len(df):,} transacciones")
    print(f"üìÖ Per√≠odo: {df['start_date_time'].min()} a {df['start_date_time'].max()}")
except Exception as e:
    print(f"‚ùå Error al cargar datos: {e}")

‚úÖ M√≥dulos importados correctamente
‚úì Datos cargados: 8,739 registros
‚úÖ Datos cargados: 8,739 transacciones
üìÖ Per√≠odo: 2025-01-01 18:01:27 a 2025-10-01 01:41:21


---

# 1Ô∏è‚É£ Transacciones por Estaci√≥n

## üéØ ¬øPara qu√© sirve este gr√°fico?

Identifica **cu√°les estaciones tienen mayor actividad** al mostrar el n√∫mero de transacciones realizadas en cada punto de carga.

## üíº Valor Empresarial

- **Optimizaci√≥n de Recursos**: Permite identificar estaciones con alto tr√°fico que pueden necesitar m√°s capacidad o mantenimiento preventivo
- **Planificaci√≥n de Inversi√≥n**: Ayuda a decidir d√≥nde instalar nuevas estaciones bas√°ndose en patrones de demanda existentes
- **Detecci√≥n de Problemas**: Identifica estaciones con bajo uso que pueden tener problemas t√©cnicos o de ubicaci√≥n
- **Balance de Red**: Facilita la redistribuci√≥n de recursos entre estaciones para optimizar la experiencia del usuario

## üìà Visualizaci√≥n

In [3]:
fig1 = g01.crear_grafico(df)
fig1.show()

---

# 2Ô∏è‚É£ Distribuci√≥n de Usuarios por Frecuencia

## üéØ ¬øPara qu√© sirve este gr√°fico?

Segmenta a los usuarios seg√∫n su **frecuencia de uso**: usuarios de una sola transacci√≥n, uso ocasional (2-5), uso regular (6-10) y uso frecuente (11+).

## üíº Valor Empresarial

- **Estrategias de Retenci√≥n**: Identifica el porcentaje de usuarios "one-time" para crear programas de fidelizaci√≥n
- **Dise√±o de Membres√≠as**: Permite crear planes diferenciados seg√∫n patrones de uso (prepago, suscripciones, etc.)
- **An√°lisis de Churn**: Detecta usuarios en riesgo de abandono para implementar acciones correctivas
- **Proyecci√≥n de Ingresos**: Ayuda a estimar ingresos recurrentes vs. espor√°dicos
- **Marketing Segmentado**: Facilita campa√±as personalizadas por nivel de uso

## üìà Visualizaci√≥n

In [8]:
df_dist = g02.preparar_distribucion_usuarios(df)
fig2 = g02.crear_grafico(df)  # El gr√°fico espera el df original, no el preparado
fig2.show()

---

# 3Ô∏è‚É£ Segmentaci√≥n RFM de Clientes

## üéØ ¬øPara qu√© sirve este gr√°fico?

Clasifica usuarios usando el modelo **RFM** (Recency, Frequency, Monetary):
- **VIP**: Usuarios recientes, frecuentes y de alto valor
- **Leales**: Usuarios consistentes con buen valor
- **Potenciales**: Usuarios con margen de crecimiento
- **En riesgo**: Usuarios que requieren atenci√≥n inmediata

## üíº Valor Empresarial

- **Priorizaci√≥n de Recursos**: Concentra esfuerzos en segmentos de mayor impacto
- **Personalizaci√≥n de Servicios**: Crea experiencias diferenciadas por segmento (VIP lounge, descuentos, prioridad)
- **Prevenci√≥n de Churn**: Identifica usuarios "en riesgo" antes de perderlos
- **Upselling/Cross-selling**: Desarrolla estrategias para convertir "Potenciales" en "VIP"
- **ROI de Marketing**: Optimiza inversi√≥n publicitaria seg√∫n el valor del segmento

## üìà Visualizaci√≥n

In [13]:
df_rfm = g03.calcular_rfm(df)
fig3 = g03.crear_grafico_2d(df_rfm)  # Funci√≥n correcta
fig3.show()

---

# 4Ô∏è‚É£ Valor del Cliente por Segmento (CLV)

## üéØ ¬øPara qu√© sirve este gr√°fico?

Muestra el **Customer Lifetime Value (CLV) promedio** por segmento RFM, indicando cu√°nto ingreso genera cada tipo de cliente.

## üíº Valor Empresarial

- **C√°lculo de ROI**: Determina cu√°nto invertir en adquisici√≥n y retenci√≥n por segmento
- **Priorizaci√≥n de Inversi√≥n**: Justifica presupuestos mayores para segmentos de alto CLV
- **Estrategia de Precios**: Dise√±a planes premium para usuarios VIP que generan m√°s valor
- **Proyecciones Financieras**: Estima ingresos futuros bas√°ndose en la composici√≥n de la base de clientes
- **Benchmarking**: Compara el valor generado por diferentes segmentos para identificar oportunidades

## üìà Visualizaci√≥n

In [6]:
fig4 = g04.crear_grafico(df)
fig4.show()


===== CLV POR SEGMENTO (COP) =====
       segment  usuarios  ingreso_total  ingreso_promedio
3          VIP       367    105668048.0     287923.836512
1       Leales       388     33849274.0      87240.396907
2  Potenciales       795     20223679.0      25438.589937
0    En riesgo       562      6650259.0      11833.201068



---

# 5Ô∏è‚É£ Evoluci√≥n de Ingresos Mensuales

## üéØ ¬øPara qu√© sirve este gr√°fico?

Visualiza la **tendencia de ingresos mes a mes** para identificar patrones de crecimiento, estacionalidad y anomal√≠as.

## üíº Valor Empresarial

- **Planificaci√≥n Financiera**: Proyecta ingresos futuros bas√°ndose en tendencias hist√≥ricas
- **Detecci√≥n de Estacionalidad**: Identifica meses pico y bajos para ajustar inventario y recursos
- **Evaluaci√≥n de Campa√±as**: Mide el impacto de promociones y estrategias de marketing
- **Alertas Tempranas**: Detecta ca√≠das inesperadas que requieren investigaci√≥n inmediata
- **Comunicaci√≥n con Stakeholders**: Demuestra crecimiento y salud financiera del negocio

## üìà Visualizaci√≥n

In [7]:
fig5 = g05.crear_grafico(df)
fig5.show()

---

# 6Ô∏è‚É£ Patrones de Uso Horario

## üéØ ¬øPara qu√© sirve este gr√°fico?

Identifica las **horas del d√≠a con mayor demanda** de servicios de carga.

## üíº Valor Empresarial

- **Optimizaci√≥n de Tarifas**: Implementa precios din√°micos (surge pricing) en horas pico
- **Gesti√≥n de Personal**: Asigna recursos humanos seg√∫n demanda real por horario
- **Planificaci√≥n de Mantenimiento**: Programa mantenimientos en horas de baja demanda
- **Gesti√≥n Energ√©tica**: Negocia mejores tarifas el√©ctricas bas√°ndose en patrones de consumo
- **Campa√±as de Incentivos**: Ofrece descuentos en horas valle para balancear la demanda

## üìà Visualizaci√≥n

In [10]:
df_temporal = g06.preparar_datos_temporales(df)
matriz = g06.crear_matriz_heatmap(df_temporal)
fig6 = g06.crear_grafico(df_temporal, matriz)
fig6.show()

---

# 7Ô∏è‚É£ Mapa de Calor: Uso por Estaci√≥n y Tiempo

## üéØ ¬øPara qu√© sirve este gr√°fico?

Visualiza patrones de uso **combinando estaci√≥n y tiempo** mediante un heatmap que muestra concentraciones de actividad.

## üíº Valor Empresarial

- **Expansi√≥n Estrat√©gica**: Identifica zonas geogr√°ficas y horarios con demanda insatisfecha
- **Redistribuci√≥n de Capacidad**: Mueve recursos de estaciones subutilizadas a zonas de alta demanda
- **Partnerships Estrat√©gicos**: Identifica ubicaciones para alianzas con comercios cercanos
- **An√°lisis Competitivo**: Compara performance entre estaciones para identificar mejores pr√°cticas
- **Customer Experience**: Reduce tiempos de espera balanceando carga entre estaciones

## üìà Visualizaci√≥n

In [19]:
# Crear heatmap de uso por estaci√≥n y hora del d√≠a
df_heatmap = df.copy()
df_heatmap['hora'] = df_heatmap['start_date_time'].dt.hour
df_heatmap['dia_semana'] = df_heatmap['start_date_time'].dt.dayofweek

# Crear matriz de transacciones por estaci√≥n y hora
top_estaciones = df['evse_uid'].value_counts().head(10).index.tolist()
df_heatmap_top = df_heatmap[df_heatmap['evse_uid'].isin(top_estaciones)]

matriz_estacion_hora = df_heatmap_top.pivot_table(
    index='evse_uid',
    columns='hora',
    values='id',
    aggfunc='count',
    fill_value=0
)

import plotly.graph_objects as go

fig7 = go.Figure(data=go.Heatmap(
    z=matriz_estacion_hora.values,
    x=[f'{h}:00' for h in matriz_estacion_hora.columns],
    y=matriz_estacion_hora.index,
    colorscale='YlOrRd',
    hovertemplate='Estaci√≥n: %{y}<br>Hora: %{x}<br>Transacciones: %{z}<extra></extra>'
))

fig7.update_layout(
    title='Mapa de Calor: Uso de Estaciones por Hora del D√≠a',
    xaxis_title='Hora del D√≠a',
    yaxis_title='Estaci√≥n',
    height=500,
    template='plotly_white'
)

fig7.show()

---

# 8Ô∏è‚É£ Top Estaciones por Rendimiento

## üéØ ¬øPara qu√© sirve este gr√°fico?

Rankea las **estaciones m√°s exitosas** considerando m√∫ltiples m√©tricas: ingresos, transacciones, usuarios √∫nicos y energ√≠a dispensada.

## üíº Valor Empresarial

- **Best Practices**: Identifica caracter√≠sticas de las estaciones exitosas para replicar
- **Benchmarking Interno**: Establece KPIs basados en el rendimiento de los mejores
- **Decisiones de Cierre**: Eval√∫a si estaciones de bajo rendimiento deben cerrarse o reubicarse
- **Inversi√≥n Priorizada**: Concentra mejoras en estaciones que ya demuestran alto potencial
- **Negociaciones Comerciales**: Usa datos de top performers para atraer inversores y partners

## üìà Visualizaci√≥n

In [15]:
# Top estaciones por rendimiento
metricas = g08.calcular_metricas_estaciones(df)
fig8 = g08.figura_barras_top(metricas, top_n=15)
fig8.show()

---

# 9Ô∏è‚É£ Comparaci√≥n: Conectores Tipo 1 vs Tipo 2

## üéØ ¬øPara qu√© sirve este gr√°fico?

Compara el rendimiento de **diferentes tipos de conectores** en t√©rminos de uso, ingresos, energ√≠a y preferencia de usuarios.

## üíº Valor Empresarial

- **Decisiones de Inventario**: Determina qu√© tipo de cargadores comprar para nuevas instalaciones
- **Estandarizaci√≥n**: Eval√∫a si conviene estandarizar en un solo tipo de conector
- **Pricing Diferenciado**: Ajusta precios seg√∫n demanda y caracter√≠sticas de cada tipo
- **Predicci√≥n de Demanda**: Anticipa necesidades bas√°ndose en tendencias de adopci√≥n de veh√≠culos
- **Ventaja Competitiva**: Ofrece el mix correcto de conectores para atraer m√°s clientes

## üìà Visualizaci√≥n

In [16]:
# Comparaci√≥n Tipo 1 vs Tipo 2
# Verificar si hay datos de conectores
if 'connector_id' in df.columns:
    # Preparar datos por tipo
    df_tipos = df.copy()
    df_tipos['tipo_conector'] = df_tipos['connector_id'].apply(lambda x: f'Tipo {x}' if pd.notna(x) else 'Sin Tipo')
    
    # Calcular m√©tricas por tipo
    metricas_tipos = df_tipos.groupby('tipo_conector').agg({
        'id': 'count',
        'user_id': 'nunique',
        'energy_kwh': 'sum',
        'ingresos_cop': 'sum'
    }).reset_index()
    metricas_tipos.columns = ['tipo_conector', 'transacciones', 'usuarios', 'energia_kwh', 'ingresos']
    
    # Crear gr√°fico de barras comparativo
    import plotly.graph_objects as go
    from plotly.subplots import make_subplots
    
    fig9 = make_subplots(
        rows=2, cols=2,
        subplot_titles=('Transacciones', 'Usuarios √önicos', 'Energ√≠a (kWh)', 'Ingresos (COP)'),
        specs=[[{'type': 'bar'}, {'type': 'bar'}],
               [{'type': 'bar'}, {'type': 'bar'}]]
    )
    
    colores = ['#1f77b4', '#ff7f0e', '#2ca02c']
    
    fig9.add_trace(go.Bar(x=metricas_tipos['tipo_conector'], y=metricas_tipos['transacciones'],
                          marker_color=colores, showlegend=False), row=1, col=1)
    fig9.add_trace(go.Bar(x=metricas_tipos['tipo_conector'], y=metricas_tipos['usuarios'],
                          marker_color=colores, showlegend=False), row=1, col=2)
    fig9.add_trace(go.Bar(x=metricas_tipos['tipo_conector'], y=metricas_tipos['energia_kwh'],
                          marker_color=colores, showlegend=False), row=2, col=1)
    fig9.add_trace(go.Bar(x=metricas_tipos['tipo_conector'], y=metricas_tipos['ingresos'],
                          marker_color=colores, showlegend=False), row=2, col=2)
    
    fig9.update_layout(height=600, title_text="Comparaci√≥n de Conectores por Tipo", showlegend=False)
    fig9.show()
else:
    print("‚ö†Ô∏è No hay datos de tipos de conectores disponibles")

---

# üîü Eficiencia Energ√©tica por Estaci√≥n

## üéØ ¬øPara qu√© sirve este gr√°fico?

Analiza la **eficiencia en el uso de energ√≠a** por estaci√≥n, mostrando kWh dispensados, eficiencia por transacci√≥n y relaci√≥n costo-energ√≠a.

## üíº Valor Empresarial

- **Reducci√≥n de Costos**: Identifica estaciones con p√©rdidas energ√©ticas para mantenimiento correctivo
- **Pricing Inteligente**: Ajusta tarifas bas√°ndose en costos energ√©ticos reales por estaci√≥n
- **Sostenibilidad**: Demuestra eficiencia energ√©tica para reportes ESG y certificaciones
- **Mantenimiento Predictivo**: Detecta degradaci√≥n de equipos mediante an√°lisis de eficiencia
- **Negociaci√≥n con Proveedores**: Usa datos de consumo para negociar mejores tarifas el√©ctricas

## üìà Visualizaci√≥n

In [17]:
# Eficiencia energ√©tica por estaci√≥n
metricas_energia = df.groupby('evse_uid').agg({
    'energy_kwh': 'sum',
    'id': 'count',
    'ingresos_cop': 'sum'
}).reset_index()
metricas_energia.columns = ['evse_uid', 'energia_total_kwh', 'transacciones', 'ingresos_total']
metricas_energia['kwh_por_tx'] = metricas_energia['energia_total_kwh'] / metricas_energia['transacciones']
metricas_energia['cop_por_kwh'] = metricas_energia['ingresos_total'] / metricas_energia['energia_total_kwh']
metricas_energia = metricas_energia.sort_values('energia_total_kwh', ascending=False).head(15)

import plotly.graph_objects as go
from plotly.subplots import make_subplots

fig10 = make_subplots(
    rows=1, cols=2,
    subplot_titles=('Energ√≠a Total por Estaci√≥n (kWh)', 'Eficiencia (kWh por Transacci√≥n)'),
    specs=[[{'type': 'bar'}, {'type': 'bar'}]]
)

fig10.add_trace(go.Bar(
    x=metricas_energia['evse_uid'], 
    y=metricas_energia['energia_total_kwh'],
    marker_color='lightgreen',
    showlegend=False
), row=1, col=1)

fig10.add_trace(go.Bar(
    x=metricas_energia['evse_uid'], 
    y=metricas_energia['kwh_por_tx'],
    marker_color='orange',
    showlegend=False
), row=1, col=2)

fig10.update_xaxes(tickangle=45)
fig10.update_layout(height=500, title_text="An√°lisis de Eficiencia Energ√©tica")
fig10.show()

---

# 1Ô∏è‚É£1Ô∏è‚É£ Retenci√≥n de Usuarios (An√°lisis de Cohortes)

## üéØ ¬øPara qu√© sirve este gr√°fico?

Mide la **retenci√≥n de usuarios a lo largo del tiempo** mediante an√°lisis de cohortes mensuales, mostrando qu√© porcentaje de usuarios regresa despu√©s de su primera transacci√≥n.

## üíº Valor Empresarial

- **Medici√≥n de Lealtad**: Cuantifica la efectividad de estrategias de retenci√≥n
- **C√°lculo de LTV**: Mejora proyecciones de valor de vida del cliente bas√°ndose en retenci√≥n real
- **Identificaci√≥n de Problemas**: Detecta ca√≠das de retenci√≥n que indican problemas de servicio
- **ROI de Onboarding**: Eval√∫a si los esfuerzos de bienvenida convierten usuarios en clientes recurrentes
- **Benchmark Temporal**: Compara cohortes para identificar qu√© per√≠odos tuvieron mejor onboarding
- **Estrategia de Crecimiento**: Balancea inversi√≥n entre adquisici√≥n y retenci√≥n seg√∫n datos reales

## üìà Visualizaci√≥n

In [18]:
# Retenci√≥n de usuarios (an√°lisis de cohortes)
# Calcular primera y √∫ltima transacci√≥n por usuario
user_activity = df.groupby('user_id').agg({
    'start_date_time': ['min', 'max', 'count']
}).reset_index()
user_activity.columns = ['user_id', 'primera_tx', 'ultima_tx', 'total_tx']
user_activity['cohorte'] = user_activity['primera_tx'].dt.to_period('M')

# Calcular retenci√≥n
cohortes = user_activity.groupby('cohorte').size().reset_index(name='usuarios_nuevos')
usuarios_repetidores = user_activity[user_activity['total_tx'] > 1].groupby('cohorte').size().reset_index(name='usuarios_repetidores')
cohortes = cohortes.merge(usuarios_repetidores, on='cohorte', how='left').fillna(0)
cohortes['tasa_retencion'] = (cohortes['usuarios_repetidores'] / cohortes['usuarios_nuevos'] * 100).round(1)
cohortes['cohorte_str'] = cohortes['cohorte'].astype(str)

import plotly.graph_objects as go
from plotly.subplots import make_subplots

fig11 = make_subplots(
    rows=1, cols=2,
    subplot_titles=('Usuarios Nuevos por Cohorte', 'Tasa de Retenci√≥n (%)'),
    specs=[[{'type': 'bar'}, {'type': 'bar'}]]
)

fig11.add_trace(go.Bar(
    x=cohortes['cohorte_str'], 
    y=cohortes['usuarios_nuevos'],
    marker_color='skyblue',
    showlegend=False,
    text=cohortes['usuarios_nuevos'],
    textposition='outside'
), row=1, col=1)

fig11.add_trace(go.Bar(
    x=cohortes['cohorte_str'], 
    y=cohortes['tasa_retencion'],
    marker_color='coral',
    showlegend=False,
    text=cohortes['tasa_retencion'].apply(lambda x: f'{x}%'),
    textposition='outside'
), row=1, col=2)

fig11.update_xaxes(tickangle=45)
fig11.update_layout(height=500, title_text="An√°lisis de Retenci√≥n de Usuarios por Cohortes")
fig11.show()

print(f"\nüìä Resumen de Retenci√≥n:")
print(f"   ‚Ä¢ Tasa de retenci√≥n promedio: {cohortes['tasa_retencion'].mean():.1f}%")
print(f"   ‚Ä¢ Total usuarios nuevos: {cohortes['usuarios_nuevos'].sum():.0f}")
print(f"   ‚Ä¢ Total usuarios que repiten: {cohortes['usuarios_repetidores'].sum():.0f}")


üìä Resumen de Retenci√≥n:
   ‚Ä¢ Tasa de retenci√≥n promedio: 56.0%
   ‚Ä¢ Total usuarios nuevos: 2112
   ‚Ä¢ Total usuarios que repiten: 1144


---

# üéØ Conclusiones y Recomendaciones

## Hallazgos Clave

1. **Concentraci√≥n de Demanda**: Las estaciones top generan una porci√≥n desproporcionada de ingresos
2. **Oportunidad de Retenci√≥n**: Alto porcentaje de usuarios one-time representa oportunidad de mejora
3. **Patrones Temporales**: Existe clara concentraci√≥n de uso en horarios espec√≠ficos
4. **Segmentaci√≥n Clara**: Los usuarios VIP y Leales generan significativamente m√°s valor

## Acciones Recomendadas

### Corto Plazo (0-3 meses)
- Implementar programa de fidelizaci√≥n para reducir usuarios one-time
- Ajustar tarifas en horas pico para optimizar ingresos
- Realizar mantenimiento preventivo en top estaciones

### Mediano Plazo (3-6 meses)
- Expandir capacidad en estaciones de alta demanda
- Desarrollar estrategias espec√≠ficas por segmento RFM
- Implementar precios din√°micos basados en demanda

### Largo Plazo (6-12 meses)
- Planificar nuevas ubicaciones basadas en an√°lisis de demanda
- Estandarizar tipos de conectores seg√∫n preferencias del mercado
- Desarrollar modelos predictivos de demanda y churn

---

## üìû Pr√≥ximos Pasos

Este an√°lisis proporciona la base para decisiones data-driven. Se recomienda:
- Actualizar dashboards mensualmente
- Establecer KPIs basados en estos gr√°ficos
- Implementar sistema de alertas para m√©tricas cr√≠ticas
- Realizar A/B testing de estrategias propuestas

---

**¬°Gracias por su atenci√≥n!**