# <center><font size="8">Prototipo de Oferta Dinámica Personalizada</font></center>

<div align="left"><font size="5">📌 Introducción</font></div>

## 1. Contexto y Objetivos

El presente proyecto se enfoca en el desarrollo de un sistema avanzado de **Oferta Dinámica (Dynamic Pricing)** con el objetivo primordial de **optimizar los ingresos y la rentabilidad** a través de la **personalización de tarifas**.  

En lugar de utilizar modelos de precio estáticos o ajustes basados únicamente en la demanda global, nuestro prototipo se cimenta en el **análisis individual del consumidor** para determinar el precio óptimo en tiempo real.  

Para lograr esta personalización, hemos diseñado un **pipeline de Machine Learning** que combina técnicas de **econometría**, **aprendizaje no supervisado** y **modelos predictivos**.

---

## 2. Metodología y Arquitectura del Modelo

La propuesta metodológica se basa en **tres fases interconectadas**, que transforman la sensibilidad del cliente en una tarifa personalizada:

---

### A. Estimación y Segmentación por Elasticidad (Fundamento Económico)

El primer pilar del prototipo fue la **estimación rigurosa de la elasticidad precio de la demanda ($\text{EPD}$)**.  
Esta métrica ha sido fundamental para entender el grado de respuesta de la cantidad demandada ante variaciones de precio en nuestros datos históricos.

Posteriormente, aplicamos un **algoritmo de clustering** (*aprendizaje no supervisado*) para **clasificar a los clientes** basándonos en su $\text{EPD}$ y otras características de comportamiento.  

Este *clustering* nos permitió crear **segmentos de clientes bien definidos** (por ejemplo: *“Extremadamente Elásticos”*, *“Inelásticos”*), estableciendo un **rango de ajuste de precios** (aumento o decremento) específico para cada grupo.

---

### B. Clasificación de Clientes Nuevos (Motor de XGBoost)

Una vez establecidos los segmentos de elasticidad, desarrollamos un **clasificador basado en el algoritmo XGBoost (eXtreme Gradient Boosting)**.  

La función de este modelo es crucial en la operativa:  
al recibir los datos de un nuevo cliente o una nueva interacción, **XGBoost predice a cuál de las categorías de elasticidad pre-clasificadas pertenece**.  

Esta predicción es el **factor determinante inicial** para estimar la tarifa personalizada, permitiéndonos saber si el sistema debe apuntar a un **aumento**, un **decremento** o un **precio base**.

---

### C. Determinación de la Oferta Dinámica (Red Neuronal)

Finalmente, para la etapa de determinación del precio, implementamos una **red neuronal artificial**.  

Este modelo de aprendizaje profundo **integra las características de la demanda**, la **clasificación de elasticidad obtenida de XGBoost**, y otras **variables dinámicas** (como inventario, hora del día y actividad de la competencia) para **estimar la oferta dinámica final y personalizada**.  

La red neuronal provee la **flexibilidad** y la **capacidad de capturar relaciones no lineales** necesarias para el ajuste preciso del precio a nivel individual.



<div align="left"><font size="5">📌 Objetivos</font></div>


- **1. Estimar la Elasticidad de la Demanda**  
  - Cuantificar la sensibilidad al precio ($\text{EPD}$) de los diferentes segmentos de clientes.  
  - Servirá como fundamento económico para la toma de decisiones de precio.

- **2. Segmentar Clientes por Comportamiento de Precio**  
  - Aplicar técnicas de *clustering para agrupar clientes en categorías de elasticidad homogéneas.  
  - Crear segmentos accionables que definan la estrategia inicial de aumento o decremento de precios.

- **3. Desarrollar un Motor de Clasificación de Clientes**  
  - Implementar y validar el algoritmo XGBoost para clasificar con alta precisión a nuevos clientes.  
  - Integrar la clasificación dentro de los segmentos de elasticidad previamente definidos.

- **4. Integrar un Pipeline Predictivo Completo**  
  - Crear un prototipo pipeline robusto que combine:  
    - **Clustering** (aprendizaje no supervisado)  
    - **Clasificación** (XGBoost)  
    - **Predicción** (Red Neuronal)  
- **5. Generar la tarifa final personalizada con tarifa dinámica**.



# <div align="left"><font size="5">📌 Librerias</font></div>

In [None]:
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
import os

from Tools import Tools4DataExtraction as T4DE
from Tools.Tools4Cluster import ClusteringData
from Tools.Tools4ClasSupervisada import ClusteringSupervisado
from Tools import Tools4TarifPer as T4TP
from Tools import Tools4Net as T4N 
from Tools import Tools4Elasticity as T4E
from Tools import Tools4CaracDemanda as TCD

# <div align="left"><font size="5">📌Extracción de información del modelo de datos</font></div>

In [None]:
# Se extraen los datos del modelo de datos
D4NN, D4C, D4C1, D4GC= T4DE.Get_Data()

In [None]:
TCD.BuenasCaracteristicas(D4GC)

# <div align="left"><font size="5">📌Calculo de la elasticidad</font></div>

La Elasticidad Precio de la Demanda (EPD) mide cómo la cantidad demandada de un producto cambia en respuesta a una variación en su precio. Se calcula como 

$$\epsilon_{Q} = \frac{\Delta Q}{\Delta P}$$

### Clasificación de la Elasticidad de la Demanda según su valor

**Demanda Elástica** ($|EPD| > 1$):  
La cantidad demandada varía en una proporción mayor que el cambio en el precio.  
Un pequeño cambio en el precio provoca un cambio significativo en la cantidad demandada.  
*Ejemplo:* Bienes de lujo o productos con muchos sustitutos disponibles.

---

**Demanda Inelástica** ($|EPD| < 1$):  
La cantidad demandada varía en una proporción menor que el cambio en el precio.  
Un cambio en el precio tiene poco impacto en la cantidad demandada.  
*Ejemplo:* Bienes de primera necesidad o esenciales, como medicamentos o gasolina (a corto plazo).

---

**Elasticidad Unitaria** ($|EPD| = 1$):  
La cantidad demandada varía en la misma proporción que el cambio en el precio.

In [None]:
T4E.MainElas()

# <div align="left"><font size="5">📌Clasificación no supervisada</font></div>

La clasificación de clientes permite entender cómo distintos grupos responden al precio y al servicio, habilitando estrategias de precio personalizado que maximizan ingresos y reducen pérdida de demanda. Se calcula el **precio óptimo** según la respuesta esperada del segmento (elasticidad estimada o probabilidad de compra).

### 🔹 Estrategias diferenciadas
- **Segmento elástico →** precios competitivos o descuentos.  
- **Segmento inelástico →** precios premium o aumentos graduales.  
- **Segmento leal →** estabilidad de precios.

---

## 📊 Beneficios Clave

- 💰 **Maximiza los ingresos** ajustando precios según la disposición a pagar.  
- 📉 **Reduce pérdida de demanda** por aumentos injustificados.  
- 🎯 **Mejora la precisión del modelo**, al trabajar con segmentos más homogéneos.  
- 🧠 **Permite estrategias personalizadas y accionables** según el tipo de cliente.


In [None]:
# 0 es para todos los dias antes de ayer
# -1 es para todos los dias antes de 7 dias desde ayer
# 1 es desde ayer hasta hace un año
Zero= -1
ClusteringData(False,D4C,Zero)

### Estrategia de Precios por *Cluster*

### Ajuste de Precio por Cluster

| Cluster | Estrategia                 | Descripción                                                           |
|:--------:|:--------------------------:|:----------------------------------------------------------------------|
| **3** | **+10% Sobrecosto**        | Clientes urgentes, pagan caro sin promo. Aprovechar elasticidad baja. |
| **1** | **+7.5% Sobrecosto**         | Clientes leales y poco sensibles, mantener precios altos.             |
| **4** | **+2.5% Ligero sobrecosto**  | Compradores mixtos, ajustar marginalmente.                            |
| **2** | **-2.5% Descuento leve**     | Fieles pero algo sensibles, descuento simbólico.                      |
| **0** | **-5% Descuento moderado** | Alta anticipación y uso de promo, sensibles.                          |
| **5** | **-7.5% Descuento fuerte**   | Segmento más sensible, atraer con precios agresivos.                  |



# <div align="left"><font size="5">📌Extracción de la base de datos de los clusters generados</font></div>

In [None]:
# se extrae la base de datos de los clusters generados
DBClus= T4DE.GetDB()

# <div align="left"><font size="5">📌Clasificación supervisada</font></div>


La implementación de un algoritmo de aprendizaje supervisado es fundamental para transformar una base de datos de clientes clasificados en un sistema de tarifa dinámica eficiente y rentable.

El valor agregado reside en pasar de la segmentación estática a la predicción continua. 

| Componente | Rol en el Modelo de Tarifa Dinámica | Beneficio Clave |
| :--- | :--- | :--- |
| **Clasificación Inicial de Clientes** | Sirve como *input* (una de las características) para el modelo de Machine Learning. | Proporciona una base de datos histórica y segmentada de alta calidad. |
| **Algoritmo de Aprendizaje Supervisado** | Entrena un modelo para predecir el comportamiento del cliente y calcular el precio óptimo basándose en datos históricos etiquetados (transacciones y resultados). | Maximiza el ingreso al ajustar la tarifa en tiempo real a la disposición a pagar individual. |
| **Red neuronal (Output)** | Permite al modelo predecir un valor continuo y exacto (el precio de venta) en lugar de limitarse a asignar categorías predefinidas. | Permite un ajuste fino y automatizado de precios, respondiendo a la demanda, inventario, precios de la competencia y el perfil específico del cliente simultáneamente. |



In [None]:
# Se aplica la clasificación supervisada a la base de datos de los clusters generados
ClusteringSupervisado(DBClus)

# <div align="left"><font size="5">📌Calculando la tarifa dinámica</font></div>

Una red neuronal artificial (RNA) es una herramienta poderosa para pronosticar la tarifa dinámica porque sobresale en el manejo de la complejidad y las relaciones no lineales inherentes a la fijación de precios en el mercado.

Su principal utilidad es su capacidad para modelar la elasticidad de la demanda de forma muy precisa, considerando simultáneamente una gran cantidad de variables.

In [None]:
# 0 es para todos los dias antes de ayer
# -1 es para todos los dias antes de 7 dias desde ayer
# 1 es desde ayer hasta hace un año
T4N.ProcessingNet(D4NN,Zero)

# para pronosticar con todo el dataframe

# False es para el dia de hoy
# True es para hace 7 dias hasta hoy
Negativo= True
df_= T4N.PrepareData4Fore(D4NN,Negativo)

#Fore= T4N.GetTodayData4Net(df_)
#PrecioDin=T4N.NewClientsPredNet(Fore)
#df_['PRECIO DINAMICO']=PrecioDin
#TodayDataPD= df_.copy()

# para pronosticar por cliente el dataframe
lista_resultados = []

for row in range(len(df_)):
    InfoClient = pd.DataFrame(df_.iloc[row]).T
    Foree= T4N.GetTodayData4Net(InfoClient)
    InfoClient["TARIFA DINAMICA"] = T4N.NewClientsPredNet(Foree)[0,0]
    
    lista_resultados.append(InfoClient)

TodayDataPD = pd.concat(lista_resultados, ignore_index=True)

# <div align="left"><font size="5">📌Obteniendo la elasticidad calculada</font></div>

La elasticidad calculada se guarda en un modelo de datos para posteriormente cargarla y hacer los cálculos necesarios en la segmentación de los clientes.

In [None]:
DataElas= T4E.GetDataElasticity()
Elas=DataElas['Elasticidad']

# <div align="left"><font size="5">📌Obteniendo datos del presente día para la tarifa personalizada</font></div>

Se cargan los datos del día presente del modelo de datos

In [None]:
# Se obtienen los datos de los clientes para obtener la tarifa personalizada
# False es para el dia de hoy
# True es para hace 7 dias hasta hoy
TodayData4C= T4TP.GetTodayData4Cluster(D4C1,Negativo)

# <div align="left"><font size="5">📌Calculando el porcentaje de aumento para la tarifa personalizada</font></div>

Ya teniendo entrenados los algoritmos que clasificaron la data histórica de clientes, de manera supervisada y no supervisada, se procede a realizar una prueba de calidad con los datos del día corriente para poder observar el comportamiento de los precios personalizados.

In [None]:
# se simula la obtencion del cluster del cliente que está comprando
# para ver que tarifa personalizada se le asigna

import pandas as pd

# 1. Inicializa una lista vacía para guardar los resultados
lista_resultados = []

# 2. Itera y agrega cada DataFrame a la lista
for row in range(len(TodayData4C)):
    # 1. Crea la fila (DataFrame de 1xN)
    InfoClient = pd.DataFrame(TodayData4C.iloc[row]).T
    
    # 2. Procesa la información (asumo que T4TP.GetCluster devuelve Cluster y desc)
    Cluster, desc = T4TP.GetCluster(InfoClient, DBClus,Elas)
    
    # 3. Agrega la nueva columna
    InfoClient["%_Tarifa Personalizada"] = desc
    InfoClient["Cluster"] = Cluster
    InfoClient["Delta_Q"] = desc*Elas
    
    # 4. Agrega el DataFrame resultante a la lista
    lista_resultados.append(InfoClient)

# 3. Concatena todos los DataFrames de la lista de una sola vez
TodayDataTP = pd.concat(lista_resultados, ignore_index=True)

# El DataFrame 'final' ahora contiene todas las filas concatenadas

# <div align="left"><font size="5">📌Merge de las tarifas</font></div>

Para finalizar este pipeline, se combinan los dataframes obtenidos de la red neuronal del precio dinámico con el del algoritmo de clasificación del precio personalizado

In [None]:
df_combinado = pd.merge(
    TodayDataPD,
    TodayDataTP,
    on='NOMBRE_PASAJERO',  # La columna clave que comparten
    how='inner'    # El tipo de unión que deseas
)

In [None]:
df_combinado.columns

In [None]:
df_PD= df_combinado[['NOMBRE_PASAJERO', 'EMAIL','Cluster', 'TARIFA DINAMICA', '%_Tarifa Personalizada','TARIFA_BASE_TRAMO',"Delta_Q"]]
df_PD ['Precio final con IVA']= df_PD['TARIFA DINAMICA']*(df_PD['%_Tarifa Personalizada']/100)+ df_PD['TARIFA DINAMICA']+df_PD['TARIFA DINAMICA']*0.16
df_PD ['Precio final con IVA']= np.round(df_PD ['Precio final con IVA'])

df_PD ['Precio final sin IVA']= df_PD['TARIFA DINAMICA']*(df_PD['%_Tarifa Personalizada']/100)+ df_PD['TARIFA DINAMICA']
df_PD ['Precio final sin IVA']= np.round(df_PD ['Precio final sin IVA'])

El siguiente dataframe muestra los precios dinámicos con el 15 porciento de IVA para cada uno de los usuarios del presente día según su clasificación obtenida con los algoritmos de aprendizaje. 

In [None]:
df_PD

In [None]:
# solo para el final del dia
df_PD.to_csv('datos_dinamicos.csv', index=False)

In [None]:
ruta_principal = os.getcwd()
config_path = os.path.join(ruta_principal, "Files", 'datos_dinamicos.parquet')
df_PD.to_parquet(config_path, index=False)
config_path = os.path.join(ruta_principal, "Files", 'datos_dinamicos.csv')
df_PD.to_csv(config_path, index=False)