# <center><font size="8">Prototipo de Oferta Din√°mica Personalizada</font></center>

<div align="left"><font size="5">üìå Introducci√≥n</font></div>

## 1. Contexto y Objetivos

El presente proyecto se enfoca en el desarrollo de un sistema avanzado de **Oferta Din√°mica (Dynamic Pricing)** con el objetivo primordial de **optimizar los ingresos y la rentabilidad** a trav√©s de la **personalizaci√≥n de tarifas**.  

En lugar de utilizar modelos de precio est√°ticos o ajustes basados √∫nicamente en la demanda global, nuestro prototipo se cimenta en el **an√°lisis individual del consumidor** para determinar el precio √≥ptimo en tiempo real.  

Para lograr esta personalizaci√≥n, hemos dise√±ado un **pipeline de Machine Learning** que combina t√©cnicas de **econometr√≠a**, **aprendizaje no supervisado** y **modelos predictivos**.

---

## 2. Metodolog√≠a y Arquitectura del Modelo

La propuesta metodol√≥gica se basa en **tres fases interconectadas**, que transforman la sensibilidad del cliente en una tarifa personalizada:

---

### A. Estimaci√≥n y Segmentaci√≥n por Elasticidad (Fundamento Econ√≥mico)

El primer pilar del prototipo fue la **estimaci√≥n rigurosa de la elasticidad precio de la demanda ($\text{EPD}$)**.  
Esta m√©trica ha sido fundamental para entender el grado de respuesta de la cantidad demandada ante variaciones de precio en nuestros datos hist√≥ricos.

Posteriormente, aplicamos un **algoritmo de clustering** (*aprendizaje no supervisado*) para **clasificar a los clientes** bas√°ndonos en su $\text{EPD}$ y otras caracter√≠sticas de comportamiento.  

Este *clustering* nos permiti√≥ crear **segmentos de clientes bien definidos** (por ejemplo: *‚ÄúExtremadamente El√°sticos‚Äù*, *‚ÄúInel√°sticos‚Äù*), estableciendo un **rango de ajuste de precios** (aumento o decremento) espec√≠fico para cada grupo.

---

### B. Clasificaci√≥n de Clientes Nuevos (Motor de XGBoost)

Una vez establecidos los segmentos de elasticidad, desarrollamos un **clasificador basado en el algoritmo XGBoost (eXtreme Gradient Boosting)**.  

La funci√≥n de este modelo es crucial en la operativa:  
al recibir los datos de un nuevo cliente o una nueva interacci√≥n, **XGBoost predice a cu√°l de las categor√≠as de elasticidad pre-clasificadas pertenece**.  

Esta predicci√≥n es el **factor determinante inicial** para estimar la tarifa personalizada, permiti√©ndonos saber si el sistema debe apuntar a un **aumento**, un **decremento** o un **precio base**.

---

### C. Determinaci√≥n de la Oferta Din√°mica (Red Neuronal)

Finalmente, para la etapa de determinaci√≥n del precio, implementamos una **red neuronal artificial**.  

Este modelo de aprendizaje profundo **integra las caracter√≠sticas de la demanda**, la **clasificaci√≥n de elasticidad obtenida de XGBoost**, y otras **variables din√°micas** (como inventario, hora del d√≠a y actividad de la competencia) para **estimar la oferta din√°mica final y personalizada**.  

La red neuronal provee la **flexibilidad** y la **capacidad de capturar relaciones no lineales** necesarias para el ajuste preciso del precio a nivel individual.



<div align="left"><font size="5">üìå Objetivos</font></div>


- **1. Estimar la Elasticidad de la Demanda**  
  - Cuantificar la sensibilidad al precio ($\text{EPD}$) de los diferentes segmentos de clientes.  
  - Servir√° como fundamento econ√≥mico para la toma de decisiones de precio.

- **2. Segmentar Clientes por Comportamiento de Precio**  
  - Aplicar t√©cnicas de *clustering para agrupar clientes en categor√≠as de elasticidad homog√©neas.  
  - Crear segmentos accionables que definan la estrategia inicial de aumento o decremento de precios.

- **3. Desarrollar un Motor de Clasificaci√≥n de Clientes**  
  - Implementar y validar el algoritmo XGBoost para clasificar con alta precisi√≥n a nuevos clientes.  
  - Integrar la clasificaci√≥n dentro de los segmentos de elasticidad previamente definidos.

- **4. Integrar un Pipeline Predictivo Completo**  
  - Crear un prototipo pipeline robusto que combine:  
    - **Clustering** (aprendizaje no supervisado)  
    - **Clasificaci√≥n** (XGBoost)  
    - **Predicci√≥n** (Red Neuronal)  
- **5. Generar la tarifa final personalizada con tarifa din√°mica**.



# <div align="left"><font size="5">üìå Librerias</font></div>

In [1]:
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
import os

from Tools import Tools4DataExtraction as T4DE
from Tools.Tools4Cluster import ClusteringData
from Tools.Tools4ClasSupervisada import ClusteringSupervisado
from Tools import Tools4TarifPer as T4TP
from Tools import Tools4Net as T4N 
from Tools import Tools4Elasticity as T4E

# <div align="left"><font size="5">üìåCalculo de la elasticidad</font></div>

La Elasticidad Precio de la Demanda (EPD) mide c√≥mo la cantidad demandada de un producto cambia en respuesta a una variaci√≥n en su precio. Se calcula como 

$$\epsilon_{Q} = \frac{\Delta Q}{\Delta P}$$

### Clasificaci√≥n de la Elasticidad de la Demanda seg√∫n su valor

**Demanda El√°stica** ($|EPD| > 1$):  
La cantidad demandada var√≠a en una proporci√≥n mayor que el cambio en el precio.  
Un peque√±o cambio en el precio provoca un cambio significativo en la cantidad demandada.  
*Ejemplo:* Bienes de lujo o productos con muchos sustitutos disponibles.

---

**Demanda Inel√°stica** ($|EPD| < 1$):  
La cantidad demandada var√≠a en una proporci√≥n menor que el cambio en el precio.  
Un cambio en el precio tiene poco impacto en la cantidad demandada.  
*Ejemplo:* Bienes de primera necesidad o esenciales, como medicamentos o gasolina (a corto plazo).

---

**Elasticidad Unitaria** ($|EPD| = 1$):  
La cantidad demandada var√≠a en la misma proporci√≥n que el cambio en el precio.

In [2]:
T4E.MainElas()

Memoria usada antes: 623.56 MB
Memoria usada despu√©s: 121.20 MB
Reducci√≥n: 80.6%
La elasticidad de la demanda es: -0.9054
El precio maximo a vender es: 967.6565


# <div align="left"><font size="5">üìåExtracci√≥n de informaci√≥n del modelo de datos</font></div>

In [3]:
# Se extraen los datos del modelo de datos
D4NN, D4C= T4DE.Get_Data()

Memoria usada antes: 623.56 MB
Memoria usada despu√©s: 121.20 MB
Reducci√≥n: 80.6%


# <div align="left"><font size="5">üìåClasificaci√≥n no supervisada</font></div>

La clasificaci√≥n de clientes permite entender c√≥mo distintos grupos responden al precio y al servicio, habilitando estrategias de precio personalizado que maximizan ingresos y reducen p√©rdida de demanda. Se calcula el **precio √≥ptimo** seg√∫n la respuesta esperada del segmento (elasticidad estimada o probabilidad de compra).

### üîπ Estrategias diferenciadas
- **Segmento el√°stico ‚Üí** precios competitivos o descuentos.  
- **Segmento inel√°stico ‚Üí** precios premium o aumentos graduales.  
- **Segmento leal ‚Üí** estabilidad de precios.

---

## üìä Beneficios Clave

- üí∞ **Maximiza los ingresos** ajustando precios seg√∫n la disposici√≥n a pagar.  
- üìâ **Reduce p√©rdida de demanda** por aumentos injustificados.  
- üéØ **Mejora la precisi√≥n del modelo**, al trabajar con segmentos m√°s homog√©neos.  
- üß† **Permite estrategias personalizadas y accionables** seg√∫n el tipo de cliente.


In [4]:
ClusteringData(False,D4C)

Modelo K-Means guardado exitosamente como: KmeansAllData.joblib


### Estrategia de Precios por *Cluster*

---

#### 1. Incrementar Precios (o Reducir Descuentos) üìà  
**Objetivo:** Maximizar el margen en clientes de alto valor.  

| **Cluster** | **Acci√≥n** | **Raz√≥n Clave** |
|--------------|-------------|-----------------|
| **2** | Aumentar el precio. | **√âlite:** M√°ximo gasto  y m√°xima actividad . Demanda inel√°stica. |
| **0** | Evaluar aumento moderado. | **Alto Valor:** Alto gasto. Monitorear para no perderlos por su menor actividad. |

---

#### 2. Bajar Precios (o Aumentar Promociones) üìâ  
**Objetivo:** Impulsar el volumen y reactivar a clientes sensibles al precio o en riesgo.  

| **Cluster** | **Acci√≥n** | **Raz√≥n Clave** |
|--------------|-------------|-----------------|
| **5** | Aumentar las promociones. | **Sensibles:** Bajo valor y alta indicaci√≥n de sensibilidad a promociones. |
| **3** | Ofertas de reactivaci√≥n. | **En Riesgo:** Gasto inicial alto, pero actividad posterior nula. Necesitan un incentivo fuerte para reengancharse. |

---

#### 3. Mantener Precios (Enfoque en Volumen y Venta Cruzada) üõçÔ∏è  
**Objetivo:** Fidelizar y aumentar la compra de productos adicionales sin tocar la base del precio.  

| **Cluster** | **Acci√≥n** | **Raz√≥n Clave** |
|--------------|-------------|-----------------|
| **1 y 4** | Mantener precios. | **Muy Activos:** Ya tienen una alta frecuencia de compra. La meta es venderles m√°s productos, no bajarles ni bajarles el precio base. |


# <div align="left"><font size="5">üìåExtracci√≥n de la base de datos de los clusters generados</font></div>

In [5]:
# se extrae la base de datos de los clusters generados
DBClus= T4DE.GetDB()

# <div align="left"><font size="5">üìåClasificaci√≥n supervisada</font></div>


La implementaci√≥n de un algoritmo de aprendizaje supervisado es fundamental para transformar una base de datos de clientes clasificados en un sistema de tarifa din√°mica eficiente y rentable.

El valor agregado reside en pasar de la segmentaci√≥n est√°tica a la predicci√≥n continua. 

| Componente | Rol en el Modelo de Tarifa Din√°mica | Beneficio Clave |
| :--- | :--- | :--- |
| **Clasificaci√≥n Inicial de Clientes** | Sirve como *input* (una de las caracter√≠sticas) para el modelo de Machine Learning. | Proporciona una base de datos hist√≥rica y segmentada de alta calidad. |
| **Algoritmo de Aprendizaje Supervisado** | Entrena un modelo para predecir el comportamiento del cliente y calcular el precio √≥ptimo bas√°ndose en datos hist√≥ricos etiquetados (transacciones y resultados). | Maximiza el ingreso al ajustar la tarifa en tiempo real a la disposici√≥n a pagar individual. |
| **Red neuronal (Output)** | Permite al modelo predecir un valor continuo y exacto (el precio de venta) en lugar de limitarse a asignar categor√≠as predefinidas. | Permite un ajuste fino y automatizado de precios, respondiendo a la demanda, inventario, precios de la competencia y el perfil espec√≠fico del cliente simult√°neamente. |



In [6]:
# Se aplica la clasificaci√≥n supervisada a la base de datos de los clusters generados
ClusteringSupervisado(DBClus)

Modelo XGBoost guardado exitosamente como: modelo_xgboost_clientes.json


# <div align="left"><font size="5">üìåCalculando la tarifa din√°mica</font></div>

Una red neuronal artificial (RNA) es una herramienta poderosa para pronosticar la tarifa din√°mica porque sobresale en el manejo de la complejidad y las relaciones no lineales inherentes a la fijaci√≥n de precios en el mercado.

Su principal utilidad es su capacidad para modelar la elasticidad de la demanda de forma muy precisa, considerando simult√°neamente una gran cantidad de variables.

In [7]:
TodayDataPD=T4N.ProcessingNet(D4NN)

Epoch 1/2
[1m6918/6918[0m [32m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[37m[0m [1m9s[0m 1ms/step - loss: 18703.9766 - mae: 47.4079 - mse: 18703.9766 - val_loss: 645.1938 - val_mae: 18.3961 - val_mse: 645.1938
Epoch 2/2
[1m6918/6918[0m [32m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[37m[0m [1m8s[0m 1ms/step - loss: 190.2577 - mae: 9.0158 - mse: 190.2577 - val_loss: 121.5889 - val_mae: 7.7615 - val_mse: 121.5889
[1m2162/2162[0m [32m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[37m[0m [1m1s[0m 475us/step

El Error Absoluto Medio (MAE) final es de: 7.77 [Moneda]

La Ra√≠z del Error Cuadr√°tico Medio (RMSE) final es de: 10.95 [Moneda]
(0, 20)
[1m1/1[0m [32m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[37m[0m [1m0s[0m 25ms/step


# <div align="left"><font size="5">üìåObteniendo la elasticidad calculada</font></div>

La elasticidad calculada se guarda en un modelo de datos para posteriormente cargarla y hacer los c√°lculos necesarios en la segmentaci√≥n de los clientes.

In [8]:
DataElas= T4E.GetDataElasticity()
Elas=DataElas['Elasticidad']

# <div align="left"><font size="5">üìåObteniendo datos del presente d√≠a para la tarifa personalizada</font></div>

Se cargan los datos del d√≠a presente del modelo de datos

In [9]:
# Se obtienen los datos de los clientes para obtener la tarifa personalizada
TodayData4C= T4TP.GetTodayData4Cluster(D4C)

# <div align="left"><font size="5">üìåCalculando el porcentaje de aumento para la tarifa personalizada</font></div>

Ya teniendo entrenados los algoritmos que clasificaron la data hist√≥rica de clientes, de manera supervisada y no supervisada, se procede a realizar una prueba de calidad con los datos del d√≠a corriente para poder observar el comportamiento de los precios personalizados.

In [10]:
# se simula la obtencion del cluster del cliente que est√° comprando
# para ver que tarifa personalizada se le asigna

import pandas as pd

# 1. Inicializa una lista vac√≠a para guardar los resultados
lista_resultados = []

# 2. Itera y agrega cada DataFrame a la lista
for row in range(len(TodayData4C)):
    # 1. Crea la fila (DataFrame de 1xN)
    InfoClient = pd.DataFrame(TodayData4C.iloc[row]).T
    
    # 2. Procesa la informaci√≥n (asumo que T4TP.GetCluster devuelve Cluster y desc)
    Cluster, desc = T4TP.GetCluster(InfoClient, DBClus,Elas)
    
    # 3. Agrega la nueva columna
    InfoClient["%_Tarifa Personalizada"] = desc
    InfoClient["Cluster"] = Cluster
    
    # 4. Agrega el DataFrame resultante a la lista
    lista_resultados.append(InfoClient)

# 3. Concatena todos los DataFrames de la lista de una sola vez
TodayDataTP = pd.concat(lista_resultados, ignore_index=True)

# El DataFrame 'final' ahora contiene todas las filas concatenadas

# <div align="left"><font size="5">üìåMerge de las tarifas</font></div>

Para finalizar este pipeline, se combinan los dataframes obtenidos de la red neuronal del precio din√°mico con el del algoritmo de clasificaci√≥n del precio personalizado

In [11]:
df_combinado = pd.merge(
    TodayDataPD,
    TodayDataTP,
    on='NOMBRE_PASAJERO',  # La columna clave que comparten
    how='inner'    # El tipo de uni√≥n que deseas
)

In [12]:
df_PD= df_combinado[['NOMBRE_PASAJERO', 'EMAIL','Cluster', 'PRECIO DINAMICO', '%_Tarifa Personalizada']]
df_PD ['Precio final con IVA']= df_PD['PRECIO DINAMICO']*(df_PD['%_Tarifa Personalizada']/100)+ df_PD['PRECIO DINAMICO']+df_PD['PRECIO DINAMICO']*0.15
df_PD ['Precio final con IVA']= np.round(df_PD ['Precio final con IVA'])

El siguiente dataframe muestra los precios din√°micos con el 15 porciento de IVA para cada uno de los usuarios del presente d√≠a seg√∫n su clasificaci√≥n obtenida con los algoritmos de aprendizaje. 

In [13]:
df_PD

Unnamed: 0,NOMBRE_PASAJERO,EMAIL,Cluster,PRECIO DINAMICO,%_Tarifa Personalizada,Precio final con IVA
0,DANIEL CEBALLOS RENDON,daniel.ceballos.rendon@ejemplo.com,1,949.796143,0.0,1092.0
1,JOSE RENTERIA,jose.renteria@ejemplo.com,3,952.062256,-4.527081,1052.0
2,RODOLFO MENDOZA MARTINEZ,rodolfo.mendoza.martinez@ejemplo.com,1,951.783875,0.0,1095.0
3,MARTIN DURAN,martin.duran@ejemplo.com,1,951.505493,0.0,1094.0
4,FRANCO RAMOS,franco.ramos@ejemplo.com,1,951.459167,0.0,1094.0
5,MARTIN PATI√ëO,martin.pati√±o@ejemplo.com,1,951.366394,0.0,1094.0
6,BENNY VEGA,benny.vega@ejemplo.com,1,951.320068,0.0,1094.0
7,FILEMON ORTEGA,filemon.ortega@ejemplo.com,1,951.87677,0.0,1095.0
8,JOSE DE JESUS MEJIA ALCARAS,jose.de.jesus.mejia.alcaras@ejemplo.com,1,949.349487,0.0,1092.0
9,GONZALO TERRAZAS,gonzalo.terrazas@ejemplo.com,1,951.383667,0.0,1094.0


In [14]:
df_PD.to_excel('datos_dinamicos.xlsx')