In [2]:
import pandas as pd
import pulp
import numpy as np
from IPython.display import Markdown, display

pulp.LpSolverDefault.msg = 0

# Read all data files
demand_df = pd.read_csv('demanda_usuarios.csv')
bandwidth_cost_df = pd.read_csv('costo_ancho_de_banda.csv')
latency_df = pd.read_csv('latencia.csv')
server_capacity_df = pd.read_csv('carga_maxima_servidores.csv')
current_infra_df = pd.read_csv('infraestructura_actual.csv')

# Clean latency data
latency_df['tiempo de respuesta promedio por solicitud (milisegundos)'] = \
    latency_df['tiempo de respuesta promedio por solicitud (milisegundos)'].str.replace(',', '').astype(float)

In [30]:
# For the markdown text, fix the escape sequence by using raw strings
markdown_text = r"""
## 1. Planteo del Programa Lineal

### Variables de Decisión
- $x_{ij}$ = Cantidad de solicitudes por minuto del grupo de usuarios i al servidor j
  - donde i ∈ {1,...,8} (grupos de usuarios)
  - donde j ∈ {1,...,6} (servidores)

### Función Objetivo
Minimizar el costo total por minuto = Costo de ancho de banda + Penalización por latencia

$\min \sum_{i=1}^{8}\sum_{j=1}^{6} (c_{ij}x_{ij} + p_{ij}x_{ij})$

donde:
- $c_{ij}$ = costo de ancho de banda por solicitud del grupo i al servidor j
- $p_{ij}$ = costo de penalización por latencia = max(0, (l_{ij} - 400) × 0.0000001)
- $l_{ij}$ = latencia en milisegundos del grupo i al servidor j

### Restricciones

1. Capacidad de los servidores:
   $\sum_{i=1}^{8} x_{ij} \leq Cap_j$ para todo j
   donde $Cap_j$ es la capacidad máxima del servidor j

2. Satisfacción de la demanda:
   $\sum_{j=1}^{6} x_{ij} = D_i$ para todo i
   donde $D_i$ es la demanda del grupo de usuarios i

3. No negatividad:
   $x_{ij} \geq 0$ para todo i,j
"""

display(Markdown(markdown_text))


## 1. Planteo del Programa Lineal

### Variables de Decisión
- $x_{ij}$ = Cantidad de solicitudes por minuto del grupo de usuarios i al servidor j
  - donde i ∈ {1,...,8} (grupos de usuarios)
  - donde j ∈ {1,...,6} (servidores)

### Función Objetivo
Minimizar el costo total por minuto = Costo de ancho de banda + Penalización por latencia

$\min \sum_{i=1}^{8}\sum_{j=1}^{6} (c_{ij}x_{ij} + p_{ij}x_{ij})$

donde:
- $c_{ij}$ = costo de ancho de banda por solicitud del grupo i al servidor j
- $p_{ij}$ = costo de penalización por latencia = max(0, (l_{ij} - 400) × 0.0000001)
- $l_{ij}$ = latencia en milisegundos del grupo i al servidor j

### Restricciones

1. Capacidad de los servidores:
   $\sum_{i=1}^{8} x_{ij} \leq Cap_j$ para todo j
   donde $Cap_j$ es la capacidad máxima del servidor j

2. Satisfacción de la demanda:
   $\sum_{j=1}^{6} x_{ij} = D_i$ para todo i
   donde $D_i$ es la demanda del grupo de usuarios i

3. No negatividad:
   $x_{ij} \geq 0$ para todo i,j


In [20]:
def solve_optimization(latency_adjustment=None):
    # Create the optimization model
    prob = pulp.LpProblem("Server_Load_Optimization", pulp.LpMinimize)
    
    # Create decision variables
    user_groups = range(1, 9)
    servers = range(1, 7)
    x = pulp.LpVariable.dicts("traffic", 
                             ((i, j) for i in user_groups for j in servers), 
                             lowBound=0)
    
    def get_latency_penalty(latency, server):
        if latency_adjustment and latency_adjustment[1] == server:
            latency = max(0, latency - 200)
        return max(0, (latency - 400) * 0.0000001)
    
    # Objective function
    objective = pulp.lpSum(
        x[i,j] * (
            bandwidth_cost_df[(bandwidth_cost_df['grupo de usuarios']==i) & 
                             (bandwidth_cost_df['servidor']==j)]['costo del ancho de banda por solicitud (USD por solicitud)'].iloc[0] +
            get_latency_penalty(
                latency_df[(latency_df['grupo de usuarios']==i) & 
                          (latency_df['servidor']==j)]['tiempo de respuesta promedio por solicitud (milisegundos)'].iloc[0],
                j
            )
        )
        for i in user_groups for j in servers
    )
    prob += objective
    
    # Constraints
    for j in servers:
        prob += pulp.lpSum(x[i,j] for i in user_groups) <= server_capacity_df[server_capacity_df['servidor']==j]['carga maxima (solicitudes por minuto)'].iloc[0]
    
    for i in user_groups:
        prob += pulp.lpSum(x[i,j] for j in servers) == demand_df[demand_df['grupo de usuarios']==i]['demanda (solicitudes por minuto)'].iloc[0]
    
    # Solve
    prob.solve()
    
    return prob, x

# 2. Solve for optimal distribution
prob, x = solve_optimization()

# Create results DataFrame
results = []
for i in range(1, 9):
    for j in range(1, 7):
        if pulp.value(x[i,j]) > 0.1:  # Filter out very small values
            results.append({
                'Grupo de usuarios': i,
                'Servidor': j,
                'Tráfico (solicitudes/min)': pulp.value(x[i,j])
            })

results_df = pd.DataFrame(results)
display(Markdown("## 2. Distribución Óptima del Tráfico"))
display(results_df)

Welcome to the CBC MILP Solver 
Version: 2.10.3 
Build Date: Dec 15 2019 

command line - /opt/anaconda3/lib/python3.12/site-packages/pulp/solverdir/cbc/osx/64/cbc /var/folders/8k/5tyzysfn2kl3gm85nppn4j6w0000gn/T/422605f0ab444e29a7783d116b4b14a3-pulp.mps -timeMode elapsed -branch -printingOptions all -solution /var/folders/8k/5tyzysfn2kl3gm85nppn4j6w0000gn/T/422605f0ab444e29a7783d116b4b14a3-pulp.sol (default strategy 1)
At line 2 NAME          MODEL
At line 3 ROWS
At line 19 COLUMNS
At line 164 RHS
At line 179 BOUNDS
At line 180 ENDATA
Problem MODEL has 14 rows, 48 columns and 96 elements
Coin0008I MODEL read with 0 errors
Option for timeMode changed from cpu to elapsed
Presolve 14 (0) rows, 48 (0) columns and 96 (0) elements
Perturbing problem by 0.001% of 9e-05 - largest nonzero change 4.9124201e-06 ( 44.21052%) - largest zero change 0
0  Obj 0 Primal inf 13700 (8)
10  Obj 0.25015628
Optimal - objective value 0.2
Optimal objective 0.2 - 10 iterations time 0.002
Option for printingOpt

## 2. Distribución Óptima del Tráfico

Unnamed: 0,Grupo de usuarios,Servidor,Tráfico (solicitudes/min)
0,1,6,2000.0
1,2,2,1000.0
2,3,2,600.0
3,4,4,900.0
4,5,2,1200.0
5,6,1,3000.0
6,6,3,1000.0
7,7,4,2000.0
8,8,5,2000.0


In [22]:
# 3. Cost comparison
def calculate_cost(traffic_df, is_current=False):
    total_cost = 0
    
    for _, row in traffic_df.iterrows():
        if is_current:
            traffic = row['tráfico dirigido (solicitudes por minuto)']
            group = row['grupo de usuarios']
            server = row['servidor']
        else:
            traffic = row['Tráfico (solicitudes/min)']
            group = row['Grupo de usuarios']
            server = row['Servidor']
            
        if traffic > 0:
            # Bandwidth cost
            bw_cost = bandwidth_cost_df[
                (bandwidth_cost_df['grupo de usuarios']==group) & 
                (bandwidth_cost_df['servidor']==server)
            ]['costo del ancho de banda por solicitud (USD por solicitud)'].iloc[0]
            
            # Latency cost
            latency = latency_df[
                (latency_df['grupo de usuarios']==group) & 
                (latency_df['servidor']==server)
            ]['tiempo de respuesta promedio por solicitud (milisegundos)'].iloc[0]
            
            latency_cost = max(0, (latency - 400) * 0.0000001)
            
            total_cost += traffic * (bw_cost + latency_cost)
    
    return total_cost

optimal_cost = calculate_cost(results_df)
current_cost = calculate_cost(current_infra_df, is_current=True)
monthly_savings = (current_cost - optimal_cost) * 60 * 24 * 30

display(Markdown(f"""
## 3. Comparación de Costos

- Costo óptimo por minuto: ${optimal_cost:.6f}
- Costo actual por minuto: ${current_cost:.6f}
- Ahorro mensual: ${monthly_savings:.2f}
"""))


## 3. Comparación de Costos

- Costo óptimo por minuto: $0.200000
- Costo actual por minuto: $0.536000
- Ahorro mensual: $14515.20


In [24]:
# 4. Server improvement analysis
def analyze_server_improvement():
    best_savings = 0
    best_server = None
    best_roi = float('inf')
    
    for server in range(1, 7):
        # Calculate new cost with improved server
        prob_improved, x_improved = solve_optimization(latency_adjustment=(200, server))
        improved_cost = pulp.value(prob_improved.objective)
        
        # Calculate monthly savings
        monthly_savings = (optimal_cost - improved_cost) * 60 * 24 * 30
        
        # Calculate ROI time in months
        if monthly_savings > 0:
            roi_months = 1000 / monthly_savings
            if roi_months < best_roi:
                best_roi = roi_months
                best_server = server
                best_savings = monthly_savings
    
    return best_server, best_savings, best_roi

best_server, monthly_savings, roi_months = analyze_server_improvement()

display(Markdown(f"""
## 4. Análisis de Mejora de Servidor

a) El servidor que debería mejorar es el servidor {best_server}

b) Tiempo para recuperar la inversión:
- Ahorro mensual: ${monthly_savings:.2f}
- Meses para recuperar la inversión: {roi_months:.2f}
"""))

Welcome to the CBC MILP Solver 
Version: 2.10.3 
Build Date: Dec 15 2019 

command line - /opt/anaconda3/lib/python3.12/site-packages/pulp/solverdir/cbc/osx/64/cbc /var/folders/8k/5tyzysfn2kl3gm85nppn4j6w0000gn/T/5b33f8c51ec84f879029bb99bb039beb-pulp.mps -timeMode elapsed -branch -printingOptions all -solution /var/folders/8k/5tyzysfn2kl3gm85nppn4j6w0000gn/T/5b33f8c51ec84f879029bb99bb039beb-pulp.sol (default strategy 1)
At line 2 NAME          MODEL
At line 3 ROWS
At line 19 COLUMNS
At line 164 RHS
At line 179 BOUNDS
At line 180 ENDATA
Problem MODEL has 14 rows, 48 columns and 96 elements
Coin0008I MODEL read with 0 errors
Option for timeMode changed from cpu to elapsed
Presolve 14 (0) rows, 48 (0) columns and 96 (0) elements
Perturbing problem by 0.001% of 9e-05 - largest nonzero change 4.9124201e-06 ( 44.21052%) - largest zero change 0
0  Obj 0 Primal inf 13700 (8)
10  Obj 0.24023323
Optimal - objective value 0.19
Optimal objective 0.19 - 10 iterations time 0.002
Option for printingO


## 4. Análisis de Mejora de Servidor

a) El servidor que debería mejorar es el servidor 6

b) Tiempo para recuperar la inversión:
- Ahorro mensual: $1296.00
- Meses para recuperar la inversión: 0.77
