In [105]:
import pandas as pd
import numpy as np
from pulp import *
import matplotlib.pyplot as plt

demanda_df = pd.read_csv('demanda_usuarios.csv')
costo_ancho_banda_df = pd.read_csv('costo_ancho_de_banda.csv')
latencia_df = pd.read_csv('latencia.csv')
carga_maxima_df = pd.read_csv('carga_maxima_servidores.csv')

# Clean the latencia data (remove commas and convert to numeric)
latencia_df['tiempo de respuesta promedio por solicitud (milisegundos)'] = \
    latencia_df['tiempo de respuesta promedio por solicitud (milisegundos)'].str.replace(',', '').astype(float)

# Verify data loaded correctly
print("Demanda total:", demanda_df['demanda (solicitudes por minuto)'].sum())
print("Capacidad total:", carga_maxima_df['carga maxima (solicitudes por minuto)'].sum())

    grupo de usuarios  servidor  \
0                   1         1   
1                   1         2   
2                   1         3   
3                   1         4   
4                   1         5   
5                   1         6   
6                   2         1   
7                   2         2   
8                   2         3   
9                   2         4   
10                  2         5   
11                  2         6   
12                  3         1   
13                  3         2   
14                  3         3   
15                  3         4   
16                  3         5   
17                  3         6   
18                  4         1   
19                  4         2   
20                  4         3   
21                  4         4   
22                  4         5   
23                  4         6   
24                  5         1   
25                  5         2   
26                  5         3   
27                  

In [65]:
# Verify input data scales
print("Demand analysis:")
print(demanda_df['demanda (solicitudes por minuto)'].sum(), "total requests/minute")
print("\nBandwidth cost range:")
print(f"Min: ${costo_ancho_banda_df['costo del ancho de banda por solicitud (USD por solicitud)'].min()}")
print(f"Max: ${costo_ancho_banda_df['costo del ancho de banda por solicitud (USD por solicitud)'].max()}")
print("\nLatency analysis:")
print("Latencies > 400ms:")
print(latencia_df[latencia_df['tiempo de respuesta promedio por solicitud (milisegundos)'] > 400])

Demand analysis:
13700 total requests/minute

Bandwidth cost range:
Min: $1e-05
Max: $3e-05

Latency analysis:
Latencies > 400ms:
    grupo de usuarios  servidor  \
0                   1         1   
1                   1         2   
2                   1         3   
3                   1         4   
4                   1         5   
5                   1         6   
6                   2         1   
8                   2         3   
9                   2         4   
10                  2         5   
11                  2         6   
12                  3         1   
14                  3         3   
15                  3         4   
16                  3         5   
18                  4         1   
19                  4         2   
20                  4         3   
22                  4         5   
23                  4         6   
24                  5         1   
25                  5         2   
26                  5         3   
27                  5         

## 1. Planteamiento del Programa Lineal

### Variables de Decisión
- x[i,j]: Cantidad de solicitudes por minuto del grupo de usuarios i al servidor j

### Función Objetivo
Minimizar el costo total que incluye:
1. Costo de ancho de banda
2. Costo por latencia superior a 400ms

MIN Σ(i,j) (c[i,j] * x[i,j] + max(0, (l[i,j] - 400) * 0.0000001) * x[i,j])

Donde:
- c[i,j]: Costo de ancho de banda por solicitud del grupo i al servidor j
- l[i,j]: Latencia en ms del grupo i al servidor j

### Restricciones
1. Demanda de usuarios:
   Σ(j) x[i,j] = d[i] para todo i
   donde d[i] es la demanda del grupo de usuarios i

2. Capacidad de servidores:
   Σ(i) x[i,j] ≤ m[j] para todo j
   donde m[j] es la carga máxima del servidor j

3. No negatividad:
   x[i,j] ≥ 0 para todo i,j

In [91]:
# Create the optimization model
model = LpProblem("Server_Optimization", LpMinimize)

# Create decision variables
grupos = demanda_df['grupo de usuarios'].unique()
servidores = carga_maxima_df['servidor'].unique()
x = LpVariable.dicts("traffic", 
                     ((i, j) for i in grupos for j in servidores), 
                     lowBound=0)

# Objective function with separated cost components
objective = lpSum((
    x[i,j] * (
        # 1. Bandwidth cost
        float(costo_ancho_banda_df[
            (costo_ancho_banda_df['grupo de usuarios'] == i) & 
            (costo_ancho_banda_df['servidor'] == j)
        ]['costo del ancho de banda por solicitud (USD por solicitud)'].iloc[0]) +
        # 2. Latency penalty (only if latency > 400ms)
        max(0, (float(latencia_df[
            (latencia_df['grupo de usuarios'] == i) & 
            (latencia_df['servidor'] == j)
        ]['tiempo de respuesta promedio por solicitud (milisegundos)'].iloc[0]) - 400) * 0.0000001)
    )
    for i in grupos for j in servidores
))
model += objective

# Add constraints
# 1. Demand constraints
for i in grupos:
    demanda = float(demanda_df[demanda_df['grupo de usuarios'] == i]['demanda (solicitudes por minuto)'].iloc[0])
    model += lpSum(x[i,j] for j in servidores) == demanda

# 2. Server capacity constraints
for j in servidores:
    capacidad = float(carga_maxima_df[carga_maxima_df['servidor'] == j]['carga maxima (solicitudes por minuto)'].iloc[0])
    model += lpSum(x[i,j] for i in grupos) <= capacidad

# Solve the model using SIMPLEX
solver = PULP_CBC_CMD(msg=False, gapRel=0.01)
status = model.solve(solver)
print(f"Status: {LpStatus[status]}")

Status: Optimal


In [99]:
def calculate_total_cost(infraestructura_df):
    """
    Calcula el costo total de la infraestructura actual considerando:
    1. Costo de ancho de banda
    2. Penalización por latencia > 400ms
    """
    costo_total = 0
    
    for _, row in infraestructura_df.iterrows():
        grupo = row['grupo de usuarios']
        servidor = row['servidor']
        solicitudes = row['tráfico dirigido (solicitudes por minuto)']
        
        # Obtener costo de ancho de banda
        costo_bw = float(costo_ancho_banda_df[
            (costo_ancho_banda_df['grupo de usuarios'] == grupo) & 
            (costo_ancho_banda_df['servidor'] == servidor)
        ]['costo del ancho de banda por solicitud (USD por solicitud)'].iloc[0])
        
        # Obtener latencia
        latencia = float(latencia_df[
            (latencia_df['grupo de usuarios'] == grupo) & 
            (latencia_df['servidor'] == servidor)
        ]['tiempo de respuesta promedio por solicitud (milisegundos)'].iloc[0])
        
        # Calcular costo total para esta combinación
        costo_bw_total = solicitudes * costo_bw
        costo_latencia = solicitudes * max(0, (latencia - 400) * 0.0000001)
        
        costo_total += costo_bw_total + costo_latencia
    
    return costo_total

# Ahora podemos usar esta función en nuestro análisis:
infraestructura_actual_df = pd.read_csv('infraestructura_actual.csv')
costo_actual = calculate_total_cost(infraestructura_actual_df)

print(f"\nComparación de costos:")
print(f"Costo actual por mes: ${costo_actual * 60 * 24 * 30:.2f}")
print(f"Costo optimizado por mes: ${original_cost * 60 * 24 * 30:.2f}")
print(f"Ahorro mensual: ${(costo_actual - original_cost) * 60 * 24 * 30:.2f}")
print(f"Porcentaje de ahorro: {((costo_actual - original_cost)/costo_actual * 100):.1f}%")


Comparación de costos:
Costo actual por mes: $23155.20
Costo optimizado por mes: $8640.00
Ahorro mensual: $14515.20
Porcentaje de ahorro: 62.7%



## 2. Distribución Óptima del Tráfico

In [101]:
## 2. Distribución Óptima del Tráfico

# Calculate and store the original cost
original_cost = value(model.objective)
print(f"Costo total por minuto: ${original_cost:.6f}")
print(f"Costo total por mes (30 días): ${original_cost * 60 * 24 * 30:.2f}")

# Crear y mostrar la matriz de distribución de tráfico
print("\nMatriz de distribución de tráfico (solicitudes/minuto):")
traffic_matrix = pd.DataFrame(
    [[value(x[i,j]) for j in servidores] for i in grupos],
    index=[f'Grupo {i}' for i in grupos],
    columns=[f'Servidor {j}' for j in servidores]
)

# Redondear valores para mejor legibilidad
traffic_matrix = traffic_matrix.round(0)
pd.set_option('display.float_format', '{:.0f}'.format)

# Agregar totales
traffic_matrix.loc['Total por Servidor'] = traffic_matrix.sum()
traffic_matrix['Total por Grupo'] = traffic_matrix.sum(axis=1)

print(traffic_matrix)

print("\nVerificación de restricciones:")
print("1. Capacidad de servidores:")
for j in servidores:
    capacidad = float(carga_maxima_df[carga_maxima_df['servidor'] == j]['carga maxima (solicitudes por minuto)'].iloc[0])
    uso_actual = traffic_matrix[f'Servidor {j}'].sum()
    print(f"Servidor {j}: {uso_actual:.0f}/{capacidad:.0f} solicitudes/minuto ({(uso_actual/capacidad*100):.1f}% utilización)")

# Calculate cost components separately for verification
bandwidth_cost = sum(
    value(x[i,j]) * float(costo_ancho_banda_df[
        (costo_ancho_banda_df['grupo de usuarios'] == i) & 
        (costo_ancho_banda_df['servidor'] == j)
    ]['costo del ancho de banda por solicitud (USD por solicitud)'].iloc[0])
    for i in grupos for j in servidores
)

latency_cost = sum(
    value(x[i,j]) * max(0, (float(latencia_df[
        (latencia_df['grupo de usuarios'] == i) & 
        (latencia_df['servidor'] == j)
    ]['tiempo de respuesta promedio por solicitud (milisegundos)'].iloc[0]) - 400) * 0.0000001)
    for i in grupos for j in servidores
)

# Load and calculate current infrastructure cost
infraestructura_actual_df = pd.read_csv('infraestructura_actual.csv')
costo_actual = calculate_total_cost(infraestructura_actual_df)  # Necesitamos implementar esta función

print(f"\nComparación de costos:")
print(f"Costo actual por mes: ${costo_actual * 60 * 24 * 30:.2f}")
print(f"Costo optimizado por mes: ${original_cost * 60 * 24 * 30:.2f}")
print(f"Ahorro mensual: ${(costo_actual - original_cost) * 60 * 24 * 30:.2f}")
print(f"Porcentaje de ahorro: {((costo_actual - original_cost)/costo_actual * 100):.1f}%")

print(f"\nDesglose de costos por minuto:")
print(f"Costo de ancho de banda: ${bandwidth_cost:.6f}")
print(f"Costo por penalización de latencia: ${latency_cost:.6f}")

Costo total por minuto: $0.200000
Costo total por mes (30 días): $8640.00

Matriz de distribución de tráfico (solicitudes/minuto):
                    Servidor 1  Servidor 2  Servidor 3  Servidor 4  \
Grupo 1                      0           0           0           0   
Grupo 2                      0        1000           0           0   
Grupo 3                      0         600           0           0   
Grupo 4                      0           0           0         900   
Grupo 5                      0        1200           0           0   
Grupo 6                   3000           0        1000           0   
Grupo 7                      0           0           0        2000   
Grupo 8                      0           0           0           0   
Total por Servidor        3000        2800        1000        2900   

                    Servidor 5  Servidor 6  Total por Grupo  
Grupo 1                      0        2000             2000  
Grupo 2                      0           0  

## 3. Análisis de Mejora de Servidor

In [81]:
## 4. Análisis de Inversión en Mejora de Servidor

def calculate_savings_with_improvement(server_id, original_cost):
    # Create a new model with improved latency for the selected server
    improved_model = LpProblem("Improved_Server_Optimization", LpMinimize)
    
    # Create new variables
    x_new = LpVariable.dicts("traffic_new", 
                            ((i, j) for i in grupos for j in servidores), 
                            lowBound=0)
    
    # Modified objective function with 200ms improvement for selected server
    improved_objective = lpSum((
        x_new[i,j] * (
            float(costo_ancho_banda_df[
                (costo_ancho_banda_df['grupo de usuarios'] == i) & 
                (costo_ancho_banda_df['servidor'] == j)
            ]['costo del ancho de banda por solicitud (USD por solicitud)'].iloc[0]) +
            max(0, (float(latencia_df[
                (latencia_df['grupo de usuarios'] == i) & 
                (latencia_df['servidor'] == j)
            ]['tiempo de respuesta promedio por solicitud (milisegundos)'].iloc[0]) - 
                (200 if j == server_id else 0) - 400) * 0.0000001)
        )
        for i in grupos for j in servidores
    ))
    improved_model += improved_objective
    
    # Add same constraints
    for i in grupos:
        demanda = float(demanda_df[demanda_df['grupo de usuarios'] == i]['demanda (solicitudes por minuto)'].iloc[0])
        improved_model += lpSum(x_new[i,j] for j in servidores) == demanda
    
    for j in servidores:
        capacidad = float(carga_maxima_df[carga_maxima_df['servidor'] == j]['carga maxima (solicitudes por minuto)'].iloc[0])
        improved_model += lpSum(x_new[i,j] for i in grupos) <= capacidad
    
    # Solve using SIMPLEX
    solver = PULP_CBC_CMD(msg=False, gapRel=0.01)
    improved_model.solve(solver)
    new_cost = value(improved_model.objective)
    
    return original_cost - new_cost

# Calculate savings for each server
savings_per_server = {j: calculate_savings_with_improvement(j, original_cost) for j in servidores}
best_server = max(savings_per_server.items(), key=lambda x: x[1])

print("\n4. Análisis de Inversión en Mejora de Servidor")
print("\na. Servidor óptimo para la inversión:")
print(f"El servidor que debería elegir la empresa es el Servidor {best_server[0]}")
print(f"Este servidor generará un ahorro mensual de: ${best_server[1] * 60 * 24 * 30:.2f}")

print("\nb. Tiempo de recuperación de la inversión:")
meses_recuperacion = 1000 / (best_server[1] * 60 * 24 * 30)
print(f"La inversión se recuperará en {meses_recuperacion:.1f} meses")

# Mostrar análisis detallado de cada servidor
print("\nAnálisis comparativo de todos los servidores:")
for servidor, ahorro in savings_per_server.items():
    ahorro_mensual = ahorro * 60 * 24 * 30
    tiempo_recuperacion = 1000 / ahorro_mensual if ahorro_mensual > 0 else float('inf')
    print(f"Servidor {servidor}:")
    print(f"- Ahorro mensual: ${ahorro_mensual:.2f}")
    print(f"- Tiempo de recuperación: {tiempo_recuperacion:.1f} meses")


4. Análisis de Inversión en Mejora de Servidor

a. Servidor óptimo para la inversión:
El servidor que debería elegir la empresa es el Servidor 6
Este servidor generará un ahorro mensual de: $1296.00

b. Tiempo de recuperación de la inversión:
La inversión se recuperará en 0.8 meses

Análisis comparativo de todos los servidores:
Servidor 1:
- Ahorro mensual: $432.00
- Tiempo de recuperación: 2.3 meses
Servidor 2:
- Ahorro mensual: $518.40
- Tiempo de recuperación: 1.9 meses
Servidor 3:
- Ahorro mensual: $0.00
- Tiempo de recuperación: inf meses
Servidor 4:
- Ahorro mensual: $0.00
- Tiempo de recuperación: inf meses
Servidor 5:
- Ahorro mensual: $0.00
- Tiempo de recuperación: inf meses
Servidor 6:
- Ahorro mensual: $1296.00
- Tiempo de recuperación: 0.8 meses


In [87]:
print("\nVerificación de los costos:")
for i in grupos:
    for j in servidores:
        if value(x[i,j]) > 0.1:
            requests = value(x[i,j])
            bw_cost = float(costo_ancho_banda_df[
                (costo_ancho_banda_df['grupo de usuarios'] == i) & 
                (costo_ancho_banda_df['servidor'] == j)
            ]['costo del ancho de banda por solicitud (USD por solicitud)'].iloc[0])
            latency = float(latencia_df[
                (latencia_df['grupo de usuarios'] == i) & 
                (latencia_df['servidor'] == j)
            ]['tiempo de respuesta promedio por solicitud (milisegundos)'].iloc[0])
            latency_penalty = max(0, (latency - 400) * 0.0000001)
            
            print(f"\nGroup {i} -> Server {j}:")
            print(f"Requests: {requests:.0f}/minute")
            print(f"Bandwidth cost: ${requests * bw_cost:.6f}/minute")
            print(f"Latency: {latency}ms (Penalty: ${requests * latency_penalty:.6f}/minute)")


Verificación de los costos:

Group 1 -> Server 6:
Requests: 2000/minute
Bandwidth cost: $0.020000/minute
Latency: 500.0ms (Penalty: $0.020000/minute)

Group 2 -> Server 2:
Requests: 1000/minute
Bandwidth cost: $0.020000/minute
Latency: 400.0ms (Penalty: $0.000000/minute)

Group 3 -> Server 2:
Requests: 600/minute
Bandwidth cost: $0.006000/minute
Latency: 400.0ms (Penalty: $0.000000/minute)

Group 4 -> Server 4:
Requests: 900/minute
Bandwidth cost: $0.018000/minute
Latency: 400.0ms (Penalty: $0.000000/minute)

Group 5 -> Server 2:
Requests: 1200/minute
Bandwidth cost: $0.024000/minute
Latency: 500.0ms (Penalty: $0.012000/minute)

Group 6 -> Server 1:
Requests: 3000/minute
Bandwidth cost: $0.030000/minute
Latency: 400.0ms (Penalty: $0.000000/minute)

Group 6 -> Server 3:
Requests: 1000/minute
Bandwidth cost: $0.010000/minute
Latency: 400.0ms (Penalty: $0.000000/minute)

Group 7 -> Server 4:
Requests: 2000/minute
Bandwidth cost: $0.020000/minute
Latency: 400.0ms (Penalty: $0.000000/minut