# Instalamos las dependencias
Necesitamos numpy y pandas

In [9]:
#!conda install -y numpy pandas 
!pip install -r requirements.txt

[0mDefaulting to user installation because normal site-packages is not writeable


In [12]:
import numpy as np
import pandas as pd
import json

MIN_VALUE = 1e7

LOW_CPU_MAX = 1e9
MID_CPU_MAX = 5e9
HIGH_CPU_MAX = 1e11

LOW_COM_MAX = 1e6
MID_COM_MAX = 5e9
HIGH_COM_MAX = 1e11

class ProfileGenerator:
    
    def __init__(self, max_resources=4):
        self.profiles = {}
        # Establecemos el valor de max_resources. Este valor dependerá de la cantidad de recursos disponibles en el sistema, pero debe ser ingresado manualmente.
        self.max_resources = max_resources

    """ 
    Bajo: Si tanto el CPU como el COM están en el rango bajo, entonces la tarea probablemente no necesite muchos recursos.
    Medio: Si el CPU o el COM están en el rango medio, la tarea podría beneficiarse de más recursos. Podemos establecer np en 2 o 3 dependiendo de si uno o ambos valores están en el rango medio.
    Alto: Si tanto el CPU como el COM están en el rango alto, la tarea probablemente necesite muchos recursos.
    """
    def get_np(self, cpu, com):
        # Normalizar los valores al rango [0, 1]
        normalized_cpu = cpu / HIGH_CPU_MAX
        normalized_com = com / HIGH_COM_MAX
        
        # Calcular el score como la media de los valores normalizados
        score = (normalized_cpu + normalized_com) / 2
        
        # Asignar recursos proporcionalmente al score
        resources = int(1 + score * (self.max_resources - 1))
        
        return resources
    
    def compute_walltime(self, cpu, com, np_val):
        # Factor base de tiempo proporcional a la suma de CPU y COM
        base_time = (cpu + com) / (HIGH_CPU_MAX + HIGH_COM_MAX)
        
        # Ajustar el factor base de tiempo por la cantidad de recursos
        # Aquí, 3600 es un factor de escala para convertir el valor en segundos (puede ajustarse según las necesidades)
        walltime = base_time * 3600 / np_val
        
        return walltime

    def generate_profile(self, cpu_range, com_range, profile_prefix):
        cpu = np.random.uniform(*cpu_range)
        com = np.random.uniform(*com_range)
        np_val = self.get_np(cpu, com)
        walltime = self.compute_walltime(cpu, com, np_val)
        profile_name = f"{profile_prefix}_{len(self.profiles) + 1}"
        self.profiles[profile_name] = {
            "type": "parallel_homogeneous",
            "cpu": cpu,
            "com": com,
            "np": np_val,
            "walltime": walltime
        }
        return profile_name

    def generate_low_profile(self):
        return self.generate_profile((1e7, LOW_CPU_MAX), (1024, LOW_COM_MAX), "low")

    def generate_med_profile(self):
        if np.random.choice([True, False]):
            cpu_range = (LOW_CPU_MAX, MID_CPU_MAX)
            com_range = (LOW_COM_MAX, MID_COM_MAX)
        else:
            cpu_range = (MID_CPU_MAX, HIGH_CPU_MAX)
            com_range = (MID_COM_MAX, HIGH_COM_MAX)
        return self.generate_profile(cpu_range, com_range, "med")

    def generate_high_profile(self):
        return self.generate_profile((MID_CPU_MAX, HIGH_CPU_MAX), (MID_COM_MAX, HIGH_COM_MAX), "high")

    def generate(self, number_of_profiles=10, low_percent=0.3, med_percent=0.4, high_percent=0.3):
        assert low_percent + med_percent + high_percent == 1.0
        
        num_low = int(number_of_profiles * low_percent)
        num_med = int(number_of_profiles * med_percent)
        num_high = number_of_profiles - num_low - num_med

        for _ in range(num_low):
            self.generate_low_profile()

        for _ in range(num_med):
            self.generate_med_profile()

        for _ in range(num_high):
            self.generate_high_profile()
        
        return self.profiles
    
    def to_dataframe(self):
        """Convierte los perfiles generados en un DataFrame de pandas."""
        return pd.DataFrame.from_dict(self.profiles, orient='index')

    def to_json(self):
        """Convierte los perfiles generados en una representación JSON."""
        return json.dumps(self.profiles, indent=4)


In [19]:
# Crear una instancia del generador de perfiles
generator = ProfileGenerator(max_resources=8)

# Generar perfiles
number_of_profiles = 50
generator.generate(number_of_profiles, low_percent=0.3, med_percent=0.4, high_percent=0.3)
print('')

{'low_1': {'type': 'parallel_homogeneous',
  'cpu': 996639571.8575777,
  'com': 780231.6403882726,
  'np': 1,
  'walltime': 17.953556462963387},
 'low_2': {'type': 'parallel_homogeneous',
  'cpu': 350974029.0181068,
  'com': 190634.06411078933,
  'np': 1,
  'walltime': 6.320963935479917},
 'low_3': {'type': 'parallel_homogeneous',
  'cpu': 126745756.2739628,
  'com': 234024.5550030879,
  'np': 1,
  'walltime': 2.2856360549213863},
 'low_4': {'type': 'parallel_homogeneous',
  'cpu': 516155404.687526,
  'com': 356299.3450540683,
  'np': 1,
  'walltime': 9.297210672586441},
 'low_5': {'type': 'parallel_homogeneous',
  'cpu': 948590734.9936827,
  'com': 84027.76773851264,
  'np': 1,
  'walltime': 17.076145729705583},
 'low_6': {'type': 'parallel_homogeneous',
  'cpu': 384269667.7927215,
  'com': 295276.12206531956,
  'np': 1,
  'walltime': 6.9221689904661625},
 'low_7': {'type': 'parallel_homogeneous',
  'cpu': 561752821.8088545,
  'com': 693687.3755172828,
  'np': 1,
  'walltime': 10.1240

In [17]:
# Convertir los perfiles a un DataFrame de pandas y mostrarlo
df = generator.to_dataframe()
df

Unnamed: 0,type,cpu,com,np,walltime
low_1,parallel_homogeneous,196499400.0,951752.1,1,3.554121
low_2,parallel_homogeneous,878309400.0,384186.0,1,15.816485
low_3,parallel_homogeneous,250602900.0,546114.6,1,4.520682
low_4,parallel_homogeneous,498002000.0,65570.93,1,8.965216
low_5,parallel_homogeneous,745329500.0,765073.2,1,13.429703
low_6,parallel_homogeneous,896915400.0,972994.5,1,16.161991
med_7,parallel_homogeneous,81642600000.0,70745080000.0,6,457.163061
med_8,parallel_homogeneous,72930440000.0,54486770000.0,5,458.701954
med_9,parallel_homogeneous,1106291000.0,1340004000.0,1,44.033314
med_10,parallel_homogeneous,95511120000.0,51494440000.0,6,441.016703


In [18]:
# Convertir los perfiles a una representación JSON y mostrarla
json_representation = generator.to_json()
print(json_representation)

{
    "low_1": {
        "type": "parallel_homogeneous",
        "cpu": 196499408.53736028,
        "com": 951752.1131210001,
        "np": 1,
        "walltime": 3.554120891708663
    },
    "low_2": {
        "type": "parallel_homogeneous",
        "cpu": 878309435.2457575,
        "com": 384186.0495352205,
        "np": 1,
        "walltime": 15.816485183315267
    },
    "low_3": {
        "type": "parallel_homogeneous",
        "cpu": 250602863.96631336,
        "com": 546114.5945100263,
        "np": 1,
        "walltime": 4.520681614094821
    },
    "low_4": {
        "type": "parallel_homogeneous",
        "cpu": 498001976.1107337,
        "com": 65570.93233411474,
        "np": 1,
        "walltime": 8.965215846775221
    },
    "low_5": {
        "type": "parallel_homogeneous",
        "cpu": 745329534.0938755,
        "com": 765073.2317988238,
        "np": 1,
        "walltime": 13.429702931862138
    },
    "low_6": {
        "type": "parallel_homogeneous",
        "cpu":