## Preparación de los datos

Diccionario que nos permitirá conocer el significado de los valores de las columnas del dataframe.

El valor que aparezca en el dataframe, será la posición de la lista asociada a la variable de cada columna.

In [None]:
significado = {
    "M":["MD_type1", "MD_type2"],
    "V":["UF_type1", "UF_type2"],
    "At":["None", "[TNORMA_MIN, TNORMA_MAX]", "[TNORMA_PRODUCT, TNORMA_MAX]", "[HARMONIC_MEAN, TNORMA_MAX]", "[OWA_OPERATOR, TNORMA_MAX]"],
    "Ap":["None", "[1.0, 0.0]", "[0.75, 0.15]", "[0.5, 0.25]", "[0.33, 0.33]", "[1.0]", "[0.75]", "[0.5]"],
    "INp":["None", "0.25", "0.5", "0.75", "1.0"],
    "PIt":["None", "PI_LINEAR"],
    "PIp":["None", "[0.0, 1.0]"]
}

Función de codificación del dataframe.

In [None]:
import pandas as pd
import numpy as np

def codificacion(datos):
  # Guardamos los valores unicos de la columna
  posVal = datos.unique()

  # Cambiamos cada valor por el número que representa el orden en el que aparecen
  for i in range(0, len(posVal)):
    datos = datos.replace({posVal[i]: i})

  return datos


Extraemos el dataframe de nuestro csv.

In [None]:
df = pd.read_csv("datos_20230805_114246.csv", delimiter=";")
df = df.fillna(0)


print(df.shape)
colnames = df.columns
df.head()

(500000, 16)


Unnamed: 0,M,IN,PI,At,Ap,INp,PIt,PIp,C,V,S,ForcedEND,T,U,TbDL,D
0,MDtypes.MD_type1,False,False,"[None, None]",[None],[None],0,"[None, None]",False,UFtypes.UF_type1,6,0,105,65.965937,7.1,5779.52242
1,MDtypes.MD_type1,False,False,"[None, None]",[None],[None],0,"[None, None]",False,UFtypes.UF_type1,7,0,102,61.934787,-0.6,5937.186715
2,MDtypes.MD_type1,False,False,"[None, None]",[None],[None],0,"[None, None]",False,UFtypes.UF_type1,8,0,97,62.57469,7.4,5747.062179
3,MDtypes.MD_type1,False,False,"[None, None]",[None],[None],0,"[None, None]",False,UFtypes.UF_type1,9,0,103,61.124483,-1.1,6188.214203
4,MDtypes.MD_type1,False,False,"[None, None]",[None],[None],0,"[None, None]",False,UFtypes.UF_type1,10,0,90,71.009162,1.15,5166.683352


Codificamos los posibles valores del dataframe para facilitaros trabajar con él.

In [None]:
for clave in list(significado.keys()):
  df[clave] = codificacion(df[clave])

## Estudio de los datos

Presentamos, a continuación, el estudio de los datos. Empezaremos estudiando esperimentos individuales y, posteriormente, agrupando por configuraciones.

### Estudio de experimentos individuales

Empezaremos calculando el máximo de la utilidad obtenida entre todas las simulaciones, y miraremos qué configuración nos la ha proporcionado.

In [None]:
# Valor maximo de utilidad
print("El máximo de utilidad obtenido ha sido: {}\n".format(max(df["U"])))

# Configuracion para el maximo de utilidad
df_maxU = df[df["U"] == max(df["U"])]
df_maxU

El máximo de utilidad obtenido ha sido: 100.0



Unnamed: 0,M,IN,PI,At,Ap,INp,PIt,PIp,C,V,S,ForcedEND,T,U,TbDL,D
5002,0,False,True,1,0,0,1,1,False,1,8,0,74,100.0,17.70,4106.602870
5004,0,False,True,1,0,0,1,1,False,1,10,0,77,100.0,9.45,4406.145065
5006,0,False,True,1,0,0,1,1,False,1,12,0,64,100.0,15.00,3698.287603
5012,0,False,True,1,0,0,1,1,False,1,18,0,81,100.0,11.65,4512.937569
5027,0,False,True,1,0,0,1,1,False,1,33,0,73,100.0,11.50,4117.828737
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
499981,1,True,True,4,4,4,1,1,True,1,987,0,38,100.0,38.70,627.577684
499992,1,True,True,4,4,4,1,1,True,1,998,0,34,100.0,39.40,814.690010
499993,1,True,True,4,4,4,1,1,True,1,999,0,36,100.0,39.20,895.846768
499996,1,True,True,4,4,4,1,1,True,1,1002,0,30,100.0,37.60,749.498026


Podemos ver que hemos obtenido el máximo posible de utilidad, 100%, en una gran variedad de configuraciones.

Miremos cuál de ellas ha conseguido un mayor TbDL (time berfore Dead-Line).

In [None]:
# Valor maximo de "time before Dead-Line"
print("El máximo de TbDL obtenido ha sido: {}\n".format(max(df_maxU["TbDL"])))

# Configuracion para el maximo de "time before Dead-Line"
df_maxU[df_maxU["TbDL"] == max(df_maxU["TbDL"])]

El máximo de TbDL obtenido ha sido: 52.7



Unnamed: 0,M,IN,PI,At,Ap,INp,PIt,PIp,C,V,S,ForcedEND,T,U,TbDL,D
257350,1,False,False,4,6,0,0,0,False,1,356,0,29,100.0,52.7,464.964982
259350,1,False,False,4,6,0,0,0,True,1,356,0,29,100.0,52.7,464.964982
309350,1,True,False,4,6,1,0,0,False,1,356,0,29,100.0,52.7,464.964982
311350,1,True,False,4,6,1,0,0,True,1,356,0,29,100.0,52.7,464.964982
361350,1,True,False,4,6,2,0,0,False,1,356,0,29,100.0,52.7,464.964982
363350,1,True,False,4,6,2,0,0,True,1,356,0,29,100.0,52.7,464.964982
413350,1,True,False,4,6,3,0,0,False,1,356,0,29,100.0,52.7,464.964982
415350,1,True,False,4,6,3,0,0,True,1,356,0,29,100.0,52.7,464.964982
465350,1,True,False,4,6,4,0,0,False,1,356,0,29,100.0,52.7,464.964982
467350,1,True,False,4,6,4,0,0,True,1,356,0,29,100.0,52.7,464.964982


Podemos ver que lo que tienen en común todas estas configuraciones es que utilizamos:
M=1, PI=False, At=4, Ap=6, V=1.

Si vamos a nuestro diccionario, estos parámetros se corresponden con:

In [None]:
print(significado["M"][1])
print(significado["At"][4])
print(significado["Ap"][6])
print(significado["V"][1])

MD_type2
[OWA_OPERATOR, TNORMA_MAX]
[0.75]
UF_type2


Fijémonos que todas también tienen en común el "Random Seed Value". Esto puede significar que estos resultados pueden depender más de la configuración inicial que de el resto de parámetros.

Con la intención de eliminar la aleatoriedad de este estudio, agruparemos los experimentos segun la configuración usada y los consideraremos en bloque.

### Estudio de los experimentos agrupados por configuración

Pasemos a agrupar todos los experimentos que se han realizado utilizando la misma configuración.

In [None]:
df_agrupado = df.groupby(list(colnames[0:10]))

Siguiendo los mismos pasos de antes, calculemos cuál es la utilidad media máxima coseguida, y que grupo es el que ha conseguido esa utilidad media.

In [None]:
# Valor maximo de utilidad media
print("El máximo de utilidad media obtenido ha sido: {}\n".format(max(df_agrupado["U"].mean())))

# Configuracion para el maximo de utilidad media
df_agrupado["U"].mean()[df_agrupado["U"].mean() == max(df_agrupado["U"].mean())]

El máximo de utilidad media obtenido ha sido: 99.97111653276048



M  IN    PI    At  Ap  INp  PIt  PIp  C      V
0  True  True  2   0   3    1    1    False  1    99.971117
Name: U, dtype: float64

Utilizando el diccionario, tenemos que este grupo se corresponde con:

In [None]:
print(significado["M"][0])
print(significado["At"][2])
print(significado["Ap"][0])
print(significado["INp"][3])
print(significado["PIt"][1])
print(significado["PIp"][1])
print(significado["V"][1])

MD_type1
[TNORMA_PRODUCT, TNORMA_MAX]
None
0.75
PI_LINEAR
[0.0, 1.0]
UF_type2


Miremos si el grupo de mayor utilidad media coincide con el grupo de mayor "TbDL":

In [None]:
# Valor maximo de "time before Dead-Line"
print("El máximo de TbDL obtenido ha sido: {}\n".format(max(df_agrupado["TbDL"].mean())))


# Configuracion para el maximo de "time before Dead-Line"
df_agrupado["TbDL"].mean()[df_agrupado["TbDL"].mean() == max(df_agrupado["TbDL"].mean())]

El máximo de TbDL obtenido ha sido: 38.2301



M  IN    PI    At  Ap  INp  PIt  PIp  C      V
1  True  True  3   0   4    1    1    False  1    38.2301
Name: TbDL, dtype: float64

Utilizando el diccionario, tenemos que este grupo se corresponde con:

In [None]:
print(significado["M"][1])
print(significado["At"][3])
print(significado["Ap"][0])
print(significado["INp"][4])
print(significado["PIt"][1])
print(significado["PIp"][1])
print(significado["V"][1])

MD_type2
[HARMONIC_MEAN, TNORMA_MAX]
None
1.0
PI_LINEAR
[0.0, 1.0]
UF_type2


Comparemos las utilidades y los TbDL de ambas configuraciones:

In [None]:
utilidades = [float(df_agrupado["U"].mean()[df_agrupado["U"].mean() == max(df_agrupado["U"].mean())]), float(df_agrupado["U"].mean()[df_agrupado["TbDL"].mean() == max(df_agrupado["TbDL"].mean())])]
ut_std = [float(df_agrupado["U"].std()[df_agrupado["U"].mean() == max(df_agrupado["U"].mean())]), float(df_agrupado["U"].std()[df_agrupado["TbDL"].mean() == max(df_agrupado["TbDL"].mean())])]
tbdl = [float(df_agrupado["TbDL"].mean()[df_agrupado["U"].mean() == max(df_agrupado["U"].mean())]), float(df_agrupado["TbDL"].mean()[df_agrupado["TbDL"].mean() == max(df_agrupado["TbDL"].mean())])]
tbdl_std = [float(df_agrupado["TbDL"].std()[df_agrupado["U"].mean() == max(df_agrupado["U"].mean())]), float(df_agrupado["TbDL"].std()[df_agrupado["TbDL"].mean() == max(df_agrupado["TbDL"].mean())])]

print ("{:<8} {:<10} {:<10}".format(' ','Mejor U','Mejor TbDL'))
print ("{:<8} {:<10} {:<10}".format( "U", round(utilidades[0], 2), round(utilidades[1], 2)))
print ("{:<8} {:<10} {:<10}".format( "U STD", round(ut_std[0], 2), round(ut_std[1], 2)))
print ("{:<8} {:<10} {:<10}".format( "TbDL", round(tbdl[0], 2), round(tbdl[1], 2)))
print ("{:<8} {:<10} {:<10}".format( "TbDL STD", round(tbdl_std[0], 2), round(tbdl_std[1], 2)))


         Mejor U    Mejor TbDL
U        99.97      96.14     
U STD    0.37       3.68      
TbDL     36.84      38.23     
TbDL STD 4.91       4.72      


Podemos ver como la configuración que proporciona la mejor utilidad es claramente mejor, ya que la diferencia entre el TbDL no es muy grande, y la utilidad obtenida es casi perfecta.

Con la intención de hacer una comparación al completo, también miraremos las medias del tiempo de acabado y distancia recorrida para cada configuración.

In [None]:
t = [float(df_agrupado["T"].mean()[df_agrupado["U"].mean() == max(df_agrupado["U"].mean())]), float(df_agrupado["T"].mean()[df_agrupado["TbDL"].mean() == max(df_agrupado["TbDL"].mean())])]
t_std = [float(df_agrupado["T"].std()[df_agrupado["U"].mean() == max(df_agrupado["U"].mean())]), float(df_agrupado["T"].std()[df_agrupado["TbDL"].mean() == max(df_agrupado["TbDL"].mean())])]
d = [float(df_agrupado["D"].mean()[df_agrupado["U"].mean() == max(df_agrupado["U"].mean())]), float(df_agrupado["D"].mean()[df_agrupado["TbDL"].mean() == max(df_agrupado["TbDL"].mean())])]
d_std = [float(df_agrupado["D"].std()[df_agrupado["U"].mean() == max(df_agrupado["U"].mean())]), float(df_agrupado["D"].std()[df_agrupado["TbDL"].mean() == max(df_agrupado["TbDL"].mean())])]

print ("{:<8} {:<10} {:<10}".format(' ','Mejor U','Mejor TbDL'))
print ("{:<8} {:<10} {:<10}".format( "T", round(t[0], 2), round(t[1], 2)))
print ("{:<8} {:<10} {:<10}".format( "T STD", round(t_std[0], 2), round(t_std[1], 2)))
print ("{:<8} {:<10} {:<10}".format( "D", round(d[0], 2), round(d[1], 2)))
print ("{:<8} {:<10} {:<10}".format( "D STD", round(d_std[0], 2), round(d_std[1], 2)))

         Mejor U    Mejor TbDL
T        34.93      29.86     
T STD    4.13       3.95      
D        757.62     440.48    
D STD    114.02     74.98     


En este caso, podemos ver como, el metodo que antes hemos considerado como el mejor, en media necesita una mayor cantidad de tiempo y recorrer una mayor cantidad de distancia que la alternativa propuesta. De hecho, la distancia que necesita recorrer el primero es 1.72 veces mayor.

De esto, podemos deducir que la primera es configuración es mejor en términos de utilidad, pero la segunda mejor en términos de gestión de recursos.

Dado que ninguna de estas configuraciones es la presentada como mejor alternativa en el paper, repetiremos el estudio anterior con la mejor configuración en cada una de las 4 métricas estudiadas, para cada MDtype, cada UFtype y cada C.

Empecemos definiendo las funciones necesarias:

In [None]:
# Funcion que nos permite obtener las métricas de las mejores configuraciones
def calcTabla(datos):
  # Configuracion con valor maximo de utilidad media
  utilidades = [max(datos["U"].mean())]
  ut_std = [float(datos["U"].std()[datos["U"].mean() == max(datos["U"].mean())])]
  tbdl = [float(datos["TbDL"].mean()[datos["U"].mean() == max(datos["U"].mean())])]
  tbdl_std = [float(datos["TbDL"].std()[datos["U"].mean() == max(datos["U"].mean())])]
  t = [float(datos["T"].mean()[datos["U"].mean() == max(datos["U"].mean())])]
  t_std = [float(datos["T"].std()[datos["U"].mean() == max(datos["U"].mean())])]
  d = [float(datos["D"].mean()[datos["U"].mean() == max(datos["U"].mean())])]
  d_std = [float(datos["D"].std()[datos["U"].mean() == max(datos["U"].mean())])]

  # Configuracion con valor maximo de TbDL
  utilidades.append(float(datos["U"].mean()[datos["TbDL"].mean() == max(datos["TbDL"].mean())]))
  ut_std.append(float(datos["U"].std()[datos["TbDL"].mean() == max(datos["TbDL"].mean())]))
  tbdl.append(max(datos["TbDL"].mean()))
  tbdl_std.append(float(datos["TbDL"].std()[datos["TbDL"].mean() == max(datos["TbDL"].mean())]))
  t.append(float(datos["T"].mean()[datos["TbDL"].mean() == max(datos["TbDL"].mean())]))
  t_std.append(float(datos["T"].std()[datos["TbDL"].mean() == max(datos["TbDL"].mean())]))
  d.append(float(datos["D"].mean()[datos["TbDL"].mean() == max(datos["TbDL"].mean())]))
  d_std.append(float(datos["D"].std()[datos["TbDL"].mean() == max(datos["TbDL"].mean())]))

  # Configuracion con valor minimo de T
  utilidades.append(float(datos["U"].mean()[datos["T"].mean() == min(datos["T"].mean())]))
  ut_std.append(float(datos["U"].std()[datos["T"].mean() == min(datos["T"].mean())]))
  tbdl.append(float(datos["TbDL"].mean()[datos["T"].mean() == min(datos["T"].mean())]))
  tbdl_std.append(float(datos["TbDL"].std()[datos["T"].mean() == min(datos["T"].mean())]))
  t.append(min(datos["T"].mean()))
  t_std.append(float(datos["T"].std()[datos["T"].mean() == min(datos["T"].mean())]))
  d.append(float(datos["D"].mean()[datos["T"].mean() == min(datos["T"].mean())]))
  d_std.append(float(datos["D"].std()[datos["T"].mean() == min(datos["T"].mean())]))

  # Configuracion con valor minimo de D
  utilidades.append(float(datos["U"].mean()[datos["D"].mean() == min(datos["D"].mean())]))
  ut_std.append(float(datos["U"].std()[datos["D"].mean() == min(datos["D"].mean())]))
  tbdl.append(float(datos["TbDL"].mean()[datos["D"].mean() == min(datos["D"].mean())]))
  tbdl_std.append(float(datos["TbDL"].std()[datos["D"].mean() == min(datos["D"].mean())]))
  t.append(float(datos["T"].mean()[datos["D"].mean() == min(datos["D"].mean())]))
  t_std.append(float(datos["T"].std()[datos["D"].mean() == min(datos["D"].mean())]))
  d.append(min(datos["D"].mean()))
  d_std.append(float(datos["D"].std()[datos["D"].mean() == min(datos["D"].mean())]))

  return [utilidades, ut_std, tbdl, tbdl_std, t, t_std, d, d_std]

# Funcion que imprime las metricas obtenidas por la funcion anterior
def imprTabla(matriz):
  print ("{:<8} {:<10} {:<10} {:<10} {:<10}".format(' ','Mejor U','Mejor TbDL','Mejor T','Mejor D'))
  print ("{:<8} {:<10} {:<10} {:<10} {:<10}".format( "U", round(matriz[0][0], 2), round(matriz[0][1], 2), round(matriz[0][2], 2), round(matriz[0][3], 2)))
  print ("{:<8} {:<10} {:<10} {:<10} {:<10}".format( "U STD", round(matriz[1][0], 2), round(matriz[1][1], 2), round(matriz[1][2], 2), round(matriz[1][3], 2)))
  print ("{:<8} {:<10} {:<10} {:<10} {:<10}".format( "TbDL", round(matriz[2][0], 2), round(matriz[2][1], 2), round(matriz[2][2], 2), round(matriz[2][3], 2)))
  print ("{:<8} {:<10} {:<10} {:<10} {:<10}".format( "TbDL STD", round(matriz[3][0], 2), round(matriz[3][1], 2), round(matriz[3][2], 2), round(matriz[3][3], 2)))
  print ("{:<8} {:<10} {:<10} {:<10} {:<10}".format( "T", round(matriz[4][0], 2), round(matriz[4][1], 2), round(matriz[4][2], 2), round(matriz[4][3], 2)))
  print ("{:<8} {:<10} {:<10} {:<10} {:<10}".format( "T STD", round(matriz[5][0], 2), round(matriz[5][1], 2), round(matriz[5][2], 2), round(matriz[5][3], 2)))
  print ("{:<8} {:<10} {:<10} {:<10} {:<10}".format( "D", round(matriz[6][0], 2), round(matriz[6][1], 2), round(matriz[6][2], 2), round(matriz[6][3], 2)))
  print ("{:<8} {:<10} {:<10} {:<10} {:<10}".format( "D STD", round(matriz[7][0], 2), round(matriz[7][1], 2), round(matriz[7][2], 2), round(matriz[7][3], 2)))


Obtengamos las tablas correspondientes a cada configuració:

In [None]:
# Separamos el df original en 4, uno para cada trio M, V y C
df_M1V2CT = df[df["M"] == 0]
df_M2V2CT = df[df["M"] != 0]

df_M1V1CT = df_M1V2CT[df_M1V2CT["V"] == 0]
df_M2V1CT = df_M2V2CT[df_M2V2CT["V"] == 0]
df_M1V2CT = df_M1V2CT[df_M1V2CT["V"] != 0]
df_M2V2CT = df_M2V2CT[df_M2V2CT["V"] != 0]

df_M1V1CF = df_M1V1CT[df_M1V1CT["C"] == False]
df_M2V1CF = df_M2V1CT[df_M2V1CT["C"] == False]
df_M1V2CF = df_M1V2CT[df_M1V2CT["C"] == False]
df_M2V2CF = df_M2V2CT[df_M2V2CT["C"] == False]
df_M1V1CT = df_M1V1CT[df_M1V1CT["C"] == True]
df_M2V1CT = df_M2V1CT[df_M2V1CT["C"] == True]
df_M1V2CT = df_M1V2CT[df_M1V2CT["C"] == True]
df_M2V2CT = df_M2V2CT[df_M2V2CT["C"] == True]

# Agrupamos los dataframes
df_M1V1CF_agrupado = df_M1V1CF.groupby(list(colnames[0:10]))
df_M2V1CF_agrupado = df_M2V1CF.groupby(list(colnames[0:10]))
df_M1V2CF_agrupado = df_M1V2CF.groupby(list(colnames[0:10]))
df_M2V2CF_agrupado = df_M2V2CF.groupby(list(colnames[0:10]))
df_M1V1CT_agrupado = df_M1V1CT.groupby(list(colnames[0:10]))
df_M2V1CT_agrupado = df_M2V1CT.groupby(list(colnames[0:10]))
df_M1V2CT_agrupado = df_M1V2CT.groupby(list(colnames[0:10]))
df_M2V2CT_agrupado = df_M2V2CT.groupby(list(colnames[0:10]))

## MDtype 1, UFtype 1, C False
print("MDtype 1, UFtype 1, C False\n")
mat = calcTabla(df_M1V1CF_agrupado)
imprTabla(mat)

## MDtype 2, UFtype 1, C False
print("\nMDtype 2, UFtype 1, C False\n")
mat = calcTabla(df_M2V1CF_agrupado)
imprTabla(mat)

## MDtype 1, UFtype 2, C False
print("\nMDtype 1, UFtype 2, C False\n")
mat = calcTabla(df_M1V2CF_agrupado)
imprTabla(mat)

## MDtype 2, UFtype 2, C False
print("\nMDtype 2, UFtype 2, C False\n")
mat = calcTabla(df_M2V2CF_agrupado)
imprTabla(mat)

## MDtype 1, UFtype 1, C True
print("\nMDtype 1, UFtype 1, C True\n")
mat = calcTabla(df_M1V1CT_agrupado)
imprTabla(mat)

## MDtype 2, UFtype 1, C True
print("\nMDtype 2, UFtype 1, C True\n")
mat = calcTabla(df_M2V1CT_agrupado)
imprTabla(mat)

## MDtype 1, UFtype 2, C True
print("\nMDtype 1, UFtype 2, C True\n")
mat = calcTabla(df_M1V2CT_agrupado)
imprTabla(mat)

## MDtype 2, UFtype 2, C True
print("\nMDtype 2, UFtype 2, C True\n")
mat = calcTabla(df_M2V2CT_agrupado)
imprTabla(mat)

MDtype 1, UFtype 1, C False

         Mejor U    Mejor TbDL Mejor T    Mejor D   
U        97.12      97.12      97.12      97.12     
U STD    3.33       3.33       3.33       3.33      
TbDL     37.51      37.51      37.51      37.51     
TbDL STD 4.64       4.64       4.64       4.64      
T        32.72      32.72      32.72      32.72     
T STD    4.22       4.22       4.22       4.22      
D        600.55     600.55     600.55     600.55    
D STD    74.14      74.14      74.14      74.14     

MDtype 2, UFtype 1, C False

         Mejor U    Mejor TbDL Mejor T    Mejor D   
U        97.16      94.65      94.8       94.49     
U STD    3.3        4.15       4.12       4.21      
TbDL     37.53      37.93      37.92      37.92     
TbDL STD 4.64       4.74       4.73       4.74      
T        32.51      29.88      29.77      29.92     
T STD    4.2        3.95       3.96       4.04      
D        596.06     453.66     452.36     451.26    
D STD    74.24      80.24      77.94    

Podemos comprobar que las mejores configuraciones se obtienen con UFtype 2. También podemos ver que MDtype 1 consigue llegar a valores más elevados de utilidad (manteniendo buenos niveles de T y D), mientras que MDtype 2 consigue valores de T y D más bajos (manteniendo buenos niveles de U). En ambos casos con valores de TbDL muy parecidos.

Además, vemos que tener C como True no supone ninguna mejora significativa aumentando de forma muy considerable T y D.

Como detalle interesante, las mejores configuraciones con UFtype 1 y C False consiguen prácticamente los mismos valores para MDtype 1 y MDtype 2.

Para acabar con esta parte, miraremos la configuración completa para los mejores resultados de las tablas anteriores:

In [None]:
print(df_M1V2CF_agrupado["U"].mean()[df_M1V2CF_agrupado["U"].mean() == max(df_M1V2CF_agrupado["U"].mean())])
print(df_M1V2CF_agrupado["U"].mean()[df_M1V2CF_agrupado["TbDL"].mean() == max(df_M1V2CF_agrupado["TbDL"].mean())])
print(df_M1V2CT_agrupado["U"].mean()[df_M1V2CT_agrupado["U"].mean() == max(df_M1V2CT_agrupado["U"].mean())])
print(df_M2V2CT_agrupado["U"].mean()[df_M2V2CT_agrupado["U"].mean() == max(df_M2V2CT_agrupado["U"].mean())])
print(df_M2V2CF_agrupado["U"].mean()[df_M2V2CF_agrupado["U"].mean() == max(df_M2V2CF_agrupado["U"].mean())])
print(df_M2V1CF_agrupado["U"].mean()[df_M2V1CF_agrupado["U"].mean() == max(df_M2V1CF_agrupado["U"].mean())])
print(df_M1V1CF_agrupado["U"].mean()[df_M1V1CF_agrupado["U"].mean() == max(df_M1V1CF_agrupado["U"].mean())])

M  IN    PI    At  Ap  INp  PIt  PIp  C      V
0  True  True  2   0   3    1    1    False  1    99.971117
Name: U, dtype: float64
M  IN    PI    At  Ap  INp  PIt  PIp  C      V
0  True  True  4   2   4    1    1    False  1    99.665911
Name: U, dtype: float64
M  IN    PI    At  Ap  INp  PIt  PIp  C     V
0  True  True  1   0   3    1    1    True  1    99.412077
Name: U, dtype: float64
M  IN    PI    At  Ap  INp  PIt  PIp  C     V
1  True  True  1   0   3    1    1    True  1    97.348772
Name: U, dtype: float64
M  IN    PI    At  Ap  INp  PIt  PIp  C      V
1  True  True  4   1   4    1    1    False  1    97.224627
Name: U, dtype: float64
M  IN    PI    At  Ap  INp  PIt  PIp  C      V
1  True  True  4   1   4    1    1    False  0    97.159844
Name: U, dtype: float64
M  IN    PI    At  Ap  INp  PIt  PIp  C      V
0  True  True  4   1   4    1    1    False  0    97.11696
Name: U, dtype: float64


Si consultamos nuestro diccionario tenemos los siguientes parámetros:

In [None]:
# At
print("At")
print(significado["At"][1])
print(significado["At"][2])
print(significado["At"][4])

# Ap
print("\nAp")
print(significado["Ap"][0])
print(significado["Ap"][1])
print(significado["Ap"][2])

# INp
print("\nINp")
print(significado["INp"][3])
print(significado["INp"][4])

# PIt
print("\nPIt")
print(significado["PIt"][1])

# PIp
print("\nPIp")
print(significado["PIp"][1])

At
[TNORMA_MIN, TNORMA_MAX]
[TNORMA_PRODUCT, TNORMA_MAX]
[OWA_OPERATOR, TNORMA_MAX]

Ap
None
[1.0, 0.0]
[0.75, 0.15]

INp
0.75
1.0

PIt
PI_LINEAR

PIp
[0.0, 1.0]


## Estudio de los ForcedEND

Pasemos a hacer un estudio de dónde aparecen los ForcedEND distintos de 0:

In [None]:
print(max(df_M1V1CF_agrupado["ForcedEND"].min()))
print(max(df_M2V1CF_agrupado["ForcedEND"].min()))
print(max(df_M1V2CF_agrupado["ForcedEND"].min()))
print(max(df_M2V2CF_agrupado["ForcedEND"].min()))
print(max(df_M1V1CT_agrupado["ForcedEND"].min()))
print(max(df_M2V1CT_agrupado["ForcedEND"].min()))
print(max(df_M1V2CT_agrupado["ForcedEND"].min()))
print(max(df_M2V2CT_agrupado["ForcedEND"].min()))

0
0
0
0
1
0
1
0


In [None]:
print(max(df_M1V1CF_agrupado["ForcedEND"].max()))
print(max(df_M2V1CF_agrupado["ForcedEND"].max()))
print(max(df_M1V2CF_agrupado["ForcedEND"].max()))
print(max(df_M2V2CF_agrupado["ForcedEND"].max()))
print(max(df_M1V1CT_agrupado["ForcedEND"].max()))
print(max(df_M2V1CT_agrupado["ForcedEND"].max()))
print(max(df_M1V2CT_agrupado["ForcedEND"].max()))
print(max(df_M2V2CT_agrupado["ForcedEND"].max()))

46
0
17
0
880
19
896
6


Aparentemente, las unicas configuraciones que no llegan nunca a ofrecer un forcedEND son las de MD_type2, sin capacidad de tomar decisiones en mitad de un desplazamiento.

Esto podría querer decir que son las configuraciones que más eficientes en la gestión del tiempo utilizado, ya que con ellas se terminan siempre las tareas antes del límite permitido.

## Calculo del mejor modelo en base a la media de los porcentajes

Ahora calcularemos como de peor es el rendimiento medio de cada una de las configuraciones respecto al rendimiento de la mejor configuración, en porcentaje, para cada una de las métricas estudiadas.

### Cálculo de los porcentajes

Para poder calcular los porcentajes previamente mencionados, necesimos encontrar cuál es el mejor valor medio para cada métrica.

In [None]:
ut_max   = max(df_agrupado["U"].mean())
tbdl_max = max(df_agrupado["TbDL"].mean())
t_min    = min(df_agrupado["T"].mean())
d_min    = min(df_agrupado["D"].mean())

También definiremos la función que vamos a utilizar.

In [None]:
def perCalc1(columna, maxVal):
  # Vector de porcentajes
  perVec = []

  for elemento in columna:
    aux = 1-elemento/maxVal
    perVec.append(aux*100)

  return perVec

def perCalc2(columna, minVal):
  # Vector de porcentajes
  perVec = []

  for elemento in columna:
    aux = -1+elemento/minVal
    perVec.append(aux*100)

  return perVec


Pasemos a utilizar estos valores para calcular los porcetajes.

In [None]:
porcentajes = pd.DataFrame(data = perCalc1(list(df_agrupado["U"].mean()), ut_max),
                           columns = ["U%"])
porcentajes["TbDL%"] = perCalc1(list(df_agrupado["TbDL"].mean()), tbdl_max)
porcentajes["T%"]    = perCalc2(list(df_agrupado["T"].mean()), t_min)
porcentajes["D%"]    = perCalc2(list(df_agrupado["D"].mean()), d_min)


Podemos encontrar la configuración utilizada poniendo el índice correspodiente del dataframe "porcentajes" en "df_agrupado.groups.keys()".

### Cálculo de la media

Ahora que ya tenemos los porcentajes de las medias para cada métrica, de cada configuración, podemos estudiar cuál es la mejor en general.

In [None]:
# media de los porcentajes obtenidos en las 4 métricas, para cada configuracion
mediaPer_original = []

for conf in range(0, porcentajes.shape[0]):
  aux = np.mean([porcentajes["U%"][conf], porcentajes["TbDL%"][conf], porcentajes["T%"][conf], porcentajes["D%"][conf]])
  mediaPer_original.append(aux)

porcentajes["Media"] = mediaPer_original

Definimos una función que nos permita imprimir la configuración obtenida más fácilmente.

In [None]:
def imprConf(dfAgrupado, indice):
  # Buscamos a que configuracion corresponde el indice
  confParam = list(dfAgrupado.groups.keys())[indice]

  #Imprimimos dicha configuracion
  print(significado["M"][confParam[0]])
  print(significado["V"][confParam[9]])
  print("Inercia: {}".format(confParam[1]))
  print("Interferencia: {}".format(confParam[2]))
  print("Tipo de AO: {}".format(significado["At"][confParam[3]]))
  print("Parametros del AO: {}".format(significado["Ap"][confParam[4]]))
  print("Parametros de inercia: {}".format(significado["INp"][confParam[5]]))
  print("Tipo de interferencia: {}".format(significado["PIt"][confParam[6]]))
  print("Parametros de interferencia: {}".format(significado["PIp"][confParam[7]]))
  print("Posibilidad de cambiar ruta: {}".format(confParam[8]))

  # Separador
  print("_"*60)



#### Resultados
Presentamos a continuación la tabla de resultados:

In [None]:
# Utilizar el código del siguiente comentario para poder ver la tabla entera
# pd.options.display.max_rows = porcentajes.shape[0]
print(porcentajes)

# Para saber la configuración a la que corresponden los resultados obtenidos, podemos usar:
# imprConf(df_agrupado, i)
# donde i se corresponde con el indice de la fila del dataframe posiciones

Las mejores configuraciones son las siguientes.

In [None]:
# Ordenamos los valores de menor a mayor
valoresOrdenados = list(np.sort(porcentajes["Media"]))

# Comprobemos cuales han sido las configuraciones que han obtenido un valor por debajo de 5
iter = 0
while(valoresOrdenados[iter] <= 5):
  # Miramos el indice del elemento que ha obtenido tal puntuacion
  indice = mediaPer_original.index(valoresOrdenados[iter])

  # Mostramos la configuracion
  print("La {} mejor configuración es:".format(iter+1))
  print("La media para esta configuración es: {}".format(valoresOrdenados[iter]))
  imprConf(df_agrupado, indice)

  # Pasamos al siguiente elemento
  iter = iter + 1

La 1 mejor configuración es:
La media para esta configuración es: 1.0798436707680326
MD_type2
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [OWA_OPERATOR, TNORMA_MAX]
Parametros del AO: [0.75, 0.15]
Parametros de inercia: 1.0
Tipo de interferencia: PI_LINEAR
Parametros de interferencia: [0.0, 1.0]
Posibilidad de cambiar ruta: False
____________________________________________________________
La 2 mejor configuración es:
La media para esta configuración es: 1.4106699138882488
MD_type2
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [OWA_OPERATOR, TNORMA_MAX]
Parametros del AO: [0.5, 0.25]
Parametros de inercia: 1.0
Tipo de interferencia: PI_LINEAR
Parametros de interferencia: [0.0, 1.0]
Posibilidad de cambiar ruta: False
____________________________________________________________
La 3 mejor configuración es:
La media para esta configuración es: 2.156609080442615
MD_type2
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [OWA_OPERATOR, TNORMA_MAX]
Parametros del AO:

### Alterantivas

Con el método de evaluación anterior, podemos ver que claramente MD_type2, junto a UF_type2, usando el operador OWA nos da los mejores resultados.

No obstante, con el método anterior tenemos en cuenta todos los parámetros con el mismo peso. Esto puedo no ser adecuado, dado que existe correlación entre las 4 métricas utilizadas y podríamos estar dando un exceso de importancia a alguna de ellas.

Además, la importacia de cada parámetro depende de cada situación. En aquellas situaciones en las que la distancia suponga un coste o tengamos baterías limitadas, tener valores de D pequeños será prioritario. Sin embargo, en situaciones dónde terminar el máximo de tareas antes de la DL sea indispensable priorizaremos U y TbDL.

Miremos cuales serían las mejores si solo consideráramos U y D:

In [None]:
# media de los porcentajes obtenidos en las 4 métricas, para cada configuracion
mediaPer = []

for conf in range(0, porcentajes.shape[0]):
  aux = np.mean([porcentajes["U%"][conf], porcentajes["D%"][conf]])
  mediaPer.append(aux)

# Ordenamos los valores de menor a mayor
valoresOrdenados = list(np.sort(mediaPer))

# Comprobemos cuales han sido las configuraciones que han obtenido un valor por debajo de 5
iter = 0
while(valoresOrdenados[iter] <= 5):
  # Miramos el indice del elemento que ha obtenido tal puntuacion
  indice = mediaPer.index(valoresOrdenados[iter])

  # Mostramos la configuracion
  print("La {} mejor configuración es:".format(iter+1))
  print("La media para esta configuración es: {}".format(valoresOrdenados[iter]))
  imprConf(df_agrupado, indice)

  # Pasamos al siguiente elemento
  iter = iter + 1

La 1 mejor configuración es:
La media para esta configuración es: 1.9943071829699122
MD_type2
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [OWA_OPERATOR, TNORMA_MAX]
Parametros del AO: [0.75, 0.15]
Parametros de inercia: 1.0
Tipo de interferencia: PI_LINEAR
Parametros de interferencia: [0.0, 1.0]
Posibilidad de cambiar ruta: False
____________________________________________________________
La 2 mejor configuración es:
La media para esta configuración es: 2.428300604121192
MD_type2
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [OWA_OPERATOR, TNORMA_MAX]
Parametros del AO: [0.5, 0.25]
Parametros de inercia: 1.0
Tipo de interferencia: PI_LINEAR
Parametros de interferencia: [0.0, 1.0]
Posibilidad de cambiar ruta: False
____________________________________________________________
La 3 mejor configuración es:
La media para esta configuración es: 3.5464029735400358
MD_type2
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [OWA_OPERATOR, TNORMA_MAX]
Parametros del AO:

Miremos que pasaría si no consideraramos D, ni T:

In [None]:
# media de los porcentajes obtenidos en las 4 métricas, para cada configuracion
mediaPer = []

for conf in range(0, porcentajes.shape[0]):
  aux = np.mean([porcentajes["U%"][conf], porcentajes["TbDL%"][conf]])
  mediaPer.append(aux)

# Ordenamos los valores de menor a mayor
valoresOrdenados = list(np.sort(mediaPer))

# Comprobemos cuales han sido las configuraciones que han obtenido un valor por debajo de 2
iter = 0
while(valoresOrdenados[iter] <= 2):
  # Miramos el indice del elemento que ha obtenido tal puntuacion
  indice = mediaPer.index(valoresOrdenados[iter])

  # Mostramos la configuracion
  print("La {} mejor configuración es:".format(iter+1))
  print("La media para esta configuración es: {}".format(valoresOrdenados[iter]))
  imprConf(df_agrupado, indice)

  # Pasamos al siguiente elemento
  iter = iter + 1

La 1 mejor configuración es:
La media para esta configuración es: 1.0266310406062351
MD_type1
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [OWA_OPERATOR, TNORMA_MAX]
Parametros del AO: [0.75, 0.15]
Parametros de inercia: 1.0
Tipo de interferencia: PI_LINEAR
Parametros de interferencia: [0.0, 1.0]
Posibilidad de cambiar ruta: False
____________________________________________________________
La 2 mejor configuración es:
La media para esta configuración es: 1.0852269156369554
MD_type1
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [OWA_OPERATOR, TNORMA_MAX]
Parametros del AO: [0.5, 0.25]
Parametros de inercia: 1.0
Tipo de interferencia: PI_LINEAR
Parametros de interferencia: [0.0, 1.0]
Posibilidad de cambiar ruta: False
____________________________________________________________
La 3 mejor configuración es:
La media para esta configuración es: 1.1568212911364284
MD_type1
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [TNORMA_PRODUCT, TNORMA_MAX]
Parametros del 

Con esto podemos ver que con MD_type2 lo que se prioriza es completar todas las tareas lo antes posible, minimizado el tiempo total utilizado. Por contra, con el MD_type1 se prioriza maximizar la utilidad y, en consecuencia, que todas las tareas se terminen antes del Dead-line.

Esto último tiene sentido porque en el MD_type1 no consideramos la distancia como un estímulo independiente, sino que consideramos la distancia conjuntamente con la utilidad (en todo momento la utilidad que percibe un robot es la que obtendría si se dirigiera en ese momento a realizar la tarea).

### Correlación entre las métricas

Para ver como de relacionadas están las métricas que hemos considerado para este estudio, calcularemos la matriz de correlaciones.

In [None]:
#Calculo correlación sin separar los datos
df_medidas = {"T": list(df_agrupado["T"].mean()),
              "U": list(df_agrupado["U"].mean()),
              "TbDL": list(df_agrupado["TbDL"].mean()),
              "D": list(df_agrupado["D"].mean())}
df_medidas = pd.DataFrame(df_medidas)

df_medidas.corr()

Unnamed: 0,T,U,TbDL,D
T,1.0,-0.744368,-0.992495,0.999824
U,-0.744368,1.0,0.774585,-0.751055
TbDL,-0.992495,0.774585,1.0,-0.993252
D,0.999824,-0.751055,-0.993252,1.0


Parece que las métricas T, TbDL y D guardan una correlación de prácticamente 1, mientras que la correlación con de estas 3 con U parece no ser tan grande. Esto puede querer decir que, en el método de evaluación, podríamos estar sobrerepresetando la información proporcionada por estas 3 variables.

Estudiemos que pasaría si mediáramos los resultados porcentuales de U con la media de los resultados de las otras 3.

In [None]:
# media de los porcentajes obtenidos en las 4 métricas, para cada configuracion
mediaPer = []

for conf in range(0, porcentajes.shape[0]):
  aux = np.mean([porcentajes["T%"][conf], porcentajes["TbDL%"][conf], porcentajes["D%"][conf]])
  aux = np.mean([porcentajes["U%"][conf], aux])
  mediaPer.append(aux)

# Ordenamos los valores de menor a mayor
valoresOrdenados = list(np.sort(mediaPer))

# Comprobemos cuales han sido las configuraciones que han obtenido un valor por debajo de 5
iter = 0
while(valoresOrdenados[iter] <= 10):
  # Miramos el indice del elemento que ha obtenido tal puntuacion
  indice = mediaPer.index(valoresOrdenados[iter])

  # Mostramos la configuracion
  print("La {} mejor configuración es:".format(iter+1))
  print("La media para esta configuración es: {}".format(valoresOrdenados[iter]))
  imprConf(df_agrupado, indice)

  # Pasamos al siguiente elemento
  iter = iter + 1

La 1 mejor configuración es:
La media para esta configuración es: 2.049433902491963
MD_type2
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [OWA_OPERATOR, TNORMA_MAX]
Parametros del AO: [0.75, 0.15]
Parametros de inercia: 1.0
Tipo de interferencia: PI_LINEAR
Parametros de interferencia: [0.0, 1.0]
Posibilidad de cambiar ruta: False
____________________________________________________________
La 2 mejor configuración es:
La media para esta configuración es: 2.2539254996799967
MD_type2
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [OWA_OPERATOR, TNORMA_MAX]
Parametros del AO: [0.5, 0.25]
Parametros de inercia: 1.0
Tipo de interferencia: PI_LINEAR
Parametros de interferencia: [0.0, 1.0]
Posibilidad de cambiar ruta: False
____________________________________________________________
La 3 mejor configuración es:
La media para esta configuración es: 2.76868640377357
MD_type2
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [OWA_OPERATOR, TNORMA_MAX]
Parametros del AO: [

Los resultados obtenidos siguen siendo mejores para MD_type2. Esto se debe a la gran mejora que supone este método en términos de la distancia total recorrida.

Repitamos el cálculo, pero separando por MD_type:

In [None]:
## Caluculo de la correlación separando por MD_type
# Encontramos el primer valor que es MD_type2
primerM2 = list(pd.DataFrame(list(df_agrupado.groups.keys()))[0]).index(1)

# Correlaciones en MD_type1
print("MD_type1")
print(df_medidas.loc[0:primerM2].corr())

# Correlaciones en MD_type2
print("\nMD_type2")
print(df_medidas.loc[primerM2:].corr())


MD_type1
             T         U      TbDL         D
T     1.000000 -0.752990 -0.992948  0.999878
U    -0.752990  1.000000  0.780371 -0.758601
TbDL -0.992948  0.780371  1.000000 -0.993303
D     0.999878 -0.758601 -0.993303  1.000000

MD_type2
             T         U      TbDL         D
T     1.000000 -0.906565 -0.947656  0.996500
U    -0.906565  1.000000  0.962808 -0.920720
TbDL -0.947656  0.962808  1.000000 -0.963261
D     0.996500 -0.920720 -0.963261  1.000000


Podemos ver que la matriz de correlaciones es muy distinta. Para MD_type1 la correlación de U con el resto de métricas es muy baja, mientras que para MD_type2 existe un gran correlación entre todas las métricas.

## Calculo del mejor modelo en base al ranking por métrica

Como alterativa al método propuesto en el apartado anterior para calcular el mejor modelo, en esta sección presentamos un método basado en rankings.

Para este método haremos un ranking en el que se indique que posición ha obtenido cada modelo para cada una de las métricas estudiadas. Posteriormente, sumaremos todas las posiciones para cada configuración. Consideraremos mejor aquellas configuraciones cuya suma tenga un valor más bajo.

Empecemos calculando la posición obtenida por cada configuración en cada una de las métricas.

In [None]:
# Diccionario de metricas ordenadas
metricas_ordenadas = {}
posiciones = {}

# Generamos el diccionario
for name in colnames[12:]:
  if(name == "U" or name == "TbDL"):
    aux = list(round(df_agrupado[name].mean(), 4))
    aux = sorted(aux, reverse=True)
    metricas_ordenadas[name] = aux.copy()
    posiciones[name] = aux.copy()
  elif(name == "T" or name == "D"):
    aux=list(round(df_agrupado[name].mean(), 4))
    aux.sort()
    metricas_ordenadas[name] = aux.copy()
    posiciones[name] = aux.copy()

# Generamos los rankings
for clave in list(metricas_ordenadas.keys()):
  ranking = 1

  for elemento in metricas_ordenadas[clave]:
    aux = np.where(np.array(list(round(df_agrupado[clave].mean(), 4)))==elemento)
    for i in list(aux[0]):
      posiciones[clave][i] = ranking

    ranking = ranking + 1


Calculemos ahora la suma de todas las posiciones para cada una de las configuraciones.

In [None]:
# Transformamos el diccionario en un dataframe
posiciones = pd.DataFrame(posiciones)

# Calculamos la suma de la posición obtenida en cada una de las métricas para todas las configuraciones
posiciones["Rank"] = posiciones[posiciones.columns[0]]-posiciones[posiciones.columns[0]]
for name in posiciones.columns:
  posiciones["Rank"] = posiciones["Rank"] + posiciones[name]

### Resultados
Presentamos a continuación la tabla completa de resultados:

In [None]:
# Utilizar el código del siguiente comentario para poder ver la tabla entera
# pd.options.display.max_rows = posiciones.shape[0]
print(posiciones)

# Para saber la configuración a la que corresponden los resultados obtenidos, podemos usar:
# imprConf(df_agrupado, i)
# donde i se corresponde con el indice de la fila del dataframe posiciones

       T    U  TbDL    D  Rank
0    396  357   318  369  2880
1    431  300   368  431  3060
2    358  335   297  340  2660
3    451  411   448  451  3522
4    304  311   335  306  2512
..   ...  ...   ...  ...   ...
495  272  316   329  272  2378
496    9   77    13    9   216
497    3   52     5    3   126
498   93  108   108   79   776
499   79   56    99   60   588

[500 rows x 5 columns]


Para facilitar la exploración del dataframe anterior, presentamos a continuación un método para encontrar las n mejores configuaraciones.

Consideramos que, en caso de empate, ambas configuraciones ocupan la misma posición, por lo que contamos todas como una única posición.

In [None]:
# Número de posiciones que queremos explorar
n = 10

# Ordenamos los resultados de la columna Rank
rankOrdenados = sorted(posiciones["Rank"])

iter = 0
while(iter < n):
  # Miramos el indice del elemento que ha obtenido tal puntuacion
  aux = np.where(np.array(list(posiciones["Rank"])) == rankOrdenados[iter])
  for i in list(aux[0]):
    # Mostramos la configuracion
    print("La {} mejor configuración es:".format(iter+1))
    print("La puntuación para esta configuración es: {}".format(rankOrdenados[iter]))
    imprConf(df_agrupado, i)

  # Pasamos al siguiente elemento
  iter = iter + 1

La 1 mejor configuración es:
La puntuación para esta configuración es: 116
MD_type2
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [OWA_OPERATOR, TNORMA_MAX]
Parametros del AO: [0.5, 0.25]
Parametros de inercia: 1.0
Tipo de interferencia: PI_LINEAR
Parametros de interferencia: [0.0, 1.0]
Posibilidad de cambiar ruta: False
____________________________________________________________
La 2 mejor configuración es:
La puntuación para esta configuración es: 122
MD_type2
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [HARMONIC_MEAN, TNORMA_MAX]
Parametros del AO: None
Parametros de inercia: 1.0
Tipo de interferencia: PI_LINEAR
Parametros de interferencia: [0.0, 1.0]
Posibilidad de cambiar ruta: False
____________________________________________________________
La 3 mejor configuración es:
La puntuación para esta configuración es: 124
MD_type2
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [TNORMA_PRODUCT, TNORMA_MAX]
Parametros del AO: None
Parametros de inercia: 0.75


### Comparativa del mejor modelo por criterio

En este apartado compararemos el mejor modelo obtenido por el método del ranking, con el mejor modelo obtenido por el método de de la media de todos los porcentajes.

In [None]:
indice1 = list(posiciones["Rank"]).index(rankOrdenados[0])
print("La mejor configuración utilizando ranking es:")
print(list(df_agrupado.groups.keys())[indice1])
print("La puntuación de ranking para esta configuración es: {}".format(rankOrdenados[0]))
print("La puntuación de media para esta configuración es: {}".format(mediaPer_original[indice1]))
imprConf(df_agrupado, indice1)

indice2 = mediaPer_original.index(sorted(mediaPer_original)[0])
print("La mejor configuración utilizando media de porcentajes es:")
print(list(df_agrupado.groups.keys())[indice2])
print("La puntuación de ranking para esta configuración es: {}".format(posiciones["Rank"][indice2]))
print("La puntuación de media para esta configuración es: {}".format(mediaPer_original[indice2]))
imprConf(df_agrupado, indice2)

for name, group in df_agrupado:
  if (name == list(df_agrupado.groups.keys())[indice1] or name == list(df_agrupado.groups.keys())[indice2]):
    # Imprime el nombre
    print(name)
    # Imprime el grupo
    print(group[colnames[12:]].mean())

    # Separador
    print("_"*60)

La mejor configuración es utilizando ranking es:
(1, True, True, 4, 3, 4, 1, 1, False, 1)
La puntuación de ranking para esta configuración es: 116
La puntuación de media para esta configuración es: 1.4106699138882488
MD_type2
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [OWA_OPERATOR, TNORMA_MAX]
Parametros del AO: [0.5, 0.25]
Parametros de inercia: 1.0
Tipo de interferencia: PI_LINEAR
Parametros de interferencia: [0.0, 1.0]
Posibilidad de cambiar ruta: False
____________________________________________________________
La mejor configuración es utilizando media de porcentajes es:
(1, True, True, 4, 2, 4, 1, 1, False, 1)
La puntuación de ranking para esta configuración es: 124
La puntuación de media para esta configuración es: 1.0798436707680326
MD_type2
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [OWA_OPERATOR, TNORMA_MAX]
Parametros del AO: [0.75, 0.15]
Parametros de inercia: 1.0
Tipo de interferencia: PI_LINEAR
Parametros de interferencia: [0.0, 1.0]
Posibilidad 

Podemos ver que ambos modelos coinciden en todo excepto los parámetros del método de agregación. Además, en ambos casos, las configuraciones han obtenido muy buena posición en la metodología en la que no han ganado.

Esto parece confirmar que el MD_type2, con UF_type2, utilizando como operador de agragación OWA, teniendo en cuenta inercia e interferencia ofrece los mejores resultados.

### Mejor configuración por métrica

In [None]:
for name in colnames[12:]:
  indice = list(posiciones[name]).index(min(posiciones[name]))
  print("La mejor configuración para {} es:".format(name))
  print("La puntuación de ranking para esta configuración es: {}".format(posiciones["Rank"][indice]))
  print("La puntuación de media para esta configuración es: {}".format(mediaPer_original[indice]))
  imprConf(df_agrupado, indice)


La mejor configuración para T es:
La puntuación de ranking para esta configuración es: 124
La puntuación de media para esta configuración es: 1.0798436707680326
MD_type2
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [OWA_OPERATOR, TNORMA_MAX]
Parametros del AO: [0.75, 0.15]
Parametros de inercia: 1.0
Tipo de interferencia: PI_LINEAR
Parametros de interferencia: [0.0, 1.0]
Posibilidad de cambiar ruta: False
____________________________________________________________
La mejor configuración para U es:
La puntuación de ranking para esta configuración es: 334
La puntuación de media para esta configuración es: 28.190296664144512
MD_type1
UF_type2
Inercia: True
Interferencia: True
Tipo de AO: [TNORMA_PRODUCT, TNORMA_MAX]
Parametros del AO: None
Parametros de inercia: 0.75
Tipo de interferencia: PI_LINEAR
Parametros de interferencia: [0.0, 1.0]
Posibilidad de cambiar ruta: False
____________________________________________________________
La mejor configuración para TbDL es:
La puntu