Данный код обрабатывает результаты тестирования алгоритмов из `cpp-effective-solution/`, собирает метрики и выводит их на экран.

In [11]:
import numpy as np
import pandas as pd
import math
import matplotlib.pyplot as plt
from IPython.display import display, HTML, Image

In [49]:
def get_table(PRIM_time, PRIM_res,
              COST_time, COST_res, COST_cost,
              TYPES_time, TYPES_res, TYPES_cost,
              PARALL20_time, PARALL20_res, PARALL20_cost,
              PARALL100_time, PARALL100_res, PARALL100_cost,
              PARALL500_time, PARALL500_res, PARALL500_cost):
    """
    Данная функция получает значения всех метрик для данного тестирования (на конкретной карте, с конкретными control_set и types).
    
    Для этого необходимо в функцию передать массвы _res, _cost, _time для каждого алгоритма, участвующего в тестировании:
    PRIM (базовое решение, где стоимость примитива = длина), COST (базовое решение, стоимость примитива = стоимость коллизионного 
    следа), TYPES (альтернативное решение со склеиванием), PARALL20, 100, 500 (три варианта PARALL_T для разных T).
    (Для PRIM массив _cost не нужен, так как его стоимость несопоставима со стоимостью остальных алгоритмов: он ищет
    траектории кратчайшую, а не с наименьшим коллизионным следом)

    Эти массивы для каждого теста номер i содержат следюущее:
        _res[i] = 1, если путь в данном тесте алгоритм нашёл и 0 иначе,
        _time[i] = время работы (вне зависимости, нашелся ли путь) алгоритма на данном тесте,
        _cost[i] = стоимость решения, которое найдено алгоритмом.

    Будет возвращено в качестве результата таблица dataframe со всеми метриками.
    """

    assert (np.all(PRIM_res == COST_res) == 1)  # проверяем, что решенные тесты у PRIM и COST одинаковые (так должно быть, ведь
                                                # это базовые решения - отличается стоимость и все)#
    
    arr = []  # список строк таблицы

    # перебираем: название алгоритма, его массивы time, res, cost
    for name, time, res, cost in zip(["PRIM", "COST", "TYPES", "PARALL_20", "PARALL_100", "PARALL_500"],
                                     [PRIM_time, COST_time, TYPES_time, PARALL20_time, PARALL100_time, PARALL500_time], 
                                     [PRIM_res, COST_res, TYPES_res, PARALL20_res, PARALL100_res, PARALL500_res],
                                     [None, COST_cost, TYPES_cost, PARALL20_cost, PARALL100_cost, PARALL500_cost]):

        # Так как PRIM - базовое решение, то не может быть тестов, которые PRIM не решил,
        # а какой-то другой алгоритм решил...
        assert (res[PRIM_res == 0].sum() == 0)  # для этого все значения res, где PRIM_res = 0, должны быть нулями 
          
        line = []  # очередная строка таблицы
        line.append(name)  # имя алгоритма
        line.append(res.sum())  # количество решенных алгоритмом тестов
        line.append(round(res.sum() / PRIM_res.sum() * 100, 2))  # success rate (= доля от количетва тестов, решенных базовым решением), переводим в % и округляем до 2 знаков после запятой

         # на РЕШАЕМЫХ ТЕСТАХ (то есть решенных базовым решеним PRIM) вычисляем:
        line.append(f"{(time[PRIM_res==1].mean() * 1000):.2f}")  # среднее время работы алгоритма
        line.append(f"{(np.median(time[PRIM_res==1]) * 1000):.2f}")  # медианное время работы (оба времени в миллисекундах, мс)
        
        mask = (time > 0.01) & (PRIM_res == 1)  # тесты (маска в виде набора индексов), на которых алгоритм работал > 10 миллисекунд и которые были решаемы (базовым решеним PRIM) 
        speed_up = round((COST_time[mask] / time[mask]).mean(), 2)  # считаем ускорение относительно алгоритма COST на таких тестах
        line.append(speed_up)

        if cost is None:
            line.append(None)
        else:  # если текущий алгоритм не PRIM, то можно посчитать изменение стоимости
            cost_mask = (COST_cost > 0) & (res == 1)  # рассматриваем тесты, где стоимость пути у COST > 0, и на которых алгоритм нашёл путь
            line.append(round(((cost[cost_mask] / COST_cost[cost_mask]).mean() - 1) * 100, 2))  # считаем, на сколько в среднем дороже (в %) найденный алгоритмом путь, чем найденный COST
        
        low_mask = (PRIM_res == 1) & (TYPES_res == 0) & (PRIM_time > 0.01)  # маска тестов, решенных PRIM, но не решенных TYPES (такие вероятно есть, так как TYPES не даёт полноту), а также на которые PRIM потратил > 10 мс (чтобы тривиальные тесты не учитывать)
        line.append(round((time[low_mask] / PRIM_time[low_mask]).mean(), 2))  # считаем среднее замедление алгоритма на такой тестах
        
        arr.append(line)  # добавляем очередную строку таблицы
   
    df = pd.DataFrame(arr, columns=["Алгоритм", "Решено тестов", "Success rate, %",
                                    "Среднее время, мс", "Медианное время, мс", "Ускорение PRIM в тестах > 10 мс, раз",
                                    "Увеличиение стоимости, %", "Замедление, раз"])  # формируем dataframe
    return df

In [50]:
def get_metrics_from_file(file):
    """
    Данная функция должна собрать все метрики из файла file, который создаётся в процессе тестирования алгоритов. Такие файлы
    лежат в папке cpp-effective-solution/res.
    """

    # массивы для всех алгоритмов
    PRIM_time = []
    PRIM_res = []
    
    COST_time = []
    COST_res = []
    COST_cost = []
    
    TYPES_time = []
    TYPES_res = []
    TYPES_cost = []

    PARALL20_time = []
    PARALL20_res = []
    PARALL20_cost = []
    
    PARALL100_time = []
    PARALL100_res = []
    PARALL100_cost = []
    
    PARALL500_time = []
    PARALL500_res = []
    PARALL500_cost = []
    
    with open(file, "r") as f:
        while 1:  
            line = f.readline()  # построчно читаем файл
            if line == "":
                break  # дошли до конца -> выходим из цикла
                
            if "result" in line:  # если найдена строка результатов
                line1 = line
                line2 = f.readline()

                if ("result PRIM:" in line1) and ("time PRIMS:" in line2):  # проверяем, какой алгоритм нашёл путь согласно строке результатов          
                    PRIM_res.append(int(line1.split()[2]))
                    PRIM_time.append(float(line2.split()[2]))
                    continue

                if ("result COST:" in line1) and ("time COST:" in line2):                
                    COST_res.append(int(line1.split()[2]))
                    COST_time.append(float(line2.split()[2]))
                    COST_cost.append(float(line1.split()[4]))
                    continue

                if ("result TYPES:" in line1) and ("time TYPES:" in line2):                
                    TYPES_res.append(int(line1.split()[2]))
                    TYPES_time.append(float(line2.split()[2]))
                    TYPES_cost.append(float(line1.split()[4]))
                    continue

                if ("result PARALL:" in line1) and ("time PARALL 20:" in line2):                
                    PARALL20_res.append(int(line1.split()[2]))
                    PARALL20_time.append(float(line2.split()[3]))
                    PARALL20_cost.append(float(line1.split()[4]))
                    continue
                    
                if ("result PARALL:" in line1) and ("time PARALL 100:" in line2):                
                    PARALL100_res.append(int(line1.split()[2]))
                    PARALL100_time.append(float(line2.split()[3]))
                    PARALL100_cost.append(float(line1.split()[4]))
                    continue

                if ("result PARALL:" in line1) and ("time PARALL 500:" in line2):                
                    PARALL500_res.append(int(line1.split()[2]))
                    PARALL500_time.append(float(line2.split()[3]))
                    PARALL500_cost.append(float(line1.split()[4]))
                    continue

                raise Exception(line1, line2)  # если ни олин алгоритм не подошёл, что-то странное -> исключение

    PRIM_time = np.array(PRIM_time)  # превращаем массивы в numpy
    PRIM_res = np.array(PRIM_res, dtype=np.int32)
    
    COST_time = np.array(COST_time)
    COST_res = np.array(COST_res, dtype=np.int32)
    COST_cost = np.array(COST_cost)
    
    TYPES_time = np.array(TYPES_time)
    TYPES_res = np.array(TYPES_res, dtype=np.int32)
    TYPES_cost = np.array(TYPES_cost)

    PARALL20_time = np.array(PARALL20_time)
    PARALL20_res = np.array(PARALL20_res, dtype=np.int32)
    PARALL20_cost = np.array(PARALL20_cost)
    
    PARALL100_time = np.array(PARALL100_time)
    PARALL100_res = np.array(PARALL100_res, dtype=np.int32)
    PARALL100_cost = np.array(PARALL100_cost)

    PARALL500_time = np.array(PARALL500_time)
    PARALL500_res = np.array(PARALL500_res, dtype=np.int32)
    PARALL500_cost = np.array(PARALL500_cost)

    df = get_table(PRIM_time, PRIM_res,
                  COST_time, COST_res, COST_cost,
                  TYPES_time, TYPES_res, TYPES_cost,
                  PARALL20_time, PARALL20_res, PARALL20_cost,
                  PARALL100_time, PARALL100_res, PARALL100_cost,
                  PARALL500_time, PARALL500_res, PARALL500_cost)
    return df  # собираем таблицу из возвращаем её

In [51]:
maps = ["AR0700SR", "Milan_1_256", "Moscow_0_512", "Labyrinth", "WheelofWar", "w_woundedcoast"]  # названия всех карт, где тестировались алгоритмы
control_sets = ["main_control_set", "big_control_set", "short_control_set"]  # наборы control set, для которых было тестирование

for task_map in maps:
    img_file = "../cpp-effective-solution/maps/" + task_map + ".png"  # файл с картой

    results = []
    for cs in control_sets:
        res_file = "../cpp-effective-solution/res/" + task_map + "_" + cs + ".txt"
        df = get_metrics_from_file(res_file)
        results.append(df)  # собираем список всех результатов для данной карты

    display(HTML(f"<h1>Результаты карты {task_map}:</h1>"))  
    
    # пишем html-код, который рисует картинку с картой, справа от неё рисует три штуки dataframe - для каждого control set:
    html_content = f'''
    <br>
    <div style="display: flex;">
        <div style="flex: 1;">
            <img src="{img_file}" style="width: 400px; height: auto;"> 
        </div>
        <div style="flex: 1; margin-left: 20px;">
            <h5>Результаты для main_control_set</h5>
            {results[0].to_html()}
            <br>
            <h5>Результаты для big_control_set</h5>
            {results[1].to_html()}
            <br>
            <h5>Результаты для short_control_set</h5>
            {results[2].to_html()}
        </div>
    </div>
    '''
    # замечание: <br> ставит пробел в строку, <h3> делает текст жирным (как заголовок) - число можно увеличиивать, уменьшая
    # размер заголовка (<h1>, <h4>, ...)

    display(HTML(html_content))  # рисуем html-код


Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,2132,100.0,321.88,167.33,1.1,,1.0
1,COST,2132,100.0,344.55,177.79,1.0,0.0,1.16
2,TYPES,1900,89.12,121.93,59.57,3.38,6.33,3.62
3,PARALL_20,2132,100.0,183.47,71.44,2.67,4.47,3.37
4,PARALL_100,2132,100.0,169.57,60.34,3.24,5.26,4.6
5,PARALL_500,2132,100.0,166.12,57.86,3.4,5.64,4.65

Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,2511,100.0,368.53,184.19,1.11,,1.0
1,COST,2511,100.0,385.11,198.85,1.0,0.0,1.11
2,TYPES,1573,62.64,89.65,23.5,3.14,24.16,0.58
3,PARALL_20,2511,100.0,282.44,141.59,1.71,14.26,1.42
4,PARALL_100,2511,100.0,259.18,114.72,2.17,15.11,1.65
5,PARALL_500,2511,100.0,254.56,109.3,2.31,15.12,1.7

Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,3202,100.0,419.57,245.64,1.05,,1.0
1,COST,3202,100.0,437.39,250.72,1.0,0.0,1.09
2,TYPES,3111,97.16,267.57,131.58,1.86,1.87,4.82
3,PARALL_20,3202,100.0,334.74,160.28,1.54,1.72,3.83
4,PARALL_100,3202,100.0,293.06,136.64,1.81,1.82,5.16
5,PARALL_500,3202,100.0,285.03,131.83,1.87,1.82,5.86


Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,1872,100.0,86.29,20.03,1.13,,1.0
1,COST,1872,100.0,94.27,21.16,1.0,0.0,1.11
2,TYPES,1738,92.84,38.41,7.72,3.5,4.39,3.2
3,PARALL_20,1872,100.0,60.01,10.33,2.53,3.24,3.13
4,PARALL_100,1872,100.0,56.0,8.5,3.14,3.81,4.31
5,PARALL_500,1872,100.0,55.66,7.99,3.34,4.08,4.36

Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,2016,100.0,231.24,62.75,1.3,,1.0
1,COST,2016,100.0,256.25,81.93,1.0,0.0,1.29
2,TYPES,1349,66.91,81.45,11.49,2.75,18.6,0.76
3,PARALL_20,2016,100.0,220.26,66.24,1.54,10.64,1.64
4,PARALL_100,2016,100.0,197.89,53.1,1.96,11.94,1.92
5,PARALL_500,2016,100.0,193.36,51.49,2.1,12.4,2.06

Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,2333,100.0,242.71,90.78,1.16,,1.0
1,COST,2333,100.0,263.23,98.07,1.0,0.0,1.13
2,TYPES,2284,97.9,153.02,49.15,2.08,1.75,8.76
3,PARALL_20,2333,100.0,191.5,60.09,1.7,1.71,4.72
4,PARALL_100,2333,100.0,171.44,50.91,2.0,1.71,8.35
5,PARALL_500,2333,100.0,166.66,49.26,2.08,1.71,9.7


Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,4597,100.0,625.4,243.12,0.9,,1.0
1,COST,4597,100.0,534.3,212.21,1.0,0.0,0.94
2,TYPES,4388,95.45,170.35,47.46,4.66,2.08,5.9
3,PARALL_20,4597,100.0,268.39,66.43,3.22,1.83,3.02
4,PARALL_100,4597,100.0,239.1,51.68,4.22,1.96,5.04
5,PARALL_500,4597,100.0,233.46,48.76,4.5,1.99,6.91

Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,4784,100.0,1991.87,635.77,1.11,,1.0
1,COST,4784,100.0,1919.05,668.08,1.0,0.0,1.09
2,TYPES,3334,69.69,890.7,98.29,2.38,21.44,0.89
3,PARALL_20,4784,100.0,1899.12,579.35,1.37,12.68,1.3
4,PARALL_100,4784,100.0,1621.15,475.47,1.8,14.75,1.51
5,PARALL_500,4784,100.0,1562.07,452.73,1.94,14.93,1.81

Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,5145,100.0,673.48,304.29,0.92,,1.0
1,COST,5145,100.0,567.51,258.83,1.0,0.0,0.85
2,TYPES,5104,99.2,271.85,110.59,2.43,0.96,6.01
3,PARALL_20,5145,100.0,349.2,141.54,1.91,0.94,3.71
4,PARALL_100,5145,100.0,301.12,117.6,2.28,0.96,6.01
5,PARALL_500,5145,100.0,290.18,113.07,2.38,0.96,7.2


Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,8859,100.0,3346.53,2807.45,1.03,,1.0
1,COST,8859,100.0,3528.65,2945.01,1.0,0.0,1.08
2,TYPES,8547,96.48,1123.37,793.31,3.81,1.51,17.56
3,PARALL_20,8859,100.0,1456.69,992.3,2.97,1.29,3.5
4,PARALL_100,8859,100.0,1267.12,803.11,3.72,1.37,6.33
5,PARALL_500,8859,100.0,1236.61,771.36,3.91,1.45,11.25

Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,9099,100.0,4582.18,4188.61,0.99,,1.0
1,COST,9099,100.0,4570.6,4040.1,1.0,0.0,1.0
2,TYPES,6412,70.47,823.75,356.31,4.67,16.62,1.51
3,PARALL_20,9099,100.0,2627.89,1710.43,2.26,11.44,1.16
4,PARALL_100,9099,100.0,2259.13,1184.66,3.24,11.68,1.36
5,PARALL_500,9099,100.0,2190.41,1087.22,3.55,11.71,1.83

Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,9514,100.0,2235.41,1818.92,0.94,,1.0
1,COST,9514,100.0,2153.5,1721.67,1.0,0.0,0.98
2,TYPES,9463,99.46,1121.96,867.85,2.01,0.66,19.27
3,PARALL_20,9514,100.0,1463.13,1127.8,1.55,0.65,5.28
4,PARALL_100,9514,100.0,1206.35,927.61,1.89,0.66,9.43
5,PARALL_500,9514,100.0,1152.85,884.74,1.98,0.66,18.49


Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,8039,100.0,2700.69,1364.9,0.92,,1.0
1,COST,8039,100.0,2568.42,1193.14,1.0,0.0,0.97
2,TYPES,7790,96.9,568.4,243.88,4.92,1.33,7.94
3,PARALL_20,8039,100.0,911.76,345.99,3.38,1.15,2.68
4,PARALL_100,8039,100.0,734.25,266.08,4.46,1.29,4.93
5,PARALL_500,8039,100.0,699.95,250.59,4.76,1.29,8.13

Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,8229,100.0,9256.05,5071.8,1.03,,1.0
1,COST,8229,100.0,9297.11,4789.19,1.0,0.0,1.03
2,TYPES,5866,71.28,1857.22,628.55,3.54,18.14,1.26
3,PARALL_20,8229,100.0,5557.31,2988.89,1.92,12.5,1.13
4,PARALL_100,8229,100.0,4752.84,2240.27,2.62,12.87,1.28
5,PARALL_500,8229,100.0,4609.35,2118.17,2.83,12.93,1.53

Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,8619,100.0,2759.48,1459.54,0.9,,1.0
1,COST,8619,100.0,2589.83,1216.87,1.0,0.0,0.92
2,TYPES,8578,99.52,1291.33,583.03,2.12,0.69,17.0
3,PARALL_20,8619,100.0,1701.76,755.98,1.64,0.68,3.35
4,PARALL_100,8619,100.0,1399.96,624.1,1.98,0.69,6.84
5,PARALL_500,8619,100.0,1334.8,595.73,2.08,0.69,13.18


Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,3416,100.0,212.88,171.1,1.08,,1.0
1,COST,3416,100.0,229.96,182.61,1.0,0.0,1.11
2,TYPES,2794,81.79,76.24,53.69,3.58,15.78,1.75
3,PARALL_20,3416,100.0,138.92,66.95,2.81,10.22,2.35
4,PARALL_100,3416,100.0,132.18,57.24,3.32,11.91,2.77
5,PARALL_500,3416,100.0,130.62,55.26,3.46,12.9,2.76

Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,4061,100.0,466.07,386.33,1.1,,1.0
1,COST,4061,100.0,504.17,412.91,1.0,0.0,1.1
2,TYPES,2459,60.55,111.41,55.27,3.63,25.6,0.78
3,PARALL_20,4061,100.0,345.98,193.65,2.11,14.1,1.48
4,PARALL_100,4061,100.0,328.49,165.14,2.6,15.08,1.79
5,PARALL_500,4061,100.0,324.25,157.71,2.74,15.38,1.86

Unnamed: 0,Алгоритм,Решено тестов,"Success rate, %","Среднее время, мс","Медианное время, мс","Ускорение PRIM в тестах > 10 мс, раз","Увеличиение стоимости, %","Замедление, раз"
0,PRIM,5194,100.0,176.16,150.93,0.99,,1.0
1,COST,5194,100.0,176.56,148.35,1.0,0.0,1.01
2,TYPES,5061,97.44,110.15,88.57,1.71,1.51,3.88
3,PARALL_20,5194,100.0,139.72,109.46,1.39,1.41,3.57
4,PARALL_100,5194,100.0,122.35,93.83,1.61,1.47,4.98
5,PARALL_500,5194,100.0,118.57,91.0,1.67,1.47,4.99
