In [1]:
import matplotlib.pyplot as plt
import numpy as np
import time
import plotly.express as px
import pandas as pd


In [2]:
with open('broadwell.log') as file:
    broadwell_input = file.read();
with open('clk.log') as file:
    cascadelake_input = file.read();

In [3]:
number_of_nodes_list = []
input_file_size_list = []
write_times_list = []
read_times_list = []
test_type_list = []

for elem in broadwell_input.split('==='):
    try:
        list_of_elem = elem.split('\n');
        number_of_nodes = int(list_of_elem[list_of_elem.index('numofnodes:')+1])
        input_file_size = int(list_of_elem[list_of_elem.index('cmdline:')+1].split()[0])
        write_list = list_of_elem[list_of_elem.index('Write times:')+1].split(' ');
        read_list = list_of_elem[list_of_elem.index('Read times:')+1].split(' ');
        for i in range(5):
            number_of_nodes_list.append(number_of_nodes)
            input_file_size_list.append(input_file_size)
            write_times_list.append(input_file_size/float(write_list[i]))
            read_times_list.append(input_file_size/float(read_list[i]))
            test_type_list.append(i+1)
    
    except ValueError:
        pass

In [4]:
df_broadwell = pd.DataFrame({
    'number_of_nodes': number_of_nodes_list,
    'input_file_size': input_file_size_list,
    'write_times': write_times_list,
    'read_times': read_times_list,
    'test_type': test_type_list,
})
df_broadwell

Unnamed: 0,number_of_nodes,input_file_size,write_times,read_times,test_type
0,1,1024,6.424090e+04,5.688889e+05,1
1,1,1024,2.370370e+05,5.851429e+05,2
2,1,1024,2.370370e+05,6.059172e+05,3
3,1,1024,2.332574e+05,5.688889e+05,4
4,1,1024,2.432304e+05,6.320988e+05,5
...,...,...,...,...,...
275,16,4294967296,6.583829e+08,6.124556e+08,1
276,16,4294967296,6.365046e+08,5.973944e+08,2
277,16,4294967296,6.321725e+08,6.072917e+08,3
278,16,4294967296,6.785163e+08,6.305196e+08,4


In [5]:
number_of_nodes_list = []
input_file_size_list = []
write_times_list = []
read_times_list = []
test_type_list = []

for elem in cascadelake_input.split('==='):
    try:
        list_of_elem = elem.split('\n');
        number_of_nodes = int(list_of_elem[list_of_elem.index('numofnodes:')+1])
        input_file_size = int(list_of_elem[list_of_elem.index('cmdline:')+1].split()[0])
        write_list = list_of_elem[list_of_elem.index('Write times:')+1].split(' ');
        read_list = list_of_elem[list_of_elem.index('Read times:')+1].split(' ');
        for i in range(5):
            number_of_nodes_list.append(number_of_nodes)
            input_file_size_list.append(input_file_size)
            write_times_list.append(input_file_size/float(write_list[i]))
            read_times_list.append(input_file_size/float(read_list[i]))
            test_type_list.append(i+1)
    
    except ValueError:
        pass

In [6]:
df_cascadelake = pd.DataFrame({
    'number_of_nodes': number_of_nodes_list,
    'input_file_size': input_file_size_list,
    'write_times': write_times_list,
    'read_times': read_times_list,
    'test_type': test_type_list,
})
df_cascadelake

Unnamed: 0,number_of_nodes,input_file_size,write_times,read_times,test_type
0,1,1024,1.535232e+05,1.256442e+05,1
1,1,1024,2.598985e+05,6.023529e+05,2
2,1,1024,2.730667e+05,5.953488e+05,3
3,1,1024,2.694737e+05,6.023529e+05,4
4,1,1024,2.680628e+05,6.206061e+05,5
...,...,...,...,...,...
190,1,16777216,5.380762e+08,9.494746e+08,1
191,1,16777216,5.579387e+08,9.510893e+08,2
192,1,16777216,5.831497e+08,8.886237e+08,3
193,1,16777216,5.631828e+08,9.182932e+08,4


In [15]:
fig = px.line(df_broadwell.sort_values('input_file_size'),
              x='input_file_size',
              y='read_times',
              title='График зависимости времени чтения от размера файла, процессоры - Intel Broadwell',
              labels={
                  'input_file_size': "Размер файла, байт",
                  'read_times': "Скорость чтения, байт в секунду",
                  'test_type': "Тип теста",
              },
              markers=True,
              log_x=True,
              log_y=True,
              color='number_of_nodes')
fig.show()

In [8]:
fig = px.line(df_broadwell.sort_values('input_file_size'),
              x='input_file_size',
              y='read_times',
              title='График зависимости времени чтения от размера файла, процессоры - Intel Broadwell',
              labels={
                  'input_file_size': "Размер файла, байт",
                  'read_times': "Скорость чтения, байт в секунду",
                  'test_type': "Тип теста",
              },
              markers=True,
              log_x=True,
              log_y=True,
              color='test_type')
fig.show()

In [9]:
fig = px.line(df_broadwell.sort_values('input_file_size'),
              x='input_file_size',
              y='write_times',
              title='График зависимости времени записи от размера файла, процессоры - Intel Broadwell',
              labels={
                  'input_file_size': "Размер файла, байт",
                  'write_times': "Скорость записи, байт в секунду",
                  'test_type': "Тип теста",
              },
              markers=True,
              log_x=True,
              log_y=True,
              color='test_type')
fig.show()

In [10]:
fig = px.line(df_cascadelake.sort_values('input_file_size'),
              x='input_file_size',
              y='read_times',
              title='График зависимости времени чтения от размера файла, процессоры - Intel Cascadelake',
              labels={
                  'input_file_size': "Размер файла, байт",
                  'read_times': "Скорость чтения, байт в секунду",
                  'test_type': "Тип теста",
              },
              markers=True,
              log_x=True,
              log_y=True,
              color='test_type')
fig.show()

In [11]:
fig = px.line(df_cascadelake.sort_values('input_file_size'),
              x='input_file_size',
              y='write_times',
              title='График зависимости времени записи от размера файла, процессоры - Intel Cascadelake',
              labels={
                  'input_file_size': "Размер файла, байт",
                  'write_times': "Скорость записи, байт в секунду",
                  'test_type': "Тип теста",
              },
              markers=True,
              log_x=True,
              log_y=True,
              color='test_type')
fig.show()