# Analiza pomiarów

Analiza i wizualizacja danych zebranych przy uruchamianiu algorytmu Knutha oraz algorytmu ewolucyjnego z różnymi parametrami.

In [48]:
import numpy as np
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

from pathlib import Path
from glob import glob
import re
from collections import defaultdict

from typing import Tuple, List, Dict

## Pomocnicze funkcje

In [99]:
def read_data_files(directory: str) -> Tuple[List[str], Dict[str, List[str]]]:
    files = glob(f'{directory}/*.csv')
    
    names = []
    data = defaultdict(list)
    for file_path in files:
        names.append(Path(file_path).stem)
        with open(file_path, 'r') as file:
            line = ''
            while(not re.match(r'Parametry', line)):
                line = file.readline()

            line = file.readline()
            parts = line.split(';')
            while len(parts) == 2:
                    data[parts[0]].append(parts[1].strip())

                    line = file.readline()
                    parts = line.split(';')

            while(not re.match(r'Wyniki', line)):
                    line = file.readline()

            line = file.readline()
            parts = line.split(';')
            while len(parts) == 2:
                data[parts[0]].append(parts[1].strip())

                line = file.readline()
                parts = line.split(';')
    
    tmp = data['Najmniejsza liczba generacji']
    data['Najmniejsza liczba generacji'] = data['Największa liczba generacji']
    data['Największa liczba generacji'] = tmp
    
    return names, data

In [146]:
def read_data_files_to_df(directory: str, index: str = None) -> pd.DataFrame:
    index_name = Path(directory).stem
    names, data = read_data_files(directory)
    
    df = pd.DataFrame(data)
    if (index):
        df.set_index(index)
    else:
        df.index = pd.Index(names, name=index_name)
    
    df = df.astype(
        {'Liczba symulacji': int, 
         'Wielkość populacji': int, 
         'Procent osobników używanych do reprodukcji': int,
         'Prawdopodobieństwo krzyżowania': float,
         'Prawdopodobieństwo mutacji': float,
         'Makymalna liczba pokoleń': int,
         'Średnia liczba populacji': float,
         'Liczba zabitych populacji': int,
         'Najmniejsza liczba generacji': int,
         'Największa liczba generacji': int
        })
    
    return df

## Algorytm Knutha

In [53]:
# TODO: Jakaś prosta analiza jedych wyników

## Algorytm gentyczny

Analizy wyników dla różnych parametrów.

In [80]:
base_path = 'Wyniki/Algorytm_ewolucyjny/Pojedyncze_zmiany'

### Metoda selekcji

In [204]:
df = read_data_files_to_df(f'{base_path}/metoda_selekcji')
results_df = df.iloc[:, -4:]
results_df

Unnamed: 0_level_0,Średnia liczba populacji,Liczba zabitych populacji,Najmniejsza liczba generacji,Największa liczba generacji
metoda_selekcji,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
ruletka,5.79,4,3,13
prosta,5.07,1,1,13
losowa,8.04,32,1,13
turniej,5.84,10,3,13


In [205]:
x = 'Metoda selekcji'
y = 'Średnia liczba populacji'
fig = px.bar(df.sort_values(y), x=x, y=y, color=x,
       title='Wpływ metody selekcji na średnią liczbę ruchów')

fig.show()
fig.write_image('fig.svg')

### Prawdopodobieństwo krzyżowania

In [206]:
df = read_data_files_to_df(f'{base_path}/prawdopodobienstwo_krzyzowania')
results_df = df.iloc[:, -4:]
results_df

Unnamed: 0_level_0,Średnia liczba populacji,Liczba zabitych populacji,Najmniejsza liczba generacji,Największa liczba generacji
prawdopodobienstwo_krzyzowania,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
40,5.86,1,2,13
80,5.81,3,2,13
0,6.29,4,2,13
90,6.02,5,2,13
50,5.2,0,2,11
20,5.37,1,2,13
30,5.46,1,1,13
100,5.87,3,2,13
10,5.47,2,3,13
60,5.58,1,2,13


In [207]:
x = 'Prawdopodobieństwo krzyżowania'
y = 'Średnia liczba populacji'
df = df.sort_values(y)
fig = px.bar(df, x=[f'⠀{i}%⠀' for i in df.index], y=y,
       title='Wpływ prawdopodobieństwa krzyżowania na średnią liczbę ruchów')

fig.show()
fig.write_image('fig.svg')

### Prawdopodobieństwo mutacji

In [210]:
df = read_data_files_to_df(f'{base_path}/prawdopodobienstwo_mutacji')
results_df = df.iloc[:, -4:]
results_df

Unnamed: 0_level_0,Średnia liczba populacji,Liczba zabitych populacji,Najmniejsza liczba generacji,Największa liczba generacji
prawdopodobienstwo_mutacji,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
40,5.76,2,1,13
80,5.93,1,2,13
0,6.57,16,3,13
90,5.73,0,3,12
50,5.65,2,2,13
20,6.09,7,2,13
30,5.87,4,2,13
100,5.74,4,3,13
10,6.57,16,3,13
60,5.79,3,3,13


In [211]:
x = 'Prawdopodobieństwo mutacji'
y = 'Średnia liczba populacji'
df = df.sort_values(y)
fig = px.bar(df, x=[f'⠀{i}%⠀' for i in df.index], y=y,
       title='Wpływ prawdopodobieństwa mutacji na średnią liczbę ruchów')

fig.show()
fig.write_image('fig.svg')

### Procent osobników wziętych do reprodukcji

In [216]:
df = read_data_files_to_df(f'{base_path}/procent_osobnikow_do_reprodukcji')
results_df = df.iloc[:, -4:]
results_df

Unnamed: 0_level_0,Średnia liczba populacji,Liczba zabitych populacji,Najmniejsza liczba generacji,Największa liczba generacji
procent_osobnikow_do_reprodukcji,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
50,5.86,3,2,13
25,7.55,24,3,13
100,5.91,2,2,13
75,5.84,6,2,13


In [217]:
x = 'Procent osobników używanych do reprodukcji'
y = 'Średnia liczba populacji'
df = df.sort_values(y)
fig = px.bar(df, x=[f'⠀{i}%⠀' for i in df.index], y=y,
       title='Wpływ procentu osobników używanych do reprodukcji na średnią liczbę ruchów')

fig.show()
fig.write_image('fig.svg')

### Czy osobniki są unikalne

In [222]:
df = read_data_files_to_df(f'{base_path}/unikalne_osobniki')
results_df = df.iloc[:, -4:]
results_df

Unnamed: 0_level_0,Średnia liczba populacji,Liczba zabitych populacji,Najmniejsza liczba generacji,Największa liczba generacji
unikalne_osobniki,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
nie,6.29,5,2,13
tak,6.21,3,3,13


In [226]:
y = 'Średnia liczba populacji'
df = df.sort_values(y)
fig = px.bar(df, x=df.index, y=y, color=df.index,
       title='Wpływ unikalności osobników na średnią liczbę ruchów')

fig.show()
fig.write_image('fig.svg')

### Wielkość populacji

In [228]:
df = read_data_files_to_df(f'{base_path}/wielkosc_populacji')
results_df = df.iloc[:, -4:]
results_df

Unnamed: 0_level_0,Średnia liczba populacji,Liczba zabitych populacji,Najmniejsza liczba generacji,Największa liczba generacji
wielkosc_populacji,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
750,4.95,0,1,9
50,11.76,78,4,13
300,6.64,6,2,13
100,10.29,60,1,13
500,5.35,0,3,10
200,7.62,18,1,13
400,5.95,3,3,13


In [231]:
x = 'Wielkość populacji'
y = 'Średnia liczba populacji'
df = df.sort_values(y)
fig = px.bar(df, x=[f'⠀{i}⠀' for i in df.index], y=y,
       title='Wpływ wielkości populacji na średnią liczbę ruchów')

fig.show()
fig.write_image('fig.svg')