# Úloha 2: nasazení pokročilé heuristiky

Dominik Dosoudil

dosoudom

03.01.2023

## Zadání

**Řešení problému max. vážené splnitelnosti booleovské formule (MWSAT) pokročilou iterativní metodou**

Popis problému: https://courses.fit.cvut.cz/NI-KOP/problems/sat.html#mwsat

Problém řešte některou z pokročilých heuristik:

- simulované ochlazování
- genetický algoritmus

Detail zadání: https://courses.fit.cvut.cz/NI-KOP/homeworks/files/task2.html

## Implementace

Pro řešení problému jsem si vybral variantu **simulované ochlazování** (SA). Heuristiku jsem implementoval v jazyce **Rust**, který je z mého pohledu pro tuto úlohu vhodný vzhledem k jeho rychlosti a jelikož je problém řešen jednovláknově, nebudou dělat překážku ani mechaniky jazyka pro práci s pamětí.

Základ SA:

```rust
    // Nejprve nastavíme nějakou počáteční teplotu, konkrétní metoda bude popsána později.
    let mut t = compute_initial_temperature(&mut rng, &f, &value);

    // Vygenerujeme náhodný počáteční stav.
    let mut state = TruthAssignment::new_random(f.vars_n, &mut rng);

    // Algoritmus simulovaného ochlazování běží ve 2 úrovních smyček.
    // Ve vnější smyčce iterujeme dokud není splněna podmínka zamrznutí, tedy teplota neklesne pod stanovenou hodnotu.
    while !frozen(t) {
        // Vnitřní smyčka běží fixní počet kroků definovaný v konstanntě "EQUILIBRIUM".
        for _ in 0..EQUILIBRIUM {
            // V každé iteraci si vybereme náhodného souseda aktuálního stavu.
            // (pozn.: Do funkce next_state předávám generátor náhodných čísel aby bylo možené v případě debugování použít PRNG se seedem)
            let new_state = next_state(&mut rng, state.clone());
            
            // Vypočteme hodnotu obou stavů.
            let state_value = value(&state, &f);
            let new_state_value = value(&new_state, &f);

            // Pokud je nový stav lepší (má vyšší hodnotu), přejdeme do něj.
            if new_state_value > state_value {
                state = new_state;
            // V případě zhoršení do něj přejdeme pokud funkce accept vrátí true,
            // což je založeno na náhodě, aktuální teplotě a velikosti zhoršení.
            } else if accept(&mut rng, (state_value - new_state_value) as f64, t) {
                state = new_state;
            }
        }
        // Nakonec každé iterace vnější smyčky snížíme teplotu.
        t = cool_down(t);
    }

```
### Inicializace teploty (compute_initial_temperature)

Vysoká teplota nám v podstatě zvyšuje šanci přijetí horšího stavu, což zapříčiní rozšíření zkoumaného prostoru. Proto potřebujeme počáteční teplotu dost vysokou, aby byl prozkoumaný prostor dostatečně velký.

Jelikož řeším problém vážené splnitelnosti, musí počáteční teplota odrážet i váhy proměnných. K obecným metodám zmíněným v přednášce se zde nabízí odhad počáteční teploty na základě počtu proměnných, počtu klauzulí a například průměru vah. Nakonec jsem se nicméně rozhodl pro obecnou metodu sledování četnosti přijetí při zvyšování teploty. Tu jsem provedl tak, že ve smyčce zvyšuji teplotu o nějakou konstantu a v každé iteraci si vygeneruji 10 náhodných stavů a jejich sousedů, spočtu pravděpodobnost přijetí a pokud průměr z těchto pravděpodobností přijetí je vyšší než 0.5, vrátím aktuální teplotu.

Díky tomu je výběr počáteční teploty dynamický a není třeba jej ladit ve white box fázi.

### Výběr souseda (next_state)

Při výběru náhodného souseda zneguji ohodnocení náhodné proměnné v aktuálním stavu.

### Hodnota stavu (value)

Hodnota stavu je součet vah proměnných ohodnocených na true (1).
Nicméně jelikož by se mohlo stát, že SA začne upřednostňovat taková řešení, která ohodnotí hodně proměnných na true ačkoli takové ohodnocení nesplní formuli, musíme hodnotu penalizovat pokud jsou některé klauzule nesplněné. Tedy součet vah zmenšíme o počet nesplněných klauzulí vynásobených nějakou penalizační konstantou.

#### Penalizační konstanta

V přednášce máme uvedenou jako penalizační konstantu hodnotu 1000. Nicméně tato hodnota by mohla být moc malá pokud bychom měli velké váhy. Proto musí penalizační konstanta odrážet velikost vah. Zde by mohl dobře fungovat například průměr vah.

Tento průměr vah ještě přenásobím hodnotou 4, což je popsáno ve white box testování.

### Předběžné ukončení ()

Pro předběžné ukončení jsem zkusil 2 metody.

První jednodušší v každé iteraci zkusila, zdali je relativní změna hodnoty oproti předchozí iteraci menší než nějaká malá konstanta. Pokud ano, snížila counter o 1, pokud ne, resetovala counter. Pokud counter došel k 0, ukončila SA. Nicméně tato metoda se moc neosvědčila.

Druhá metoda každou vnější iteraci vezme posledních 2500 hodnot a spočítá relativní odchylku. Pokud je tato relativní odchylka menší než nějaká malá konstanta, ukončí výpočet.

### Ochlazení (cool_down)

Ochlazování se provádí vynásobením aktuální teploty nějakou konstantou menší než 1.

White box testování úkázalo jako vhodný koeficient hodnotu 0.97.

### Zamrznutí (frozen)

Protože počáteční teplota je nastavena dynamicky na základě problému, nastavím i minimální teplotu závisle na počáteční. Tím bych měl teoreticky docílit podobné doby běhu nezávisle na velikosti instance.

Vydělím tedy počáteční teplotu mocninou 10. Tato mocnina bude parametrizovatelná a vyzkoušená ve white box fázi.


### Parametry programu
výpis --help
```
Options:
  -i, --input <INPUT>
          
  -c, --cooling-ratio <COOLING_RATIO>
          [default: 0.995]
  -m, --min-temperature <MIN_TEMPERATURE>
          [default: 5]
  -p, --penalty-multiplier <PENALTY_MULTIPLIER>
          [default: 4]
      --tail-cut-length <TAIL_CUT_LENGTH>
          [default: 2500]
      --tail-cut-method <TAIL_CUT_METHOD>
          [default: relative-deviation] [possible values: relative-deviation, relative-change]
  -h, --help
          Print help information

```

## Experimenty

Při všech experimentech měřím počet iterací vnitřní smyčky (tedy počet změn stavu). Tedy nezáleží na HW.

### White box

V této fázi experimentu se budu věnovat výběru parametrů pro nastavení algoritmu tak, aby průběh fungoval dobře pro reprezentanty různých velikostí instancí.
Jako reprezentanty náhodně vybírám:
 - data/wuf20-91R/wuf20-91R-R/wuf20-0118.mwcnf
     - optimum: 15021
 - data/wuf50-218R/wuf50-218R-Q/wuf50-0311.mwcnf
     - optimum: 463
 - data/wuf75-325/wuf75-325-M/wuf75-078.mwcnf
     - optimum: 25743

#### Velikost penalizace

Jako první bych rád správně nastavil penalizaci, abych zajistil, že nevalidní stavy (stavy, které mají nenulový počet nesplněných klauzulí) nebudou mít hodnotu větší než stavy validní. Díky tomu by pak SA mělo preferovat stavy, které splňují všechny klauzule a tedy nejlepší z takových stavů by i měl být výsledkem algoritmu.

Jak jsem již zmínil v řešení, jako penalizaci místo hodnoty 1000 používám průměr vah ze zadání problému. Tento průměr ale možná ještě bude potřeba přenásobit nějakým multiplikátorem.

Konfigurace:
|||
|-|-|
|cooling ratio|0.995|
|minimal temperature|5.0|

Zkoušené multiplikátory penalizace:

|multiplier | input | value |
|-------|---|---|
| 1     | wuf20-0118 | 26989 |
| 1     | wuf50-0311 | 6331  |
| 1     | wuf75-078  | 25830 |
| 4     | wuf20-0118 | 15956 |
| 4     | wuf50-0311 | 4806  |
| 4     | wuf75-078  | 25743 |
| 8     | wuf20-0118 | 15021 |
| 8     | wuf50-0311 | 3641  |
| 8     | wuf75-078  | 25743 |


Z následujících grafů můžeme vidět, že pro hodnotu 1 je více nesplněných klauzulí. Pro hodnotu 4 už méně a pro hodnotu 8 ještě méně. Nicméně pokud bude multiplikátor moc velký, zbytečně nám bude velmi snižovat hodnotu a zvětšovat rozsah možných hodnot. Zároveň je na grafu vidět, že průběh již není tak dobrý. Proto vybírám hodnotu **4**.

multiplier = 1

![wuf20-0118.mwcnf.png](attachment:89b0081a-9258-42a5-892f-d41ce1b1365c.png)
![wuf50-0311.mwcnf.png](attachment:43e31612-7f1e-4c14-83d3-0408072367ce.png)
![wuf75-078.mwcnf.png](attachment:56d905dd-f52f-4cea-b0d0-592690ef9b2d.png)


multiplier = 4

![wuf20-0118.mwcnf.png](attachment:95d7e1f6-8061-43fa-ab81-1728ffa5fbd8.png)
![wuf50-0311.mwcnf.png](attachment:f8f711df-f2ad-40a1-a25e-054f50d2bda5.png)
![wuf75-078.mwcnf.png](attachment:198712c5-f855-45c6-a8dc-295b9f4ee4e5.png)

multiplier = 8

![wuf20-0118.mwcnf.png](attachment:35a6924e-7b8c-40af-b8f7-b9b6c3614e34.png)
![wuf50-0311.mwcnf.png](attachment:acce07f3-a43d-4581-834c-6c0ebcaf9bce.png)
![wuf75-078.mwcnf.png](attachment:df6c04b2-a31e-4dfe-9548-70fa1ed5cdad.png)

#### Ochlazovací koeficient

Ochlazovací koeficient je jeden z parametrů, který nám omezuje maximální dobu běhu (s menším koeficientem klesá teplota rychleji a dříve zamrzne algoritmus). Na druhou stranu ale v podstatě určuje kolik má SA prostoru pro volnější prozkoumávání stavového prostoru. Pokud se teplota ochladí moc brzy, brzy se i přestanou přijímat zhoršující stavy.

Obvykle se ochlazovací koeficient nastavuje na hodnoty v rozmezí 0.8 - 0.99. Proto také zkusím hodnoty z tohoto rozmezí.

|cooling coefficient| input | value |
|---|---|---|
| 0.85 | wuf20-0118 | 14285 |
| 0.85 | wuf50-0311 | 4380  |
| 0.85 | wuf75-078  | 25743 |
| 0.9  | wuf20-0118 | 15956 |
| 0.9  | wuf50-0311 | 4496  |
| 0.9  | wuf75-078  | 25743 |
| 0.95 | wuf20-0118 | 15956 |
| 0.95 | wuf50-0311 | 4380  |
| 0.95 | wuf75-078  | 25743 |
| 0.97 | wuf20-0118 | 15956 |
| 0.97 | wuf50-0311 | 4806  |
| 0.97 | wuf75-078  | 25743 |
| 0.99 | wuf20-0118 | 15956 |
| 0.99 | wuf50-0311 | 4806  |
| 0.99 | wuf75-078  | 25743 |

Z následujících grafů je vidět, že pro hodnoty 0.85 - 0.95 se moc nemění hodnoty stavů a prostor není dostatečně prozkoumán. Lepší mi přijdou vyšší hodnoty. Může to být dané zafixováním hodnoty ekvilibria na malou hodnotu. Nicméně i tak pro koeficient 0.97 vypadá průběh SA dobře a proto volím tuto hodnotu. Vyšší hodnota 0.99 už zbytečně prodlužuje výpočet.

cooling coefficient = 0.85

![wuf20-0118.mwcnf.png](attachment:756f748a-291d-4541-a6dd-0052d13f9d34.png)
![wuf50-0311.mwcnf.png](attachment:8ee23c5a-6ea3-41aa-b84c-b508f80d22b3.png)
![wuf75-078.mwcnf.png](attachment:8e747073-fc12-47e2-8143-12301359b061.png)

cooling coefficient = 0.9

![wuf20-0118.mwcnf.png](attachment:86129608-664a-48c7-9a32-d7d4182e1c20.png)
![wuf50-0311.mwcnf.png](attachment:85cea734-bea6-4abc-aa89-d73a60fdcfa9.png)
![wuf75-078.mwcnf.png](attachment:b163aab8-e05c-4708-ade8-6082b6542f1f.png)

cooling coefficient = 0.95

![wuf20-0118.mwcnf.png](attachment:6017907b-0b3a-43df-81bb-a8cc6869ba2d.png)
![wuf50-0311.mwcnf.png](attachment:a9cd4500-2930-4c27-9e42-0c303d5e0105.png)
![wuf75-078.mwcnf.png](attachment:29522902-b40d-46a4-9ba8-bbe7c4ac04e5.png)

cooling coefficient = 0.97

![wuf20-0118.mwcnf.png](attachment:b7c4b9b4-fc9c-446d-b087-d2d5456643e8.png)
![wuf50-0311.mwcnf.png](attachment:1b634e1a-661c-4ce9-ae90-a70161480deb.png)
![wuf75-078.mwcnf.png](attachment:f85712c1-d3e4-4667-a19c-37a3d482a006.png)


cooling coefficient = 0.99

![wuf20-0118.mwcnf.png](attachment:f3bcf9bc-f3ea-40ea-b7bc-89889464d2dd.png)
![wuf50-0311.mwcnf.png](attachment:589b5e88-2262-4d01-83e2-6ec16695ce87.png)
![wuf75-078.mwcnf.png](attachment:c1dbc2a7-b61c-41c0-827a-de2311895d93.png)

#### Zamrznutí

Minimální teplota, tedy teplota, při které SA ukončí výpočet, je další parametr participující na maximální době běhu. Pokud nebude o dost menší než počáteční teplota, tak se algoritmus vypne dříve než dokonverguje k nějaké ustálené hodnotě. Proto by měla být minimální teplota dostatečně nízká.

Zkusím nastavit $ x $, kde minimální teplota bude $ t_{min} = \frac{t_{init}}{10^x} $.


|x||
|-|-|
|1||
|**2**||
|4||
|8||
|10||


Z grafů je vidět, že pro mocninu 1 skončí výpočet moc brzy a nebyl dostatek času pro konvergování.
Pro hodnotu 2 je již čas na konvergenci dostatečný a tedy volím tuto hodnotu, protože zbytečně snižovat minimální teplotu by přineslo akorát prodloužení výpočtu.

x = 1

![wuf20-0118.mwcnf.png](attachment:5f12f4aa-4937-45a0-82a0-44726c7b4174.png)![wuf50-0311.mwcnf.png](attachment:795da411-b93a-49a1-a821-53e6daaa52c9.png)![wuf75-078.mwcnf.png](attachment:94db81d5-8579-4f9c-b41a-3fc81f3b70e7.png)

x = 2

![wuf20-0118.mwcnf.png](attachment:8cb65c2d-a710-44d1-96ab-d8688b1a7651.png)![wuf50-0311.mwcnf.png](attachment:918a3564-f46d-4849-a0c9-a82af1b6ea11.png)![wuf75-078.mwcnf.png](attachment:91da0085-b269-4b22-8d46-e96815b24c95.png)

x = 4

![wuf20-0118.mwcnf.png](attachment:5d2efd08-fe55-473d-8795-b40396eb350c.png)![wuf50-0311.mwcnf.png](attachment:bbc53526-23af-4bb7-ad9e-1cf106a4e25a.png)![wuf75-078.mwcnf.png](attachment:62a61a98-baad-48f4-874c-3986f01884b9.png)

x = 8

![wuf20-0118.mwcnf.png](attachment:3e5e042a-0b87-4db6-8a10-4f23324523c2.png)![wuf50-0311.mwcnf.png](attachment:7aac6b45-7320-4d74-a95d-5bb31d25460c.png)![wuf75-078.mwcnf.png](attachment:c0f4008b-25df-4f36-b935-a208550d01e9.png)


#### Metodika předběžného ukončení (tail cut)

Jelikož jsem implementoval 2 různé metody předběžného ukončení a navíc lze parametrizovat kolik posledních hodnot bude metoda zkoumat, provedu kombinace těchto nastavení najednou.

| method | last_values_n | wuf20-0118 value | wuf50-0311 value | wuf75-078 value |
|-|-|-|-|-|
|relative-change    | 100  | 15956 | -2266 | -8548 |
|relative-change    | 800  | 15021 | 4806 | 25743 |
|relative-change    | 3000 | 15021 | 3955 | 25743 |
|relative-deviation | 100  | 15956 | 4806 | 25743 |
|relative-deviation | 800  | 15021 | 4806 | 25743 |
|relative-deviation | 3000 | 15956 | 4496 | 25743 |

method = relative-change, last_values_n = 100

![wuf75-078.mwcnf.png](attachment:281a2577-80f4-47fd-9fd7-58a9930d03fa.png)![wuf20-0118.mwcnf.png](attachment:c49ae676-28f8-44ce-839a-0cba95649784.png)![wuf50-0311.mwcnf.png](attachment:775588a2-1a8e-4f23-8b85-c6cbe5f798f0.png)

method = relative-change, last_values_n = 800

![wuf20-0118.mwcnf.png](attachment:5c41ea22-8ab3-4752-8b77-4e8225abc9af.png)![wuf50-0311.mwcnf.png](attachment:5c176437-f8c3-4a00-899a-1d4350673a8b.png)![wuf75-078.mwcnf.png](attachment:8f4c61b3-b243-4778-b8e8-8b60be8bde95.png)

method = relative-change, last_values_n = 3000

![wuf20-0118.mwcnf.png](attachment:5696109c-0a5d-4d9f-a95a-43b311274f31.png)![wuf50-0311.mwcnf.png](attachment:e16e96a7-6255-4738-9ddf-8872033857c8.png)![wuf75-078.mwcnf.png](attachment:505d09d3-1379-4e7a-80ba-45398fc466e7.png)

method = relative-deviation, last_values_n = 100

![wuf50-0311.mwcnf.png](attachment:dc6296e9-b53a-4922-be3c-665a9c485651.png)![wuf20-0118.mwcnf.png](attachment:b5ecfb75-c636-4147-9457-461d98743fa6.png)![wuf75-078.mwcnf.png](attachment:13610ada-d986-4e83-abdc-55a0ce409ca2.png)

method = relative-deviation, last_values_n = 800

![wuf20-0118.mwcnf.png](attachment:fd0252b4-8f75-47ca-9e56-64cc6e4f83ab.png)![wuf50-0311.mwcnf.png](attachment:973009ee-d44f-4c3d-a2c1-ead9d867d0a1.png)![wuf75-078.mwcnf.png](attachment:7a65f6f4-f352-478b-a41d-1a28d126fa9e.png)

method = relative-deviation, last_values_n = 3000

![wuf20-0118.mwcnf.png](attachment:268ac512-3ad0-4e76-a7ea-53ffb2dd771f.png)![wuf50-0311.mwcnf.png](attachment:d70be26e-fa25-41f3-a712-3bd1d86a93a0.png)![wuf75-078.mwcnf.png](attachment:183a1613-2c65-4411-9ab6-817e52617a21.png)


### Black box

Nyní nastavené SA pustím pro všechny datasety, pro které jsou známé optima: wuf20-71 wuf20-91 wuf50-218 wuf75-325. 

In [125]:
import pandas as pd
import math

pd.options.display.max_rows = 100
stats = pd.read_csv('./data/output-big.csv', sep=' ', names=['datacategory', 'size', 'dataset', 'optimum', 'value', 'solved'])

stats['change'] = abs(stats['optimum'] - stats['value']) / stats['optimum']

#### Průměrná relativní chyba

V následující tabulce můžeme vidět zprůměrovanou relativní chybu $\frac{optimum - value}{optimum}$ pro každou kategorii datasetu.

V této tabulce je vidět, že SA fungovalo velmi dobře pro datasety typu **M** a **N**, kde byla chyba malá.

Naopak velké chyby jsou u všech velikostí typu **Q** a **R** kromě **wuf20-71**. 

Například u **wuf20-91 R** to může být například tím, že kvůli penalizaci jsou některé hodnoty dokonce záporné, čímž pak vzníká velká relativní chyba. Minimální hodnoty vypisuji v další tabulce.

In [123]:
pd.DataFrame(stats.groupby(['datacategory', 'size'])['change'].mean().apply(lambda x: f'{x * 100:.4f} %'))

Unnamed: 0_level_0,Unnamed: 1_level_0,change
datacategory,size,Unnamed: 2_level_1
wuf20-71,M,0.0000 %
wuf20-71,N,0.0131 %
wuf20-71,Q,0.6709 %
wuf20-71,R,0.7951 %
wuf20-91,M,0.3389 %
wuf20-91,N,2.2405 %
wuf20-91,Q,4678.6320 %
wuf20-91,R,50997.1336 %
wuf50-218,M,0.9298 %
wuf50-218,N,3.5499 %


Minimální hodnoty nalezených stavů pro každou kategorii

In [131]:
pd.DataFrame(stats.groupby(['datacategory', 'size'])['value'].min())

Unnamed: 0_level_0,Unnamed: 1_level_0,value
datacategory,size,Unnamed: 2_level_1
wuf20-71,M,1277
wuf20-71,N,35854
wuf20-71,Q,2166
wuf20-71,R,15971
wuf20-91,M,521
wuf20-91,N,-33141
wuf20-91,Q,-891
wuf20-91,R,-9950
wuf50-218,M,2041
wuf50-218,N,33940


#### Relativní četnosti počtů splněných klauzulí

Následující tabulka zobrazuje relativní četnosti počtů nalezených klauzulí.
Opět můžeme pozorovat lepší výsledky pro menší **wuf20-71**, **wuf20-91** a jednodušší sady **M** a **N**, kde je úspěšnost splnění všech klauzulí nad 95 %.

Počet nesplněných klauzulí se pohybuje v rozmezí 1 - 8.

In [124]:
pd.DataFrame(stats.groupby(['datacategory', 'size'])['solved'].value_counts(normalize=True).apply(lambda x: f'{x * 100:.2f} %'))

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,solved
datacategory,size,solved,Unnamed: 3_level_1
wuf20-71,M,71,100.00 %
wuf20-71,N,71,100.00 %
wuf20-71,Q,71,98.40 %
wuf20-71,Q,70,1.60 %
wuf20-71,R,71,98.90 %
wuf20-71,R,70,1.10 %
wuf20-91,M,91,99.10 %
wuf20-91,M,90,0.70 %
wuf20-91,M,88,0.10 %
wuf20-91,M,89,0.10 %



## Závěr

V tomto experimentu jsem implementoval řešení optimalizačního váženého 3-SAT problému (MWSAT) metodou simulovaného ochlazování. Následně jsem ve white box fázi ladil parametry, které ovlivňují chování a dobu běhu této heuristiky. Toto ladění proběhlo na různě velkých vzorcích dat.
Nakonec jsem změřil úspěšnost na všech datech s nalezenými parametry z white box fáze.
Experiment ukázal, že lze problém řešit nedeterministicky, což je rychlejší než projít všechny stavy, ale kvalita výsledku velmi závisí na nastavení SA.

V tomto experimentu se nastavení ukázalo jako vhodné pro data typu **M** a **N**. Pro ostatní data výsledky nebyly moc uspokojivé.