# Stavový prostor

- Každý systém je v každém okamžiku v určitém stavu 
- Množina všech takových stavů pak vytváří stavový prostor 
- Lze interpretovat jako graf
- Uzly reprezentují jednotlivé stavy 
- Hrany představují akce (přechod z jednoho uzlu na druhý)

### Reprezentace

Stavový prostor S<sub>p</sub> = (S, O) je dvojice, kde:

- S je množina stavů úlohy; S = {s<sub>i</sub>}, i = 1,2,...
- O je množina operátorů; O = {o<sub>j</sub>}, j = 1,2,...

Úloha = (s<sub>0</sub>, G), kde:

- s<sub>0</sub> je počáteční stav; s<sub>0</sub> patří do množiny stavů S
- G je množina cílových stavů; G je podmnožina S  

![BFS](bfs.jpg)

In [None]:
graph = {"A":["B","D"], "B":["A","C"], "C":["B"], "D":["A","E","F"], 
         "E":["D","F","G"], "F":["D","E","H"], "G":["E","H"], "H":["G","F"]}

### Řešení úlohy
- Uloha se na počátku nachází v počátečním stavu 
- Cílem je dostat se do cílového stavu 
- Vyřešení úlohy = nalezézt takovou posloupnost akcí, které převedou počáteční stav do cílového při splnění zadaných omezení.

### Možné problémy
- Stavový prostor může být příliš rozsáhlý, v některých případech dokonce nekonečný
- Cílové stavy tedy mohou být od počátečního vzdáleny natolik, že počítač ani nemusí být schopen k žádnému z nich jednoduchými metodami v rozumném čase a s omezenou operační pamětí cestu najít
- Cílové stavy nemusí být známy (existuje pouze představa, jak by měly vypadat)

### Jak se efektivně dostat z počátečního stavu do stavu cílového
- Vznik různých metody pro prohledávání stavového prostoru
- Nelze říci, že některá z metod je jednoznačně lepší než jiná
- Každá metoda má své výhody a nevýhody
- Záleží na povaze řešené úlohy, požadavcích na řešení a dostupných prostředcích.




# Prohledávání stavového prostoru

### Způsob hodnocení metod
- Časová složitost
- Prostorová složitost
- Úplnost
- Optimálnost

## Slepé metody

- Nemají žádné znalosti o stavovém prostoru
- Musí systematicky procházet všechny stavy, dokud nenaleznou řešení
- Jednotlivé metody se liší tím, jakým způsobem systematické procházení provádějí

## Prohledávání do šířky (BFS)

- Metoda je úplná a optimální  
- Časová i prostorová složitost základního algoritmu: O(b<sup>d+1</sup>)  
- Časová i prostorová složitost modifikovaného algoritmu: O(b<sup>d</sup>)


- b ... maximální počet bezprostředních následníků  
- d ... hloubka stromu, ve které se nachází řešení

Základní algoritmus:
1. Vytvoření fronty OPEN, která bude obsahovat všechny uzly určené k expanzi. Současně je v tomto kroku do fronty umístěn počáteční uzel.
2. Je-li fronta OPEN prázdná, úloha nemá řešení a prohledávání je ukončeno jako neúspěšné. Jinak pokračujte.
3. Z fronty OPEN je vybrán první uzel
4. Je-li vybraný uzel cílový, prohledávání je ukončeno jako úspěšné a je vrácena cesta od kořenového uzlu k tomuto cílovému. Jinak pokračujte.
5. Vybraný uzel je expandován a všichni jeho bezprostřední následníci jsou umísteny do fronty OPEN. Návrat na bod 2.

Algoritmus se seznamem CLOSED:
1. Vytvoření fronty OPEN, která bude obsahovat všechny uzly určené k expanzi a seznamu CLOSED, který bude obsahovat všechny již expandované uzly. Současně je v tomto kroku do fronty umístěn počáteční uzel.
2. Je-li fronta OPEN prázdná, úloha nemá řešení a prohledávání je ukončeno jako neúspěšné. Jinak pokračujte.
3. Z fronty OPEN je vybrán první uzel
4. Je-li vybraný uzel cílový, prohledávání je ukončeno jako úspěšné a je vrácena cesta od kořenového uzlu k tomuto cílovému. Jinak pokračujte.
5. Vybraný uzel je expandován a všichni jeho bezprostřední následníci, kteří nejsou ve frontě OPEN, ani v seznamu CLOSED, jsou umístěny do fronty OPEN. Expandovaný uzel je umístěn do seznamu CLOSED Návrat na bod 2.

<img src="bfs_ukazka.gif" />

### Příklad
![BFS](bfs.jpg)

In [32]:
from queue import Queue

graph = {"A":["B","D"], "B":["A","C"], "C":["B"], "D":["A","E","F"], 
         "E":["D","F","G"], "F":["D","E","H"], "G":["E","H"], "H":["G","F"]}

close = {}
parent = {}
queue = Queue()

for node in graph.keys():
    close[node] = False
    parent[node] = None
        
s = "G"
g = "C"
close[s] = True
queue.put(s)


while not queue.empty():
    u = queue.get()
    
    if(parent[g] is not None):
        break
    
    for v in graph[u]:
        if not close[v]:
            close[v] = True
            parent[v] = u
            queue.put(v)

path = []
while g is not None:
    path.append(g)
    g = parent[g]
path.reverse()
print(path)

## Prohledávání do hloubky (DFS)

- Metoda není úplná a není optimální  
- Časová i prostorová složitost je stejná: O(∞)

Algoritmus:
1. Vytvoření zásobníku OPEN, který bude obsahovat všechny uzly určené k expanzi. Současně je v tomto kroku do zásobníku umístěn počáteční uzel.
2. Je-li zásobník OPEN prázdný, úloha nemá řešení a prohledávání je ukončeno jako neúspěšné. Jinak pokračujte.
3. Z vrcholu zásobníku OPEN je vybrán první uzel
4. Je-li vybraný uzel cílový, prohledávání je ukončeno jako úspěšné a je vrácena cesta od kořenového uzlu k tomuto cílovému. Jinak pokračujte. 
5. Vybraný uzel je expandován a všichni jeho bezprostřední následníci jsou umísteny do zásobníku OPEN. Návrat na bod 2.

Modifikace:
5. Vybraný uzel je expandován a do zásobníku OPEN jsou umístěny všichni bezprostřední následníci, kteří v tomto zásobníku ještě nejsou a kteří nejsou ani předky generovaného uzlu. Návrat na bod 2.

<img src="dfs_ukazka.gif" />

Po modifikaci:  
- Metoda je úplná, ale není optimální  
- Prostorová složitost: O(m)  
- Časová složitost: O(b<sup>m</sup>)


- b ... maximální počet bezprostředních následníků  
- m ... maximální počet možných různých stavů

### Příklad
![BFS](dfs.jpg)

In [16]:
import sys

dfs_graph = {
    'A' : ['B','C'],
    'B' : ['D', 'E', 'C'],
    'C' : ['F'],
    'D' : [],
    'E' : [],
    'F' : []
}

close = set()

def dfs(close, dfs_graph, node, goal):
    if node not in close:
        print (node)
        close.add(node)
        if(node == goal):
            print("GOAL")
            sys.exit('GOAL')
        else:
            for neighbour in dfs_graph[node]:
                dfs(close, dfs_graph, neighbour, goal)

In [None]:
dfs(close, dfs_graph, 'A', 'C')

## Informované metody

- Využívají znalosti specifické pro daný problém
- Nalezení cíle je tak efektivnější, včetně lepší možnosti dosáhnout optimálního řešení

- Pokud jsou uzly s nejlepším ohodnocením expandovány jako první, jedná se o strategii hledání prvního nejlepšího (Best-first search či BestFS).


- Heuristická funkce h(n) => výsledkem je odhad ceny nejlepší cesty z uzlu n do cílového uzlu-
- h(n) může být jakoukoliv funkcí, jediný požadavek je, aby v cílovém uzlu n platilo h(n) = 0
- Heuristické funkce jsou specifické pro daný problém, tj. aplikačně závislé.

Algoritmus BestFS:
1. Vytvoření seznamu OPEN, který bude obsahovat všechny uzly určené k expanzi. Současně je v tomto kroku do fronty umístěn počáteční uzel včetně jeho ohodnocení.
2. Je-li seznam OPEN prázdný, úloha nemá řešení a prohledávání je ukončeno jako neúspěšné. Jinak pokračujte.
3. Ze seznamu OPEN je vybrán uzel s nejlepším (nejnižším) ohodnocením.
4. Je-li vybraný uzel cílový, prohledávání je ukončeno jako úspěšné a je vrácena cesta od kořenového uzlu k tomuto cílovému. Jinak pokračujte.
5. Vybraný uzel je expandován a všichni jeho bezprostřední následníci, kteří nejsou jeho předky jsou umístěny do seznamu OPEN včetně jejich ohodnocení. Z uzlů, které se v seznamu OPEN vyskytují vícekrát, je ponechán pouze uzel s nejlepším ohodnocením, ostatní jsou ze seznamu OPEN odstraněny. Návrat na bod 2.

## Greedy Search

- Taktéž známo jako lačné prohledávání
- Využívá takové strategie, že vždy je prvně expandován uzel, který se zdá být nejblíže k cíli
- Pro většinu (reálných) problémů lze náklady na dosažení cíle z aktuálního uzlu jen odhadnout, nikoliv určit přesně.
- Vyhodnocovací funkce f(n) = h(n)


- Metoda je úplná, ale není optimální
- Časová i prostorová složitost: O(b<sup>d</sup>)  


- b ... maximální počet bezprostředních následníků  
- d ... hloubka stromu, ve které se nachází řešení


- Dobrá heuruistika může skutečnou složitost výrazeně zmenšit

<img src="greedy.gif" style="width: 576px;"/>


- Příklad na konci...

### Uniform-cost search (UCS)

- Řadí se ke slepým metodám
- Její informovanost spočívá v respektování ohodnocení hran
- Jedná se vlastně o BFS, ale oproti ní má navíc ohodnocené hrany.


- Metoda je úplná a optimální  
- Časová i prostorová složitost metody je dána cenou optimálního řešení dělenou nejmenším přírůstkem ceny mezi dvěma uzly

Základní algoritmus:
1. Vytvoření seznamu OPEN, který bude obsahovat všechny uzly určené k expanzi. Současně je v tomto kroku do fronty umístěn počáteční uzel včetně jeho (nulového) ohodnocení.
2. Je-li seznam OPEN prázdný, úloha nemá řešení a prohledávání je ukončeno jako neúspěšné. Jinak pokračujte.
3. Ze seznamu OPEN je vybrán uzel s nejnižším ohodnocením.
4. Je-li vybraný uzel cílový, prohledávání je ukončeno jako úspěšné a je vrácena cesta od kořenového uzlu k tomuto cílovému. Jinak pokračujte.
5. Vybraný uzel je expandován a všichni jeho bezprostřední následníci včetně jejich ohodnocení jsou umísteny do seznamu OPEN. Návrat na bod 2.

Algoritmus se seznamem CLOSED:
1. Vytvoření seznamu OPEN, který bude obsahovat všechny uzly určené k expanzi a seznamu CLOSED, který bude obsahovat seznam expandovaných uzlů. Současně je v tomto kroku do fronty umístěn počáteční uzel včetně jeho (nulového) ohodnocení.
2. Je-li seznam OPEN prázdný, úloha nemá řešení a prohledávání je ukončeno jako neúspěšné. Jinak pokračujte.
3. Ze seznamu OPEN je vybrán uzel s nejnižším ohodnocením.
4. Je-li vybraný uzel cílový, prohledávání je ukončeno jako úspěšné a je vrácena cesta od kořenového uzlu k tomuto cílovému. Jinak pokračujte.
5. Vybraný uzel je expandován a jeho bezprostřední následníci, kteří nejsou v seznamu CLOSED jsou umístěny do seznamu OPEN včetně jejich ohodnocení. Expandovaný uzel je umístěn do seznamu CLOSEK. Z uzlů, které se v seznamu OPEN vyskytují vícekrát, je ponechán pouze uzel s nejlepším ohodnocením. Návrat na bod 2.


<img src="ucs.gif" style="width: 576px;"/>

## A*

- Kombinuje výhody UCS a lačného prohledávání
- Heuristická funkce h(s<sub>k</sub>) je spodním odhadem skutečné ceny cesty od uzlu s<sub>k</sub> k cílovému uzlu
- Taková heuristika se nazývá přípustnou heuristikou.

- f(s<sub>k</sub>) = g(s<sub>k</sub>) + h(s<sub>k</sub>)
- g(s<sub>0</sub>) = 0
- h(s<sub>G</sub>) = 0
- h je přípustná heuristika: h(s<sub>k</sub>) <= h<sup>*</sup>(s<sub>k</sub>)
- f je monotónní funkce: f(s<sub>k</sub>) >= f(s<sub>k-1</sub>)


- Metoda je úplná a optimální  
- Časová i prostorová složitost je stejná a výrazně závisí na použité heuristické funkci
- Pohybuje se od O(b<sup>d</sup>) (pro hodnoty h blízké nule) do O(d) (pro h = h<sup>*</sup>)


- b ... maximální počet bezprostředních následníků  
- d ... hloubka stromu, ve které se nachází řešení

Důkaz optimálnosti:
1. Označme cenu optimální cesty do nejbližšího optimálního cílového uzlu G<sub>opt</sub> jako f<sub>opt</sub>(s<sub>Gopt</sub>) a cenu jiné cesty do stejného nebo jiného cílového uzlu jako f(s<sub>G</sub>). Zřejmě musí platit f<sub>opt</sub>(s<sub>Gopt</sub>) < f(s<sub>G</sub>).
2. Nechť x je uzel na optimální cestě k optimálnímu cíli. Pro monotónní přípustnou heuristiku musí platit f<sub>opt</sub>(s<sub>Gopt</sub>)  >= f(x).
3. Pokud by uzel x nebyl vybrán k expanzi, zatímco cílový uzel s<sub>G</sub> s ohodnocením f(s<sub>G</sub>) ano, muselo by platit f(x) >= f(s<sub>G</sub>).
4. Z bodů 2 a 3 vyplývá, že f<sub>opt</sub>(s<sub>Gopt</sub>) >= f(x) >= f(s<sub>G</sub>), tedy že f<sub>opt</sub>(s<sub>Gopt</sub>) >= f(s<sub>G</sub>), což je ve sporu se závěrem bodu 1.
5. Uzel x proto musí být vybrán k expanzi, stejně jako každý jiný uzel na optimální cestě k optimálnímu cíli, a proto metoda musí nalézt optimální cestu.

![dukaz](dukaz.png)

In [None]:
from queue import PriorityQueue

class State(object):
	def __init__(self, value, parent, start = 0, goal = 0, solver = 0):
		self.children = []
		self.parent = parent
		self.value = value
		self.distance = 0
		if parent:
			self.path = parent.path[:]
			self.path.append(value)
			self.start = parent.start
			self.goal = parent.goal
			self.solver = parent.solver
		else:
			self.path = [value]
			self.start = start
			self.goal = goal
			self.solver = solver

	def GetDistance(self):
		pass
	def CreateChildren(self):
		pass
    
class State_String(State):
	def __init__(self, value, parent, start = 0, goal = 0):
		super(State_String, self).__init__(value, parent, start, goal)
		self.distance = self.GetDistance()

	def GetDistance(self):
		if self.value == self.goal:
			return 0
		distance = 0
		for i in range(len(self.goal)):
			letter = self.goal[i]
			distance += abs(i - self.value.index(letter))
		return distance

	def CreateChildren(self):
		if not self.children:
			for i in range(len(self.goal)-1):
				val = self.value
				val = val[:i] + val[i+1] +val[i] + val[i+2:]
				children = State_String(val, self)
				self.children.append(children)
                
class AStar:
	def __init__(self, start, goal):
		self.path = []
		self.close = []
		self.open = PriorityQueue()
		self.start = start
		self.goal = goal

	def Solve(self):
		startState = State_String(self.start, 0, self.start, self.goal)
		count = 0
		self.open.put((0, count, startState))
		while(not self.path and self.open.qsize()):
			closestChild = self.open.get()[2]
			closestChild.CreateChildren()
			self.close.append(closestChild.value)
			for child in closestChild.children:
				if child.value not in self.close:
					count += 1
					if not child.distance:
						self.path = child.path
						break
					self.open.put((child.distance, count, child))
		if not self.path:
			print ("Goal of " + self.goal + " is not possible")
		return self.path
    
if __name__ == "__main__":
	start1 = "VOIP"
	goal1 = "PIVO"
	a = AStar(start1, goal1)
	a.Solve()
	for i in range(len(a.path)):
		print (str(i) + ") " + a.path[i])

## Lokální metody

### Gradientní prohledávání

- Též známo jako Hill-Climbing


- Metoda není úplná ani optimální  
- Prostorová složitost je extrémně nizká: O(1)  
- Časová složitost je (d)


- b ... maximální počet bezprostředních následníků  

Algoritmus:
1. Vytvoření uzlu Current, do kterého se uloží počátečnístav spolu s jeho ohodnocením.
2. Uzel Current je expandován, jsou ohodnoceny bezprostřední následníci a z nich se vybere ten nejlepší (nazvěme jej Next)
3. Je-li ohodnocení uzlu Current lepší než ohodnocení uzlu Next, prohledávání je ukončeno a jako výsledek je vrácen uzel Current. Jinak pokračujte.
4. Uzel Current je nahrazen uzlem Next. Návrat na bod 2.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

def h(x):
    if x < -1 or x > 1:
        y = 0
    else:
        y = (np.cos(50*x) + np.sin(20*x))
    return y

hv = np.vectorize(h)

X = np.linspace(-1, 2, num=1000)
plt.plot(X, hv(X))

In [37]:
def hill(f, state_space):
    start = np.random.choice(state_space)
    current = start
    history = [current]
    for i in range(100):
        history.append(current)
        u = 0.001
        xleft, xright = current-u, current+u
        yleft, yright = f(xleft), f(xright)
        if yleft > yright:
            current = xleft
        else:
            current = xright
        
    return current, history

In [None]:
x0, history = hill(hv, X)

plt.plot(X, hv(X))
plt.scatter(x0, hv(x0), marker='x', s = 100)
plt.plot(history, hv(history))

### Simulované žíhání

- Prostorová složitost je extrémně nizká: O(1)  
- Časová složitost je velmi vysoká a je závislá na rychlosti klesání "teploty".  
- Pro reálné časové možnosti tak není zaručena ani úplnost a tedy ani optimálnost.

Algoritmus:
1. Vytvoření tabulky s předpisem pro klesání „teploty“ v závislosti na kroku výpočtu.
2. Vytvoření uzlu Current, do kterého se uloží počáteční stav spolu s jeho ohodnocením. Krok výpočtu k je nastaven na hodnotu 0.
3. Z tabulky se zjistí aktuální „teplota“ T(T = f(k)). Je-li hodnota nulová, prohledávání je ukončeno a jako výsledek je vrácen uzel Current. Jinak pokračujte.
4. Uzel Current je expandován a z jeho bezprostředních následníků je vybrán náhodně jeden z nich (nazvěme jej Next)
5. Vypočítá se rozdíl ohodnocení uzlů Current a Next: E = value(Current) - value(Next)
6. Jestliže E > 0, pak je uzel Current je nahrazen uzlem Next, jinak je toto nahrazení provedeno s pravděpodobností p = e<sup>E/T</sup>.
7. Krok výpočtu k je inkrementován a následuje návrat na bod 3.

Pozn. Algoritmus přechází do nového stavu nepodmíněně, pokud je ohodnocení uzlu Next lepší, než ohodnocení aktuálního uzlu Current (nový stav je „blíže“ cílovému stavu). V opačném případě je přechod dán pravděpodobností, která je pro vysoké počáteční „teploty“ také vysoká, a která se snižující se „teplotou“ se také postupně snižuje. Algoritmus tak může opustit lokální extrémy, které jsou pro předchozí Hill climbing algoritmus nepřekonatelné, a může tak přispět k nalezení (optimálního) řešení.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

def h(x):
    if x < -1 or x > 1:
        y = 0
    else:
        y = (np.cos(50*x) + np.sin(20*x))
    return y

hv = np.vectorize(h)

X = np.linspace(-1, 2, num=1000)
plt.plot(X, hv(X))

In [23]:
def SA(state_space, f, T):
    scale = np.sqrt(T)
    start = np.random.choice(state_space)
    x = start * 1
    current = f(x)
    history = [x]
    for i in range(1000):
        nex = x + np.random.normal()*scale
        if nex > 1 or nex <0 or np.log(np.random.rand()) * T > (f(nex) - current):
            nex = x
        x = nex
        current = f(x)
        T = T * 0.9
        history.append(x)
    return x, history

In [None]:
X = np.linspace(-1, 1, num = 1000)
x1, history = SA(X, h, T = 4)

plt.plot(X, hv(X))
plt.scatter(x1, hv(x1), marker='x')
plt.plot(history, hv(history))

# Příklad na A*

<img src="okresycr.jpg" alt="Drawing" style="width: 576px;"/>

<img src="okresycr_cary.jpg" alt="Drawing" style="width: 576px;"/>

In [25]:
from queue import Queue
from queue import PriorityQueue
import pandas as pd
import math

coordinatesExcel = pd.read_excel (r'souradnice.xlsx')
edgesExcel = pd.read_excel (r'mesta.xlsx')

coordinates = {}
edges = {}

for i in range(len(coordinatesExcel)):
    coordinates[coordinatesExcel.values[i][0]] = [coordinatesExcel.values[i][1], coordinatesExcel.values[i][2]]

for i in range(len(coordinatesExcel)):
    neighbors = []
    for j in range(len(edgesExcel)):
        if(edgesExcel.values[j][0] == coordinatesExcel.values[i][0]):
            neighbors.append([edgesExcel.values[j][1], float(edgesExcel.values[j][2])])
    edges[coordinatesExcel.values[i][0]] = neighbors

In [None]:
print(coordinates)

In [None]:
print(edges)

In [27]:
def heuristic(node, goal):
    nodeX = coordinates[node][0]
    nodeY = coordinates[node][1]
    goalX = coordinates[goal][0]
    goalY = coordinates[goal][1]

    a = abs(nodeX - goalX)
    b = abs(nodeY - goalY)
    c = math.sqrt(a*a + b*b)

    return c

In [28]:
def a_star(start, goal):
    open = PriorityQueue()
    open.put(start)
    g = 0
    f = g + heuristic(start, goal)
    close = []

    while not open.empty():
        current = open.get()
        print(current + " - " + str(round(g)))

        if current == goal:
            break

        best_next = float('inf')
        for neighbor in edges[current]:
            new_g = g + neighbor[1]
            new_f = new_g + heuristic(neighbor[0], goal)
            if(neighbor[0] not in close and new_f < best_next):
                best_next = new_f
                next = neighbor[0]
                best_g = new_g

        g = best_g
        close.append(current)
        open.put(next)
    return g

In [None]:
a_star("Cheb", "Karviná")

<img src="cheb_karvina.png" alt="Drawing" style="width: 576px;"/>

# Porovnání s Greedy search

In [34]:
def greedy(start, goal):
    open = PriorityQueue()
    open.put(start)
    f = heuristic(start, goal)
    close = []
    cost = 0

    while not open.empty():
        current = open.get()
        print(current + " - " + str(round(cost)))

        if current == goal:
            break

        best_next = float('inf')
        for neighbor in edges[current]:
            new_f = heuristic(neighbor[0], goal)
            if(neighbor[0] not in close and new_f < best_next):
                best_next = new_f
                best_next_cost = neighbor[1]
                next = neighbor[0]

        cost = cost + best_next_cost
        close.append(current)
        open.put(next)
    return cost

In [None]:
print(greedy("Cheb", "Karviná"))