# Problémamegoldás II. (Problem solving - part 2)

Most folytatjuk az algoritmikus problémák felfedezését, ezúttal gráfelmélet területén.

Gráfokat a (V, E) párral definiáljuk, ahol $V$ a csúcsok halmaza, $E$ pedig az csúcspontok között haladó élek listája. Ezeket az információkat különböző módon lehet tárolni:

* éllista
* szomszédsági mátrix
* szomszédsági lista

Éllista esetén az első sorban az $n,e$ számok a csúcsok, illetve élek számát jelenti, a további $e$ sorban pedig az élek következnek: az $a,b$ jelölés azt jelenti, hogy van egy él $a$-ból $b$-be, az $a,b,w$ pedig egy $w$ súlyt is tesz a megadott élre. Először irányítatlan gráfokban az élsúlyozatlan esettel foglakozunk.


<table>
<tr>
<td>

```
6 7
1 2
2 3
6 3
5 6
2 5
2 4
4 1
```
 
</td>
<td style="padding:100px">
    
<img src="img/simple_graph.png" width="400" height="400"> 
    
</td>
</tr>
</table>

Szomszédségi mátrix esetén egy olyan $A\in\mathbb{R}^{n\times n}$ mátrixunk van, amire $a_{ij}=1$ (esetleg $k$-szoros él esetén $k$), ha van él az $i$ és $j$ csúcsok között, egyébként a mátrix többi eleme 0.

Végül a szomszédsági lista olyan tárolásmód, amikor minden csúcshoz eltároljuk a szomszédainak listáját, pl.

```
v: [u_1, u_2,...,u_l],
```
a $v$ csomópont szomszédainak listája, mindezt minden $v\in V$ csúcsra eltárolva.

## Legrövidebb út keresése gráfokban (Shortest path in a graph)

Tegyünk fel, hogy adott egy irányítatlan, egyszerű gráf, valamint ennek egy rögzített $u$ csúcsa. Arra vagyunk kíváncsiak, hogy $u$-ból mi a legrövidebb út bármely más csúcsba, ahol az út hosszán egyszerűen az odavezető utat alkotó élek számát értjük.

A kétféle tanult gráfbejárás közül a szélességi keresés (BFS, Breadth-first search) segít most nekünk.

Adott $v$ csúcs és minden más csúcs között mi a legrövidebb út hossza?

* induljunk ki a $v$ pontból
* látogassuk meg $v$ összes szomszédját (ezek vannak 1 távolságra $v$-től)
* látogassuk meg ezek olyan szomszédait, melyeket még nem látogattunk meg korábban (ezek vannak 2 távolságra $v$-től)
* a fenti eljárást folytassuk addig, amíg találunk olyan csúcsot, melyet nem jártunk még be korábban
* ezzel minden, $v$-ből elérhető pont távolságát megkaptuk
* azon pontok, melyeket egyszer sem látogattunk meg, $v$-ből nem érhetők el úton (tehát a gráfnak több komponense is van)

Tegyük fel az egyszerűség kedvéért, hogy a gráf csúcsai az $1, 2,\ldots,n$ számokkal van jelölve.

In [None]:
class Graph:
    def __init__(self, edges):
        self._adjacency_list = create_adjacency_list_from_edges(edges)
        

def create_adjacency_list_from_edges(edges):
    pass

In [None]:
from collections import defaultdict


class Graph:
    def __init__(self, edges):
        self._adjacency_list = create_adjacency_list_from_edges(edges)
        

def create_adjacency_list_from_edges(edges):
    pass

In [None]:
class Graph:
    def __init__(self, edges):
        self._adjacency_list = create_adjacency_list_from_edges(edges)


def create_adjacency_list_from_edges(edges):
    adjacency_lists = defaultdict(list)
    for a, b in edges:
        pass
    
    return dict(adjacency_lists)

In [None]:
class Graph:
    def __init__(self, edges):
        self._adjacency_list = create_adjacency_list_from_edges(edges)


def create_adjacency_list_from_edges(edges):
    adjacency_lists = defaultdict(list)
    for a, b in edges:
        adjacency_lists[a].append(b)
        adjacency_lists[b].append(a)
    return dict(adjacency_lists)

In [None]:
nr_nodes = 6
edges = [(1, 2), (2, 3), (6, 3), (5, 6), (2, 5), (2, 4), (4, 1)]

create_adjacency_list_from_edges(edges)

In [None]:
class Graph:
    def __init__(self, edges):
        self._adjacency_list = create_adjacency_list_from_edges(edges)
        
    def neighbors(self, node):
        pass

In [None]:
class Graph:
    def __init__(self, edges):
        self._adjacency_list = create_adjacency_list_from_edges(edges)
        
    def neighbors(self, node):
        return self._adjacency_list[node]   # Ez jo lesz igy?

In [None]:
class Graph:
    def __init__(self, edges):
        self._adjacency_list = create_adjacency_list_from_edges(edges)
        
    def neighbors(self, node):
        return self._adjacency_list.get(node, [])

In [None]:
import math


class Graph:
    def __init__(self, nr_nodes, edges):
        self._nr_nodes = nr_nodes
        self._adjacency_list = create_adjacency_list_from_edges(edges)
        
    @property    
    def nr_nodes(self):
        return self._nr_nodes
        
    def neighbors(self, node):
        return self._adjacency_list.get(node, [])


def calc_shortest_distances(graph, start_node):
    distances = [math.inf] * graph.nr_nodes
    distances[start_node-1] = 0.0
    pass

In [None]:
def calc_shortest_distances(graph, start_node):
    distances = [math.inf] * graph.nr_nodes
    distances[start_node-1] = 0.0
    queue = [start_node]
    while queue:
        # u = a sorban kovetkezo csucs
        # u minden v szomszedjara, melyet meg nem latogattunk meg korabban:
        # v-t tegyük a sor végére
        # dist[v] = dist[u] + 1
        pass

Milyen adatszerkezet lenne jó, amiből sorra ki tudjuk venni a csúcsokat, majd ezek meg nem látogatott szomszédait be tudjuk tenni?

* Jó egy egy Python lista erre a célra?
* Ha $v$ az $u$ egy korábban nem látogatott szomszédja, akkor tegyük a lista végére $v$-t
* Melyik legyen az a csúcs, amit legközelebb kiveszünk ebből az adatszerkezetből? A $v$? (azaz amit legutóbb raktunk be?)
* Vagy inkább az, amit a legrégebben állítottunk be a sorba?

Korábban láttuk a verem adatszerkezetet (Stack, LIFO). 

Nekünk most valami más kell. Olyat szeretnénk, ahol a végébe gyorsan lehet új elemet tenni, de kivenni a másik végéből lehet gyorsan.

Ennek az adatszerkezetnek a neve Sor (Queue), FIFO - First in, first out. Egy pénztár előtt kígyózó sor végére kerül az új vásárló, de nem ő lesz először kiszolgálva, hanem a sor elején álló személy.

![](img/queue.png)

Pythonban van ún. double-ended queue implementálva, ami azt jelenti, hogy támogatja a sor mindkét végére történő gyors beszúrást, illetve bármelyik végéről a gyors törlést. 

Emlékeztetek arra, hogy a Python `list` adatszerkezetbe gyorsan lehet a végére elemet tenni, de a másik végére (azaz az elejére) beszúrni vagy törölni elemet lassú művelet.

In [None]:
from collections import deque

In [None]:
def calc_shortest_distances(graph, start_node):
    distances = [math.inf] * graph.nr_nodes
    distances[start_node-1] = 0.0
    queue = deque([start_node])
    while queue:
        # u = a sorban kovetkezo csucs
        # u minden v szomszedjara, melyet meg nem latogattunk meg korabban:
        # v-t allitsuk sorba
        # dist[v] = dist[u] + 1
        pass

In [None]:
def calc_shortest_distances(graph, start_node):
    distances = [math.inf] * graph.nr_nodes
    distances[start_node-1] = 0.0
    queue = deque([start_node])
    while queue:
        u = queue.popleft()
        for neighbor in graph.neighbors(u):
            # mit csinaljunk az u csucs szomszedaival?
            pass

In [None]:
def calc_shortest_distances(graph, start_node):
    distances = [math.inf] * graph.nr_nodes
    distances[start_node-1] = 0.0
    queue = deque([start_node])
    while queue:
        u = queue.popleft()
        for neighbor in graph.neighbors(u):
            if math.isinf(distances[neighbor-1]):
                # Ha egy szomszedot meg nem latogattunk meg (azaz u-tol meg mindig vegtelen tavolsagra van):
                pass

In [None]:
def calc_shortest_distances(graph, start_node):
    distances = [math.inf] * graph.nr_nodes
    distances[start_node-1] = 0.0
    queue = deque([start_node])
    while queue:
        u = queue.popleft()
        for neighbor in graph.neighbors(u):
            if math.isinf(distances[neighbor-1]):
                queue.append(neighbor)
                distances[neighbor-1] = distances[u-1] + 1
    
    return tuple(distances)

In [None]:
graph = Graph(nr_nodes, edges)

In [None]:
graph.neighbors(1)

In [None]:
calc_shortest_distances(graph, 1)

A legrövidebb út hossza már megvan, de hogyan jutunk hozzá magához az úthoz?

In [None]:
def calc_shortest_distances(graph, start_node):
    distances = [math.inf] * graph.nr_nodes
    distances[start_node-1] = 0.0
    previous_node = [None] * graph.nr_nodes
    queue = deque([start_node])
    while queue:
        u = queue.popleft()
        for neighbor in graph.neighbors(u):
            if math.isinf(distances[neighbor-1]):
                queue.append(neighbor)
                distances[neighbor-1] = distances[u-1] + 1
                previous_node[neighbor-1] = u
    
    return tuple(distances), previous_node

In [None]:
def reconstruct_path(graph, start_node, end_node, previous_node):
    path = []
    pass

In [None]:
def reconstruct_path(graph, start_node, end_node, previous_node):
    path = []
    node = end_node
    while node is not None:
        pass

In [None]:
def reconstruct_path(graph, start_node, end_node, previous_node):
    path = []
    node = end_node
    while node is not None:
        path.append(node)
        node = previous_node[node-1]
    pass    

In [None]:
def reconstruct_path(graph, start_node, end_node, previous_node):
    path = []
    node = end_node
    while node is not None:
        path.append(node)
        node = previous_node[node-1]
    return path[::-1]

In [None]:
distances, previous_nodes = calc_shortest_distances(graph, 1)

In [None]:
reconstruct_path(graph, 1, 6, previous_nodes)

**Feladat**: repülőgéppel hány átszállással lehet eljutni Debrecenből Katmanduba menetrend szerinti járatokkal?

Igazából sokkal több kérdést is meg tudunk majd válaszolni:

* Van-e olyan repülőtér, ahova nem tudunk Debrecenből eljutni menetrendszerinti járattal, tetszőleges számú átszállással sem?
* Honnan lehet Katmanduba eljutni kevesebb átszállással, Debrecenből, vagy Honoluluból?
* Melyek azok a városok, ahova a legtöbb átszállással lehet eljutni Debrecenből?

In [None]:
path_to_data = "data/flight_routes.txt"

In [None]:
!head -n 10 $path_to_data

In [None]:
!grep "Debrecen|Hungary" $path_to_data | head -n 5

In [None]:
def read_flight_routes(path):
    edges = []
    with open(path, "r") as f:
        lines = f.read().splitlines()
        nr_nodes, _ = map(int, lines[0].split("\t"))
        for line in lines[1:]:
            a, b, _ = line.split("\t")
            edges.append((a, b))
                
    return nr_nodes, edges

In [None]:
nr_nodes, edges = read_flight_routes(path_to_data)

In [None]:
edges[:10]

In [None]:
class CityConverter:
    def __init__(self):
        self._city_to_number = {}
        self._number_to_city = {}
        
    def encode(self, city):
        pass
    
    def decode(self, number):
        pass

In [None]:
import itertools as it


class CityConverter:
    def __init__(self):
        self._id_generator = it.count(1)
        self._city_to_number = {}
        self._number_to_city = {}  
        
    def encode(self, city):
        if (number := self._city_to_number.get(city)) is None:
            number = next(self._id_generator)
            self._city_to_number[city] = number
            self._number_to_city[number] = city
        return number 

    def decode(self, number):
        return self._number_to_city.get(number)

In [None]:
converter = CityConverter()

encoded_edges = [(converter.encode(a), converter.encode(b)) for a, b in edges]

In [None]:
print(encoded_edges[:3])
print(edges[:3])

print()
print(converter.decode(1))
print(converter.decode(2))
print(converter.decode(3))

In [None]:
graph = Graph(nr_nodes, encoded_edges)

source = converter.encode("Debrecen|Hungary")
destination = converter.encode("Kathmandu|Nepal")

In [None]:
distances, previous_nodes = calc_shortest_distances(graph, source)

path = reconstruct_path(graph, source, destination, previous_nodes)

In [None]:
list(map(converter.decode, path))

In [None]:
# Azon varosok, melyek nem erhetok el a kiindulasi pontbol
for ix, dist in enumerate(distances, start=1):
    if math.isinf(dist):
        print(converter.decode(ix))

**HF**: Melyik az a város, ahova a legtöbb átszállás szükséges, ha el akarok oda jutni Debrecenből? Hogyan lehet oda eljutni?

In [None]:
source = converter.encode("Honolulu|United States")
destination = converter.encode("Kathmandu|Nepal")

distances, previous_nodes = calc_shortest_distances(graph, source)
path = reconstruct_path(graph, source, destination, previous_nodes)

In [None]:
list(map(converter.decode, path))