Preuredjenje genoma tokom evolucije predstavlja niz razlicitih evolutivnih transformacija genoma koje su desavale tokom godina i koje su dovodile do odvajanja razlicitih vrsta organizama od zajednickog pretka. Posmatracemo genome orgnizama koji danas postoje i traziti koliko je evolutivnih transformacija potrebno da se od jednog genoma dobije drugi, odnosno koji je niz transformacija potreban da se od jedne vrste organizama dodje do zajednickog pretka, a zatim od zadjednickog pretka do druge vrste organizama.

<img src="assets/synteny_blocks.png" width="650"> 

Umesto na nivou nukleotida posmatracemo genome na visem nivou - nivo tzv. **sinteni blokovi**, blokova konzerviranih susednih gena. Posmatranje preuredjenja genoma cemo ograniciti samo na jednu vrstu evolutivnih transformacija genoma - tzv. **inverzija** (eng. *reversal*). Ta vrsta transformacije genoma podrazumevamo sledeci evolutivni dogadjaj: sekvenca se uvrne, pa pukne na mestu gde se dodiruju, i onda se uspostave nove veze izmedju razlicitih krajeva koji su nastali pucanjem. Podrazumevacemo da se uvrtanje i prekid sekvence moze dogoditi samo na mestima izmedju pojedinacnih blokova sintenije, tj. da ne moze doci do deljenja blokova sintenije. Ovakva vrsta transformacije menja redosled i usmerenje blokova sintenije u genomu izmedju 2 tacke prekida (koje su nastale prilikom uvrtanja sekvence) tako da blokovi idu u obrnutom redosledu i imaju drugacije usmerenje nego pre uvrtanja. 

<img src="assets/chromosomal_inversion.png" width="650"> 

Ovakva ogranicenja imaju bioloskog smisla, jer ukoliko blok gena promeni poziciju u okviru genoma, pa cak i usmerenje, to je i dalje jedan isti blok gena, tj. na osnovu tih gena i dalje mogu da se sintetisu isti proteini, samo je potrebno da se ti delovi sekvenci citaju u drugom smeru (tj. sa drugog lanca DNK). Dok, ukoliko bi doslo do prekida bloka sintenije, tada vise ne bi mogli da se sintetisu proteini za koje su bili zaduzeni ti geni, i takav organizam ne bi preziveo, pa zato takve slucajeve ne razmatramo. 

Kod jednog (referentnog) genoma blokove obelezavamo redom pozitivnim celim brojevima, a kod drugog genoma (onog koji poredimo sa referentnim genomom) blokove obelezavamo tako da imaju oznaku kao odgovarajuci sinteni blok u prvom genomu, pri cemu ukoliko je blok usmeren u suprotnom smeru od usmerenja u prvom genomu, tada oznaci dodajemo predznak '-'. **Na ovaj nacin smo sveli problem na trazenje niza transformacija koje neku permutaciju (niz oznaka sintenih blokova drugog genoma) prevodi u jedinicnu permutaciju (niz oznaka blokova prvog, referentnog genoma).** 

<img src="assets/genome_rearangement_scenario.png" width="600"> 

# Greedy Algoritithm for Sorting by Reversals

Govorimo o sortiranju, jer smo rekli da transformisemo proizvoljnu permutaciju do jedinicne permutacije, sto odgovara tome da uzimamo proizvoljan neuredjen niz brojeva i sortiramo ga. Jedina dozvoljena operacija kojom mozemo da transformisemo niz jeste rotacija podniza koja obrce redosled elemenata podniza i menja im znak. Pohlepan pristup se zasniva na tome da u svakom koraku primenom jedne (ili dve) rotacije postavimo na svoje mesto jedan element niza.

<img src="assets/reversal_transformation.png" width="650"> 

Funkcija **apply_soorting_reversal** primenjuje rotaciju (inverziju) na permutaciju **P** (niz sintenih blokova) tako da na indeks **k** postavi element koji <u>prema apsolutnoj vrednosti</u> treba da stoji na toj poziciji u sortiranom redosledu. Pretpostavka je da su elementi do indeksa **k** vec sortirani.

In [1]:
def apply_sorting_reversal_bob9952(P, k):
    n = len(P)

    # znaci tako da na indeks k, postavi element koji prema aps vr treba da stoji na toj poziciji u sortiranom redosteldu
    # PP. indeksi niza do k vec sortirani
    for i in range(k, n):      
        if abs(P[i]) == k+1:  # na indeksu k treba da stoji element sa abs vrednoscu k + 1 
            Left = P[:k]   # P[0:3]  1 2 3 
            Mid = P[k:i+1]  # P[3:8] -8 -7 -6 -5 -4
            Right = P[i+1:] # P[8:end] 9 10 
            
            return Left + [-x for x in Mid[::-1]] + Right 

In [2]:
def apply_sorting_reversal(P, k):
    n = len(P)
    
    for i in range(k, n):
        if abs(P[i]) == k+1:      #na indeksu k treba da stoji element sa abs vrednoscu k+1
            Left = P[:k]
            Mid = P[k:i+1]
            Right = P[i+1:]
            
            return Left + [-x for x in Mid[::-1]] + Right

In [3]:
P = [1, 2, 3, -8, -7, -6, -5, -4, 9, 10]

print(apply_sorting_reversal(P, 3))

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


In [4]:
P = [1, 2, 3, -8, -7, -6, -5, -4, 9, 10]

print(apply_sorting_reversal_bob9952(P, 3))

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


Funkcija **greedy_sorting_by_reversals** prevodi permutaciju **P** u jedinicnu permutaciju i racuna broj potrebnih rotacija.

In [8]:
def greedy_sorting_by_reversals(P, verbose=False):
    permutation_distance = 0
    
    n = len(P)
    
    for k in range(n):
        if P[k] != k+1:     #k-ti element nije na svom mestu
            P = apply_sorting_reversal(P, k)
            permutation_distance += 1
            
            if verbose:
                print(P)
            
        #nakon primene prethodne rotacije moze se desiti da smo doveli dobar blok na svoje mesto 
        #ali da ima pogresno usmerenje, pa je potrebno izvrsiti jos jednu rotaciju samo oko njega      
        if P[k] == -(k+1):  
            P[k] = -P[k]
            permutation_distance += 1
            
            if verbose:
                print(P)
            
    return permutation_distance

In [13]:
def greedy_sorting_by_reversals_bob9952(P, verbose=False):
    n = len(P)

    permutation_distance = 0 
    
    for k in range(n):
        if abs(P[k]) != k+1:
            P = apply_sorting_reversal(P, k)
            # ?? 
            permutation_distance +=1 

            if verbose:
                print(P)

        #nakon primene prethodne rotacije moze se desiti da smo doveli dobar blok na svoje mesto 
        #ali da ima pogresno usmerenje, pa je potrebno izvrsiti jos jednu rotaciju samo oko njega    
        if (-P[k]) == k+1:
            P[k] = -P[k]
            permutation_distance +=1 

            if verbose:
                print(P)

    return permutation_distance
            

In [10]:
P = [+1, -7, +6, -10, +9, -8, +2, -11, -3, +5, +4]

permutation_distance = greedy_sorting_by_reversals(P, True)

print(permutation_distance)

[1, -2, 8, -9, 10, -6, 7, -11, -3, 5, 4]
[1, 2, 8, -9, 10, -6, 7, -11, -3, 5, 4]
[1, 2, 3, 11, -7, 6, -10, 9, -8, 5, 4]
[1, 2, 3, -4, -5, 8, -9, 10, -6, 7, -11]
[1, 2, 3, 4, -5, 8, -9, 10, -6, 7, -11]
[1, 2, 3, 4, 5, 8, -9, 10, -6, 7, -11]
[1, 2, 3, 4, 5, 6, -10, 9, -8, 7, -11]
[1, 2, 3, 4, 5, 6, -7, 8, -9, 10, -11]
[1, 2, 3, 4, 5, 6, 7, 8, -9, 10, -11]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, -11]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
11


In [14]:
P = [+1, -7, +6, -10, +9, -8, +2, -11, -3, +5, +4]

permutation_distance = greedy_sorting_by_reversals_bob9952(P, True)

print(permutation_distance)

[1, -2, 8, -9, 10, -6, 7, -11, -3, 5, 4]
[1, 2, 8, -9, 10, -6, 7, -11, -3, 5, 4]
[1, 2, 3, 11, -7, 6, -10, 9, -8, 5, 4]
[1, 2, 3, -4, -5, 8, -9, 10, -6, 7, -11]
[1, 2, 3, 4, -5, 8, -9, 10, -6, 7, -11]
[1, 2, 3, 4, 5, 8, -9, 10, -6, 7, -11]
[1, 2, 3, 4, 5, 6, -10, 9, -8, 7, -11]
[1, 2, 3, 4, 5, 6, -7, 8, -9, 10, -11]
[1, 2, 3, 4, 5, 6, 7, 8, -9, 10, -11]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, -11]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
11


In [11]:
# nije minimalan broj, ali daje resenje ( valjda )


Uporedjivanjem sa slikom gore, vidimo da greedy pristup ne daje minimalan broj inverzija koje transformisu jedan genom u drugi (na slici je prikazano 7 inverzija).

# Shortest Rearrangement Scenario Algorithm

Smatra se da *evolucija uvek ide kracim putem*, tj. da prati put koji zahteva najmanje promena, sto znaci da je najkraci niz inverzija koji transformise jedan genom u drugi onaj koji se evolutivno i desio. Stoga, nas problem se svodi na izracunavanje rastojanja permutacija. Bioloski gledano, rastojanje permutacija odgovara tome koliko je evolutivno udaljen jedan oragnizam od drugog.

**Rastojanje permutacija:** Najmani broj promena potrebnih za transformisanje jedne permutacije u drugu.

Umesto linearno redosled sintenih blokova u genomu cemo sada predstavljati cirkularno, i to svaki od hromozoma pojedinacno. Takva struktura nam je pogodnija za implementaciju algoritma koji pronalazi najmanji broj potrebnih inverzija da se redosled sintenih blokova jednog genoma transformise u redosled sintenih blokova drugog (referentnog) genoma. Takodje, posmatranje problema preuredjenja genoma uopstiti na multihromozomalne genome, s obzirom da se algoritam **Shortest Rearrangement Scenario Algorithm** po konstrukciji moze primeniti kako za preuredjenje pojedinacnih hromozoma, tako i za preuredjenje vise hromozoma odjednom.

## Cirkularna reprezentacija genoma

<img src="assets/genome_circular_representation.png" width="250"> 

Funkcija **chromosome_to_cycle** pravi cirkularnu reprezentaciju na osnovu linearne reprezentacije hromozoma **chromosome**. Cirkularnu reprezentaciju pojedinacnih hromozoma predstavljamo nizom cvorova cirkularnog grafa, pri cemu cvorove navodimo u redosledu koji odgovara redosledu obilaska usmerenih grana koje smo pridruzili svakom od blokova sintenije iz linearne reprezentacije.

Usmerene grane predstavljamo parom cvorova (polazni_cvor, dolazni_cvor). Za usmerenu granu koju pridruzujemo bloku sintenije sa oznakom **k** polazni_cvor obelezavamo sa **2k-1**, a dolazni_cvor sa **2k**.

In [15]:
def chromosome_to_cycle_bob9952(chromosome):
    n = len(chromosome)

    cycle = [0] * (2*n) # duplo vise grana valjda zbog toga je 2*n ? ako je n broj cvorova ? 

    for i in range(n):
        j = chromosome[i]

        # pozitivno orj granu obilazimo od polaznog cvora do dolaznog cvora 
        if j > 0:
            cycle[2*i] = 2 * j - 1
            cycle[2*i + 1] =  2 * j
        else: 
            # negativno orj granu obilazimo od dolaznog cvora do polaznog cvora
            cycle[2 * i] = -2 * j
            cycle[2 * i + 1] = -2 * j - 1
        print(cycle)
    return cycle

In [16]:
def chromosome_to_cycle(chromosome):
    n = len(chromosome)
    
    cycle = [0] * (2*n)      #NAPOMENA: obavezno ograditi 2*n!
    
    for i in range(n):
        j = chromosome[i]
        
        #pozitivno orijentisanu granu obilazimo od polaznog_cvora do dolaznog_cvora
        if j>0:     
            cycle[2*i] = 2*j - 1
            cycle[2*i + 1] = 2*j
            
        #negativno orijentisanu granu obilazimo od dolaznog_cvora do polaznog_cvora    
        else:
            cycle[2*i] = -2*j
            cycle[2*i + 1] = -2*j - 1
            
    return cycle

In [17]:
chromosome = [+1, -2, -3, +4]

print(chromosome_to_cycle(chromosome))

[1, 2, 4, 3, 6, 5, 7, 8]


In [18]:
chromosome = [+1, -2, -3, +4]

print(chromosome_to_cycle_bob9952(chromosome))

[1, 2, 0, 0, 0, 0, 0, 0]
[1, 2, 4, 3, 0, 0, 0, 0]
[1, 2, 4, 3, 6, 5, 0, 0]
[1, 2, 4, 3, 6, 5, 7, 8]
[1, 2, 4, 3, 6, 5, 7, 8]


Funkcija **cycle_to_chromosome** pravi linearnu reprezentaciju na osnovu cirkularne reprezentacije hromozoma **cycle_nodes**.

In [29]:
def cycle_to_chromosome_bob9952(cycle_nodes):
    m = len(cycle_nodes)

    chromosome = [0] * (m // 2)

    for i in range(0, m, 2):
        if cycle_nodes[i] < cycle_nodes[i+1]: # poz orj granu smo obilazili od polaznog do dolaznog cvora
            chromosome[i // 2] = cycle_nodes[i+1] // 2
        else:
            chromosome[i // 2] = -cycle_nodes[i] // 2
        print(chromosome)
    return chromosome

In [30]:
def cycle_to_chromosome(cycle_nodes):
    m = len(cycle_nodes)
    
    chromosome = [0] * (m//2)     #NAPOMENA: obavezno ograditi m//2! 
    
    for j in range(0, m, 2):
        #pozitivno orijentisanu granu smo obilazili od polaznog_cvora do dolaznog_cvora 
        if cycle_nodes[j] < cycle_nodes[j+1]:
            chromosome[j//2] = cycle_nodes[j+1] // 2
        
        #negativno orijentisanu granu smo obilazili od dolaznog_cvora do polaznog_cvora 
        else:
            chromosome[j//2] = -cycle_nodes[j] // 2
            
    return chromosome

In [31]:
cycle_nodes = [1, 2, 4, 3, 6, 5, 7, 8]

print(cycle_to_chromosome(cycle_nodes))

[1, -2, -3, 4]


In [33]:
cycle_nodes = [1, 2, 4, 3, 6, 5, 7, 8]

print(cycle_to_chromosome_bob9952(cycle_nodes))

[1, 0, 0, 0]
[1, -2, 0, 0]
[1, -2, -3, 0]
[1, -2, -3, 4]
[1, -2, -3, 4]


Funkcija **colored_edges** vraca sve obojene grane (neusmerene grane) cirkularne reprezentacije genoma **P** (niz hromozoma, tj. niz permutacija).

In [34]:
def colored_edges(P):
    edges = []
    
    for chromosome in P:
        cycle_nodes = chromosome_to_cycle(chromosome)
        m = len(cycle_nodes)
        
        for j in range(1, m-1, 2):
            edges.append((cycle_nodes[j], cycle_nodes[j+1]))
            
        edges.append((cycle_nodes[m-1], cycle_nodes[0]))
        
    return edges

In [35]:
P = [[+1, -2, -3, +4]]        

print(colored_edges(P))

[(2, 4), (3, 6), (5, 7), (8, 1)]


Funkcija **black_edges** vraca sve crne grane (usmerene grane) cirkularne reprezentacije genoma **P** (niz hromozoma, tj. niz permutacija).

In [36]:
def black_edges(P):
    edges = []
    
    for chromosome in P:
        cycle_nodes = chromosome_to_cycle(chromosome)
        m = len(cycle_nodes)
        
        for j in range(0, m, 2):
            edges.append((cycle_nodes[j], cycle_nodes[j+1]))
            
    return edges

In [37]:
P = [[+1, -2, -3, +4]]       

print(black_edges(P))

[(1, 2), (4, 3), (6, 5), (7, 8)]


## Cirkularna reprezentacija genoma grafom

Pravimo klasu **GenomeGraph** koja na osnovu skupa grana formira graf. Prethodne funckije su nam bile potrebne da bismo mogli da odredimo koje su to grane koje trebaju da udju u graf kojim predstavljamo cirkularnu reprezentaciju genoma (za inicijalizaciju objekta grafa). 

**NAPOMENA:** Instance klase GenomeGraph bice neusmereni grafovi, medjutim ukoliko nam treba da saznamo koje je usmerenje neke grane, to uvek mozemo da zakljucimo na osnovu numeracije cvorova - polazni cvor uvek ima numeraciju neparnim brojem, a dolazni cvor parnim brojem!

In [39]:
class GenomeGraph:
    #konstruktorska funkcija (metod)
    def __init__(self, edges):
        self.adjacency_list = {}
        
        for (u, v) in edges:
            if u not in self.adjacency_list:
                self.adjacency_list[u] = []
            if v not in self.adjacency_list:
                self.adjacency_list[v] = []
                
            self.adjacency_list[u].append(v)
            self.adjacency_list[v].append(u)
    
    #metod koji vraca listu ciklusa u grafu
    def get_cycles(self):
        # ovo je lista cvorova ako se ne varam , da 
        unvisited = list(self.adjacency_list.keys())
        
        cycles = []
        
        while len(unvisited) > 0:
            # uzmem cvor 
            v = unvisited[0]

            # dodam ga u ciklus 
            current_cycle = [v]
            # uklonim ga iz liste neposeceni
            unvisited.remove(v)

            # pokusavam da prosirim ciklus dokle god mogu time sto posecujem cvorove
            while True:
                next_v = None
                
                for w in self.adjacency_list[v]:
                    if w in unvisited:
                        next_v = w
                        break
                        
                if next_v == None:
                    break
                    
                current_cycle.append(next_v)
                unvisited.remove(next_v)
                v = next_v
                
            # u listu ciklusa dodajem pronadjeni
            cycles.append(current_cycle)
            
        return cycles
    
    #metod koji iz grafa uklanja neusmerenu granu 
    def remove_undirected_edge(self, edge):
        (u, v) = edge
        
        self.adjacency_list[u].remove(v)
        self.adjacency_list[v].remove(u)
       
    #metod koji u graf dodaje neusmerenu granu 
    def add_undirected_edge(self, edge):
        (u, v) = edge
        
        self.adjacency_list[u].append(v)
        self.adjacency_list[v].append(u)

In [41]:
P = [[1, -2, -3, 4], [5, 6]]


grane = black_edges(P) + colored_edges(P)
print(grane)
genome_graph = GenomeGraph(black_edges(P) + colored_edges(P))

print(genome_graph.get_cycles())

[(1, 2), (4, 3), (6, 5), (7, 8), (9, 10), (11, 12), (2, 4), (3, 6), (5, 7), (8, 1), (10, 11), (12, 9)]
[[1, 2, 4, 3, 6, 5, 7, 8], [9, 10, 11, 12]]


Funkcija **graph_to_genome** vraca linearnu reprezentaciju genoma predstavljenim cirkularnim grafom **genome_graph**.

In [42]:
def graph_to_genome(genome_graph):
    P = []     #prazan niz hromozoma
    
    cycles = genome_graph.get_cycles()
    
    for cycle in cycles:
        chromosome = cycle_to_chromosome(cycle)
        P.append(chromosome)
        
    return P

In [43]:
P = [[1, -2, -3, 4], [5, 6]]

genome_graph = GenomeGraph(black_edges(P) + colored_edges(P))

print(graph_to_genome(genome_graph))

[[1, -2, -3, 4], [5, 6]]


## 2 - prekidi

Uvodimo pojam **2-prekida** koji podrazumeva raskidanje dve <u>obojene</u> grane i uspostavljanje dve nove grane na cirkularnoj reprezentaciji genoma grafom. 

<img src="assets/2-break.png" width="550"> 

Funkcija **two_break_on_genome_graph** pravi 2-prekid u cirkularnoj reprezentaciji genoma grafom **genome_graph** raskidanjem neusmerenih grana (**i**, **i_p**) i (**j**, **j_p**), i uspostavljanjem novih grana (**i**, **j**) i (**i_p**, **j_p**).

In [44]:
def two_break_on_genome_graph(genome_graph, i, i_p, j, j_p):
    genome_graph.remove_undirected_edge((i, i_p))
    genome_graph.remove_undirected_edge((j, j_p))
    
    genome_graph.add_undirected_edge((i, j))
    genome_graph.add_undirected_edge((i_p, j_p))
    
    return genome_graph

In [45]:
P = [[1, -2, -3, 4]]

genome_graph = GenomeGraph(black_edges(P) + colored_edges(P))

print(genome_graph.get_cycles())                
genome_graph = two_break_on_genome_graph(genome_graph, 1, 8, 3, 6)
print(genome_graph.get_cycles()) 

[[1, 2, 4, 3, 6, 5, 7, 8]]
[[1, 2, 4, 3], [6, 5, 7, 8]]


Funcija **two_break_on_genome** pravi cirkularnu reprezentaciju genoma **P** (niz hromozoma, tj. niz permutacija) grafom i nad njim vrsi 2-prekih raskidanjem neusmerenih grana (**i**, **i_p**) i (**j**, **j_p**), i uspostavljanjem novih grana (**i**, **j**) i (**i_p**, **j_p)**. 

**Graf nam je samo pomocni sredstvo koje nam omogucava da izvrsimo 2-prekid i da nadjemo mesto na kojem treba da se izvrsi 2-prekid.**

In [46]:
def two_break_on_genome(P, i, i_p, j, j_p):
    genome_graph = GenomeGraph(black_edges(P) + colored_edges(P))
    genome_graph = two_break_on_genome_graph(genome_graph, i, i_p, j, j_p)
    
    P = graph_to_genome(genome_graph)  
    
    return P

In [47]:
P = [[1, -2, -3, 4]]

print(two_break_on_genome(P, 1, 8, 3, 6))
print(two_break_on_genome(P, 8, 1, 3, 6))        #broj ciklusa se nije povecao jer je izvrsen drugaciji 2-prekid!

[[1, -2], [-3, 4]]
[[1, -2, -4, 3]]


## Break Point graf

Algoritam za nalazenje minimalnog broja transformacija potrebnog da se genom **P** transformise u genom **Q** se zasniva na tzv. **Break Point grafu**.  

Break Point graf za genome P i Q formiramo na sledeci nacin: <br/> 
-formiramo cirkularnu reprezentaciju za genom Q <br/>
-formiramo cirkularnu reprezentaciju za genom P, ali takvu da raspored crnih grana bude isti kao u cirkularnoj reprezentaciji za Q (**cirkularna reprezentacija nije jedinstvena!**) <br/>
-tzv. obojene grane u P obojimo crvenom bojom, a obojene grane u Q plavom bojom <br/>
-preklopimo cirkularne reprezentacije za P i Q <br/>
-iz dobijenog grafa eliminisemo crne grane 

U ovako formiranom grafu ostaju samo crvene i plave grane, takve da formiraju alternirajuce cikluse - naizmenicno idu crvene i plave grane. Dobijeni **neusmereni** graf koji se sastoji samo od crvenih i plavih grana je Break Point graf za P i Q.

<img src="assets/breakpoint_graph.png" width="800">

Algoritam **shortest_rearangement_scenario** transformise genom **P** u genom **Q** tako sto formira Break Point graf za P i Q, a zatim vrsi 2-prekide nad dobijenim grafom tako da razbija alternirajuce cikluse na manje, sve dok u grafu ne ostanu samo trivijalni alterinrajuci ciklusi (alternirajuci ciklus od dve grane - jedne crvene i jedne plave). Kada je Break Point graf za P i Q takav da ima samo trivijalne alternirajuce cikluse, to implicitno znaci da grafovi ciklicnih reprezentacija za P i Q imaju iste obojene grane, a kako imaju i iste crne grane, to znaci da su im i ciklicne reprezentacije iste. Drugim recima, to znaci da razbijanjem alternirajucih ciklusa u Break Point grafu implicitno transformisemo graf ciklicne reprezentacije za P u graf ciklicne reprezentacije za Q, tj. genom P u genom Q.

In [50]:
import random
random.seed(5)

In [54]:
def shortest_rearangement_scenario(P, Q, verbose=False):
    permutation_distance = 0
    
    red_edges = colored_edges(P) 
    blue_edges = colored_edges(Q)
    breakpoint_graph = GenomeGraph(red_edges + blue_edges)
    
    while True:
        cycles = breakpoint_graph.get_cycles()
        
        selected_cycle = None
        for cycle in cycles:
            if len(cycle) > 2:
                selected_cycle = cycle
                break
                
        if selected_cycle == None:
            break
                 
        selected_cycle_edges = [(selected_cycle[i], selected_cycle[i+1]) for i in range(len(selected_cycle)-1)] \
                             + [(selected_cycle[-1], selected_cycle[0])]        
                
        #2-PREKIDE VRSIMO SAMO NAD CRVENIM GRANAMA, JER SU TO GRANE KOJE DEFINISU REDOSLED BLOKOVA U GENOMU P!
        #biramo proizvoljnu PLAVU GRANU (i, j) i uzimamo njoj susedne crvene grane (i_p, i) i (j, j_p), i nad njima
        #vrsimo 2-prekid, koji ce ukloniti (i_p, i) i (j, j_p), a uspostaviti CRVENU GRANU (i, j), kao i (i_p, j_p) 
        #NA TAJ NACIN IZDVAJAMO JEDAN TRIVIJALNI CIKLUS KOJI SE SASTOJI OD JEDNE PLAVE I JEDNE CRVENE GRANE (i, j)!
            
        n = len(selected_cycle_edges)
        k = random.randrange(0, n)
        
        selected_edge = selected_cycle_edges[k]
        (u, v) = selected_edge
        
        #NAPOMENA: u blue_edges imamo samo po jedan primerak neusmerene grane, 
        #tek kad ih dodamo u graf onda dodajemo obe, pa zato ovakva provera!
        if (u, v) not in blue_edges and (v, u) not in blue_edges:
            k = (k+1) % n              #ako k-ta nije plava onda prva sledeca sigurno jeste, posto idu naizmenicno!
            
        selected_edge = selected_cycle_edges[k]
        previous_red_edge = selected_cycle_edges[(k-1) % n]
        next_red_edge = selected_cycle_edges[(k+1) % n]
        
        (i_p, i) = previous_red_edge
        (i, j) = selected_edge
        (j, j_p) = next_red_edge
        
        breakpoint_graph = two_break_on_genome_graph(breakpoint_graph, i, i_p, j, j_p)
        permutation_distance += 1
        
        #ovo sluzi samo za ispis, da mozemo da pratimo sta radimo na grafu
        if verbose:
            print(selected_edge)
            print(P)
            P = two_break_on_genome(P, i, i_p, j, j_p)
            print(P)
            
    return permutation_distance

In [55]:
P = [[1, -2, -3, 4]]
Q = [[1, 2, 3, 4]]

shortest_rearangement_scenario(P, Q, verbose=True)

(7, 6)
[[1, -2, -3, 4]]
[[1, -2, 3, 4]]
(3, 2)
[[1, -2, 3, 4]]
[[1, 2, 3, 4]]


2

**NAPOMENA**: ovaj test primer se razlikuje od onog prikazanog na slici koja objasnjava formiranje BreakPoint grafa - tamo je <code>P = [[1, -2, -3, 4]]</code> a <code>Q = [[1, 3, 2, -4]]</code>; takodje u primeru na slici kao referentni genom (sa fiksiranim redosledom sintenih blokova) uzima se <code>P</code> a premestaju se sinteni blokovi genoma <code>Q</code>, tj. njemu odgovarajuce grane u BreakPoint grafu, dok je kod funkcije <code>shortest_rearangement_scenario</code> to obrnuto!

In [53]:
P = [[+1, -7, +6, -10, +9, -8, +2, -11, -3, +5, +4]]
Q = [[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]]

shortest_rearangement_scenario(P, Q)

7