# Dodatne ovire

Oddelek za gozdarske dejavnosti in motorni promet nam je tokrat nakopal težko nalogo. Najboljše, da narišem.

Recimo, da imamo ovire, ki so postavljene takole (številke služijo za pomoč pri razbiranju koordinat):

```
         1         2         3         4         5         6         7         8
123456789012345678901234567890123456789012345678901234567890123456789012345678901
  ###   ##  ###   ###### ##     ### ##      ### ##  ###    # # ###  # # #  ##
```

Ali, v notaciji iz naših davnih nalog:

```
obstojece = [(3, 5), (9, 10), (13, 15), (19, 24), (26, 27), (33, 35), (37, 38), (45, 47), (49, 50), (53, 55), (60, 60), (62, 62), (64, 66), (69, 69), (71, 71), (73, 73), (76, 77)]
```

Pa so se odločili, da postavijo nekaj novih ovir. Predvidene nove ovire so:

```
         1         2         3         4         5         6         7         8
123456789012345678901234567890123456789012345678901234567890123456789012345678901
      ###     ##   #   ##    ####  #    ##     #          #######   ####      ###
```

torej

```
nove = [(7, 9), (15, 16), (20, 20), (24, 25), (30, 33), (36, 36), (41, 42), (48, 48), (59, 65), (69, 72), (79, 81)]
```

Postavimo to reč skupaj:

```
         1         2         3         4         5         6         7         8
123456789012345678901234567890123456789012345678901234567890123456789012345678901
  ###   ##  ###   ###### ##     ### ##      ### ##  ###    # # ###  # # #  ##
      ###     ##   #   ##    ####  #    ##     #          #######   ####      ###
```

Dela se bodo lotili tako, da bodo najprej odstranili vse obstoječe ovire, ki bi ovirale postavite novih. Tako dobijo

```
         1         2         3         4         5         6         7         8
123456789012345678901234567890123456789012345678901234567890123456789012345678901
  ###                    ##         ##      ### ##  ###                 #  ##
      ###     ##   #   ##    ####  #    ##     #          #######   ####      ###
```

Od obstoječih ovir torej ostane samo

```
[(3, 5), (26, 27), (37, 38), (45, 47), (49, 50), (53, 55), (73, 73), (76, 77)]
```

Nato postavijo nove ovire:

```
		 1         2         3         4         5         6         7         8	
123456789012345678901234567890123456789012345678901234567890123456789012345678901
  ### ###     ##   #   ####  ####  ###  ##  ######  ###   ########  #####  ## 
```

Rezultat je torej:

```
[(3, 5), (7, 9), (15, 16), (20, 20),(24, 27), (30, 33), (36, 38), (41, 42), (45, 50), (53, 55), (59, 65), (69, 73), (76, 77), (79, 81)]
```

## Obvezni del

Napišite funkcijo `odstrani_odvecne(obstojece, dodatne)`, ki kot argumenta sprejme dva seznama ovir v zgornji notaciji. Predpostaviti smete, da so ovire urejene od leve proti desni in se (znotraj posamičnega seznama) ne prekrivajo. **Funkcija ne vrne ničesar**, temveč spremeni seznam `obstojece` tako, da iz nje odstrani vse ovire, ki se prekrivajo z vsaj eno oviro iz množice `dodatne`.

Nato napišite funkcijo `zlite_ovire(obstojece, dodatne)`, ki prejme enaka argumenta kot prva funkcija in vrne nov seznam ovir, ki nastane z združitvijo obeh seznamov. Pri tem naj bodo vse ovire urejene od leve proti desni. Upoštevajte tudi, da se nekatere nove in stare ovire združijo v eno samo oviro.

Funkcija `zlite_ovire` ne sme spreminjati vhodnih seznamov!

Nasvet: če ne želite izgubiti živcev, pripravite niz z novimi ovirami in jih podajte funkciji, ki pretvarja niz v seznam ovir. Napisali smo jo v eni od prejšnjih nalog.

Pomoč: tule je funkcija, ki ji podamo dve oviri in vrne `True`, če se prekrivata, sicer pa `False`.

```python
def sovpad(ovira1, ovira2):
    return ovira2[0] <= ovira1[0] <= ovira2[1] or ovira1[0] <= ovira2[0] <= ovira1[1]
```

## Rešitev "Odstrani odvečne"

Prvi, naivni poskus bi bil lahko

In [3]:
def odstrani_odvecne(obstojece, dodatne):
    for ovira in obstojece:
        for dodatna in dodatne:
            if sovpad(ovira, dodatna):
                obstojece.remove(ovira)
                break

ali, za tiste, ki poznajo generatorje

In [4]:
def odstrani_odvecne(obstojece, dodatne):
    for ovira in obstojece:
        if any(sovpad(ovira, d) for d in dodatne):
            obstojece.remove(ovira)

To ne deluje. Tu gremo z zanko `for` čez seznam - ta jemlje elemente na indeksih 0, 1, 2, 3 in tako naprej. Če pri tem pobrišemo kak element, se vsi elementi, ki mu sledijo, premaknejo za mesto naprej (oziroma nazaj, stvar pogleda), zanka pa gre vseeno na element na naslednjem indeksu. Na ta način se nam nekatere ovire, ki bi jih morali pobrisati, izmuznejo.

### Rešitve z novim seznamom

Na boljšo pot je stopil ta, ki se je lotil reševati takole:

In [6]:
def odstrani_odvecne(obstojece, dodatne):
    ostanejo = []
    for ovira in obstojece:
        if not any(sovpad(ovira, d) for d in dodatne):
            ostanejo.append(ovira)

V `ostanejo` bodo res vse ovire, ki ostanejo, vendar naloga zahteva, naj bodo te ovire v `obstojece`.

Naivno lahko napišemo

In [8]:
def odstrani_odvecne(obstojece, dodatne):
    ostanejo = []
    for ovira in obstojece:
        if not any(sovpad(ovira, d) for d in dodatne):
            ostanejo.append(ovira)
    obstojece = ostanejo

Vendar to ne deluje: po zadnji vrstici se seznam `obstojece` nanaša na isti seznam kot `ostanejo`, seznam, ki ga je dobila funkcija kot argument (in ki se je poprej imenoval `obstojece`), pa ostane nespremenjen.

Kogar je to presenetilo, ni dobro spremljal predavanja, po katerem smo dobili to domačo nalogo.

Pač pa lahko naredimo tako:

In [9]:
def odstrani_odvecne(obstojece, dodatne):
    ostanejo = []
    for ovira in obstojece:
        if not any(sovpad(ovira, d) for d in dodatne):
            ostanejo.append(ovira)
    obstojece.clear()
    for ovira in ostanejo:
        obstojece.append(ovira)

To je seveda zelo nerodno; boljše je

In [10]:
def odstrani_odvecne(obstojece, dodatne):
    ostanejo = []
    for ovira in obstojece:
        if not any(sovpad(ovira, d) for d in dodatne):
            ostanejo.append(ovira)
    obstojece.clear()
    obstojece += ostanejo

Še boljše pa

In [11]:
def odstrani_odvecne(obstojece, dodatne):
    ostanejo = []
    for ovira in obstojece:
        if not any(sovpad(ovira, d) for d in dodatne):
            ostanejo.append(ovira)
    obstojece[:] = ostanejo

Tule zamenjamo celotno vsebino seznama `obstojece`, torej `obstojece[:]` z elementi seznama `ostanejo`. Razlika med `obstojece = ostanejo` in `obstojece[:] = ostanejo` je v tem, da enkrat "preusmerimo puščico", drugič spreminjamo seznam, na katerega puščica kaže. Enkrat spremenimo, *na kaj* se nanaša ime `obstojece`, drugič pa spremenimo *na kar* se nanaša ime `obstojece`.

Iznajdljivejši so seznam `ostanejo` sestavili kot izpeljani seznam.

In [12]:
def odstrani_odvecne(obstojece, dodatne):
    ostanejo = [ovira for ovira in obstojece
                if not any(sovpad(ovira, d) for d in dodatne)]
    obstojece[:] = ostanejo

Po tem je ime `ostanejo` očitno nepotreben.

In [13]:
def odstrani_odvecne(obstojece, dodatne):
    obstojece[:] = [ovira for ovira in obstojece
                    if not any(sovpad(ovira, d) for d in dodatne)]

Najhujši med nami pa uporabijo generator, kadar ga le smejo.

In [14]:
def odstrani_odvecne(obstojece, dodatne):
    obstojece[:] = (ovira for ovira in obstojece
                    if not any(sovpad(ovira, d) for d in dodatne))

### Rešitev s spreminjanjem seznama

Bolj zanimivo je spreminjati seznam na mestu - torej nekaj v slogu prve ideje, le pravilno. Za to moramo uporabiti zanko `while`.

Klasična rešitev je

In [15]:
def odstrani_odvecne(obstojece, dodatne):
    o = 0
    while o < len(obstojece):
        if any(sovpad(obstojece[o], d) for d in dodatne):
            del obstojece[o]
        else:
            o += 1

Namesto zanke `for`, ki gre v vsakem krogu naprej, na naslednji element, torej vzamemo `while`, kjer o tem, kdaj gremo naprej, odločamo sami. V vsakem krogu bodisi pobrišemo oviro in pustimo `o`, kakršen je, saj se bo na mesto trenutnega elementa pomaknil naslednji, bodisi pustimo ta element (oviro) pri miru in gremo na naslednjega (`o += 1`).

Tule smo, kot stalno zgoraj, uporabili `any` in generator. Brez njega bi bilo (še) malo zabavneje.

In [16]:
def odstrani_odvecne(obstojece, dodatne):
    o = 0
    while o < len(obstojece):
        for dodatna in dodatne:
            if sovpad(obstojece[o], dodatna):
                del obstojece[o]
                break
        else:
            o += 1

Tiste, ki vedo kaj več, zaskrbi dvojna zanka; v tej, zadnji različici je očitna (`for` znotraj `while`), v oni prej pa se tudi ni prav dobro skrila (`for` znotraj `any` znotraj `while`). Če imamo 20 obstoječih ovir in 6 dodatnih, bomo funkcijo `sovpad` (v najslabšem primeru) poklicali $20\times6=120$-krat. 

Gre boljše? Gre. Naloga pravi, da so seznami ovir urejeni in tega dejstva doslej nismo izkoristili.

In [17]:
def odstrani_odvecne(obstojece, dodatne):
    o = d = 0
    while o < len(obstojece) and d < len(dodatne):
        obstojeca = obstojece[o]
        dodatna = dodatne[d]
        if sovpad(obstojeca, dodatna):
            del obstojece[o]
        elif obstojeca[0] < dodatna[0]:
            o += 1
        else:
            d += 1

Zdaj bomo šli v nekem smislu vzporedno čez seznam obstoječih in dodatni ovir. Ne vzporedno po elementih, tako kot bi to naredil zip. Ne, šli prek sovpadajočih ovir.

Začnemo s prvo oviro.
- Če sovpadata, pobrišemo obstoječo oviro (in ne povečamo `o`); tu ni kaj.
- Če ne sovpadata, pogledamo, katera ovira je bolj levo. Če je bolj levo obstoječa ovira, potem jo bomo očitno pustili pri miru (če je ne odstrani tale nova ovira, je tudi naslednje ne bodo, saj so le še bolj desno od nje) in vzamemo naslednjo obstoječo oviro, `o += 1`.
- Če pa je bolj levo dodatna ovira, potem jo preskočimo; `d += 1`. Ta dodatna ovira ne bo odstranila nobene obstoječe več, saj so vse naslednje obstoječe ovire le še bolj desno.

Tako nadaljujemo z naslednjim parom (od katerih je vsaj ena ovira ista kot v tem paru!), dokler ne zmanjka enega od seznamov.

Ta rešitev ni najkrajša, je pa najlepša. To je seveda stvar okusa, ampak, tako, v ozadju je lepo razmišljanje in lep algoritem, ne le "groba sila". Pri dovolj velikem številu ovir pa je ta rešitev gotovo najhitrejša.

## Rešitev "Zlite ovire"

Ubogajmo nasvet: "*Če ne želite izgubiti živcev, pripravite niz z novimi ovirami in jih podajte funkciji, ki pretvarja niz v seznam ovir. Napisali smo jo v eni od prejšnjih nalog.*"

In [22]:
def pretvori_vrstico(vrstica):
    bloki = []
    for i, (prej, znak) in enumerate(zip("." + vrstica, vrstica + ".")):
        if prej + znak == ".#":  # zacetek ovire
            zacetek = i + 1
        elif prej + znak == "#.":  # konec
            bloki.append((zacetek, i))
    return bloki
    
def zlite_ovire(obstojece, dodatne):
    obstojece = obstojece.copy()
    odstrani_odvecne(obstojece, dodatne)
    vse = obstojece + dodatne
    s = ["."] * max(x1 for _, x1 in vse) + 1
    for x0, x1 in vse:
        s[x0:x1 + 1] = ["#"] * (x1 - x0 + 1)
    return pretvori_vrstico("".join(s[1:]))

Funkcija deluje tako, da sestavi niz, ki predstavlja vrstico z ovirami - pike in hashi. Le-to poda funkciji `pretvori_vrstico`, ki smo jo (hvala za dovoljenje, navodila naloge), skopirali iz prejšnje rešitve.

Pri tem je potrebno vedeti dve stvari.

Najprej moramo pobrisati obstoječe ovire, ki sovpadajo z novimi. Za to bomo seveda uporabili funkcijo `odstrani_odvecne`. Vendar ta funkcija *spreminja* seznam `obstojece`. Vrstica `obstojece = obstojece.copy()` pripravi kopijo seznama; le-to lahko spreminjamo kakor hočemo. Brez tega pa bi funkcija `zlite_ovire` spreminjala seznam, ki ga je dobila argument, tega pa ne sme početi, ker je za to ni nihče pooblastil.

Če je kdo namesto tega pisal

```python
    ostale = obstojece
    odstrani_odvecne(ostale, dodatne)
```

in se potem čudil, zakaj to spreminja seznam `obstojece`, ni dobro poslušal prejšnjega predavanja.

Druga stvar, ki se je moramo zavedati: funkcija mora sestaviti niz. Vendar nizov ni možno spreminjati. Zato raje sestavimo seznam pik, jih zamenjujemo s hashi in nato združimo v niz.

Ostalo je potem relativno kar preprosto: preostale obstoječe in dodatne ovire vržemo v skupni seznam, sestavimo vrstico ustrezne dolžine, vanjo narišemo in ga na koncu spremenimo v želeno obliko - seznam parov. Dolžina seznama je enaka največjemu koncu ovire (`max(x1 for _, x1 in vse)`) plus 1, ker štejemo od 1, ne od 0. Odvečni seznam odbijemo v `join`-u, ki mu kot argument damo `s[1:]`.

Če res hočemo delati z vrstico v obliki niza, ne seznama: lahko, vendar ne pridobimo kaj dosti.

In [23]:
def zlite_ovire(obstojece, dodatne):
    obstojece = obstojece.copy()
    odstrani_odvecne(obstojece, dodatne)
    s = "." * max(x1 for _, x1 in obstojece + dodatne) + 1
    for ovire in (obstojece, dodatne):
        for x0, x1 in ovire:
            s = s[:x0] + "#" * (x1 - x0 + 1) + s[x1 + 1:]
    return pretvori_vrstico(s[1:])

Ker niza, `s` ne moremo spreminjati, vzamemo niz do `x0 - 1` (-1, ker stolpce v teh nalogah štejemo od 1, ne od 0), nato vstavimo oviro (`"#" * (x1 - x0 + 1)`) in nato še ostanek vrstice.

Kaj pa, če ne bi upoštevali nasveta in delali s seznami ovir, ne z vrstico? V tem primeru bi bilo potrebno narediti nekaj takšnega, kot počnemo v dodatni nalogi.

## Dodatna naloga

Napišite funkcijo `zlij_ovire(obstojece, dodatne)`, ki je podobna prejšnji, vendar ne vrne ničesar, temveč spremeni seznam `obstojece`, da vsebuje združene ovire. Pri reševanju bi seveda lahko samo spretno uporabili prejšnjo funkcijo, vendar za izziv poskusite to delati na mestu.

Pa še nekaj: ker gre za dodatno nalogo, bodo testi napisani nekoliko hudobneje (= vse ovire so 10000000000000000000000-krat daljše, toliko pomnilnika pa nima niti OpenAI) in trik s pretvarjanjem v niz ne bo deloval. Srečno! :)

### Rešitev

Na predavanju sem pokazal tole grozno rešitev.

In [21]:
def zlij_ovire(obstojece, dodatne):
    odstrani_odvecne(obstojece, dodatne)
    o = d = 0
    while o < len(obstojece) and d < len(dodatne):
        obstojeca = obstojece[o]
        dodatna = dodatne[d]
        if obstojeca[1] + 1 == dodatna[0]:
            if o + 1 < len(obstojece) and dodatna[1] + 1 == obstojece[o + 1][0]:
                obstojece[o] = (obstojeca[0], obstojece[o + 1][1])
                del obstojece[o + 1]
                d += 1
            else:
                obstojece[o] = (obstojeca[0], dodatna[1])
                d += 1
        elif dodatna[1] + 1 == obstojeca[0]:
            obstojece[o] = (dodatna[0], obstojeca[1])
            d += 1
        elif dodatna[0] < obstojeca[0]:
            obstojece.insert(o, dodatna)
            o += 1
            d += 1
        else:
            o += 1
    obstojece += dodatne[d:]


Najprej odstranimo odvečne ovire. Brez kopiranja, zdaj *hočemo* spreminjati seznam obstoječe.

Nato pride zanka prek obeh seznamov, podobno, kot smo delali v eni od rešitev obvezne naloge. Le situacij, na katere moramo paziti je več.

- Če se obstoječa ovira konča točno tam, kjer se začenja dodatna
  - preverimo, ali se takoj za to dodatno začne nova obstoječa. Če je tako, združimo vse tri: vstavimo oviro, ki se začne s to obstoječo in konča z naslednjo obstoječo; nato pobrišemo naslednjo obstoječo; potem pa še povečamo indeks d, da bomo v naslednjem koraku gledali naslednjo dodatno oviro;
  - sicer pa zamenjamo to obstoječo oviro z novo, v kateri sta ta in dodatna; nadaljujemo z naslednjo dodatno oviro;
- sicer preverimo, ali je naslednja obstoječa tako za to dodatno oviro in ju združimo ter nadaljujemo z naslednjo dodatno oviro;
- sicer preverimo, ali je ta dodatna ovira pred naslednjo obstoječo; če je, jo dodamo;
- sicer preskočimo to obstoječo oviro.

Morda pa sem kaj izpustil. Tole je primer kode, ki bi jo zelo nerad vključil v nek sistem, ki bi moral dejansko in zanesljivo delovati.

Nekaj študentov je debelo gledalo, češ, to se da lažje. Tudi jaz sem se že med govorjenjem domislil krajše rešitve: odstraniš odvečne ovire, vržeš vse skupaj, urediš in nato združuješ. Takšna rešitev je seveda lažja, po premisleku pa me je navdušenje nad njo malo minilo. Poglejmo.

In [24]:
def zlij_ovire(obstojece, dodatne):
    odstrani_odvecne(obstojece, dodatne)
    obstojece += dodatne
    obstojece.sort()
    i = 0
    while i + 1 < len(obstojece):
        if obstojece[i][1] + 1 == obstojece[i + 1][0]:
            obstojece[i] = (obstojece[i][0], obstojece[i + 1][1])
            del obstojece[i + 1]
        else:
            i += 1

Kaj mi ni všeč? To, da ta rešitev krši omejitev, ki sem si jo postavil pred reševanjem. Delal bom v živo, na seznamu obstoječe. To sicer res počnem, vendar ... no, ideja je bila v tem, da dejansko popravljam ta seznam, postopno dodajam vanj ... ne pa, da v bistvu naredim nov seznam in ga prečistim.

Nezadovoljen z obojim sem sestavil rešitev, ki je v duhu mojega prvega cilja in se mi zdi dovolj pregledna, da ji zaupam. Tale, spodaj. Razložijo jo komentarji. Tudi ta mi ni všeč, zato sem se lotil še neke nove ideje - ki spet ni šla nikamor. Tu se vdam: dejansko je najboljša in najbolj varna ta, ki jo imamo zgoraj - zmeci skupaj, uredi, zlij.

In [25]:
def zlij_ovire(obstojece, dodatne):
    odstrani_odvecne(obstojece, dodatne)
    dodatne = dodatne[::-1]
    def pridruzi(ovira):
        obstojece[o] = (obstojece[o][0], ovira[1])

    o = 0
    while o < len(obstojece) and dodatne:
        obstojeca = obstojece[o]
        # Prilepiti naslednjo obstoječo k tej? Prilepi in nadaljuj z zanko
        if o + 1 < len(obstojece) and obstojeca[1] + 1 == obstojece[o + 1][0]:
            pridruzi(obstojece.pop(o + 1))
            continue

        # Vzemi naslednjo dodatno
        dodatna = dodatne.pop()
        # Prilepiti dodatno za obstoječo?
        if obstojeca[1] + 1 == dodatna[0]:
            pridruzi(dodatna)
        # Vriniti dodatno pred obstoječo?
        elif dodatna[0] < obstojeca[0]:
            obstojece.insert(o, dodatna)
        # Vrni dodatno v seznam
        else:
            dodatne.append(dodatna)
            o += 1

    # Morda je bila obstojeca[o] prilepljena dodatna, ki se dotika naslednje
    # obstoječe: združi!
    if o + 1 < len(obstojece) and obstojece[o][1] + 1 == obstojece[o + 1][0]:
        pridruzi(obstojece.pop(o + 1))
    obstojece += dodatne[::-1]