# Metode

Najprej smo delali s številkami. Številke se preproste živali - lahko jih odštevaš, seštevaš, množiš in deliš, tu pa se približno konča. V Pythonu imamo, kot v večini jezikov, dve vrsti števil (če pozabimo na vse ostale, ki so malo bolj skrite ali malo manj uporab(lja)ne), namreč cela in necela števila. Nato smo spoznali nize, se pravi, zaporedja znakov. Ta so še bolj preprosta (kmalu bomo sicer videli, da videz vara), saj jih lahko samo seštevamo. Naslednji podatkovni tip, na katerega smo naleteli, so bile logične vrednosti, `True` in `False`. Teh ne moremo seštevati in množiti (res ne? ste prepričani? ste poskusili?), tipične operacije na njih so `and`, `or` in `not`.

V zadnjem poglavju pa smo naleteli na čisto drugačen podatkovni tip: datoteka. Ta je nenavaden, ker ... pač ne zveni kot podatek. Ni številka ali kos besedila. Malo abstraktnejši je. (Takšnim rečem pravimo *objekti*. Ime ni preveč pomembno. In tudi številke so objekti. Le da me boste v zvezi z nekaterimi rečmi slišali uporabljati to ime, v zvezi s številkami pa ne.)

Datotek ne moremo seštevati in množiti, ne moremo jih primerjati po velikosti, ne moremo jih izpisati (lahko pa preberemo in izpišemo njihovo vsebino, seveda). Splošne funkcije, ki smo jih videli doslej, recimo, `print`, `abs`, `pow`, `int` in `str`, zanje niso uporabne; nekatere med njimi (`abs`) sploh ne sprejmejo datoteke kot argument, druge pa ne vrnejo ničesar pametnega (`print` izpiše tisti `TextWrapper`...). Pač pa imajo datoteke svoje specifične funkcije. Videli smo tri: `write`, `read` in `close`. Imajo jih še precej. Ker pa so te funkcije specifične za datoteke (skoraj nobena druga reč v Pythonu nima funkcije `close`), ne plavajo kar tako na prostem, temveč so vezane na datoteko.

Kako to izgleda sintaktično, smo videli. Namesto, da bi napisali `write(dat, "Prva vrstica\n")`, smo pisali `dat.write("Prva vrstica\n").`. Funkcija `write` je "znotraj" datoteke, del definicije tega, kar zna datoteka. Zato pisanje s piko; pika bo tudi v drugih kontekstih v Python pomenila nekaj, kar je znotraj nečesa.

Funkcija `write` torej ne obstaja, pač pa obstaja `dat.write` - funkcija `write`, ki je funkcija prav te specifične datoteke `dat`. Takšnim funkcijam navadno ne rečemo *funkcija* temveč *metoda*. To spet ni preveč pomembno (razlika je bolj zgodovinska, v modernih jezikih pa je praktično ni več) in je potrebno povedati le zato, ker boste to besedo pogosto slišali.

Datoteke seveda niso edine reči, ki imajo metode. V resnici jih imajo celo števila, a tiste za nas niso posebej zanimive in uporabne. Pač pa so zanimive in uporabne metode, ki jih imajo nizi.

Python v resnici nima veliko funkcij - golih funkcij, ki same plavajo naokrog. Vse, kar je uporabnega, se skriva v metodah. Z nizi, recimo, bomo morali početi marsikaj: včasih bomo želeli odkriti, na katerem mestu v nizu se pojavi določeno podzaporedje znakov (beseda, ali pa nek kodon, če vas zanimajo take reči). Ali pa bomo prešteli število pojavitev kodona. Razbili niz na seznam podnizov glede na določeno ločilo. Zamenjali del niza z drugim; morda vse pojavitve "AGA" z "AGG"... Za vse te reči obstajajo metode.

# Primer: metoda `split()`

Datoteka `osebe.txt` vsebuje tole:

```
Ana 72 1.70
Berta 85 1.84
Cilka 70 1.65
Dani 82 1.80
Eva 50 1.50
Fanči 64 1.65
```

Izpisati želimo imena oseb in indekse njihovih telesnih tež.

Za začetek se spomnimo le, kako lepo, po vrsticah prebrati datoteko.

In [12]:
for vrstica in open("datoteke/osebe.txt"):
    print(vrstica)

Ana 72 1.70

Berta 85 1.84

Cilka 70 1.65

Dani 82 1.80

Eva 50 1.50

Fanči 64 1.65


Zanka `for` bere datoteko, vrstico za vrstico, in vsebino vsake vrstice priredi spremenljivki `vrstica`. Kakšnega tipa je vrstica? Niz, seveda.

V gornjem programu jo izpišemo. V resnici pa jo moramo razdeliti na tri reči, ime, težo in višino. To ne bo težko, saj imajo nizi metodo `split`. Uporabimo jo lahko takole:

In [23]:
for vrstica in open("datoteke/osebe.txt"):
    ime, teza, visina = vrstica.split()
    print(ime)

Ana
Berta
Cilka
Dani
Eva
Fanči


Ker je vrstica sestavljena točno iz treh besed, bo `split` vrnila tri stvari, ki jih spravimo v tri spremenljivke. Če se število reči in spremenljivk ne ujema, Python javi napako.

In [24]:
for vrstica in open("datoteke/osebe.txt"):
    ime, teza, visina, nekaj_cesar_ni = vrstica.split()
    print(ime)

ValueError: not enough values to unpack (expected 4, got 3)

Kaj v resnici vrne `split` in kako ga uporabljati varneje, bomo še izvedeli (ali pa boste odkrili sami, če nam zmanjka časa :)).

Spremenljivka `ime` je, očitno, niz. Kaj pa `teza` in `visina`? Tudi. Sicer so res videti kot številke - a Python ne ugiba. Če hočemo števila, moramo pretvarjati. Ročno. Pa dajmo: kar sproti, znotraj računanja `bmi`, bomo poklicali `int(teza)` in `float(visina)`. Teža naj bo celo število (lahko bi bila tudi necelo, saj je vseeno), višina pa bo necelo (to pa je pomembno - zakaj?).

In [19]:
for vrstica in open("datoteke/osebe.txt"):
    ime, teza, visina = vrstica.split()
    bmi = int(teza) / float(visina) ** 2
    print(ime, bmi)

Ana 24.913494809688583
Berta 25.10633270321361
Cilka 25.71166207529844
Dani 25.30864197530864
Eva 22.22222222222222
Fanči 23.507805325987146


Tole je stranska tema, v katero se ne bomo spuščali: izpis je grd. Le na hitro nakažimo, kaj se da storiti. Najprej pred narekovaj, ki začenja niz, postavimo `f`, znotraj niza pa v zavitih oklepajih povemo, kaj naj se izpiše.

In [21]:
for vrstica in open("datoteke/osebe.txt"):
    ime, teza, visina = vrstica.split()
    bmi = int(teza) / float(visina) ** 2
    print(f"{ime}: {bmi}")

Ana: 24.913494809688583
Berta: 25.10633270321361
Cilka: 25.71166207529844
Dani: 25.30864197530864
Eva: 22.22222222222222
Fanči: 23.507805325987146


Nato poleg tega, kaj naj se izpiše, navedimo, *kako* naj se izpiše. `{ime}` spremenimo v `{ime:>15}`, kar pomeni, naj se `ime` izpiše na 15 znakov, poravnano na desno. `{bmi}` pa spremenimo v `{bmi:.3f}`, kar pomeni na tri decimalna mesta in kot običajno število (`f`).

In [22]:
for vrstica in open("datoteke/osebe.txt"):
    ime, teza, visina = vrstica.split()
    bmi = int(teza) / float(visina) ** 2
    print(f"{ime:>15}: {bmi:.3f}")

            Ana: 24.913
          Berta: 25.106
          Cilka: 25.712
           Dani: 25.309
            Eva: 22.222
          Fanči: 23.508


Ker je to, kot rečeno, tema, v katero se ne bomo spuščali, naj si ta, ki ga to zanima, sam prebere [dokumentacijo](https://docs.python.org/3/library/string.html#formatspec). Ta se žal nanaša na starejšo metodo `format` in ne na f-nize. A se boste že znašli - samo na `format` pozabite, in `f` dodajte, ostalo je isto.

Ob metodi `split` povejmo še, da ji lahko damo tudi argument: ločilo. V gornjem primeru bi imeli očitno probleme pri

```
Marija Terezija 90 1.70
```

saj bi `split` razbil vrstico na štiri besede, ker se je zdelo Marijini mami dobra fora, da je dala svoji hčeri dve imeni. Datoteko bi bilo zato varneje pisati tako, da bi bili podatki ločeni z vejico.

```
Ana, 72, 1.70
Berta, 85, 1.84
Cilka, 70, 1.65
Marija Terezija, 90, 1.70
```

V tem primeru namesto `split()` pokličemo `split(",")`, pa loči po vejici namesto po presledkih.

Datoteke so pogosto zapisane tako, da so stolpci ločeni s tabulatorjem (*tab-delimited*). V tem primeru pokličemo `split("\t")`. Posebni znak `\t` je podoben posebnemu znaku `\n` - tako kot `\n` pomeni konec vrstice, `\t` pomeni tabulator.

# Primer: Metoda count()

Datoteka `qwerty-dna.txt` vsebuje sekvence desetih genov avstralskega Qwertyja. Vsaka vrstica se začne z imenom gena, sledi pa sto baznih parov. (Toliko so namreč dolgi njegovi geni. Čudna žival pač.)

```
ASDF13 gcaactgttggacggctacagtgacggttggtagaactgagtcggtttaaggactcacacatcgcgggtctgcaaagtgtaatctacaagggagcccgag
SDFG14 cgaagggcaatcggaagttgaggttcgtcatattaagtttggggaacgccgacatctaaatcttttaggtgataaatgcctaaatcagattcaatgtatt
DFGH15 cgacctcgtaaaatgacaaacactgtcgtggagcagtattcggtcatgccgcccgagccctaccaatcgagttcaactatcgctaactcgcgatgagcct
FGHJ16 tcgcgggtagcccacagccgggcctgattacagaggggtgaattcgatgcttgatgcggattcctggtaagctccgccgtgcgaccgacaactctcgact
GHJK17 tggtgatgtggtacatctttgaaaggctcaccgtgaacaaaagtgtattacaatcaacgagccccagggactgatccctcaacaagggcacccaagaagt
HJKL18 tacagacactatcgctcccgtagctggaggatttcacatgatctaagcaaagccgtagtgggagttcctatggcaataagcgaccttctataaccgagag
ZXCV19 tcatgcatgttaggttacatctaggctatgcctgtcccagtcagcaggtgggcctagattaagaaatgcccggttaggcaacacaacaccggtgtccttt
XCVB20 cgctacgtatgtccctaatcaagggctcatggtgctagccagggtcggggctagtttttaaggtatttctgcccccaacaaggagccagataggcccctt
CVBN21 acttggccactttactcctgcaatctttagtcctggggggagtttaaaatcattccagctgggatgggtctctatcctctccctgtaataacaacaaacg
VBNM22 tggtctttaagattaactgctcattaggatctgtctccaaacactgttaccgccggcaatcacaggagaatcagtcacctaagttgcgtaggccatatcc
```

Izpisati želimo, koliko `a`-jev je v sekvenci vsakega gena.

Pomagali si bomo z metodo `count`, ki ji kot argument podamo (pod)niz in vrne število ponovitev tega podniza.

In [25]:
for vrstica in open("datoteke/qwerty-dna.txt"):
    ime, zaporedje = vrstica.split()
    print(ime, zaporedje.count("a"))

ASDF13 26
SDFG14 31
DFGH15 26
FGHJ16 19
GHJK17 32
HJKL18 29
ZXCV19 24
XCVB20 21
CVBN21 24
VBNM22 27


To je to. :)

Nizi imajo še kup drugih metod. Ker seveda nimamo časa, da bi si jih ogledali vse po vrsti, lahko poškilite v [dokumentacijo](https://docs.python.org/3/library/stdtypes.html#text-sequence-type-str), ali pa v [zapiske predmeta Programiranje 1](https://ucilnica.fri.uni-lj.si/mod/page/view.php?id=7693).