# Nove funkcije

Spomnimo se na zadnji program iz prejšnjega poglavja.

Imamo neko `zaporedje` in izračunati je torej potrebno pogostosti vseh trojk.

Morda bomo to reč potrebovali večkrat. Če je tako, bi bilo praktično, če bi jo spremenili v funkcijo in jo poklicali vsakič, ko jo bomo potrebovali.

In [4]:
def pogostosti(zaporedje):
    trojke = {}
    i = 0
    while i < len(zaporedje) - 2:
        trojka = zaporedje[i:i + 3]
        if trojka not in trojke:
            trojke[trojka] = 0
        trojke[trojka] += 1
        i += 3
    return trojke

In [5]:
pogostosti("aaaacgacgacgaaaaaaaaa")

{'aaa': 4, 'acg': 3}

Definicijo nove funkcije začnemo z `def`. Sledi ime funkcije. Nato v oklepajih naštejemo imena argumentov. To jo podobno kot v matematiki, kjer smo pisali, recimo, `f(x, y) = 2x + sin(x) + y`. Znotraj funkcije se potem ta imena nanašajo na tisto, kar je funkcija dobila kot argument. Če matematik po gornje definiciji f-a napiše `f(5, 3)`, je to enako `2 * 5 + sin(5) + 3` - namesto vseh x in y imamo 5 in 3. Tu pa prav tako. Če imamo `pogostosti(zaporedje)` in pokličemo `pogostosti("aaaacgacgacgaaaaaaaaa")`, se bo ime `zaporedje` znotraj funkcije nanašalo na `"aaaacgacgacgaaaaaaaaa"`.

Definicijo funkcije smo končali z `return trojke`. `return` pove, kaj naj funkcija vrne. Če ga pozabimo, funkcija ne bo vrnila ničesar.

Ob funkcijah bi lahko preživeli še nekaj ur. Povedali bi lahko, da `return` ni nujno na koncu in da jih je lahko več. Govorili bi o lokalnih in globalnih spremenljivkah, skladu, vezavi imen ... in še veliko stvareh. Vendar za to ni časa; te stvari se boste učili sami in sproti.

Tule dodajmo le še eno malenkost: funkcije z več argumenti. Na Marsu bodo morda odkrili bitja, katerih kodoni so dolgi štiri bazne pare. Da bo naša funkcija pripravljena na osvajanje Marsa, ji dodajmo še argument `dolzina`.

In [13]:
def pogostosti(zaporedje, dolzina):
    trojke = {}
    i = 0
    while i < len(zaporedje) - (dolzina - 1):
        trojka = zaporedje[i:i + dolzina]
        if trojka not in trojke:
            trojke[trojka] = 0
        trojke[trojka] += 1
        i += dolzina
    return trojke

In [8]:
zap = "gcaactgttggacggctacagtgacggttggtagaactgagtcggtttaaggactcacacatcgcgggtctgcaaagtgtaatctacaagggagcccgag"
pogostosti(zap, 4)

{'aagg': 1,
 'aatc': 1,
 'acac': 1,
 'actc': 1,
 'agaa': 1,
 'agcc': 1,
 'aggg': 1,
 'atcg': 1,
 'caaa': 1,
 'cgag': 1,
 'cggc': 1,
 'cggg': 1,
 'cggt': 1,
 'ctga': 1,
 'ctgt': 1,
 'gcaa': 1,
 'gtcg': 1,
 'gtga': 1,
 'gtgt': 1,
 'gttt': 1,
 'taca': 2,
 'tctg': 1,
 'tgga': 1,
 'tggt': 1}

In [9]:
pogostosti(zap, 10)

{'aatctacaag': 1,
 'atcgcgggtc': 1,
 'gacggctaca': 1,
 'gcaactgttg': 1,
 'ggactcacac': 1,
 'ggagcccgag': 1,
 'gtagaactga': 1,
 'gtcggtttaa': 1,
 'gtgacggttg': 1,
 'tgcaaagtgt': 1}

Ker pa je dolžina kodona pri vseh doslej znanih bitjih vendarle le tri pare, pa bi bilo lepo, če bi imel ta argument privzeto vrednost, da bi lahko poklicali

In [10]:
pogostosti(zap)

TypeError: pogostosti() missing 1 required positional argument: 'dolzina'

in dobili rezultat, ne napake.

Tudi to je preprosto: argumentu enostavno "priredimo" vrednost.

In [11]:
def pogostosti(zaporedje, dolzina=3):
    trojke = {}
    i = 0
    while i < len(zaporedje) - (dolzina - 1):
        trojka = zaporedje[i:i + dolzina]
        if trojka not in trojke:
            trojke[trojka] = 0
        trojke[trojka] += 1
        i += dolzina
    return trojke

In [12]:
pogostosti(zap)

{'aag': 2,
 'act': 1,
 'agt': 2,
 'atc': 2,
 'caa': 1,
 'cac': 1,
 'cag': 1,
 'cga': 1,
 'cgg': 3,
 'cta': 1,
 'ctg': 2,
 'gaa': 1,
 'gac': 1,
 'gca': 1,
 'gcc': 1,
 'gcg': 1,
 'gga': 2,
 'ggt': 1,
 'gta': 2,
 'gtt': 1,
 'tac': 1,
 'tca': 1,
 'tga': 1,
 'ttg': 1,
 'ttt': 1}