# Oppsummert Resultat
Aggregering: gå igjennom en masse data, lage et oppsummert resultat.

F.eks.
- summere en serie tall
- gange sammen en serie tall
- finne gjennomsnitt, største, minste tall e.l.

Nedenfor vises en funksjon hvor ei for-løkke summerer tall i en sekvens som blir gitt inn:


In [None]:
def sum_av_sekvens(sekv):
    summen = 0
    for element in sekv:
        summen += element
    return summen

# kode for å teste funksjonen, ser at den virker både for tupler, lister, array
import numpy as np
tuppel = (3, 5, 7, 0, 12)
liste = [4, 2, 3, 6, 5]
arr = np.array([2, 5, -1, 8])
print(sum_av_sekvens(tuppel))
print(sum_av_sekvens(liste))
print(sum_av_sekvens(arr))

For-løkka kommer til å gå like mange runder som det er element i sekvensen
- f.eks. 4 ganger når arrayet __arr__ er argument til funksjonen
- for hver runde legges ett nytt tall til summen
    - variabelen __element__ inneholder dette tallet, 
    - hhv. 2, 5, -1, 8 på de fire rundene løkka kjører hvis vi gir inn arr

__Før__ løkka må vi ha satt summen = 0
- siden det er riktig verdi før vi har lagt til noen tall
- samt også gir riktig sluttresultat hvis sekvensen er tom

Alternativt til å iterere sekvensen på verdier (for element in sekv:), kunne vi også ha iterert på indeks:

In [None]:
def sum_av_sekvens(sekv):
    summen = 0
    for i in range(len(sekv)):
        summen += sekv[i]
    return summen

# kode for å teste funksjonen, ser at den virker både for tupler, lister, array
import numpy as np
tuppel = (3, 5, 7, 0, 12)
liste = [4, 2, 3, 6, 5]
arr = np.array([2, 5, -1, 8])
print(sum_av_sekvens(tuppel))
print(sum_av_sekvens(liste))
print(sum_av_sekvens(arr))

Som vi ser, gir dette helt samme resultat, bare oppnådd på en litt annen måte:
- her får __i__ verdiene 0, 1, 2, 3 (hvis en sekvens på lengde 4, som __arr__, blir gitt inn)
- så blir sekv[i] 2, 5, -1, 8 på de fire rundene av løkka hvis __arr__ ble gitt inn

## For enkle, vanlige behov trengs ikke løkke
Hvis vi ønsker en sum av alle tall i en sekvens
- trenger vi __ikke__ skrive noen løkke
- kan i stedet bruke biblioteksfunksjoner

In [None]:
liste = [4, 2, 3, 6, 5]
sum(liste)

In [None]:
arr = np.array([2, 5, -1, 8])
np.sum(arr)

Samme gjelder for andre vanlige behov (produkt, største, minste)

In [None]:
print(f'Produkt av tall i liste: {np.prod(liste)}') # Produktet
print(f'Produkt av tall i arr: {np.prod(arr)}')     
print(f'Minste tall i liste: {min(liste)}')
print(f'Minste tall i arr: {np.min(arr)}')
print(f'Største tall i liste: {max(liste)}')
print(f'Største tall i arr: {np.max(arr)}')

## Men hva om vi ikke skal samle opp alle element i lista?
men bare noen av dem, avhengig av betingelser?
- blir innfløkt å bruke biblioteksfunksjoner
- enklere å skrive løkke med if-setning inni
- typisk løsningsmønster: __betinget aggregering__

Noen enkle eksempel:
- summen av alle oddetall i sekvensen
- antall negative tall i sekvensen
- produkt av tall som ikke null i sekvensen
- største tosifra tall i sekvensen

In [None]:
def sum_odde(sekvens):
    '''Får inn sekvens, som er liste / tuppel / array med heltall
       Returnerer summen av oddetallene i sekvens'''
    summen = 0
    for tall in sekvens:
        if tall % 2 == 1:
            summen += tall
    return summen

liste = [3, 5, 2, 7, 8, 10]
print(sum_odde(liste))

In [None]:
def antall_negative(sekvens):
    '''Får inn sekvens, som er liste / tuppel / array med tall
       Returnerer antall negative tall i sekvens'''
    antall = 0
    for i in range(len(sekvens)):
        if sekvens[i] < 0:
            antall += 1
    return antall

liste = [3, -5, 2, 7, -8, 10]
print(antall_negative(liste))

In [None]:
def prod_ikke_null(sekvens):
    '''Får inn sekvens, som er liste / tuppel / array med tall
       Returnerer produktet av tall som er ulik 0 i sekvens'''
    prod = 1
    for i in range(len(sekvens)):
        if sekvens[i] != 0:
            prod *= sekvens[i]
    return prod

liste = [3, 0, 2, 7, 0, 0.5]
print(prod_ikke_null(liste))

In [None]:
def max_tosifra(sekvens):
    '''Får inn sekvens, som er liste / tuppel / array med positive heltall
       Returnerer største tosifra tall i sekvensen, eller None hvis ingen tosifra tall i sekvens'''
    max_tall = None
    for tall in sekvens:
        if 10 <= tall < 100:
            if max_tall == None:
                max_tall = tall
            elif tall > max_tall:
                max_tall = tall
    return max_tall

liste = [1, 19, 188, 94, 32]
print(max_tosifra(liste))
liste2 = [1, 4, 1000]
print(max_tosifra(liste2))

Her er det essensielt at __max_tall == None__ sjekkes FØR __tall > max_tall__

Dette fordi sammenligningen __tall > None__ vil gi __TypeError__

Denne kan også løses med __or__ i stedet for __elif__
- og igjen må __max_tall == None__ i så fall stå før __or__, og __tall > max_tall__ etter

In [None]:
def max_tosifra(sekvens):
    '''Får inn sekvens, som er liste / tuppel / array med positive heltall
       Returnerer største tosifra tall i sekvensen, eller None hvis ingen tosifra tall i sekvens'''
    max_tall = None
    for tall in sekvens:
        if 10 <= tall < 100:
            if max_tall == None or tall > max_tall:
                max_tall = tall
    return max_tall

liste = [1, 19, 188, 94, 32]
print(max_tosifra(liste))
liste2 = [1, 4, 1000]
print(max_tosifra(liste2))

## Oppsummering
Typisk struktur for betinget aggregering:
1. initialisere variabel som skal huske foreløpig resultat underveis, f.eks.
    - hva er foreløpig sum / produkt / antall / ...?
    - hva er foreløpig største / minste verdi vi har funnet?
2. kjøre løkke gjennom aktuell sekvens av element
3. inni løkka, teste om elementet tilfredsstiller betingelsen
4. hvis ja, endre variabelen som husker foreløpig resultat
5. ETTER løkka, returnere resultatet