# Eksempel: summering av tallserier

## Oppgave. Lag en funksjon som
- får inn et positivt heltall n
- returnerer summen av alle tall fra og med 1 til og med n, dvs. 1 + 2 + ... + n

Lag både en variant med while-løkke og en variant med for-løkke

Hvordan tenke om løsning her?

Vi skal regne ut en sum. Med while-løkke trenger vi å opprette før løkka
- en variabel for denne summen. Den begynner typisk på 0 (før vi har lagt til noe)
- en annen variabel for tallet som vi gradvis skal øke. Begynner på 1...

Siden summen er det som skal regnes ut, må den returneres til slutt
- dette må gjøres __etter__ løkka
    - (hvis vi returnerer __i__ løkka, vil vi avslutte funksjonen allerede i første runde)
    
Dette gir en foreløpig kladd til løsning:

In [None]:
def sum_1_n_while(n):
    '''Får inn et positivt heltall n
       Returnerer summen 1 + 2 + ... + n'''
    summen = 0
    tallet = 1
    while tallet : #TO be done, passende betingelse...
        # TO be done, innmat i løkka
    return summen

Denne koden vil ikke kjøre, vi må legge til
- en betingelse etter while
- innmat i løkka

Hva skal betingelsen være? Her kan man tenke:
- Hva er det aller siste tallet som skal komme med i summen?
- Jo, det er n
- For at n skal komme med, må betingelsen være tallet <= n
    - hvis den bare var < n, ville n ikke bli med

Og hva med innmaten i løkka?
- tallserien vil skal summere, er 1, 2, 3, ..., n. Dvs., for hver runde må tallet økes med 1
- og hvert av disse tallene må legges til den summen vi hadde fra før, dvs. summen økes med tall

Men hva blir riktig rekkefølge. Blir det...?

In [None]:
def sum_1_n_while(n):
    summen = 0
    tallet = 1
    while tallet <= n:
        tallet += 1
        summen += tallet
    return summen

...eller blir det...??

In [None]:
def sum_1_n_while(n):
    summen = 0
    tallet = 1
    while tallet <= n:
        summen += tallet
        tallet += 1
    return summen

Her må vi se: hva er tallet når vi kommer inn til løkka?
- jo, det er 1 - som er det første tallet som skal med i summen
- hvis vi gjør tallet += 1 først i løkka, blir det feil - for da blir tallet 2 før vi rekker å summere det inn
- altså er det andre alternativet korrekt her, vi må først addere tallet inn i summen, deretter øke tallet med 1

Løsningen blir altså:

In [6]:
def sum_1_n_while(n):
    '''Får inn et positivt heltall n
       Returnerer summen 1 + 2 + ... + n'''
    summen = 0
    tallet = 1
    while tallet <= n:
        summen += tallet
        tallet += 1
    return summen

print(sum_1_n_while(5))

15


Med erfaringene fra while-løkka friskt i minne, blir for-løkka enklere.

Vi må likeledes starte med å sette summen = 0

Til for-løkka kan vi bruke range
- det andre argumentet til range er til, men __ikke__ med
- vi må derfor ha range(1, n+1) for å få tallsekvensen 1, 2, ..., n

I for-løkka trenger vi ikke oppdatere tallet inni løkka fordi for-setninga gjør det automatisk. Dermed blir løsninga enklere her:

In [5]:
def sum_1_n_for(n):
    '''Får inn et positivt heltall n
       Returnerer summen 1 + 2 + ... + n'''
    summen = 0
    for tallet in range(1, n+1): # gir sekvens 1, 2, 3, ..., n
        summen += tallet
    return summen

print(sum_1_n_for(5))

15


Vi ser at for dette problemet var for-løkke litt enklere enn while løkke
- med for-løkka slipper vi ei kodelinje for å sette tallet til 1
- slipper også eksplisitt å øke tallet med 1, fordi for-løkka gjør dette automatisk

Oppgaven med å summere disse tallene kan også løses på flere andre måter. Nedenfor vises tre eksempler til:
- en løsning med den innebygde sum-funksjonen fra Pythons standardbibliotek anvendt rett på range-objektet
- en løsning med numpy.sum-funksjonen anvendt på et tilsvarende array laget med numpy.arange()
- en løsning som benytter Gauss sin formel for slike summer

Som vi ser, gir alle identisk svar 15 med 5 som argument (som er riktig, 1+2+3+4+5 er 15)

In [13]:
import numpy as np

def sum_1_n_range(n):
    '''Regner ut summen 1 + 2 + ... + n ved hjelp av standard sum()-funksjon'''
    return sum(range(1,n+1))

def sum_1_n_arange(n):
    '''Regner ut summen 1 + 2 + ... + n ved hjelp av numpy.sum()-funksjon'''
    return np.sum(np.arange(1,n+1))

def sum_1_n_gauss(n):
    '''Regner ut summen 1 + 2 + ... + n ved Gauss sin formel'''
    return (n+1) * n // 2

sum_1_n_range(5), sum_1_n_arange(5), sum_1_n_gauss(5)

(15, 15, 15)

__Det som kommer videre her, er for spesielt interesserte; du trenger det ikke for å klare de neste øvingene__

Hvilken funksjon er "best"? Det kommer an på bruksområdet. Men anta at
- vi blant annet tenker å bruke den på skikkelig lange heltall
- da er det viktig at den fortsatt gir riktig svar
- og at den ikke bruker altfor lang tid (og unødig mye strøm) på beregningen

I koden nedenfor bruker vi time.perf_counter() for å måle tiden på utførelse av de ulike funksjonene

In [28]:
import time
import numpy as np

def sum_1_n_while(n):
    '''Får inn et positivt heltall n
       Returnerer summen 1 + 2 + ... + n'''
    summen = 0
    tallet = 1
    while tallet <= n:
        summen += tallet
        tallet += 1
    return summen

def sum_1_n_for(n):
    '''Får inn et positivt heltall n
       Returnerer summen 1 + 2 + ... + n'''
    summen = 0
    for tallet in range(1, n+1): # gir sekvens 1, 2, 3, ..., n
        summen += tallet
    return summen

def sum_1_n_range(n):
    '''Regner ut summen 1 + 2 + ... + n ved hjelp av standard sum()-funksjon'''
    return sum(range(1,n+1))

def sum_1_n_arange(n):
    '''Regner ut summen 1 + 2 + ... + n ved hjelp av numpy.sum()-funksjon'''
    return np.sum(np.arange(1,n+1))

def sum_1_n_gauss(n):
    '''Regner ut summen 1 + 2 + ... + n ved Gauss sin formel'''
    return (n+1) * n // 2

x = 23564 # et stort heltall
# denne løkka har ei liste med funksjonene, dvs. hver runde av løkka prøver en ny funksjon
for func in [sum_1_n_while, sum_1_n_for, sum_1_n_range, sum_1_n_arange, sum_1_n_gauss]:
    time_0 = time.perf_counter() # starttidspunkt for stoppeklokka
    svar = func(x) # her brukes funksjonen for å regne ut svaret
    time_spent = time.perf_counter() - time_0 # brukt tid er nåtidspunkt minus starttidspunkt
    print(f'{svar:20}    {time_spent:14.12f}') # printer resultatet
    # NB: viktig at print kommer etter at tidtaking er stoppet, ellers vil printen stå for en god del av tidsbruken

           277642830    0.002645700000
           277642830    0.001138800000
           277642830    0.000289700000
           277642830    0.000271500000
           277642830    0.000001300000


Som vi ser, alle får samme svar, men gauss-varianten (nederst) er klart raskest i sekunder brukt

Vi prøver et enda større tall (dette kommer til å ta en del mer tid):

In [27]:
x = 23564000 # et stort heltall
for func in [sum_1_n_while, sum_1_n_for, sum_1_n_range, sum_1_n_arange, sum_1_n_gauss]:
    time_0 = time.perf_counter()
    svar = func(x)
    time_spent = time.perf_counter() - time_0
    print(f'{svar:20}    {time_spent:14.12f}')

     277631059782000    1.892278000000
     277631059782000    1.035873500000
     277631059782000    0.601982300000
            78801264    0.031163000000
     277631059782000    0.000001500000


Igjen er gauss-varianten raskest, og enda mye klarere enn sist. Hvorfor?
- grunnen er at den gjør kun en addisjon, en multiplikasjon og en heltallsdivisjon, uansett hvor stort tallet er
- alle de andre variantene gjør et økende antall addisjoner jo større tall
    - while-varianten og for-varianten har disse addisjonene direkte synlige i koden, en for hver runde av løkka
    - range- og arange-variantene har addisjonene skjult i sum() og np.sum()-funksjonene. 
        - De er mer effektive enn våre egne while- og for-løkker, men har likevel økende tidsbruk med økende tallstørrelse
- for numpy-varianten kan det dessuten merkes at den gir feil svar
    - numpy takler ikke lange heltall særlig godt hvis vi bare gjør beregningen rett fram som dette
    - numpy er primært ment for effektive beregninger med flyttall
    
Dette eksemplet illustrerer at et problem kan "se ut" som et typisk løkkeproblem
- f.eks. summer alle tallene fra og med 1 til og med n
- men det kan finnes bedre løsninger som __ikke__ bruker løkke
- her er løsning uten løkke mulig fordi vi har en regulær tallserie hvor alle opplysninger er kjent på forhånd