# Python grundlæggende

Denne notebook indeholder meget kort information om Python. Brug den, hvis du har brug for en hurtig og enkel reference om de vigtigste datatyper og sprogkonstruktioner.

## Variabler

Alle værdier, du indtaster, læser fra filer eller opretter ved at udføre beregninger, skal gemmes i variabler. En variabel er et sted i computerens hukommelse, hvor værdien er gemt. Python husker positionen af dette sted og giver det en etiket — *variabelnavn*.

For at oprette en ny variabel bruges *tildelings*-operatoren, `=`. Her er nogle eksempler:

In [None]:
# create numeric variable with name "a"
a = 10
a

In [None]:
# create text variable with name "last_name"
last_name = "Peter"
last_name

Variablenavn skal starte med et bogstav og kan indeholde bogstaver, tal og understregninger.

### Primitive typer

Afhængigt af hvilken slags oplysninger du gemmer i en variabel, har de forskellige *typer*. De enkleste typer er:

* *integer* — indeholder hele tal (kan være med fortegn eller uden), f.eks. `a = 10`.
* *float* — indeholder reelle tal, f.eks. `pi = 3.14`.
* *string* — indeholder tekstsymboler, f.eks. `besked = "Hej verden!"`.
* *boolean* — indeholder logiske værdier `Sandt` og `Falsk`.

Her er nogle eksempler:

In [None]:
a = 10
type(a)

In [None]:
b = 10.5
type(b)

In [None]:
c = "Peter"
type(c)

In [None]:
d = True
type(d)

Nogle typer kan konverteres til andre, for eksempel flydende punkttal (float) til heltal (integer):

In [None]:
a = 10.567
b = int(a)
(a, b)

In [None]:
(type(a), type(b))

Såvel som ethvert tal kan konverteres til en streng (string):

In [None]:
a = 10.567
b = str(a)
(a, b)

In [None]:
(type(a), type(b))

### Beholdere

Hvis variabler af primitiv type kun kan indeholde én værdi, kan beholdere bruges til at kombinere flere værdier (eller flere variabler eller endda flere beholdere) sammen.

Den enkleste beholder i Python er et *tupel*, som du opretter ved at bruge `(` og `)`. For eksempel:

In [None]:
fruit = ("apple", "pear", "lemon")
fruit

In [None]:
type(fruit)

Du så allerede tuplerne i kodeeksemplerne ovenfor, vi brugte dem til at vise to variabler på samme tid.

Den anden type beholder, som er meget lig tuples, er en liste. Lister oprettes på samme måde som tuples, men med firkantede parenteser: `[` og `]`:

In [None]:
vegs = ["cucumber", "tomato", "squash"]
vegs

In [None]:
type(vegs)

I både tupler og lister har hver værdi et indeks. Indekserne i Python starter altid ved 0, så den første værdi har indeks 0, den anden har indeks 1, osv. Du kan få en værdi fra en tuple eller fra en liste ved at specificere dens indeks:

In [None]:
v = vegs[1]
v

In [None]:
f = fruit[0]
f

Vær opmærksom på, at selvom tuples oprettes med symboler `(` `)`, skal du angive dets indeks i firkantede parenteser for at få adgang til en værdi fra en tuple.

Hvad er forskellen på tupler og lister? Lister kan ændres, hvilket betyder, at du kan erstatte enhver værdi inde i listen med en ny:

In [None]:
vegs[1] = "potato"
vegs

Selvom tupler er uforanderlige, hvilket betyder, at du ikke kan ændre dens værdier, efter du har oprettet en tuple:

In [None]:
# this will give an error message!
fruit[1] = "orange"

Du kan også udvide og mindske listerne:

In [None]:
# add a new value to the end of the list
vegs.append("carrot")
vegs

In [None]:
# remove value with index 2 ("squash") from the list
vegs.pop(2)
vegs

>Du kan tænke på en variabel som en enkelt frugt, du kan få fra et grøntafdeling i et supermarked. Beholdere er plastikposer eller kasser du kan bruge til at pakke flere frugter sammen som et enkelt element. Så hvis det er en plastikpose, hvor du kan lægge et hvilket som helst antal frugter, fjerne eller erstatte nogle senere, er det et eksempel på en liste. Hvis det er en forseglet pose, hvor du ikke kan erstatte en frugt, er det et eksempel på en tuple.

Både lister og tupler kan udpakkes — så hvert element i beholderen tildeles til en separat variabel:

In [None]:
person = ("Peter", 170, 79)
person

In [None]:
name, height, weight = person
print(name)

Hvis du vil pakke kun en del af et tupel eller en liste ud, f.eks. tage første og tredje elementer, så brug understregningen `_` for de elementer, du ikke har brug for at gemme i en separat variabel:

In [None]:
_, height, weight = person
weight

Python har en anden type beholder - en *ordbog*. Ordbogen ligner en liste, men hvert værdi i ordbogen har en tekst-id - en *nøgle*. Ordbøger oprettes ved hjælp af `{` `}` og derefter liste nøgler og værdier indeni.

Her er et eksempel:

In [None]:
dinner = {"starter": "soup", "main dish": "paella", "desert": "apple pie"}
dinner

In [None]:
type(dinner)

Adgang til ordbogens værdier ligner tuples og lister, men du skal angive nøglen i stedet for indeks:

In [None]:
dinner["starter"]

Alle tre beholdere har en metode `len()`, som viser antallet af elementer i beholderen.

In [None]:
len(dinner)

Beholdere kan også bestå af beholdere, du kan indlejre lister indeni lister, lave liste af tuples eller dictionary af lister. Her er nogle eksempler:

In [None]:
# create lists with values
height = [180, 190, 176, 181]
weight = [81, 88, 75, 84]
names = ["Bob", "Anne", "Peter", "Lena"]

# create dictionary with lists
people = {"height": height, "weight": weight, "names": names}
people

In [None]:
people["names"]

In [None]:
persons = [
    ("Bob", 170, 80),
    ("Peter", 180, 78),
    ("Anne", 175, 70)
]
persons

In [None]:
persons[1]

## Funktioner

Funktioner er en almindelig måde at undgå at gentage lignende kode i Python og andre programmeringssprog. I de kodeeksempler ovenfor har vi allerede brugt to funktioner, `type()`, som returnerer variabeltypen (som streng) for en hvilken som helst variabel, og `len()`, som returnerer antallet af elementer i en beholder.

Fra disse to eksempler kan du se, at en typisk funktion tager nogle *argumenter* (de kaldes også *parametre*), gør derefter noget og returnerer resultatet tilbage til programmet. For eksempel tager funktionen `len()` en beholder som parameter og returnerer antallet af dens elementer som resultat. Hvordan den finder denne information, ved vi ikke, da det er skjult inde i funktionen.

Her er endnu et eksempel:

In [None]:
names = ["Bob", "Anne", "Peter", "Lena"]
l = len(names)
l

I dette eksempel er variablen `names` (liste med fire elementer) en værdi, vi sender til funktionen `len()` som en parameter. Resultatet returneret af funktionen gemmer vi i en anden variabel, `l`, hvis værdi vi viser på skærmen.

Lad os skrive vores egen funktion, som vil beregne arealet af en cirkel ved at kende dens radius. Tilsyneladende vil denne funktion kun have en parameter — radius, og returnere en værdi — arealet.

Her er hvordan man implementerer det. Bemærk indrykningen (ekstra plads til venstre) i koden, som er en del af funktionen. Brug tab-tasten for at tilføje det:

In [None]:
def get_circle_area(radius):
    area = radius * radius * 3.1415926
    return area

Kør denne celle (ingen ting vil ske), men Python vil indlæse denne funktion i hukommelsen, så den vil være tilgængelig for andre celler i denne notebook. Lad os teste den:

In [None]:
get_circle_area(10)

Som du kan se, gemte vi ikke resultatet, men viste det kun. Hvis vi selvfølgelig har brug for at bruge denne værdi senere i koden, kan vi gemme den i en variabel:

In [None]:
a = get_circle_area(10)
a

Hvis du ser på koden til funktionen, kan du bemærke, at vi ikke genbruger variablen `area` inde i denne funktion. Nå, faktisk bruger vi den, men kun for at returnere dens værdi tilbage til koden. I dette tilfælde behøver du ikke at oprette en separat variabel og kan blot returnere resultatet af beregningerne direkte:

In [None]:
def get_circle_area(radius):
    return radius * radius * 3.1415926

Funktionen kan have et vilkårligt antal argumenter, her er et eksempel hvor vi opretter en anden funktion, som beregner volumen af en cylinder. I dette tilfælde skal vi kende dens radius og dens højde.

In [None]:
def get_cylinder_volume(radius, height):
    return get_circle_area(radius) * height

In [None]:
get_cylinder_volume(5, 10)

Så hvis vi har en cylinder med en radius på 5 cm (10 cm i diameter) og en højde på 10 cm, vil dens volumen være 785,4 kubikcentimeter.

Vær opmærksom på, at i denne nye funktion har vi genbrugt den, vi oprettede før. Ved at dele din kode op i relativt små funktioner gør du den kortere, mere klar og mere effektiv.

Som du kan se, når vi angiver værdier, specificerer vi ikke, hvilken der er radius og hvilken der er højde. Python bruger som standard samme position, som de er angivet i funktionsdefinitionen — første værdi vil altid blive behandlet som radius og den anden som højde.

Hvis du ikke kan huske positionen for hver parameter (især når en funktion har mange af dem), kan du specificere deres værdier ved navn. I dette tilfælde betyder rækkefølgen ikke noget:

In [None]:
get_cylinder_volume(height = 10, radius = 5)

 Lad os nu tilføje en ny parameter, `scale`, som kan bruges til at skalere både radius og højde med et tal. For eksempel er højde og radius som standard angivet i meter, så hvis du vil fortælle funktionen, at de værdier, du har angivet, er i centimeter, skal du angive en skalfaktor på `0,01`. Her er implementeringen:

In [None]:
def get_cylinder_volume(radius, height, scale):
    return get_circle_area(radius * scale) * (height * scale)

In [None]:
get_cylinder_volume(5, 10, 0.01)

I det ovenstående eksempel angav vi radius og højde i cm, men vi fik resultatet i kubikmeter, fordi vi også specificerede skalaværdien.

Ulempen ved denne nye funktion er, at vi nu altid skal specificere skala-parameteren. Hvad nu hvis du mest af tiden angiver værdier i cm og meget sjældent i meter eller decimeter? I så fald kan du angive en standardværdi for parameteren:

In [None]:
def get_cylinder_volume(radius, height, scale = 0.01):
    return get_circle_area(radius * scale) * (height * scale)

Hvis du angiver skalaen, vil funktionen bruge den værdi, du har angivet. Men hvis du ikke gør det, vil den blot tage standardværdien:

In [None]:
# without scale - it will use 0.01 as default
get_cylinder_volume(5, 10)

In [None]:
# or you can specify it directly
get_cylinder_volume(5, 10, 1)

Endelig, hvis du skal bruge denne funktion intensivt og måske endda dele den med andre, er det en god idé at beskrive dens adfærd og dens argumenter. Dette kan gøres ved at give hvad der kaldes en *dokumentstreng*:

In [None]:
def get_cylinder_volume(radius, height, scale = 0.01):
    """
    Computes volume of a cylinder in cubic meters.

    Arguments:
    ----------
    radius: radius of the cylinder
    height: height of the cylinder
    scale: scale factor for radius and height (0.01 for cm, 1 for m)

    Returns:
    --------
    the compued volume
    """

    return get_circle_area(radius * scale) * (height * scale)

Nu skal du flytte musen over funktionsnavnet i næste kodeblok. Du vil se en svævende dialog med dokumentationsteksten, du har skrevet:

In [None]:
get_cylinder_volume(5, 10, 1)

Du bestemmer selv, hvor detaljeret docstringen skal være.

Funktioner kan også returnere flere værdier, i så fald kombiner dem bare til et tuple, når de returneres.

In [None]:
def div(a, b):
    """ computes reminder and quotient of a / b and return both """
    q = a // b
    r = a % b
    return (q, r)

In [None]:
a = 13
b = 3
q, r = div(a, b)
print(f"{a} = {q} * {b} + {r}")

Og igen kan vi gøre funktionen kortere ved at beregne resultaterne inden i tuplen med resultater, og springe oprettelsen af variablerne over:

In [None]:
def div(a, b):
    """ computes reminder and quotient of a / b and returns both """
    return (a // b, a % b)

Du har allerede lagt mærke til, at hvis vi skriver et variabelnavn i slutningen af cellen, så vil vi se dets værdi, når vi kører cellekoden:

In [None]:
a = 10.6
a

Det samme gælder, hvis du gør noget, der returnerer en værdi som et resultat:

In [None]:
10 * 5 / 2

Men prøv at køre følgende kode:

In [None]:
a = 10.5
a

b = 78.9
b

Du kan se, at i dette tilfælde ser vi ikke værdien af `a`, som standard udskriver Jupyter-notebogen kun den sidste værdi i cellen. Du kan tvinge den til at vise begge, hvis du bruger funktionen `print()`:

In [None]:
a = 10.5
print(a)

b = 78.9
print(b)

Dog i vores eksempler `print()` viser kun en værdi. Det ville være rart at pakke den ind i noget tekst, der giver yderligere information. Dette kan gøres ved at bruge en speciel type strenge i Python - [f-strenge](https://docs.python.org/3/tutorial/inputoutput.html).

Her står bogstavet "f" for "formateret". Reglerne er følgende:

- start strengen med bogstavet `f` og brug derefter dobbelt eller enkelt citater som for en normal streng.
- skriv normal tekst inde i citaterne.
- hvis du vil vise en variabelværdi inden i teksten, skal du bruge krøllede parenteser.

Her er et eksempel:

In [None]:
radius = 5.0
area = get_circle_area(radius)

print(f"Area of a circle with radius {radius} cm is {area} squared cm.")

Du kan også specificere, hvordan numeriske værdier skal vises - hvor mange cifre der skal bruges, og hvor mange decimaler. For eksempel lad os vise området som flydende punkttal med en decimal:

In [None]:
print(f"Area of a circle with radius {radius} cm is {area:.1f} squared cm.")

Som du kan se for at definere format, tilføj blot semikolon efter variabelnavnet og formatet: `:.1f`, som i dette tilfælde betyder flydende punkt med én decimal. Du kan læse mere om formateringsoptionerne i den [officielle dokumentation](https://docs.python.org/3/tutorial/inputoutput.html).

## Løkker

Løkke er en måde at gentage en eller flere linjer kode flere gange. Den enkleste måde er en `for`-løkke, hvor du kan specificere præcist hvor mange gange den skal køre. Tanken bag en for-løkke er som følger.

1. Definér en beholder med flere elementer
2. Brug `for` til at iterere over elementerne
3. Skriv kode, som du gerne vil køre ved hver iteration med indrykning.

Her er et eksempel:

In [None]:
x = [10, 20, 30]

for i in x:
    print(i * 2)

Som du kan se, først oprettede vi en beholder (liste i dette tilfælde) og bruger derefter løkke til at iterere over beholderens elementer. Løkken har en speciel variabel (i vores tilfælde `i`). Ved den første gennemløb er denne variabel lig med det første element i beholderen. Ved den anden gennemløb har den samme værdi som det andet element, og så videre. Dermed vil koden inde i løkken blive gentaget lige så mange gange som der er elementer i beholderen.

Som med funktioner skal linjerne med kode, der er en del af løkken, have ekstra plads i venstre side (indrykning). Dette er måden, Python forstår, hvad der skal køres inde i løkken, og hvad der er udenfor. Her er to eksempler for at hjælpe dig med at forstå dette:

In [None]:
# the last line is without indentation so it will be executed only
# once, after the loop
for i in x:
    print(i * 2)
print("we are done!")

In [None]:
# the last line has indentation so it will be executed at every iteration
for i in x:
    print(i * 2)
    print("we are done!")

Du kan også gennemgå en tuple:

In [None]:
names = ("John", "Peter", "Lene")

for n in names:
    print(f"Hello, {n}!")

Og selv over en ordbog vil du i dette tilfælde løbe igennem nøglerne, ikke værdierne:

In [None]:
dinner = {"starter": "salad with tuna", "main dish": "seafood paella", "desert": "ice-cream"}

for key in dinner:
    print(f"for {key} we will eat {dinner[key]}")

Men du kan også få både nøglen og værdien af hvert element i ordbogen, i dette tilfælde skal du bruge en funktion `items()`:

In [None]:
dinner = {"starter": "salad with tuna", "main dish": "seafood paella", "desert": "ice-cream"}

for key, val in dinner.items():
    print(f"for {key} we will eat {val}")

Sådan fungerer funktionen `itms()`:

In [None]:
dinner.items()

Så det tager en løkke og opretter en liste af tuple `(key, value)` af hvert element i ordbogen.

Hvis du bruger en løkke over en beholder for at oprette en anden beholder, kan du gøre koden meget kortere ved at placere løkken inden i beholderparenteserne. Herunder ser du to kodelinjer. Hver celle gør det samme — tager en liste over tal, kvadrerer hvert tal og kombinerer kvadraterne til en anden liste.

Her er en lang version:

In [None]:
numbers = [1, 2, 5, 10, 100]
squares = []

for n in numbers:
    squares.append(n * n)

squares

Og her er den korte:

In [None]:
squares = [n * n for n in numbers]
squares

Du kan bruge lignende form med ordbøger og tuples og endda blande dem, som det er vist nedenfor:

In [None]:
# create dictionary with squares of numbers, so a number will be the key and
# its square will be the value
squares = {n : n * n for n in numbers}
squares

In [None]:
squares[10]

Ofte har vi brug for at lave en løkke for et givet antal iterationer, f.eks. 10 eller 100. At oprette manuelt en liste med 100 værdier vil være ret besværligt. Heldigvis er der en funktion i Python, der kan gøre det for dig, `range()`. Her er nogle eksempler:

In [None]:
# range(n) creates a range of values: 0, 1, 2, ... , n - 1
for i in range(5):
    print(i)

In [None]:
# range(a, b) creates a range of values: a, a + 1, a + 2, ..., b - 1
for i in range(5, 10):
    print(i)

In [None]:
# range(a, b, s) does the same but values are incremented by "s"
for i in range(2, 10, 2):
    print(i)

In [None]:
# increment (step) can be negative but in this case a must be larger than b
for i in range(20, 10, -2):
    print(i)

`Range` er ikke en liste, det er et specielt objekt (vi vil diskutere objekter):

In [None]:
r = range(10)
r

Men du kan konvertere enhver `range` til en liste:

In [None]:
r = range(20, 10, -2)
r

In [None]:
l = list(r)
l

## Logiske operationer, betingelser, forgrening

Vi har allerede nævnt booleske (logiske) variabler, der kun har to værdier, `Sandt` eller `Falsk`. Men hvad skal de bruges til? De bruges til at kontrollere, om en bestemt betingelse er korrekt. For at producere booleske værdier skal du sammenligne værdierne. Her er et eksempel med seks operatører, du kan bruge til at sammenligne to værdier:

In [None]:
a = 5
b = 6

(a == b, a != b, a < b, a > b, a <= b, a >= b)

Som du kan se, resulterede brugen af hver af de seks operatører enten i `True` eller `False`, og vi fik `True` kun i de tilfælde, hvor betingelsen faktisk var gyldig (`a < b` og `a <= b`).

Du kan kombinere flere betingelser ved at bruge de logiske operatører "and" (`&`) og "or" (`|`). For eksempel kan vi i stedet for `a ≤ b` gøre det ved at bruge operatoren "and" og to separate sammenligninger:

In [None]:
# a is smaller than b OR a is equal two b
# if either is True the result will be True
(a < b) | (a == b)

Betingelser og logiske operationer kan bruges til at lave kodegrene: hvis betingelsen er sand, vil Python udføre én handling, og hvis betingelsen er falsk, vil den udføre den anden:

In [None]:
a = 5
b = 6

if a < b:
    print(f"{a} is smaller than {b}")
else:
    print(f"{a} is not smaller than {b}")

Du kan have så mange grene, som der er brug for.

In [None]:
# try to change the values and run the code
a = 5
b = 6

if a < b:
    print(f"{a} is smaller than {b}")
elif a > b:
    print(f"{a} is greater than {b}")
else:
    print(f"{a} is equal to {b}")

Her er et eksempel på en funktion, der beregner faktorialer, og hvordan man bruger den på en smart måde med lister. Det kombinerer mange ting, vi indtil videre har lært.

In [None]:
def factorial(a):
    """ computes and returns a! (factorial of a = 1 * 2 * ... * (a - 1) * (a - 2))"""

    # show error message and stop function if a is not integer
    # note that int is not a string, it is a type object
    if type(a) != int:
        print("Parameter 'a' must be integer number!")
        return

    # show error message and stop function if a is negative
    if a < 0:
        print("Parameter 'a' must be non-negative number!")
        return


    # 0! = 1
    if a == 0:
        return 1

    f = 1
    for i in range(a):
        f = f * (i + 1)

    return f

In [None]:
# should show error
factorial(-1)

In [None]:
# should show another error
factorial(0.1)

In [None]:
# factorial of a single number
factorial(5)

In [None]:
# factorials of a list of numbers
numbers = [0, 1, 2, 5, 10]
factorials = [factorial(n) for n in numbers]

factorials

## Klasser og objekter

Objekter er en mere avanceret måde at opbevare og manipulere forskellige værdier. Ethvert objekt i Python kan have *egenskaber* - en af flere variabler med værdier, og *metoder* - funktioner som kan gøre noget med objektet.

For at oprette et objekt, skal du først definere, hvordan det skal se ud, hvilke værdier det skal indeholde, samt hvilke metoder det skal have. Denne definition kaldes en *klasse*. Du kan tænke på en klasse som en samling af instruktioner, som fortæller Python, hvordan man skaber objektet, og hvad det kan gøre (ligesom bygningsinstruktioner til Ikea-møbler).

Her er et eksempel på en klasse `Person`, der beskriver hvordan man kan oprette et objekt af denne klasse for at opbevare information om en bestemt person, vise en velkomstbesked og øge personens alder ved at fejre dens fødselsdag:

In [None]:
class Person:

    def __init__(self, name, age, height):
        """ creates object of class Person with three parameters """
        self.name = name
        self.age = age
        self.height = height

    def welcome(self):
        """ shows welcome message """
        print(f"Hi, my name is {self.name}, I am {self.age} years old.")

    def celebrate_birthday(self):
        """ increment age of the person by one year """
        self.age = self.age + 1

Enhver klasse skal have en metode `__init__`. Du kan tænke på denne metode som en konstruktør, den opretter objektet ved at definere dets egenskaber og returnerer det oprettede objekt tilbage til python. Derfor tager den normalt alle værdier, som objektet skal have (i vores tilfælde navn og alder på en person og dens højde) og tildeler disse værdier til objektets egenskaber.

Inde i klassen har det fremtidige objekt internt navnet `self`. Derfor har alle metoder `self` som det første argument. For at få en egenskab af et objekt tilføjer du også `self.` før egenskabsnavnet, f.eks. betyder `self.name` navn på en bestemt person.

Efter at have defineret klassen kan du oprette et objekt af denne klasse og derefter bruge dette objekt ved at kalde dets metoder. Her er et eksempel:

In [None]:
p1 = Person("John", 26, 167)
p1.welcome()

In [None]:
p1.celebrate_birthday()
p1.welcome()

Du kan oprette en ny klasse ikke fra bunden, men ved at udvide den anden klasse. For eksempel opretter vi nedenfor klassen `Student` ved at udvide klassen `Person`. Den nye klasse vil have alt, hvad forældreklassen har (det kaldes også en superklasse) og også en ny egenskab - ordbog med aktuelle karakterer og to nye metoder - `set_exam_result()` og `show_grades()`:

In [None]:
class Student(Person):

    def __init__(self, name, age, height):
        """ creates object of class Student """
        super().__init__(name, age, height)
        self.grades = {"math": None, "physics": None, "chemistry": None}

    def set_exam_results(self, subject, grade):
        subjects = self.grades.keys()

        if not subject in subjects:
            print(f"Subject '{subject}' is not a part of the curriculum.")
            return

        self.grades[subject] = grade

    def show_grades(self):
        for subject, grade in self.grades.items():
            if grade is None:
                print(f"{subject}: this exam is not taken yet.")
            else:
                print(f"{subject}: the grade is {grade}")

Fordi navn, alder og højde er egenskaber ved en superklasse `Person`, skal vi først initialisere superklassen og derefter opbygge noget ovenpå den. Det er derfor, vi kører denne linje kode inde i `__init()__` metoden af den nye klasse:

```python
super().__init__(name, age, height)
```

Nu lad os oprette et nyt objekt af klassen `Student` og prøve en af metoderne fra dens overklasse:

In [None]:
s1 = Student("Lena", 21, 167)
s1.welcome()

Og lad os prøve nogle af de nye metoder:

In [None]:
s1.show_grades()

In [None]:
s1.set_exam_results("math", "A")
s1.set_exam_results("chemistry", "B")
s1.show_grades()


In [None]:
s1.set_exam_results("history", "C")

## Modul og pakker

Mange metoder og klasser kan genbruges enten af dig eller af andre. I så fald kan du dele din kode ved at oprette en *modul*. En modul er simpelthen en samling af funktioner og/eller klasser, som du kan bruge fra andre python-filer (f.eks. Jupyter notebooks eller python-scripts).

Når du installerer Python, kommer den allerede med mange moduler, der er en del af standardbiblioteket, f.eks.:

* `math` – indeholder matematiske funktioner og konstanter (som pi).
* `random` – indeholder funktioner til at generere tilfældige tal.
* `copy` – indeholder funktioner til at oprette kopier af komplekse strukturer, såsom ordbøger, objekter osv.

Og mange andre. For at bruge funktioner fra en hvilken som helst modul skal du enten importere en bestemt funktion eller hele modulet. Koden nedenfor viser, hvordan man importerer en bestemt funktion fra en modul:

In [None]:
# import function that compute square root
from math import sqrt

p1 = (1, 1) # (x, y) coordinates of the first point
p2 = (4, 5) # (x, y) coordinates of the second point

# compute and show Euclidean distance
d = sqrt( (p1[0] - p2[0])**2 + (p1[1] - p2[1])**2)

print(f"Distance between the two points is {d:.1f}")

Og her er hvordan man indlæser alle funktioner fra modulet og bruger nogle af dem:

In [None]:
# import whole module
import math

a = 2
print(f"square root of {a} is {math.sqrt(a):.3f}")

Hvis navnet på modulet er for langt, kan du give det et kort alias for at gøre koden kortere:

In [None]:
# import whole module and give it a short name
import math as mt

a = 2
print(f"square root of {a} is {mt.sqrt(a):.3f}")

En eller flere moduler kan kombineres i pakker. Enhver kan lave en pakke og dele den. For eksempel er de fleste Python-pakker tilgængelige i en særlig pakkebeholder, [PyPI](https://pypi.org). For at bruge en pakke skal du installere den først.

For at installere en pakke skal du køre følgende kommando enten fra kommandolinjen eller, hvis du arbejder i Jupyter Notebook, skal du blot starte denne kommando med `!`. For eksempel kodesnippet i cellen nedenfor installerer pakken `matplotlib`, som kan bruges til at lave grafer.

Kør den en gang (hvis du er på Mac, brug `pip3` i stedet for `pip`):

In [None]:
! pip install matplotlib

Du vil se, at denne kommando faktisk installerer ikke kun `matplotlib`, men flere andre pakker, f.eks. `numpy`, `pillow` og flere andre. Disse er *afhængigheder*, forfatterne af pakken `matplotlib` genbrugte funktioner fra disse pakker for at gøre deres arbejde lettere.

Hvis du allerede har installeret denne pakke, og kører denne kode igen, vil du se en besked `Krav allerede opfyldt`.

Nu kan vi bruge det. I koden nedenfor indlæser vi modulet `pyplot` fra pakken `matplotlib`, giver det et kort navn `plt` og bruger derefter flere funktioner fra dette modul til at oprette et søjlediagram.

In [None]:
import matplotlib.pyplot as plt

names = ["John", "Lena", "Peter", "Anna"]
height = [175, 180, 167, 171]

plt.bar(names, height)
plt.xlabel("Names")
plt.ylabel("Height, cm")

Hvis du flytter en musen cursor til navnet på pakken i koden ovenfor, vil du se en flydende dialog med hjælpetekst, som beskriver hvad denne pakke gør, og hvilke moduler den indeholder.

De fleste af de populære pakker har dokumentation, som beskriver alle moduler og funktioner. For eksempel her er en [dokumentation](https://matplotlib.org/stable/index.html) for pakken `matplotlib`.

## Oversigt over pakker brugt i dette kursus

Her er en oversigt over de pakker, vi vil bruge i kurset med en kort beskrivelse og et link til dokumentationen.

### matplotlib

Som nævnt ovenfor, er [matplotlib](https://matplotlib.org/stable/) den primære Python-pakke til at lave grafer. Den kan skabe mange forskellige typer grafer, fra de simpleste til mere avancerede med flere y-akser, komplekse layouts osv.

I dette kursus vil vi kun bruge en enkelt modul af denne pakke, `pyplot`.


### NumPy

[NumPy](https://numpy.org) er den primære pakke til at arbejde med arrays (vektorer, matricer osv.) - strukturer med flere elementer, der har samme type (f.eks. heltal eller flydende punkttal). Elementerne er organiseret i rektangulære strukturer såsom vektorer, matricer, kuboider osv.

NumPy gør det nemmere og hurtigere at arbejde med samlinger. For eksempel, hvis du har en samling af tal som en liste eller en tupel, skal du lave en løkke for at behandle hvert tal (f.eks. beregne kvadrater). I tilfælde af NumPy er løkker ikke nødvendige, du kan bare kvadrere hele arrayet, og NumPy vil gøre arbejdet for dig.

### pillow

Pakken [pillow](https://pillow.readthedocs.io/en/stable/) er en moderne version af en anden pakke, PIL, der står for Python Image Library. Som navnet antyder, indeholder denne pakke moduler og funktioner til at arbejde med billeder - indlæse dem fra filer, oprette fra arrays, vise på skærmen, udføre forskellige transformationer osv.

### opencv

[Open CV](https://docs.opencv.org/4.x/index.html) er sandsynligvis det mest avancerede bibliotek til billed- og videobehandling (CV står for *computer vision*). Det er tilgængeligt for mange sprog, herunder Python. Vi vil kun bruge Open CV til at optage videoer fra computerens webcam i nogle af klasserne. Men hvis du vil udføre kompleks billedbehandling, er det værd at lære biblioteket.

### pandas

[Pandas](https://pandas.pydata.org) er en pakke til at arbejde med dataframes. Dataframe er en måde at repræsentere tabulære data på, hvor hver kolonne er en bestemt egenskab eller karakteristik (f.eks. navn på personer, deres højde, vægt, uddannelsesniveau osv.) og hver række er en bestemt måling eller objekt (som enkeltperson). Dataframes ligner meget klassiske tabeller i Excel eller andre regnearkstyper, f.eks. Google Sheets. Ved hjælp af pandas kan du indlæse data fra CSV- eller Excel-filer, anvende forskellige filtre, sortere rækker, lave undergrupper og gøre andre nyttige ting. 

### pytorch/torch

[Pytorch](https://pytorch.org) er et populært bibliotek til at oprette, træne, optimere og bruge forskellige kunstige neurale netværk. Det består af mange forskellige moduler, f.eks.:

* `torch.nn` - indeholder byggeblokke til neurale netværk, såsom forskellige lag, tabssfunktioner osv.
* `torch.optim` - indeholder optimeringsalgoritmer, funktioner der ændrer vægtene baseret på tabet.
* `torch.utils` - indeholder hjælpefunktioner - funktioner, der ikke bruges direkte til ANN, men hjælper med at forberede data osv.

Nogle af modulerne har også undermoduler, f.eks. `torch.nn` har et undermodul `torch.nn.functional`, der indeholder forskellige funktioner (f.eks. aktiveringsfunktioner). Modulet `torch.utils` indeholder undermodulet `torch.utils.data` til arbejde med datsæt og data loaders.    

Du behøver ikke at kende alle disse på forhånd. Følg blot undervisningens indhold, og du vil med tiden lære det hele.   

### torchvision  

[Torchvision](https://pytorch.org/vision/stable/index.html) er et supplement til Torch/Pytorch, der gør det nemt at arbejde med billeder. Det indeholder moduler, klasser og funktioner, som lader dig oprette datasæt baseret på mapper med billeder, udføre billedtransformationer (beskæring, ændring af størrelse osv.) og andre nyttige ting. Det er uundværligt, hvis du skal bruge PyTorch til billeder.  

### torchinfo   

Torchinfo er en lille pakke, som giver dig information om PyTorch-modeller: hvor mange lag de har, hvor mange parametre, osv.