# Definér en funktion
***
***
Keywords: `definition`, `funktion`

Nye Python-udtryk: `def`, `return`
***
***


At **definere** en **funktion** vil sige at pakke en eller flere kodesekvenser sammen under ét navn, så det kan let kan anvendes, gemmes og genbruges. I kan tænke på det som en funktionel pedant til variabler. Vi kan gemme komplekse datastrukterer under et simpelt vaiabelnavn. På samme måde kan vi gemme kompleks funktionalitet under et simpelt funktionsnavn. Fordelen ved funktioner er, dels at man let kan genbruge funktionalitet, dels at det er lettere at finde fejl, idet man ikke behøver at tjekke al kode, men blot koden i den funktion, der fremprovokerer fejlen.

Definitioner består af tre dele: 1) Definitionskommandoen, 2) en kodeblok, 3) et `return`-kommando.

**Definitionskommandoen** består kommandoen `def`, et `funktionsnavn` samt en eller flere pladsholdere for `argumenter`. Udtrykket `def` fortæller Python, at den efterfølgende kodeblok skal gemmes under det `funktionsnavn`, der specificeres. Funktionsnavnet er valgfrit. Når funktionen efterfølgende skal bruges, kalder (call into action) man funktionen med kommandoen `funktionsnavn()`. En funktion kan have en række `parametre`, dvs. tage inputs, hvis værdier påvirker outputtet. De konkrete værdier, der indsættes i funktionen kaldes `argumenter` og specificeres i parentesen umiddelbart efter funktionsnavnet. Husk at afslutte definitionskommandoen med `:`.

Syntaksen ser således ud: `def funktion(argument_1, argument_2, argument_x):`

**Kodeblokken** består af de kodelinjer, man ønsker at gemme under det angivene `funktionsnavn`. Kodeblokken indenteres (indrykkes med fire blanktegn) på linjen under definitionskommandoen.

**Return-kommandoen** angiver hvilket output, funktionen skal returnere. Hvis intet specificeres er return-typen **NONE**. Funktionen returnerer det, der specificeres efter udtrykket `return`.



***
***
## Opgave 1
***
***
I eksemplet nedenfor defineres en lille simpel funktion. Funktionen får navnet `printStreng`. Når funktionen anvendes indtasten en værdi i parentesen. Fordi kodeblokken indeholder et `print()`-statement, skal inputtet vær af typen `string`. Inputtet gives automatisk det variabelnavn, der i definitionskommandoen specificeres i parentesen - i dette tilfælde navnet 'streng'. Kodeblokken indeholder et for-loop, der looper over elementerne i inputtet, dvs. bogstaverne i den `string`, som funktionen anvendes på. For hvert eklement i inputtet (for hvert bogstav i strengen) printes dette element. 

Prøv at afvikle koden nedenfor.

In [None]:
def printStreng(streng):
    for b in streng:
        print(b)     

I første omgang sker der ikke noget, men funktionen er nu gemt.

Kan I regne ud, hvad outputtet bliver, når i anvender funktionen nedenfor?

In [None]:
printStreng("Der var en gang")

Funktioner kan naturligvis også anvendes på variabelnavne.

In [None]:
eksempel = "Der var en gang"
printStreng(eksempel)


Hvis man vil anvende denne funktion på et input, der ikke er en `string`. kan man anvende `str()`-funktionen:

In [None]:
printStreng(str(117))

Funktionen `printStreng()` har **ikke** fået specificeret et `return`-output. Det er ikke nødvendigt, for den indeholder en anden funktion, nemlig `print()`, der giver et output. Hvis der ikke specificeres et `return`-output er returnværdien per defalt **NONE**. Dette kan I tjekke ved at afvikle koden nedenfor:

In [None]:
type(printStreng("Der var en gang"))

I eksemplet nedenfor finder i endnu et eksempel på definition af en meget simpel funktion ' den gang med `return`-statement.

In [None]:
def plus(a, b):
    return a + b

Overvej hvad outputtet af denne funktion er, inden I afprøver sekvensen nedenfor.

In [None]:
sum = plus(117, 127)
print(sum)
type(sum)

***
***
## Opgave 2
***
***
Sidst arbejdede vi med at udvikle en pipeline, der kunne hjælpe os med systematisk at rense og tokenize vores tekster. I det følgende skal vi prøve at gemme noget af denne funktionalitet i en funktion, så det kan genbruges. I kan se skridtene nedenfor.

Jeg vil anbefale, at I undlader at tilføje del 1 og del 6 til funktionen. Diskutér **hvorfor** er det en god idé.


#### 1. Open and read ####
tekst = open("filnavn.txt", encoding="utf8")<br>
mfTekst_0 = tekst.read()

#### 2. Delete line breaks ####
mfTekst_1 = mfTekst_0.replace("\n"," ")

#### 3. Delete noise ####
mfTekst_2 = mfTekst_1.replace("."," ")<br>
mfTekst_3 = mfTekst_2.replace(","," ")<br>
mfTekst_4 = mfTekst_3.replace(":"," ")<br>
mfTekst_5 = mfTekst_4.replace("*"," ")<br>
mfTekst_6 = mfTekst_5.replace("–"," ")<br>
mfTekst_7 = mfTekst_6.replace("'"," ")<br>
mfTekst_ren = mfTekst_7.replace("”"," ")

#### 4. Convert all text to lower case ####
mfTekst_lav = mfTekst_ren.lower()

#### 5. Tokenize ####
mfTekst_token = mfTekst_lav.split()

#### 6. Inspect vaiable ####
print(len(mfTekst_token))<br>
mfTekst_token


Prøv at definere funktionen i feltet nedenfor. I kan se et løsningsforslag i bunden af dette dokument, men **prøv selv** inden I tjekker mit forslag!


<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>





***
***
## Løsningsforslag
***
***

In [None]:
def rens(text_0):
    text_1 = text_0.replace("\n"," ")
    text_2 = text_1.replace("."," ")
    text_3 = text_2.replace(","," ")
    text_4 = text_3.replace(":"," ")
    text_5 = text_4.replace("*"," ")
    text_6 = text_5.replace("–"," ")
    text_7 = text_6.replace("'"," ")
    text_ren = text_7.replace("”"," ")
    text_lav = text_ren.lower()
    text_token = text_lav.split()
    return text_token

Afprøv funktionen ved at afvikle koden nedenfor.

Hvilke output kan vi forvente, hvis vi anvender funktionen på eksemplet variablen 'a'?

In [None]:
a = ["Der var en gang","og for enden af den gang var der en dør","og bag den dør var der en gang"]

In [None]:
b = [] # laver en ny tom liste
c = []
for t in a: # looper over elementer i listen gemt under navnet 'a'
    b.append(rens(t)) # anvender rens() på alle elementerne i a vha. et for-loop og tilføjer outputtet til liste 'b' 
    c.append(len(rens(t))) # måler længden af elementerne på listen og tilføjer outputtet til liste 'c'
print(b)
print(c)
