# Del 6: Kompendium ITGK 


**Dette kompendiet tar for seg filbehandling og feilhåndtering i Python.**

&nbsp;

## 1 Introduksjon

Dette kompendiet er laget av Vilde Roland Arntzen og Miriam Størseth Lillebo sommeren 2021. Kompendiet skal fungere som en ekstraressurs ved siden av annet fagmateriell som bøker, øvinger, forelesninger og øvingsforelesninger. Kompendiet tar utgangspunkt i pensumplisten for  programmeringsdelen av TDT4110 høsten 2020, og kombinerer forklaring av konsepter og relevante oppgaver.

<img src="bilder/intro.png" style="height: 160px; "/>

&nbsp;

## 2 Innhold

Kompendiet består av 6 notebooks som tar for seg ulike deler av pensum. Denne notebooken er nummer 6 av 6. Vi har forsøkt å bygge opp notebookene slik at de først gir en introduksjon til temaet med nyttige eksempler og deretter gir noen oppgaver som du kan ha nytte av å løse selv. Dette inkluderer oppgaver vi har laget selv som vi mener er relevante, kombinert med tidligere eksamensoppgaver der det er relevant. 

1. Introduksjon til Python og kalkulasjoner
2. Boolske operatorer, innebygde funksjoner i Python og moduler
3. Løkker
4. Selvprogrammerte funksjoner
5. Lister, tupler, strenger, dictionaries og sett
6. **Filbehandling og feilhåndtering**

&nbsp;

## 3 Filbehandling
De fleste kjenner til filer fra før av gjennom programmer som word eller excel. En **fil** er et sted du kan lagre data eller informasjon som lagres i minnet til datamaskinen din. Når du definerer variabler i koden din lagres de i korttidsminnet som vil si at de kun er tilgjengelig så lenge koden kjører. Filer lagres i langtidsminnet til datamaskinen og vil være tilgjengelige selv om programmet skrus av og på igjen. 


Vi skal nå lære å **lese fra** og **skrive til** filer. Frem til nå har vi vært gjennom mye som krever logisk resonnering, som løkker og logikk. Filbehandling derimot **er veldig metodisk**. Det vil si at man terper på *metoden* som brukes for å lese og skrive til fil, men ellers er logikken mye av det samme som vi har lært om lister og løkker. 

Vi kommer til å bruke **.txt**-filer (tekstfiler) i dette kompendiet. I tekstfiler skrives og leses all data som strenger. Det vil si at dersom man for eksempel leser numerisk data fra en fil så må denne konverteres fra streng til numerisk datatype.

&nbsp;

### 3.1 Hvordan ser en fil ut? 
Under ser vi en visualisering av en fil som inneholder heltall. Illustrasjonen til venstre viser hvordan en fil ser ut dersom den *printes ut* til konsollen (brukeren), mens illustrasjonen til høyre viser hvordan filen faktisk ser ut i form av hva slags tegn den inneholder.


<img src="bilder/fil_utseende.png" style="height: 220px; "/>

Som man kan se så inneholder filen \n etter hvert tall. Dette tegnet representerer linjeskift. Det finnes flere slike tegn som man må håndtere når man jobber med filer. 

Ofte skal man hente ut innholdet i en fil og bruke det til noe nyttig. For eksempel kan illustrasjonen over representere poeng i et kortspill. Hvis man skal kunne ta inn disse og regne gjennomsnittssum må man først fjerne tegnene vi ikke trenger for deretter å splitte strengen på hvert linjeskift. Vi skal lære mer om hvordan vi kan gjøre dette under. 

&nbsp;

### 3.2 Sti / path 
En fil er lagret på en spesifikk plass i minnet som vi kan aksesseres ved å referere til dens *sti* (path). Dette kjenner du nok delvis til, som f.eks. filene du har lagret på skrivebordet ditt eller i dokumenter på datamaskinen. Et eksempel på hvordan en sti kan se ut er gitt under

        /Users/vildearntzen/Desktop/ITGK/min_notebook.ipynb
            
Enhver datamaskin vil ha ulike stier basert på brukernavn og mappestrukturen. For å slippe å forholde seg til stier kan man ha filene man jobber med i samme mappe som filen man koder i. Da trenger man kun å referere til filnavnet på følgende måte 

                      notebook.ipynb


**Merk at i denne notebooken så antar vi at filene ligger i *samme* mappe som notebooken/filen vi koder programmet vårt i.** 

&nbsp;

### 3.3 Moduser for filbehandling
Det er tre spesielle **moduser** for filbehandling som vi skal bruke. Disse tre er:

<img src="bilder/moduser.png" style="height: 220px; "/>

For å jobbe med filer må man åpne dem. Det er to syntakser for å gjøre dette. Den første er:


                   file = open(filename, modus)
                   <gjør det du skal med filen>
                   file.close() 
        
        
Med denne formen må man huske å lukke filen ved bruk av `file.close()`-funksjonen. Dette er blant annet fordi at å holde filer åpne i kortiddsminnet er kostbart for datamaskinen din. Den andre formen som brukes for å åpne filer er vist under. 

                with open(filename, modus) as file:
                    <gjør det du skal med filen>

Når man bruker denne formen må man huske å skrive all kode som refererer til filen innenfor innrykk. Fordelen med denne metoden er at den automatisk lukker filen, og at man derfor ikke trenger å huske på dette selv. 

Det har ikke noe å si hvilken metode man velger, så lenge man bruker metoden på riktig måte. 

&nbsp;

### `read` 

Hvis vi ønsker å hente data fra en fil og inn i programmet vårt kan vi lese fra filen. Modusen for å lese fra fil er *alltid* `r` som står for read. Under åpner vi filen `eksempel_fil.txt` som ligger i samme mappe som notebooken vi koder i, i **lesemodus**.

In [None]:
min_fil = open("eksempel_fil.txt", "r")

Nå som filen er åpen kan vi hente ut data fra den. Dette kan også gjøres på flere måter, men det er vanlig å bruke `read()` eller `readlines()` som vi skal se på under.

In [None]:
min_fil.read()

In [None]:
min_fil.close() # husk å lukke filen når vi bruker denne syntaksen!

Som vi ser lar `read()`-funksjonen oss lese hele filen inn i en enkelt tekststreng. I enkelte tilfeller er det fint, men noen ganger ønsker vi også å hente ut hver enkelt linje i filen som en egen enhet. Det kan gjøres med `readlines()`-funksjonen:

In [None]:
with open("eksempel_fil.txt", "r") as min_fil: # vi kunne brukt samme syntaks som over for å åpne/lukke fil, men valgte å bruke denne for å demonstrere at begge fungerer fint
    linjer = min_fil.readlines()

linjer

Som vi ser så returnerer `readlines()` en liste med alle linjene i filen som hver sin separate streng. Merk at linjeskift automatisk blir med på slutten av strengen.

Nå som vi har hentet ut hver linje i filen, kan vi benytte oss av konseptene vi tidligere har lært til å behandle den. For eksempel kan vi iterere gjennom hver linje i filen ved hjelp av en for-løkke som gjort under.

In [None]:
for line in linjer:
    print(line)

Merk at når vi printer en streng med linjeskift i til konsollen vil ikke \n vises, men det vil printes en ny linje. 

&nbsp;

### `write`
**Write**-modusen er en av to moduser som lar oss skrive til fil. Write skrives som en `w` og brukes i følgende scenarier:
* Du har en fil som eksisterer fra før og ønsker **å skrive over dens tidligere innhold** med noe nytt.
* Du har ingen fil og må opprette en fil selv som du deretter ønsker å skrive til (her kan både write og append brukes)

I kodeblokken under oppretter vi filen `skrive_eksempel.txt`. Den lagres på samme sted som notebooken ligger. 

In [None]:
skrive_fil = open("skrive_eksempel.txt","w")

Under skriver vi 10 linjer til filen hvor det står `Dette er linje i` for hver linje 1-10, ved bruk av `.write()`-funksjonen.

In [None]:
for i in range(1,11):
     skrive_fil.write("Dette er linje " + str(i) + "\n") # legger til \n for å markere at det skal være linjeskift på slutten av hver iterasjon

Når vi er ferdig med å gjøre det vi skal lukker vi filen.

In [None]:
skrive_fil.close()

For å se om handlingen over var vellykket forsøker vi å lese fra filen ved bruk av `.read()`-funksjonen. Siden vi har lukket filen må vi åpne den på nytt. 

In [None]:
skrive_fil = open("skrive_eksempel.txt", "r")
innhold = skrive_fil.read()
skrive_fil.close() 

innhold

Over ser vi den rå tekststrengen. Hvis vi printer denne ser det slik ut:

In [None]:
print(innhold)

Dermed ser vi at operasjonen var vellykket og vi har klart å skrive flere linjer til fil! Merk at hvis du kjører samme kode om igjen, så vil de nye linjene *ikke* legges til på slutten av de gamle, men de vil overskrive de gamle og lage en identisk fil. Under skal vi se nærmere på hvordan vi kan legge til flere linjer i filen. 

&nbsp;

### `append`
**Append** er en annen modus for å skrive til fil og skrives som `a`. Append brukes i følgende scenarier:
* Du har en fil som eksisterer fra før og ønsker å **legge til nytt innhold på slutten av filen uten å overskrive tidligere innhold.**
* Du har ingen fil og må opprette en fil selv som du deretter ønsker å skrive til (her kan både write og append brukes)

Vi ønsker å legge til fem linjer til i filen i forrige eksempel. De skal være identiske men ha nummer 11-15. Dette kan vi bruke append-modus til som følgende. 

In [None]:
append_fil = open("skrive_eksempel.txt", "a")

for i in range(11,16):
     append_fil.write("Dette er linje " + str(i) + "\n") 

Merk at dersom du kjører kodeblokken over flere ganger så vil den fortsette å legge til linje 11-15 flere ganger etter hverandre fordi vi er i append-modus. Under leser vi fra filen for å se om handlingen var vellykket. 

In [None]:
append_fil = open("skrive_eksempel.txt", "r")
innhold = append_fil.read()
skrive_fil.close() 

innhold

In [None]:
print(innhold)

Som vi ser er det nå lagt til fem linjer til i filen vår.

&nbsp;

## 3.4 Funksjoner for filbehandling

<img src="bilder/fil_funksjoner.png" style="height: 260px; "/>

&nbsp;

## 3.5 Oppgaver: Filbehandling
Test om du har forstått *filbehandling* i Python ved å løse oppgavene under. 

**Oppgave 1: Introduksjon til filbehandling**

**a)** Skriv en funksjon `produce_number_file` som tar inn inputparameterne:

* `filename`: et filnavn
* `a`: et tall
* `b`: et tall

Programmet skal opprette en fil med navn filnavn og skrive 100 tilfeldige tall mellom a og b, med linjeskift mellom til filen. Dersom a er lik eller større enn b skal det skrives ut en melding til skjermen som sier at b må være større enn a. 

**b)** Skriv en funksjon `add_to_number_file` som tar inn inputparameterne:
* `filename`: et filnavn
* `a`: et tall
* `b`: et tall

Funksjonen skal ha samme funksjonalitet som i a), men hvis filen eksisterer fra før av så skal tallene legges til på slutten av filen og ikke skrive over det som er der fra før av. 

**c)** Skriv en funksjon `read_file`som tar inn inputparameterne: 
* `filename`: et filnavn
* `a`: et tall
* `b`: et tall

Funksjonen skal lese innholdet fra read_file og printe ut linjene fra og med `a` til (men ikke med) `b` med en linje med `------------` mellom hver linje som printes ut. 

*Ekstraoppgave: midtstill alle linjene som printes ved bruk av streng-formattering.*


Hvis du ønsker å sjekke om funksjonen din fungerer kan du forsøke å lese noen linjer fra filen du opprettet i oppgave a).

**Oppgave 2: Eksamen kont 2017 Oppgave 2**

Du kan anta at alle funksjonene mottar gyldige argumenter (inn-verdier). Du kan benytte deg av funksjoner fra deloppgaver selv om du ikke har løst deloppgaven.

I denne oppgaven skal du lage et program for å sammenlikne priser på utvalgte varer fra forskjellige butikker. Utgangspunktet for denne sammenlikningen er ei tekstfil der hver linje består av tre elementer adskilt med tabulator (”`\t`”): Navn på butikkjede, Navn på vare, og Pris (se tekstboks). Merk at en slik tekst fil kan ha varierende antall butikkjeder, samt varierende antall varer som sammenliknes.

(De oppgitte prisene er fiktive og ikke reelle priser fra de oppgitte butikkjedene.)

`pricewar.txt`:

<img src="bilder/pricewar_txt.png" style="height: 290px; "/>


**2a)** Skriv funksjonen file_to_list som har en inputparameter filename. Denne funksjonen skal lese inn en tekstfil filename og returnere en tabell (liste av lister), der hver rekke inneholder navn på butikkjede, navn på vare, og pris på vare. Merk at pris på vare skal representeres som et flyttall (float).


Eksempel på kall av funksjon med filen ’pricewar.txt’:

<img src="bilder/eksamen_k17_5a.png" style="height: 150px; "/>


**2b)** Skriv funksjonen list_stores som har dataList som input-parameter. dataList er en tabell (liste av lister) lik den som blir returnert fra funksjonen file_to_list i Oppgave 2a. Funksjonen skal returnere en komplett liste av butikkjeder den finner i tabellen dataList. Hver butikkjede skal kun ha ett innslag i lista. Merk også at man aldri vet hvilke butikkjeder som lista vil inneholde. Rekkefølgen på butikkjedene skal samsvare med rekkefølgen de kommer i tabellen dataList.

Eksempel på kall av funksjon med filen ’pricewar.txt’:

<img src="bilder/eksamen_k17_5b.png" style="height: 90px; "/>

**Oppgave 3: Eksamen Høst 2017 Oppgave 3**


<img src="bilder/eksamen_17_3.png" style="height: 800px; "/>

**Oppgave 4: Eksamen Kont 2019 Oppgave 5 a**

Programmeringsoppgaven tar utgangspunkt i oppskrifter. Et sett med ingredienser til oppskrifter skal leses inn fra fil. Deretter skal du lage funksjoner for å finne oppskrifter med gitte ingredienser, og komme med forslag til en tilfeldig rett som inneholder disse. Et sett med navn på matretter og tilhørende ingredienser befinner seg i filen food.txt. Den har følgene struktur: (Det er ikke et ekstra linjeskift mellom hver rett.)

`food.txt`:

<img src="bilder/food_txt.png" style="height: 200px; "/>


Skriv funksjonen read_file(filename) som skal lese inn en fil, og returnere en liste. Hver linje i filen blir ett element i denne listen, slik som i eksempelet under:

<img src="bilder/eksamen_k19_3.png" style="height: 130px; "/>

&nbsp;

## 4 Feilhåndtering
I kompendium 1 så vi nærmere på feilmeldinger og i hvilke situasjioner disse kan oppstå. Her skal vi se på hvordan vi kan *håndtere* disse uten at programmet vårt stopper. 

<img src="bilder/error.png" style="height: 180px; "/>

Under er det gitt et eksempel på kode som fører til at programmet vårt krasjer

In [None]:
10*( 1/ 0)

&nbsp;

## 4.1 Try - Except
Feilmeldinger oppstår i mange ulike tilfeller, som for eksempel hvis du forsøker å lese fra en fil som ikke eksisterer. 

Dette kan vi løse ved å legge inn en try-except-blokk. Hvis det da oppstår en feilmelding vil koden hoppe rett videre til koden som står i except-blokken. Syntaksen til en try-except blokk er som følgende: 

          try:
              <kode du vil prøve, men ikke vet om fungerer>
          except:
              <kode som skal kjøre hvis koden i try-blokken feiler>

På samme måte som med if-setninger og løkker, er også try-except innrykkssensitivt. Det vil si at det som skrives i try- og except-blokkene må skrives innenfor et inntrykk. Det som kommer utenfor innrykket etter try-except vil kjøres uavhengig av hvilken av blokkene som kjøres.

**Eksempel**

Under er det lagt inn et eksempel på en try-except-blokk som forsøker å åpne og lese fra en fil som ikke eksisterer.


In [None]:
try:
    fil = open("non_existing_file.txt", "r")
    innhold = fil.readlines() 
    fil.close()
    
    print(innhold)
except: 
    print("Filen eksisterer ikke.")

print("Dette er kode som kjører uansett om try-blokken kjører eller ikke.")

Som vi ser så stopper ikke programmet selv om filen ikke eksisterer, men kjører heller innholdet i except-blokken. Den siste print-setningen er utenfor try-except-blokken og kjøres uansett om filen eksisterer eller ikke

&nbsp;

## 4.2 Oppgaver: feilhåndtering 


**Oppgave 5: Implementer feilhåndtering for filhåndtering**

I denne oppgaven skal du gå inn i koden du skrev i oppgavene om filbehandling i seksjon 3 og legge inn feilhåndtering der det gir mening. Hvis du er usikker på når det gir mening - tenk gjennom hvilke situasjoner det kan oppstå en feil når du håndterer filer. Du kan også google dette. 

&nbsp;




**Oppgave 6: Implementer feilhåndtering for tall-input**

Så langt i kompendiumene har vi som regel brukt ```int(input)``` e.l. for å lese input fra bruker i programmene våre. Da kan det noen ganger oppstå et problem dersom bruker skriver inn noe annet enn tall, som igjen fører til at programmet krasjer. 

I denne oppgaven skal du lage en funksjon som spør bruker om et heltall, og spør igjen dersom brukeren ikke skriver inn et heltall. Når brukeren har skrevet inn et heltall, skal funksjonen **skrive ut** tallet. 

*Hint: `str.isnumeric()` sjekker om en streng kun inneholder tall*


**Oppgave 7: Ingredienser (Hentet fra eksamen Kont2019)**

I denne oppgaven skal du bruke en dictionary som stammer fra en tidligere deloppgave i denne eksamensoppgaven. For enkelhets skyld får du denne utdelt i kodeblokken under. 

Funksjonen ```print_recipe()``` skal ta inn denne dictionaryen samt en matrett (streng), og skrive ut informasjon om hvor mange ingredienser retten inneholder og hva disse er. 

Funksjonen tar inn parameterne: 

* ```food_dict``` (dictionary)
* ```rett``` (streng)

Her er et eksempel på kjøring:

    >>> print_recipe(food_dict, "pannekaker")
        pannekaker har 4 ingredienser: egg, mel, salt, melk
    >>> print_recipe(food_dict, "spaghetti")
        Det er ingen rett som heter spaghetti

Legg merke til at listen over ingredienser skal skrives ut på en fin måte.

In [None]:
# Dette er dictionaryen du skal bruke

food_dict = {'pannekaker': ['egg', 'mel', 'salt', 'melk'],
             'grandiosa': ['grandiosa'],
             'paprikasaus': ['sjalottløk', 'hvitløk', 'olje', 'buljong', 'smør', 'salt', 'pepper'],
             'omelett': ['egg', 'vann', 'salt', 'smør', 'skinke', 'hvitost', 'paprika']}