# Fillesing med innebygde python-funksjoner

Dette er en kort intro til fillesing slik det typisk skrives i lærebøker, hvor spesifiserer hvordan filen skal leses og konverteres til data selv. Denne kan være grei å gå gjennom dersom du ønsker å trene på anvendelse av strengoperasjoner, listeoperasjoner og løkker.
### Åpning av fil
Når man skal lese til eller skrive fra eller skrive til filer i Python, bruker man variabler til å henvise til såkalte fil-objekt. En slik variabel returneres når man kaller funksjonen `open(fileName, mode)` som du kan lese mer om [her](https://docs.python.org/3/library/functions.html#open). I funksjonskallet er det i de fleste tilfeller tilstrekkelig med to input-argument, feksempelfis `fileName` og `mode`:
* `fileName` er i tilfellet her en streng som angir filnavn **og** en henvisning til hvor filen er plassert i mappestrukturen relativ til filen med Python-kode. I denne øvignen skal vi kun operere med datafiler som ligger i samme mappe som Python-koden, så dette argumentet trenger kun å være filnavnet. 
* `mode` er en streng med nøkkelsymbol som forteller om vi skal lese fra fil, skrive til fil eller noe annet. Noen av de vanligste verdiene `mode` kan ha er:

**Symbol** | **Betydning** 
---|---
`'r'` | Åpne fil for lesing
`'w'` | Åpne ny fil for skriving, hvis fil allerede eksisterer vil den fjernes.
`'a'` | Åpne fil for skriving. Begynner å skrive på slutten av eventuell eksisterende fil.

### Lesing av fil

Når et program skal lese en csv-fil utfører den typisk følgende steg:

1. Åpne filen i "read"-modus
2. Les filen. Dette kan gjøres med følgende steg i en løkke:
    * Hent inn neste linje som en streng så lenge det finnes en "neste linje"
    * Del opp strengen etter kolonneseparator-tegnet
    * Sett inn den adskilte dataen i passende lister
2. Lukk filen.

Selve fillesingen kan utføres med f.eks. bruk av metoden `f.readline()` som typisk er den mest aktuelle. Andre metoder for fil-objekt kan du finner [her](https://docs.python.org/3/tutorial/inputoutput.html#methods-of-file-objects). 

### Lukking av fil?

"Gamlemåten" for fillesing i python er å kalle en metode `f.close()` når man er ferdig med fila. Nå er det mest vanlig å bruke nøkkelordet `with`, slik at man kan begrense alle kodelinjene som håndterer fillesing til en spesiell struktur med en egen feilhåndtering og oppryddingsprosedyre. Dette skal vi ikke gå nærmere i detalj i nå, men det er relativt enkelt å ta i bruk selv om man ikke nødvendigvis har full kontroll på hva som skjer. Nedenfor ser du et eksempel av en kode som vil lese av filinnhold i "eksempelfil.csv", og skrive ut dataene. Fila inneholder måleserie med karbondioksidmålinger over tid, og filinnholdet ser noe slikt ut:

                            Time (s);CO2 (ppm)
                            10;394
                            20;389
                            30;385
                            40;381
                            ...
                            
Cellen nedenfor vil lese de to kolonnene i fila og legge de til i listene `x_data` og `y_data`.

In [None]:
x_data = []
y_data = []

fileName = "eksempelfil.csv"

# Når vi bruker "with" til filåpning, oppretter den et eget
# variabelskop for variabeln "dataFile", som kun er tilgjengelig 
# for påfølgende kodelinjer skrevet med innrykk.
with open(fileName, 'r') as dataFile:
    
    headerLine = dataFile.readline() # Les første linje med header-informasjon
    
    headerLine = headerLine.strip("\n") # Fjern såkalte "newline-characters"
    
    x_label, y_label = headerLine.split(";") # Del opp headeren i navn til x_data og y_data
    
    for line in dataFile: # Iterer over hver linje i fil-objektet
        line = line.strip("\n") # Fjern "newline-characters"
        lineList = line.split(";") # Del opp linjen etter "delimeter" (;)
        x_data.append(float(lineList[0])) # Legg første del av linjen til i listen x_data
        y_data.append(float(lineList[1])) # Legg andre del av linjen til i listen y_data

# Når programmet kommer hit (dvs første kodelinje etter "with" uten innrykk)
# er ikke fil-variabelen "dataFile" tilgjengelig lengre.

# De tre linjene nedenfor printer ut dataene med en spesiell formatering. 
# Det er ikke nødvendig å kunne anvende dette videre i øvingen.
print('{:>10}'.format(x_label), " --- ", '{:>10}'.format(y_label)) 
for i in range(len(x_data)): 
    print('{:>10}'.format(x_data[i]), " --- ", '{:>10}'.format(y_data[i]))