# Lese data fra filer

Programmering med Python er et viktig verktøy når det kommer til å analysere datasett. Dette medfører at vi må være i stand til å lese data fra filer slik at vi kan bruke dataen til å lage grafer eller regne på dataen får å hente ut mer informasjon.

## Hvordan lese data fra en fil?

Det er vanskelig å gi en *helt* generell beskrivelse av hvordan man skal lese inn datafiler. Men typisk vil en datafil lagres på en måte slik at den likner en tabell. Dette betyr at vi har en overskrift for hver kolonne, og at hver rad representerer en ny måling.

Den typiske kodesyntaksen er

```python
with open(filnavn, "r") as infile:
    for linje in infile:
        # Gjør noe med linjen
```

```{admonition} Forklaring av syntaksen

Her er sannsynligvis noen nye ting for deg. La oss gå gjennom dem en etter en.

- `with` åpner en slags kodeblokk som automatisk rydder opp når vi er ferdig med delen. Da slipper vi å åpne og lukke filen manuelt.
- `open` åpner filen.
- `r` indikerer at vi skal *lese* filen. `r` står for *read*.
- `infile` er standardnavn for en fil vi leser fra (det er fra engelsk og er en forkortelse for *input file*).
- `for`-løkka går gjennom alle linjene i fila, slik at vi kan gjøre noe med hver linje.

```

## Eksempler

### Eksempel 1

Tenk deg at vi har en verditabell for funksjonen

$$
f(x) = x^2,
$$

som er gitt ved

| $x$ | $f(x)$ |
|-----|--------|
| 0   | 0      | 
| 1   | 1      |
| 2   | 4      |
| 3   | 9      |
| 4   | 16     |
| 5   | 25     |

Dette er også slik vi ser for oss at en datafil vil se ut. Vi har en overskrift for hver kolonne, og hver rad representerer en måling.


Du kan laste ned filen med denne koden: 

In [2]:
import os

url = "https://raw.githubusercontent.com/reneaas/vgs_programmering/main/datasets/IO_data/x_2.txt"
os.system(" ".join(["curl", url, "-o", "x_2.txt"]))

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100    40  100    40    0     0   1765      0 --:--:-- --:--:-- --:--:--  2105


0

Når datafilen er lastet ned, kan vi lese den inn i Python med følgende kode:

In [8]:
x = [] # x-verdier
y = [] # Funksjonsverdiene f(x) = x^2

with open("x_2.txt", "r") as infile:
    # Vi hopper over første linje fordi det bare er navnet på kolonnene.
    første_linje = infile.readline() 

    # Leser inn resten av filen
    for linje in infile:
        verdier = linje.split()
        x.append(float(verdier[0]))
        y.append(float(verdier[1]))

print(f"{x = }")
print(f"{y = }")

x = [0.0, 1.0, 2.0, 3.0, 4.0, 5.0]
y = [0.0, 1.0, 4.0, 9.0, 16.0, 25.0]


### Eksempel 2

Tenk deg at vi har en datafil med posisjonene til en kule over tid etter at vi har kastet den opp i lufta. Vi har målt posisjonen til kula hvert 0.1 sekund, og vi har lagret dataen i en fil som heter `posisjon.txt`. Dataen er gitt ved

| $x$ | $y$ | $z$ |
|-----|-----|-----|
| 1   | 2   | 3   |
| 4   | 5   | 6   |
| 7   | 8   | 9   |
