# Introduksjon

I denne delen av kurset bruker vi Python for å utveksle informasjon med SSBs API. Python er et meget nyttig språk for datahåndtering og automatisering av dataflyt. Særlig hvis man skal innom flere programmer med dataene kan python være en fordel. Jupyter notebooks er et veldig nyttig verktøy for å lære seg arbeidsflyten i en slik prosess. Gå gjerne igjennom *en kort introduksjon til Jupyter* før du starter her.

## Steg 1

Python består av mange ulike forhåndsprogrammerte funksjoner som brukere kan sette sammen slik de ønsker for å dekke sine behov. Disse funksjonene er gjerne samlet i biblioteker som enten er med i grunnpakken til Python ([python.org](https://www.python.org/)) eller i andre installasjoner som for eksempel [miniconda](https://docs.conda.io/en/latest/miniconda.html) eller [Anaconda](https://www.anaconda.com/). 

Mange velger å bruke Anaconda siden det stort sett sikrer at alt virker når man oppdaterer programvaren. Jeg liker å bruke miniconda - det er en lettvektsversjon av anaconda som tar mindre plass, men krever litt mer av brukeren.


In [None]:
import requests # Bibliotek som håndterer spørringer
import ast # Leser en tekstfil med spørringen til json format
import os # Sets up folders and paths
import json # Håndterer JSON format for å lese spørringen

from pyjstat import pyjstat

## Steg 2

Etter å ha importert de nødvendige modulene definerer vi noen variabler hvor vi lagrer filbane til spørringer, tabell ID og URL til selve programmet. Dette gjør det enklere å endre disse parameterene senere uten å måtte endre den delen av programmet som utfører selve transaksjonen med APIet.

I dette kurset skal vi bare sende én spørring. Dette kan også settes opp for å gå igjennom en rekke spørringer for å vedlikeholde ett oppdatert fillager.

Her må vi skrive inn filbaner og tabell id i kodevinduet og kjøre cellen ved å trykke Shift + Enter.

In [None]:
# TabellID frå SSB - APIet brukar tabellID for å sende spørjinga til rett stad hjå SSB.
tabellid = ""

# Filbane til spørringen
qDir = r""

# Filbane der datafila skal lagrast
outDir = r""

url = 'https://data.ssb.no/api/v0/no/table/' + tabellid

Etter å ha definert hvor ting er og hvor ting skal

In [None]:
# Les query som json
with open(query, "r") as file:
    contents = file.read()
    json_query = ast.literal_eval(contents)

In [None]:
print("Leser Spørring\n")
# Request - response
x = requests.post(url, json=json_query)
print("Sender spørring\n")

Nå vi har sendt spørringen kan vi sjekke status. Status koder 2xx betyr vanligvis at alt har gått fint. 4xx betyr at det er en feil på klientsiden (vi har gjort en feil). Det kan for eksempel være syntaksfeil i spørringen (et glemt komma for eksempel). 5xx betyr at det er en feil på serversiden (altså at det er et problem på leverandørsiden). For mer informasjon om statuskoder kan du lese [her](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status)

In [None]:
x.status

Vi kan også se hva som står i respons body, altså se den teksten vi fikk i svar på spørringen:

In [None]:
x.text

## Steg 3

Til slutt vil vi gjerne lagre filen i vårt fillager. Da bruker vi metoden response.iter_content() som går igjennom responsteksten uten å bruke for mye minne. Dette skrives så til en .csv fil. Her er det fullt mulig å skrive til andre formater også. Mer om det senere.

I første omgang skriver vi det enkelt til en .csv fil.

In [None]:
# Les til json-stat2 format fra spørring
ds = pyjstat.Dataset.read(x.text)

In [None]:
df = ds.write('dataframe')

In [None]:
df.head()

In [None]:
print("Skriver {}.csv til felles filområde".format(tabellid))
# Skriv innhold til csv fil (teams)
with open(os.path.join(outDir, tabellid + '.csv'), 'wb') as fd:
    for chunk in x.iter_content(chunk_size=128):
        fd.write(chunk)