# Parsing av vedtakstekster (gammel)

Vedtakene i tekstkorpuset må parses, dvs. vi må identifisere strukturen i vedtakene, og dele opp vedtakene i deres ulike deler. Formålet er å analysere korpuset, og å legge til rette for å en variert testing opp mot språkmodellen. Eksempelvis kan vi for eksempel teste ut søk der vi bare søker i klagers anførsler. Da kan vi etterpå bruke nemndas vurdering fra de samme vedtakene som kontekst opp mot språkmodellen. Et annet bruksområde er å identifisere og analysere vedtak der nemnda deler seg i et flertall og et mindretall. Da er det viktig å først identifisere hvilken del av vedtaket som er nemndas vurdering. 


## Analyse av strukturen i vedtakstekstene
Det ser ut til at mange vedtak har samme struktur: sammendrag, dato, saksnr. og tjenesteyter, så klagers anførsler, tjenesteyters anførsler og til slutt nemndas bemerkninger. Før vi går i gang med selve parsingen, skal vi analysere strukturen vedtakene. Hvilke overskrifter bruker vedtakene, har vedtakene de sammen overkriftene? Hvilke stabile strukturer vi kan basere oss på når vi skal parse teksten i vedtakene?

Det er flere mulige tilnærminger til parsingen. Her bruker vi `pdfminer`, som er en modul i Python som leser font-informasjon i pdf-ene. Vi går da tilbake til pdf-ene for i første omgang å analysere hvilke overskrifter som er overskrifter i vedtakene. En gjennomgang av ulike vedtak gjør at vi kan anta at alle overskrifter i vedtakene er skrevet med uthevet font. Annen tekst bruker ikke uthevet font. Dette må selvfølgelig kvalitetssikres, men det virker som et godt utganspunkt for å identifisere overskrifter.

Hvorfor ikke går rett på vedtakene og analysere tekstfilene vi allerede har etablert? Det er vanskelig å finne kjennetegn ved overskrifter i rent tekstformat som garanterer at vi identifiserer tekst som overskrift. Det er enkelt å hente ut tekst når vi vet hva overskriften er, og vi antar at dette er likt for alle vedtak. Men før vi kan anta at alle vedtak er like, må vi forsikre oss om at vi vet hva alle overskrifter er, og at alle vedtak har samme struktur.

Strategien er altså å bruke `pdfminer`til lese ut tekst fra pdf-en. Vi leser ut tekst fra hvert enkelt vedtak, linje for linje. Hvis den første bokstaven i linjen er skrevet med fet font, lagrer vi tekstlinjen som en overskriftskandidat. Vi prøver først å analysere ett enkelt vedtak, her sak 2021-01885.

In [4]:
from pdfminer.high_level import extract_pages
from pdfminer.layout import LTTextContainer, LTTextLine, LTChar

def extract_text_with_font(pdf_path):
    text_info = []

    for page_layout in extract_pages(pdf_path):
        for element in page_layout:
            if isinstance(element, LTTextContainer):
                for text_line in element:
                    if isinstance(text_line, LTTextLine):
                        # Forsøk å finne den første bokstaven i linjen
                        first_char = next((char for char in text_line if isinstance(char, LTChar)), None)
                        
                        if first_char is not None:
                            # Sjekk om den første bokstaven er uthevet
                            is_bold = "Bold" in first_char.fontname

                            # Hvis den første bokstaven er uthevet, betrakt hele linjen som uthevet
                            if is_bold:
                                text_info.append({
                                    "text": text_line.get_text(),  
                                    "font_name": first_char.fontname,
                                    "size": first_char.size,
                                    "is_bold": is_bold  
                                })

    return text_info

def main(pdf_path):
    teller = 0
    text_info = extract_text_with_font(pdf_path)

    print("\nIdentifiserte tekstlinjer med uthevet tekst:")
    print("--------------------------------------------")
    for info in text_info:
        print(info["text"].strip())  # Dette vil skrive ut hver uthevet linje som en separat streng
        teller +=1
    print("\nTotalt", teller, "overskrifter.")

if __name__ == "__main__":
    pdf_path = "./transportklagenemnda_pdfs/2021-01885.pdf"  # erstatt med stien til PDF-filen din
    pdf_path = "./transportklagenemnda_pdfs/
    main(pdf_path)



Identifiserte tekstlinjer med uthevet tekst:
--------------------------------------------
Vedtak i Transportklagenemnda - Fly
Sammendrag
Dato
Saksnummer
Tjenesteytere
Klager har i det vesentlige anført
Tjenesteyterne har i det vesentlige anført
Nemnda bemerker
Vedtak
Nemndas representanter

Totalt 10 overskrifter.


Koden finner det vi forventer. Den har identifisert alle overskrifter og utelatt annen tekst. Dette var for et enkelt vedtak. For å undersøke videre om denne metoden er robust, tester vi på alle vedtak. Det gir ikke mening å printe ut alle overskrifter for over 13 tusen vedtak. Vi leter derfor igjennom tekstlinjer med uthevet font og tar vare på alle unike tekstlinjer vi finner. Det skal da gi alle overskrifter som er brukt i vedtakene. Om metoden plukker med noe mer, vil vi også se det. (Koden under krever ressurser når antallet pdf-er er stort og tar derfor noe tid å kjøre)

In [7]:
import os
from pdfminer.high_level import extract_pages
from pdfminer.layout import LTTextContainer, LTTextLine, LTChar

def extract_text_with_font(pdf_path):
    text_info = []

    for page_layout in extract_pages(pdf_path):
        for element in page_layout:
            if isinstance(element, LTTextContainer):
                for text_line in element:
                    if isinstance(text_line, LTTextLine):
                        # Forsøk å finne den første karakteren i linjen
                        first_char = next((char for char in text_line if isinstance(char, LTChar)), None)

                        if first_char is not None:
                            # Sjekk om den første karakteren er uthevet
                            is_bold = "Bold" in first_char.fontname

                            # Hvis den første karakteren er uthevet, betrakt hele linjen som uthevet
                            if is_bold:
                                text_info.append(text_line.get_text().strip())  # Hent hele linjeteksten

    return text_info

def main(directory_path):
    bold_lines_set = set()

    # Gå gjennom hver fil i katalogen
    for filename in os.listdir(directory_path):
        if filename.endswith('.pdf'):
            full_path = os.path.join(directory_path, filename)
            # Ekstraher de uthevede linjene fra den nåværende PDF-en og legg dem til i settet
            bold_lines = extract_text_with_font(full_path)
            for line in bold_lines:
                bold_lines_set.add(line)

    print("\nIdentifiserte linjer med uthevet tekst:")
    print("--------------------------------------------")
    for line in bold_lines_set:
        print(line)  # Dette vil skrive ut hver unike uthevede linje som en separat streng

    print("\nTotalt unike linjer med uthevet skrift funnet:", len(bold_lines_set))

if __name__ == "__main__":
    directory_path = './transportklagenemnda_pdfs/'
    main(directory_path)




Identifiserte linjer med uthevet tekst:
--------------------------------------------
har truﬀet alle rimelige tiltak for å unngå innstillingen. Klager har etter dette rett til
oppdaget feilen på et tidligere tidspunkt.
hun ble behandlet som en forbryter på ﬂyplassen og ble tvunget ned i en stol og ﬁkk
innstillingen.
Reisens pris: 31.240
Tidspunkt: 121211 - 261211
glasskår og maur overalt. Etter klage til hotellet ﬁkk de nytt rom.
Turarrangør: TORP Booking
Reisens pris: kr 12.536
standard. Klager har derfor fått den standard han har betalt for. Sembo anser seg ikke
Klager anfører at rommet manglet a/c som fungerte. På det meste var det 29 grader på
vogn da han ble stanset. NSB har ikke gitt nærmere opplysninger om hvor lenge klager
Flertallet kan ikke se at den forklaring Tripmonster gir, skal gi grunnlag for dette.
Detur har i det vesentlige anført:
Reisens pris: 20.000,-
ﬂyvning fra Tromsø midtvinters. Etter mindretallets oppfatning er de-ices / av-ising
Ticketgarantien således ikke 

Resultatet er betryggende. Vi har analysert 7827 vedtak og sitter igjen med kun 41 forskjellige overskrifter. Det tyder på fast struktur i vedtakene. Mange av disse overskriftene er variasjoner av det samme med et tillegg av en dato. Her kan vi med tanke på parsingen fjerne datoen slik at alle disse blir like. Etter å ha fjernet variasjonen med dato, står vi igjen med 15 ulike overskrifter. Fire av disse er tittel på vedtakene:
- Vedtak i Pakkereisenemnda
- Vedtak i Transportklagenemnda - Fly
- Vedtak i Transportklagenemnda - Sjø
- Vedtak i Transportklagenemnda - Kollektivreiser

I pdf-en er overskriften til Transportklagenemnda - Kollektivreiser delt over to linjer. Derfor kommer den opp både som "Transportklagenemnda" og som "- Kollektivreiser". Fjerner vi også disse titlene, står vi igjen med bare 10 overskrifter til innhold i vedtaket.

For å vite om det er variasjon mellom vedtakene i bruken av overskrifter, dvs. om alle overskrifter er med i alle vedtak, kjører vi en sjekk også på dette. Vi lagrer da alle overskrifter for et vedtak i en liste, så sammenligner vi listene og sjekker hvor mange forskellige lister vi får.

In [3]:
import os
from pdfminer.high_level import extract_pages
from pdfminer.layout import LTTextContainer, LTTextLine, LTChar
from collections import defaultdict

def extract_text_with_font(pdf_path):
    text_info = []

    for page_layout in extract_pages(pdf_path):
        for element in page_layout:
            if isinstance(element, LTTextContainer):
                for text_line in element:
                    if isinstance(text_line, LTTextLine):
                        first_char = next((char for char in text_line if isinstance(char, LTChar)), None)

                        if first_char is not None and "Bold" in first_char.fontname:
                            line_text = text_line.get_text().strip()

                            # Sjekk starten av teksten og anvend forhold
                            if line_text.startswith("Tjenesteyter følger ikke vedtaket i saken"):
                                text_info.append("Tjenesteyter følger ikke vedtaket i saken")
                            elif not (line_text.startswith("Vedtak i") or line_text.startswith("- Kollektivreiser")):
                                text_info.append(line_text)

    return text_info

def main(directory_path):
    all_pdfs_bold_lines = []
    list_occurrences = defaultdict(int)

    for filename in os.listdir(directory_path):
        if filename.endswith('.pdf'):
            full_path = os.path.join(directory_path, filename)
            bold_lines = extract_text_with_font(full_path)
            if bold_lines:  # Bare legg til ikke-tomme lister
                # Konverter liste til en tuple slik at den kan hashes for ordboken av forekomster
                bold_lines_tuple = tuple(bold_lines)
                all_pdfs_bold_lines.append(bold_lines_tuple)
                list_occurrences[bold_lines_tuple] += 1

    unique_lists = set(all_pdfs_bold_lines)

    print("\nAntall unike lister: ", len(unique_lists))
    for unique_list in unique_lists:
        print("\nElementer i den unike listen:\n-----------------------")
        for item in unique_list:
            print(item)
        print("\nAntall PDF-er med denne unike listen: ", list_occurrences[unique_list])

if __name__ == "__main__":
    directory_path = "./pdfs" 
    main(directory_path)




Antall unike lister:  2

Elementer i den unike listen:
-----------------------
Sammendrag
Dato
Saksnummer
Tjenesteytere
Klager har i det vesentlige anført
Tjenesteyterne har i det vesentlige anført
Nemnda bemerker
Vedtak
Nemndas representanter

Antall PDF-er med denne unike listen:  7714

Elementer i den unike listen:
-----------------------
Tjenesteyter følger ikke vedtaket i saken
Sammendrag
Dato
Saksnummer
Tjenesteytere
Klager har i det vesentlige anført
Tjenesteyterne har i det vesentlige anført
Nemnda bemerker
Vedtak
Nemndas representanter

Antall PDF-er med denne unike listen:  113


Dette er gode nyheter! Vi finner bare to sett med ulike overskrifter i alle de 7827 vedtakene, og det eneste som skiller dem, er om de er innledet med «Tjenesteyter følger ikke vedtaket i saken». Det gjør det forholdsvis enkelt å parse dokumentene og lagre dem i strukturert form.

## Parsing av vedtak

Neste trinn er å parse vedtakene i deres enkelte bestanddeler. Vi bruker da informasjonen om overskrifter vi har samlet inn (se over): Alle vedtak har de samme overskriftene med to unntak:
1. Enkelte vedtak har en innledende del med informasjon om at «Tjenesteyter følger ikke vedtaket i saken». Her må vi sjekke om vedtaket har en slik innledende del. For vedtak som har en slik del, må vi lagre teksten. Det kan også være greit å ha en enkel måte å filtrer på vedtak som har en slik del. Vi oppretter derfor en bolsk variabel `Tjenesteyter_avviser_bool` og lagrer verdiene `True`og `False`.
2. Etter et slikt eventuelt svar fra tjenesteyter kommer overskriften på vedtaket.  Der står det om vedtaket er fattet av Transportklagenemnda eller Pakkereisereisenemnda. Det står også om det er Transportklagenemndas avdeling for "Fly", "Sjø", "Kollektivreiser". Denne informasjonen lagrer vi i variabelen `Nemnd`. Den kan ha fire ulike verdier "Fly", "Sjø", "Kollektivreiser", "Pakkereisenemnda".

Vi legger også inn hele vedtaktsteksten under nøkkelen «Vedtak_komplett». Det gjør det lettere å legge inn de komplette vedtakene i en database og bruke resten av den parsede informasjonen som metadata.

In [10]:
import os

headings = [
    "Sammendrag",
    "Dato",
    "Saksnummer",
    "Tjenesteytere",
    "Klager har i det vesentlige anført",
    "Tjenesteyterne har i det vesentlige anført",
    "Nemnda bemerker",
    "Vedtak"
]

def parse_vedtak(file_path, headings):
    """
    Parser et vedtak og returnerer en dictionary med overskrifter som nøkler og tekster som verdier.
    """
    content = {heading: "" for heading in headings}  # Initialiser alle overskrifter med tomme strenger
    content["Tjenesteyter_avviser"] = ""  # Initialiser denne nøkkelen med tomt innhold
    content["Nemnd"] = ""  # Initialiser denne nøkkelen med tomt innhold
    current_heading = None
    nemnd_keywords = ["Fly", "Sjø", "Kollektivreiser", "Pakkereisenemnda"]  # Nøkkelord å søke etter

    with open(file_path, 'r', encoding='utf-8') as file:
        full_text = file.read()  # Read the entire content of the file at once
        lines = full_text.split('\n')  # Split the content by line for further processing        
        for i, line in enumerate(lines):
            # Sjekk for spesiell overskrift
            if line.startswith("Tjenesteyter følger ikke vedtaket i saken"):
                content["Tjenesteyter_avviser"] += line  # Lagre denne linjen under den nye nøkkelen
                continue  # Hopp over resten av løkken for denne linjen

            # Sjekk for ett av Nemnd-nøkkelordene
            if any(keyword in line for keyword in nemnd_keywords):
                content["Nemnd"] = next((keyword for keyword in nemnd_keywords if keyword in line), "")
                continue  # Hopp over resten av løkken for denne linjen

            # Eksisterende logikk for overskrifter og innhold
            if line.strip() in headings:
                current_heading = line.strip()  # Denne linjen er en overskrift, oppdater gjeldende overskrift
            elif current_heading is not None:
                content[current_heading] += line  # Legg til tekst under gjeldende overskrift


    # Etter å ha behandlet alle linjene, sett boolsk flagg basert på innholdet under "Tjenesteyter_avviser"
    # Dette er strengt tatt en gjentagelse av informasjon, men gjør det lettere å bruke databasen senere.
    content["Tjenesteyter_avviser_bool"] = bool(content["Tjenesteyter_avviser"])
    
    content["Vedtak_komplett"] = full_text.strip()  # Add the full text of the file to the dictionary


    if not content["Nemnd"]:  # Hvis ingen nøkkelord ble funnet, skriv ut en feilmelding
        print(f"Feil: 'Nemnd'-nøkkelord ikke identifisert i filen {file_path}")

    return content



def main(directory_path, headings):
    all_files_content = []

    for filename in os.listdir(directory_path):
        if filename.endswith('.txt'):
            full_path = os.path.join(directory_path, filename)
            file_content = parse_vedtak(full_path, headings)
            all_files_content.append(file_content)

    return all_files_content


directory_path = './transportklagenmnda_txt/'
# Liste over overskrifter å søke etter i filene

parsede_vedtak = main(directory_path, headings)


In [11]:
# NY logikk

import os

headings = [
    "Sammendrag",
    "Dato",
    "Saksnummer",
    "Tjenesteytere",
    "Klager har i det vesentlige anført",
    "Tjenesteyterne har i det vesentlige anført",
    "Nemnda bemerker",
    "Vedtak"
]

def parse_vedtak(file_path, headings):
    content = {heading: "" for heading in headings}
    content["Tjenesteyter_avviser"] = ""
    content["Nemnd"] = ""
    current_heading = None
    nemnd_keywords = ["Fly", "Sjø", "Kollektivreiser", "Pakkereisenemnda"]

    
    
    in_optional_start = False

    with open(file_path, 'r', encoding='utf-8') as file:
        full_text = file.read()
        lines = full_text.split('\n')

        for i, line in enumerate(lines):

            # Check for special header start
            if line.startswith("Tjenesteyter følger ikke vedtaket i saken"):
                in_optional_start = True

            # If we are in the optional start, keep adding lines until "Vedtak i" is found
            if in_optional_start:
                content["Tjenesteyter_avviser"] += line + '\n'  # Add a newline for formatting
                if "Vedtak i" in line:
                    in_optional_start = False  # Exit optional start mode

            # Identify "Nemnd"
            if "Vedtak i" in line and not content["Nemnd"]:
                # Check current line for nemnd keyword
                for keyword in nemnd_keywords:
                    if keyword in line:
                        content["Nemnd"] = keyword
                        break  # Exit the loop once keyword is found

                # If Nemnd is not found on the current line, check the next line
                if not content["Nemnd"] and (i+1) < len(lines):
                    next_line = lines[i+1]
                    for keyword in nemnd_keywords:
                        if keyword in next_line:
                            content["Nemnd"] = keyword
                            break

            elif line.strip() in headings:
                current_heading = line.strip()
            elif current_heading is not None:
                content[current_heading] += line + '\n'
        
        content["Tjenesteyter_avviser_bool"] = bool(content["Tjenesteyter_avviser"].strip())
        content["Vedtak_komplett"] = full_text.strip()

        if not content["Nemnd"]:
            print(f"Error: 'Nemnd' keyword not identified in file {file_path}")

    return content

def main(directory_path, headings):
    all_files_content = []

    for filename in os.listdir(directory_path):
        if filename.endswith('.txt'):
            full_path = os.path.join(directory_path, filename)
            file_content = parse_vedtak(full_path, headings)
            all_files_content.append(file_content)

    return all_files_content


directory_path = './transportklagenmnda_txt/'
# Liste over overskrifter å søke etter i filene

parsede_vedtak = main(directory_path, headings)
print(len(parsede_vedtak))

13974


### Resultat av parsingen
Vi printer ut et vedtak for å se hvordan parsingen ser ut.

In [12]:
import pprint
pp = pprint.PrettyPrinter(indent=0, width=100)
pp.pprint(parsede_vedtak[100])

{'Dato': '04.11.2013\n\n',
'Klager har i det vesentlige anført': '',
'Nemnd': 'Fly',
'Nemnda bemerker': '',
'Saksnummer': '297/13F\n'
              '\n'
              'Tjenesteyter\n'
              'Norwegian Air Shuttle ASA\n'
              '\n'
              'Krav om erstatning grunnet nektet ombordstigning.\n'
              '\n'
              'Klager har i det vesentlige anført:\n'
              '\n'
              'Klager skulle reise fra Manchester til Stavanger den 1. april 2013 kl. 10:30 med '
              'DY1327.\n'
              '\n'
              'Da klager ankom terminal 1, var den i ferd med å bli evakuert grunnet bombetrussel. '
              'Klager\n'
              "fikk flere sms'er fra Norwegian med beskjed om at ny informasjon skulle komme. "
              'Siste sms\n'
              'kom kl. 12:17 om at mer info ville komme kl. 14:00.\n'
              '\n'
              'Kl. 12:40 kom det melding over høyttaleranlegget om at alle passasjerer som skulle '
           

### Videre bearbeiding

Vi ser at tekstfeltene kan forbedres på to punkter:
1. De har noen innledende og avsluttende linjeskift (\n). De skal ikke være med.
2. Teksten har også noen uønskede linjeskift i teksten.  Dette er linjeskift som stammer fra layouten i pdf-filene. De ønsker vi også å fjerne.

In [13]:
# Funksjon for å behandle tekstverdier i hvert vedtak
def behandle_tekstverdier_i_vedtak(parsede_vedtak):
    # Itererer gjennom hvert vedtak (ordbok) i listen
    for vedtak in parsede_vedtak:
        # Itererer gjennom hvert nøkkel-verdi-par i vedtaket
        for key, value in vedtak.items():
            # 1. Sjekker om verdien er en tekststreng
            if isinstance(value, str):
                # 2. Fjerner ledende og etterfølgende mellomrom
                renset_tekst = value.strip()

                # 3. Splitter teksten i verdifeltet til avsnitt (\n\n)
                avsnitt = renset_tekst.split('\n\n')
                # 4. For hvert avsnitt, erstatter \n med mellomrom
                behandlet_avsnitt = [text.replace('\n', ' ') for text in avsnitt]
               
                # Setter sammen avsnittene igjen med \n\n som skilletegn
                sammensatt_tekst = '\n\n'.join(behandlet_avsnitt)

                # Oppdaterer verdien i vedtaket med den sammensatte teksten
                vedtak[key] = sammensatt_tekst

    return parsede_vedtak  # Returnerer listen med vedtak etter at tekstverdiene er behandlet


# Kaller funksjonen med listen over parsede vedtak
#print(parsede_vedtak)  # Print to check if the list is empty or not
behandlede_vedtak = behandle_tekstverdier_i_vedtak(parsede_vedtak)



# Skriver ut de behandlete vedtakene for verifisering
#for vedtak in behandlede_vedtak:
   # print(vedtak)


In [14]:
import pprint
pp = pprint.PrettyPrinter(indent=0, width=100)
pp.pprint(behandlede_vedtak[2])

{'Dato': '02.10.2015',
'Klager har i det vesentlige anført': '',
'Nemnd': 'Fly',
'Nemnda bemerker': '',
'Saksnummer': '0027/15F\n'
              '\n'
              'Tjenesteyter Supersaver\n'
              '\n'
              'Klager har i det vesentlige anført:\n'
              '\n'
              'Klager hadde bestilt en reise hos Supersaver. I ettertid ville han endre navn på '
              'bestillingen og kontaktet reisebyrået. De henviste ham til Qatar. Klager kontaktet '
              'Qatar, som sa at han skulle ordne dette og sende mail til Supersaver. Klager '
              'informerte Supersaver om dette.\n'
              '\n'
              'En ukes tid senere ringte Supersaver og sa at klager måtte betale et gebyr på '
              'kroner 1 095 for endringen, og at de ville sende en bekreftelse og ny billett.\n'
              '\n'
              'Klager ventet en uke uten å få bekreftelse fra Supersaver på navneendringen. Han '
              'forsøkte å kontakte reisebyrået

## Flertall og mindretall

- Sjekke for mindretall og lagre i boolsk variabel.
- Kjøre statistikk som kontrollerer søkekriteriene for mindretall og flertall

In [15]:
# Uttrykk å søke etter, enkelt å endre ved å bare oppdatere denne listen
expressions = ["flertall", "flertallet", "mindretall", "mindretallet",
              "Flertall", "Flertallet", "Mindretall", "Mindretallet"]

# Funksjon for å sjekke tekst for noen av de gitte uttrykkene og oppdatere ordboken
def check_text_and_update_dictionary(dictionary, expressions):
    # Sjekker om 'dictionary' faktisk er en ordbok
    if not isinstance(dictionary, dict):
        raise ValueError("Funksjonen forventer en ordbok som input.")

    # Henter teksten som skal søkes i
    text_to_search = dictionary.get("Nemnda bemerker", "")
    
    # Søker etter noen av uttrykkene i teksten
    found_expression = any(expression in text_to_search for expression in expressions)

    # Oppdaterer ordboken basert på om et uttrykk ble funnet
    dictionary["Har_mindretall"] = "True" if found_expression else "False"

# Kaller funksjonen for hver ordbok i listen
for vedtak in behandlede_vedtak:
    check_text_and_update_dictionary(vedtak, expressions)

# Skriver ut den oppdaterte listen med ordbøker
print(behandlede_vedtak[0])



{'Sammendrag': 'Krav om standarderstatning og refusjon ved forsinkelse.', 'Dato': '20.06.2017', 'Saksnummer': '2016-00844', 'Tjenesteytere': 'Norwegian', 'Klager har i det vesentlige anført': 'Klager skulle reise med Norwegians flyvning DY7106 fra Las Vegas (LAS) til København (CPH) 16. juli 2016 kl. 18.30 lokal tid. Flyvningen ble forsinket, og klager mistet sin forbindelse fra København til Bergen med SAS. \n\nVarmt vær i Las Vegas i juli måned kan etter klagers syn ikke anses som en ekstraordinær omstendighet. \n\nKlager har på ovennevnte bakgrunn fremsatt krav om standarderstatning i henhold til EU-forordning 261/2004 på 600 euro, samt refusjon av kroner 2 067 for kjøp av nye flybilletter fra København til Bergen.', 'Tjenesteyterne har i det vesentlige anført': 'Norwegians flyvning DY7106 fra Las Vegas til København 16. juli 2016 ble forsinket med fem timer og 42 minutter. Årsaken til forsinkelsen var værforholdene i Las Vegas denne dagen. Det var svært høye temperaturer som forårs

## Lagrer vedtakene til fil. Bruker JSON

In [16]:
import json

filename = 'vedtak.json'

with open(filename, 'w', encoding='utf-8') as f:
    json.dump(behandlede_vedtak, f, indent=4, ensure_ascii=False)
