# Import/eksport av data

I denne notebooken lærer du hvordan du importerer og eksporterer familie-data i forskjellige formater.

## Støttede formater

- **YAML** (anbefalt) - Lesbar struktur
- **JSON** - Universell kompatibilitet  
- **CSV** - Enkel tabellstruktur
- **GEDCOM** - Genealogi-standard


In [None]:
# Importer nødvendige biblioteker
import sys
sys.path.append('../src')

from models import Person, Ekteskap, FamilieData, Gender
from tree import Slektstre
from family_io import (
    load_from_yaml, save_to_yaml,
    load_from_json, save_to_json,
    load_from_csv, save_to_csv,
    export_to_gedcom
)
from datetime import date
import pandas as pd

print("✅ Alle biblioteker importert!")


## 1. YAML Format (Anbefalt)

YAML er det mest lesbare formatet for familie-data:


In [None]:
# Last eksempel-familie fra YAML
familie_data = load_from_yaml('../data/eksempel_familie.yaml')
slektstre = Slektstre(familie_data)

print(f"Familie lastet med {len(familie_data.personer)} personer og {len(familie_data.ekteskap)} ekteskap")
print(f"Beskrivelse: {familie_data.beskrivelse}")

# Vis første person som eksempel
if familie_data.personer:
    første_person = familie_data.personer[0]
    print(f"\nEksempel person: {første_person.fullt_navn} (ID: {første_person.id})")


In [None]:
# Lagre til YAML
save_to_yaml(familie_data, "eksport_familie.yaml")
print("✅ Familie-data eksportert til eksport_familie.yaml")


## 2. JSON Format

JSON er godt for programmatisk bruk og kompatibilitet:


In [None]:
# Eksporter til JSON
save_to_json(familie_data, "eksport_familie.json")
print("✅ Familie-data eksportert til eksport_familie.json")

# Last fra JSON
familie_data_json = load_from_json("eksport_familie.json")
slektstre_json = Slektstre(familie_data_json)

print(f"JSON-fil lastet med {len(familie_data_json.personer)} personer")


## 3. CSV Format

CSV er enkelt for tabellbasert data. La oss lage et eksempel:


In [None]:
# Eksporter til CSV
save_to_csv(familie_data, "eksport_familie.csv")
print("✅ Familie-data eksportert til eksport_familie.csv")

# Vis CSV-innhold
df = pd.read_csv("eksport_familie.csv")
print(f"\nCSV-fil inneholder {len(df)} rader")
print("\nFørste 5 rader:")
print(df.head())


In [None]:
# Last fra CSV
familie_data_csv = load_from_csv("eksport_familie.csv")
slektstre_csv = Slektstre(familie_data_csv)

print(f"CSV-fil lastet med {len(familie_data_csv.personer)} personer")
print(f"Antall ekteskap: {len(familie_data_csv.ekteskap)}")


## 4. GEDCOM Format

GEDCOM er standarden for genealogi-programmer:


In [None]:
# Eksporter til GEDCOM
export_to_gedcom(familie_data, "eksport_familie.ged")
print("✅ Familie-data eksportert til eksport_familie.ged")

# Vis første linjer av GEDCOM-filen
with open("eksport_familie.ged", "r", encoding="utf-8") as f:
    linjer = f.readlines()[:20]
    print("\nFørste 20 linjer av GEDCOM-filen:")
    for i, linje in enumerate(linjer, 1):
        print(f"{i:2d}: {linje.rstrip()}")


## 5. Sammenligning av formater

La oss sammenligne størrelsen og kompleksiteten:


In [None]:
import os

# Sammenlign filstørrelser
filer = ["eksport_familie.yaml", "eksport_familie.json", "eksport_familie.csv", "eksport_familie.ged"]

print("📊 Filstørrelser:")
for fil in filer:
    if os.path.exists(fil):
        størrelse = os.path.getsize(fil)
        print(f"{fil:25s}: {størrelse:6d} bytes")
    else:
        print(f"{fil:25s}: Ikke funnet")


## 6. Validering av importerte data

La oss sjekke at alle formater gir samme resultat:


In [None]:
# Sammenlign antall personer og ekteskap
formater = {
    "YAML": familie_data,
    "JSON": familie_data_json,
    "CSV": familie_data_csv
}

print("📋 Sammenligning av importerte data:")
print(f"{'Format':<8} {'Personer':<10} {'Ekteskap':<10}")
print("-" * 30)

for format_navn, data in formater.items():
    print(f"{format_navn:<8} {len(data.personer):<10} {len(data.ekteskap):<10}")

# Sjekk at alle har samme antall personer
antall_personer = [len(data.personer) for data in formater.values()]
if len(set(antall_personer)) == 1:
    print("\n✅ Alle formater har samme antall personer!")
else:
    print("\n⚠️ Formater har forskjellig antall personer")


## 7. Rydde opp

La oss slette de midlertidige filene:


In [None]:
# Slett midlertidige filer
import os

filer_til_sletting = [
    "eksport_familie.yaml",
    "eksport_familie.json", 
    "eksport_familie.csv",
    "eksport_familie.ged"
]

for fil in filer_til_sletting:
    if os.path.exists(fil):
        os.remove(fil)
        print(f"🗑️ Slettet {fil}")

print("\n✅ Opprydding fullført!")


## Oppsummering

I denne notebooken har du lært:

1. ✅ **YAML** - Lesbar struktur, anbefalt format
2. ✅ **JSON** - Programmatisk kompatibilitet
3. ✅ **CSV** - Enkel tabellstruktur
4. ✅ **GEDCOM** - Genealogi-standard
5. ✅ Sammenligning av formater
6. ✅ Validering av importerte data
7. ✅ Opprydding av midlertidige filer

**Anbefalinger**:
- Bruk **YAML** for manuell redigering
- Bruk **JSON** for programmatisk bruk
- Bruk **CSV** for enkel dataoverføring
- Bruk **GEDCOM** for kompatibilitet med andre genealogi-programmer

**Neste steg**: Gå til `04_visualisering.ipynb` for å utforske alle visualiseringsalternativer.
