# Fra 2d-liste til dictionary
Et vanlig case: vi har data i ei 2d-liste
- ønsker å gjøre om til en dictionary
- for å ha raskt oppslag på en nøkkelverdi
    - heller enn på indeks (nummerrekkefølge)
    
Eksempel: Har ei 2d-liste med info om grunnstoff
- ville egentlig hatt alle, og mer info om hvert stoff
- men nøyer oss med 4 stoff og 4 opplysninger så ikke eksemplet blir for stort

Hvis vi skulle slå opp på atomnummer...
- trenger ikke dictionary, helt greit med 2d-liste
    - info om aktuelt stoff er i __liste[atomnr - 1]__, f.eks. hydrogen på indeks [0]
    
Men hvis vi heller vil slå opp på noe annet, f.eks. kjemisk symbol
- da kommer dictionary til sin rett
- gir raske oppslag på denne strengen, mens 2d-liste nødvendiggjør løkke for leting

In [2]:
grunnstoff = [
 ['1', 'Hydrogen', 'H', '1.0079'], 
 ['2', 'Helium', 'He', '4.0026'], 
 ['3', 'Litium', 'Li', '6.941'], 
 ['4', 'Beryllium', 'Be', '9.0122']
]

Vi skal her lage funksjonen __lag_grunnstoff_dict(grunnstoff)__
- som får inn lista
- returnerer en dictionary

Hvis vi er sikker på at det bare fins ei rad med info om hvert grunnstoff i lista, er dette et enkelt case
- kan kjøre ei straight løkke gjennom 2d-lista og lage et dictionary-element i hver runde
- har med noen overflødige input()-setninger for å vise hva som skjer underveis

In [None]:
def lag_grunnstoff_dict(grunnstoff):
    my_dict = {}                                # starter med å lage tom dictionary
    for rad in grunnstoff:                      # løkke, ser på ei og ei rad av 2d-lista
        input(rad)                              # kun for demo, skal tas bort
        my_dict[rad[2]] = rad[0:2] + rad[3:]    # putter kjemisk symbol som nøkkel, resten som ei verdiliste
        input(my_dict)                          # kun for demo, skal tas bort
    return my_dict

print(lag_grunnstoff_dict(grunnstoff))

In [3]:
# Og uten input()-setningene som bare var for demo:
def lag_grunnstoff_dict(grunnstoff):
    my_dict = {}                                # starter med å lage tom dictionary
    for rad in grunnstoff:                      # løkke, ser på ei og ei rad av 2d-lista
        my_dict[rad[2]] = rad[0:2] + rad[3:]    # putter kjemisk symbol som nøkkel, resten som ei verdiliste
    return my_dict

print(lag_grunnstoff_dict(grunnstoff))

{'H': ['1', 'Hydrogen', '1.0079'], 'He': ['2', 'Helium', '4.0026'], 'Li': ['3', 'Litium', '6.941'], 'Be': ['4', 'Beryllium', '9.0122']}


Dette caset ble enkelt fordi vi har eksakt ei rad av hvert element
- hvis vi har flere, blir det litt mer komplisert

Annet eksempel: bompasseringer
- ønsker en dictionary hvor skiltnummer er nøkkel
- her ser vi at en del av bilene har flere passeringer
- trenger dermed ei liste av lister eller liste av tupler
    - la oss ta liste av tupler for å ta vare på alle passeringer for hver bil

In [5]:
bompasseringer = [
 ['020323', '10:35:02', 'GX34349'], 
 ['020323', '10:35:55', 'GD30009'],
 ['020323', '10:35:02', 'GX34349'], 
 ['020323', '10:41:02', 'GY19911'], 
 ['030323', '09:13:05', 'JX10000'], 
 ['030323', '09:23:00', 'GD30009'], 
]

In [None]:
def lag_bom_dict(bompasseringer):
    my_dict = {}                                # starter med å lage tom dictionary
    for rad in bompasseringer:                  # løkke, ser på ei og ei rad av 2d-lista
        input(rad)                              # kun for demo, skal tas bort
        my_dict[rad[2]] = [tuple(rad[0:2])]       # oppretter nøkkel og data i dictionary
        input(my_dict)                          # kun for demo, skal tas bort
    return my_dict

print(lag_bom_dict(bompasseringer))

Her blir problemet...
- når vi kommer til andre forekomst av en bil
- skriver vi over infoen vi hadde fra før
ender derfor opp med å huske bare ett tuppel

Derfor trenger vi ei if-setning:
- for hver rad, sjekke om aktuell nøkkel (her skiltnummer) fins i dictionary allerede
    - hvis den fins, må vi IKKE gjøre tilordningen i linje 5 over
        - men i stedet legge til informasjonen bakerst i den som allerede fins der
    - hvis den ikke fins, gjør vi derimot tilordningen vi brukte over
        - som lager en ny nøkkelverdi i dictionary, med tilhørende data

In [None]:
def lag_bom_dict(bompasseringer):
    my_dict = {}                                # starter med å lage tom dictionary
    for rad in bompasseringer:                  # løkke, ser på ei og ei rad av 2d-lista
        input(rad)                              # kun for demo, skal tas bort
        if rad[2] in my_dict:                   # sjekke om den allerede er der
            my_dict[rad[2]].append(tuple(rad[0:2]))     # oppretter ikke ny, bare legger til et ekstra tuppel på den vi har
        else: # den  fins ikke
            my_dict[rad[2]] = [tuple(rad[0:2])]   # oppretter ny nøkkel m tilhørende data    
        input(my_dict)                          # kun for demo, skal tas bort
    return my_dict

print(lag_bom_dict(bompasseringer))

In [6]:
# og uten input-setningene:
def lag_bom_dict(bompasseringer):
    my_dict = {}                                # starter med å lage tom dictionary
    for rad in bompasseringer:                  # løkke, ser på ei og ei rad av 2d-lista
        if rad[2] in my_dict:                      # sjekke om den allerede er der
            my_dict[rad[2]].append(tuple(rad[0:2]))     # oppretter ikke ny, bare legger til et ekstra tuppel på den vi har
        else: # den  fins ikke
            my_dict[rad[2]] = [tuple(rad[0:2])]   # oppretter ny nøkkel m tilhørende data    
    return my_dict

print(lag_bom_dict(bompasseringer))

{'GX34349': [('020323', '10:35:02'), ('020323', '10:35:02')], 'GD30009': [('020323', '10:35:55'), ('030323', '09:23:00')], 'GY19911': [('020323', '10:41:02')], 'JX10000': [('030323', '09:13:05')]}


In [None]:
# alternativt kan vi ha testen på not in... da kommer innsettingen øverst
# da kan vi droppe else, men i så fall må vi legge tom liste på if, siden vi uansett appender etterpo
def lag_bom_dict(bompasseringer):
    my_dict = {}                                # starter med å lage tom dictionary
    for rad in bompasseringer:                  # løkke, ser på ei og ei rad av 2d-lista
        if rad[2] not in my_dict:               # sjekke om den allerede er der
            my_dict[rad[2]] = []                # tom liste for verdier, fordi neste linje blir utført uansett
        my_dict[rad[2]].append(tuple(rad[0:2])) 
    return my_dict

print(lag_bom_dict(bompasseringer))

## Oppsummering:
2d-liste til dictionary, typisk framgangsmåte
- gå i løkke rad for rad
- ha klart for seg hvilket element i rada som skal være nøkkelverdi
- for hver runde sjekke
    - fins dette elementet fra før?
        - i så fall, legge sammen med de opplysningene vi allerede har på den nøkkelen
    - eller ikke?
        - i så fall, opprette et nytt element - med tilhørende data
        
Komplikasjoner kan forekomme, f.eks.
- at ikke alle element skal legges til, ulike begrensninger
- men ser ikke på det her nå