## Skriv funksjonen les_meteoritter(filnavn)


Funksjonen tar inn et filnavn, og returnerer en
todimensjonal liste med delvis tolkede verdier
basert på linjene i filen.



csv-filen er på UTF-8-format, separatoren er komma, ',' og starter slik:
name,id,class,mass,year,latitude,longitude
Aachen,1,L5,21.0,1880,50.775,6.08333
Aarhus,2,H6,720.0,1951,56.18333,10.23333
Abee,6,EH4,107000.0,1952,54.21667,-113.0
Acapulco,10,Acapulcoite,1914.0,1976,16.88333,-99.9
...

Vi har noen krav til tolkningen:

Massen skal tolkes som en flyttall.
Det finnes nedslag der masse ikke er registrert. Her skal massen
settes til 0.
Nedslagsår skal tolkes som heltall.
Problemet er at enkelte meteorittyper også har komma ibetegnelsen, som på følgende linje:
Akyumak,433,"Iron, IVA",50000.0,1981,39.91667,42.81667
Alle disse spesialtilfellene er jernmeteoritter. Vi løser
dette ved å erstatte alle disse variantene (Iron Iva" med strengen 'Iron'.


In [6]:
def les_meteoritter(filnavn):
    ut = []
    with open(filnavn,'r', encoding="utf8") as f:
        f.readline()
        for nedslag in f.readlines():
            splitt = nedslag.split(",")
            splitt[-1] = splitt[-1].strip()
            if len(splitt) == 8:
                splitt[2:4] = ["Iron"]
            if splitt[3]:
                splitt[3] = float(splitt[3])
            else:
                splitt[3] = 0
            splitt[4] = int(splitt[4])
            ut.append(splitt)
    return ut

n = les_meteoritter("meteoritter.csv")
print(f"Antall meteoritter: {len(n)}.")
print(n)

Antall meteoritter: 999.
[['Aachen', '1', 'L5', 21.0, 1880, '50.775', '6.08333'], ['Aarhus', '2', 'H6', 720.0, 1951, '56.18333', '10.23333'], ['Abee', '6', 'EH4', 107000.0, 1952, '54.21667', '-113.0'], ['Acapulco', '10', 'Acapulcoite', 1914.0, 1976, '16.88333', '-99.9'], ['Achiras', '370', 'L6', 780.0, 1902, '-33.16667', '-64.95'], ['Adhi Kot', '379', 'EH4', 4239.0, 1919, '32.1', '71.8'], ['Adzhi-Bogdo (stone)', '390', 'LL3-6', 910.0, 1949, '44.83333', '95.16667'], ['Agen', '392', 'H5', 30000.0, 1814, '44.21667', '0.61667'], ['Aguada', '398', 'L6', 1620.0, 1930, '-31.6', '-65.23333'], ['Aguila Blanca', '417', 'L', 1440.0, 1920, '-30.86667', '-64.55'], ['Aioun el Atrouss', '423', 'Diogenite-pm', 1000.0, 1974, '16.39806', '-9.57028'], ['Aïr', '424', 'L6', 24000.0, 1925, '19.08333', '8.38333'], ['Aire-sur-la-Lys', '425', 'Unknown', 0, 1769, '50.66667', '2.33333'], ['Akaba', '426', 'L6', 779.0, 1949, '29.51667', '35.05'], ['Akbarpur', '427', 'H4', 1800.0, 1838, '29.71667', '77.95'], ['Akwa

## Skriv metoden sorter_masse(nedslag, kolonne)
- nedslag er den todimensjonale listen som kommer fra funksjonen les_meteoritter.
- kolonne er et heltall som indikerer kolonnen i hvert nedslag som skal fungere som nøkkel.
Funksjonen skal returnere en dictionary der de ulike nedslagenes verdi
i den gitte kolonnen skal brukes som nøkkel. Bak denne nøkkelen skal så
alle massene for disse 'like' nedslagene summeres.
Eksempel:
```python
> m = les_meteoritter("meteoritter.csv")
> d = sorter_masse(m,2) # sorter på type (kolonne 2)
> print(d)
{'L5': 16500.0, 'H6': 20000.0, '...

```


In [8]:
def sorter_masse(nedslag, kolonne):
    hvor = ['name','id','class','mass','year','latitude','longitude'].index(kolonne)
    d = {}
    for n in nedslag:
        d[n[hvor]] = d.get(hvor,0) + n[3]
    return d

# Alternativt
def sorter_masse2(nedslag, kolonne):
    hvor = {
        'name': 0,
        'id': 1,
        'class': 2,
        'mass': 3,
        'year': 4,
        'latitude': 5,
        'longitude': 6
    }
    hvor_index = hvor.get(kolonne, -1)
    d = {}
    for n in nedslag:
        d[n[hvor_index]] = d.get(hvor_index,0) + n[3]
    return d

d = sorter_masse(n,'year')
d

{1880: 720.0,
 1951: 3555.0,
 1952: 5500.0,
 1976: 605.0,
 1902: 11300.0,
 1919: 24.3,
 1949: 6000.0,
 1814: 28.0,
 1930: 2085.0,
 1920: 1222.0,
 1974: 50.0,
 1925: 300.0,
 1769: 0,
 1838: 500.0,
 1959: 134.3,
 1981: 61.4,
 1957: 5000.0,
 2001: 12000.0,
 1806: 6000.0,
 1766: 2000.0,
 2002: 45300.0,
 1835: 4300.0,
 1873: 400.0,
 1860: 54.0,
 1900: 121.5,
 1883: 360.0,
 1899: 300.0,
 1969: 815.3,
 2008: 100000.0,
 1977: 1300.0,
 1895: 1641.0,
 1898: 10750.0,
 1939: 1590.0,
 1822: 89.0,
 1869: 20000.0,
 1942: 253.6,
 1971: 3900.0,
 1984: 529.0,
 1914: 14000.0,
 1803: 1600.0,
 1954: 5560.0,
 1932: 2125.0,
 1950: 342.0,
 1805: 3891.0,
 2009: 25.81,
 1923: 1800.0,
 1886: 1900.0,
 1896: 840.0,
 1933: 4100.0,
 1945: 2050.0,
 1836: 1000.0,
 1865: 7235.0,
 1842: 0,
 1858: 144000.0,
 1908: 350.0,
 1855: 700.0,
 1968: 283.3,
 1938: 142.5,
 1934: 230.0,
 1929: 6000.0,
 1922: 16500.0,
 1907: 877.0,
 1993: 36900.0,
 1871: 5400.0,
 1892: 39000.0,
 1913: 4180.0,
 1790: 6400.0,
 1704: 0,
 1904: 18600.0,

## Skriv funksjonene lagre_sorterte_nedslag(sortert) og hent_sorterte_nedslag(sortert).
Disse skal henholdsvis lagre og hente inn samlingen sortert (en dictionary) til/fra en fil.
Du velger selv hvordan du gjør det, og hva filen skal hete.

*Her kunne en altså velge selv om en ville lagre med pickle eller ved å lage sin egen filtolker.*

In [10]:
import pickle
def lagre_sorterte_nedslag(sortert):
    with open("sortert.pickle",'wb') as f:
        pickle.dump(sortert,f)
        
def hent_sorterte_nedslag():
    with open("sortert.pickle",'rb') as f:
        return pickle.load(f)
        
lagre_sorterte_nedslag(d)
inn = hent_sorterte_nedslag()
inn

{1880: 720.0,
 1951: 3555.0,
 1952: 5500.0,
 1976: 605.0,
 1902: 11300.0,
 1919: 24.3,
 1949: 6000.0,
 1814: 28.0,
 1930: 2085.0,
 1920: 1222.0,
 1974: 50.0,
 1925: 300.0,
 1769: 0,
 1838: 500.0,
 1959: 134.3,
 1981: 61.4,
 1957: 5000.0,
 2001: 12000.0,
 1806: 6000.0,
 1766: 2000.0,
 2002: 45300.0,
 1835: 4300.0,
 1873: 400.0,
 1860: 54.0,
 1900: 121.5,
 1883: 360.0,
 1899: 300.0,
 1969: 815.3,
 2008: 100000.0,
 1977: 1300.0,
 1895: 1641.0,
 1898: 10750.0,
 1939: 1590.0,
 1822: 89.0,
 1869: 20000.0,
 1942: 253.6,
 1971: 3900.0,
 1984: 529.0,
 1914: 14000.0,
 1803: 1600.0,
 1954: 5560.0,
 1932: 2125.0,
 1950: 342.0,
 1805: 3891.0,
 2009: 25.81,
 1923: 1800.0,
 1886: 1900.0,
 1896: 840.0,
 1933: 4100.0,
 1945: 2050.0,
 1836: 1000.0,
 1865: 7235.0,
 1842: 0,
 1858: 144000.0,
 1908: 350.0,
 1855: 700.0,
 1968: 283.3,
 1938: 142.5,
 1934: 230.0,
 1929: 6000.0,
 1922: 16500.0,
 1907: 877.0,
 1993: 36900.0,
 1871: 5400.0,
 1892: 39000.0,
 1913: 4180.0,
 1790: 6400.0,
 1704: 0,
 1904: 18600.0,

## Skriv ut hvilket år det ble registrert størst total nedslagsmasse.
Hvis flere år har samme høyeste masse registrert kan du skrive ut alle.
Du trenger ikke skrive denne koden som en funksjon, men det
er lurt å bruke funksjonene som er spesifisert over. Du
kan forvente at de fungerer slik som spesifisert, selv om
du ikke har klart å løse dem.
Filen har navn 'meteoritter.csv'

*Denne trengte man ikke skrive noen funksjon for å klare, men man måtte heller kunne klare å sette sammen de tingene som er laget på forhånd.*

In [11]:
n = les_meteoritter('meteoritter.csv')
d = sorter_masse2(n,'year')
maks = max(d.values())
for k, v in d.items():
    if v == maks:
        print(k)

1947
