# Molekylmassekalkulator

I denne notebooken skal vi lage en molekylmasse-kalkulator. Målet er at vi som input skriver inn molekylets formel, f.eks: H$_2$O, eller CH$_3$CH$_2$OH, og så skal programmet regne ut vekten på molekylet for oss.

Dette er en oppgave som krever litt algoritmisk tankegang, så vi anbefaler at du finner frem penn og papir og tegner opp noen små figurer mens du jobber.

Før vi setter igang gjør vi to antagelser som gjør at vi slipper å tenke på spesialtilfeller.
- Vi unngår molekyler som bruker parenteser, f.eks CH3(OH)4.
- Vi antar at brukeren er nøye når de skriver inn, altså, vi legger ikke inn noen "idiotsikring" på store og små bokstaver osv.

Disse kan man eventuelt legge til tilslutt som en tileggsutfordring. For eksempel kan det være en morsom utfordring å prøve å finne ut av hvordan vi kan ta hensyn til parenteser.


### Atommasser

For å kunne finne massen til et molekyl trenger vi først å kjenne til atommassene. For å gjøre jobbe lettere gir vi disse under. Hver atommasse er gitt i antall Dalton, $u$, som svarer til g/mol, eller $1.66\cdot10^{27}$ kg per atom. Vi definerer `u` som en variabel, så vi kan oppgi atommasser i kg ved ønske.

In [1]:
atommasse = {"H":  1.0079, "He": 4.0026, "Li":  6.941, "Be": 9.0122,
             "B":  10.811, "C":  12.011, "N":  14.007, "O":  15.999, 
             "F": 18.998,  "Ne": 20.180, "Na": 22.990, "Mg": 24.305, 
             "Al": 26.982, "Si": 28.086, "P":  30.974, "S":  32.065,
             "Cl": 35.453, "Ar": 39.948, "K":  39.098, "Ca": 40.078,
             "Sc": 44.956, "Ti": 47.867, "V":  50.942, "Cr": 51.996,
             "Mn": 54.938, "Fe": 55.845, "Co": 58.933, "Ni": 58.693,
             "Cu": 63.546, "Zn":  65.39, "Ga": 69.723, "Ge":  72.61,
             "As": 74.922, "Se":  78.96, "Br": 79.904, "Kr":  83.80,
             "Rb": 85.468, "Sr": 87.62,  "Y":  88.906, "Zr": 91.224,
             "Nb": 92.906, "Mo": 95.94,  "Tc":  97.61, "Ru": 101.07,
             "Rh": 102.91, "Pd": 106.42, "Ag": 107.87, "Cd": 112.41,
             "In": 114.82, "Sn": 118.71, "Sb": 121.76, "Te": 127.60,
             "I":  126.90, "Xe": 131.29, "Cs": 132.91, "Ba": 137.33,
             "La": 138.91, "Ce": 140.12, "Pr": 140.91, "Nd": 144.24,
             "Pm":  145.0, "Sm": 150.36, "Eu": 151.96, "Gd": 157.25,
             "Tb": 158.93, "Dy": 162.50, "Ho": 164.93, "Er": 167.26,
             "Tm": 168.93, "Yb": 173.04, "Lu": 174.97, "Hf": 178.49,
             "Ta": 180.95, "W":  183.84, "Re": 186.21, "Os": 190.23,
             "Ir": 192.22, "Pt": 196.08, "Au": 196.08, "Hg": 200.59, 
             "Tl": 204.38, "Pb": 207.2,  "Bi": 208.98, "Po":  209.0,
             "At":  210.0, "Rn":  222.0, "Fr": 223.0,  "Ra":  226.0,
             "Ac":  227.0, "Th": 232.04, "Pa": 231.04, "U":  238.03,
             "Np": 237.0,  "Pu":  244.0, "Am":  243.0, "Cm":  247.0,
             "Bk": 247.0,  "Cf": 251.0,  "Es": 252.0,  "Fm":  257.0,
             "Md":  258.0, "No":  259.0, "Lr": 262.0,  "Rf": 261.0, 
             "Db": 262.0,  "Sg":  266.0, "Bh":  264.0, "Hs":  269.0, 
             "Mt": 268.0}

u = 1.66054000035e-27 # kg

Vi har nå definert en Pythonvariabel som heter `atommasse`. Dette er en variabeltype som heter en *dictionary*, eller ordbok på norsk. En ordbok-variabel fungerer ved at man gir en nøkkel for å komme frem til informasjonen vi er ute etter. Så her kan vi f.eks skrive `atommasse["C"]` for å finne atommassen til karbon, eller `atommasse["Fe"]` for å finne atommassen til jern.

La oss skrive en funksjon som skriver ut atommassen til et grunnstoff på ulike former:

In [2]:
def skriv_atommasse(grunnstoff):
    m = atommasse[grunnstoff]
    
    print(f"Grunnstoff: {grunnstoff}")
    print(f"{m} u per atom")
    print(f"{m*u:.2e} kg per atom")
    print(f"{m} g/mol.")
    print()

In [3]:
skriv_atommasse('H')
skriv_atommasse('O')
skriv_atommasse('C')
skriv_atommasse('Fe')

Grunnstoff: H
1.0079 u per atom
1.67e-27 kg per atom
1.0079 g/mol.

Grunnstoff: O
15.999 u per atom
2.66e-26 kg per atom
15.999 g/mol.

Grunnstoff: C
12.011 u per atom
1.99e-26 kg per atom
12.011 g/mol.

Grunnstoff: Fe
55.845 u per atom
9.27e-26 kg per atom
55.845 g/mol.



### Telle antall av hvert atom

Vi har nå en oversikt over alle atommassene, og vi har sett hvordan vi kan bruke denne oversikten til å skrive ut massen til et atom. Men hvordan gjør vi dette for et molekyl? Stopp gjerne og tenk over hvordan du gjør dette for hånd. Si f.eks at du trenger å vite molekylmassen til karbondioksid (CO$_2$), hvordan gjør du dette?

Svaret er at du først må finne antallet atomer av hvert grunnstoff som inngår i molekylet. Deretter kan du slå opp atommassen til hvert grunnstoff og legge sammen den totale massen av molekylet.

Når vi gjør dette for hånd ser vi at vi har ett karbonatom, og to oksygenatomer. Men hvordan kan vi skrive kode som klarer å finne ut det samme? La oss se litt nærmere på det.

#### Oppbygningen av en molekylformel

Når vi snakker om formelen for et molekyl vil vi i Python gi denne som en streng, f.eks har vi de følgende to molekylene:

In [4]:
karbondioksid = "CO2"
etanol = "CH3CH2OH"
silisiumoksid = "SiO2"

Disse svarer altså til CO$_2$, CH$_3$CH$_2$OH og SiO$_2$.

Å skrive kode som tolker disse molekylene handler om å bryte ned hva de ulike karakterene betyr. Dette er et godt eksempel på algoritmisk tankegang.

Enhver slik formel vil bestå av karakterer som kan deles inn i tre kategorier:
1. Store bokstaver
2. Små bokstaver
3. Tall

Ta gjerne en pause og tenk på hva hver av disse bokstavene betyr i praksis.

Enhver stor bokstav betyr starten på et nytt grunnstoff. Enhver liten bokstav betyr i praksis fortsettelse av et grunnstoff, og et tall betyr at man har flere av samme grunnstoff. 

Vi vil nå løkke over en slik formel og bryte den opp i mindre biter ved å tolke hvert tegn som en stor bokstav, liten bokstav eller et tall. Da definerer vi først hva disse er:

In [5]:
stor = "ABCDEFGHIJKLMNOPQRSTUWXYZ"
liten = "abcdefghijklmnopqrstuvwxyz"
tall = "0123456789"

Vi kan nå løkke over en formel og klassifisere hvert tegn:

In [6]:
for tegn in "SiO2":
    if tegn in stor:
        print(f"{tegn} er en stor bokstav")
    elif tegn in liten:
        print(f"{tegn} er en liten bokstav")
    else:
        print(f"{tegn} er et tall")

S er en stor bokstav
i er en liten bokstav
O er en stor bokstav
2 er et tall


Når vi nå løkker over en molekylformel vet vi at alle små bokstaver og tall vi møter på hører til den foregående store bokstaven. Slik kan vi dele opp en formel til de ulike grunnstoffene:

In [7]:
atom = ""
for tegn in "NaOH":
    if tegn in stor:
        if atom != "":
            print(atom)
        atom = tegn
    elif tegn in liten:
        atom += tegn
        
print(atom)

Na
O
H


I tilegg må vi også legge til antallet. Vi kan gjøre dette ved å ha en ny variabel, `antall`, som holder styr på alle tall som er møtt på. La oss sjekke om vi klarer å dele opp silisiumoksidformelen

In [8]:
atom = ""
antall = ""

for tegn in "SiO2":
    if tegn in stor:
        if atom != "":
            if antall == "":
                print(atom)
            else:
                print(f"{atom} (x{antall})")
            
        atom = tegn
        antall = ""
    
    elif tegn in liten:
        atom += tegn
    
    elif tegn in tall:
        antall += tegn
        
if antall == "":
    print(atom)
else:
    print(f"{atom} (x{antall})")

Si
O (x2)


Vi klarer altså å dele opp formelen. Vi kan nå lage en funksjon som regner ut molekylmassen. Da bruker vi samme fremgangsmåte som over, men istedet for å skrive ut hvert grunnstoff, så finner vi massen og legger den til en total:

In [9]:
def molekylmasse(molekylformel):
    totalmasse = 0
    
    atom = ""
    antall = ""
    for tegn in molekylformel:
        if tegn in stor:
            # Legg til forrige atom til totalen før vi fortsetter
            if atom != "":
                m = atommasse[atom]
                if antall == "":
                    n = 1
                else:
                    n = int(antall)
                totalmasse += n*m
                
            # Start på nytt atom
            atom = tegn
            antall = ""

        elif tegn in liten:
            atom += tegn
        
        elif tegn in tall:
            antall += tegn
    
    # Legg til siste atom
    m = atommasse[atom]
    if antall == "":
        n = 1
    else:
        n = int(antall)
    totalmasse += n*m
            
    return totalmasse

In [10]:
print(molekylmasse("H2O"))
print(molekylmasse("NH3"))
print(molekylmasse("CH3CH2OH"))

18.0148
17.0307
46.0684


Vi kan nå lage en litt finere funksjon, tilsvarende den vi lagde for atommassen innledningsvis:

In [11]:
def skriv_molekylmasse(molekylformel):
    m = molekylmasse(molekylformel)
    print(f"Molekyl: {molekylformel}")
    print(f"{m} u per molekyl")
    print(f"{m*u:.2e} kg per molekyl")
    print(f"{m} g/mol.")
    print()

In [12]:
skriv_molekylmasse("H2O") # Vann
skriv_molekylmasse("CO2") # Karbondioksid
skriv_molekylmasse("CH3CH2OH") # Etanol
skriv_molekylmasse("CH3COOH") # Eddiksyre

Molekyl: H2O
18.0148 u per molekyl
2.99e-26 kg per molekyl
18.0148 g/mol.

Molekyl: CO2
44.009 u per molekyl
7.31e-26 kg per molekyl
44.009 g/mol.

Molekyl: CH3CH2OH
46.0684 u per molekyl
7.65e-26 kg per molekyl
46.0684 g/mol.

Molekyl: CH3COOH
60.0516 u per molekyl
9.97e-26 kg per molekyl
60.0516 g/mol.

