### Klasser och objekt
Klasser och objekt är en viktig del i så kallad objekt-orienterad programmering. Det är dock så fundamentalt att det är i princip omöjligt att täcka i en så här liten kurs.

#### Vad är en klass?
Enklast uttryckt är en klass en mall för behållare. Behållarna är objekt, som kan innehålla egna variabler och funktioner.
Klassen definierar vilka typer av funktioner och variabler de får innehålla.

Klasser är ritningar för hur objekt skall skapas.

#### Vad är ett objekt?
Ett objekt är en så kallad *instans* av en klass. Objekt förhåller sig till klasser så som hus förhåller sig till ritningar. Objekt kan innehålla attribut (e.g. antal dörrar i ett hus, antal våningar) men också funktioner (hus.öppna_dörr, hus.stäng_dörr). Vi kan också exemplifiera med en bil:

In [15]:
class Bil:
    
    # Skapar två klassvariabler
    antal_hjul   = 4
    antal_dörrar = 4
    
    def __init__(self, färg, antal_dörrar):
        
        # Skapar en instansvariabel
        self.färg = färg
        
        # Skriver över klassvariabeln med ett specifikt antal dörrar för denna bilen.
        self.antal_dörrar = antal_dörrar
        
    def accelerera(self):
        pass
    
    def bromsa(self):
        pass
        

### Skrivning av filer
En viktig del av programmering är så kallad I/O, eller input/output av information till och från datorn. Ett exempel på output är funktionen ``print`` som vi är väl bekanta med nu, som ju skriver till skärmen. Ett exempel på input är koden vi skriver till datorn i cellerna.

Det är dock vanligt att I/O inbegriper filer: Att man har data samlat i exempelvis text- eller Excel-filer man vill läsa av programmatiskt.

#### Öppna och stäng filer
Filer i programmeringsspråk måste *öppnas* och *stängas*. Filer öppnas med den inbyggda funktionen [open](https://docs.python.org/3/library/functions.html#open). Detta returnerar ett fil-objekt, som har inbyggda funktioner för att läsa, stänga och modifiera filen. ``open(path, mode)`` har ett argument ``mode`` specificerar exempelvis om filen skall läsas eller skrivas till.

- ``'r'``: "read", läsning av filer
- ``'w'``: "write", skrivning till filer

Ett filobjekt ``file`` som öppnats i läsläge har den inbyggda funktionen ``file.read()`` som läser vanlig text till en sträng.

In [5]:
# Ladda en text-fil till ett fil-objekt
f = open('example_file.txt', mode='r')

# Använd den inbyggda funktionen .read() hos fil-objektet
text_in_file = f.read()

# Stäng filen
f.close()

print(text_in_file)

Fackelfester i forntidshallar.
Det spillda vinet ångar.
Ur det slocknade skenet glimmar
kungars pannband.
Flackande skuggor slickar
unga lemmar i klirrande rassel:
dans i smycken; dans i vapen.
Druckna skymningar faller och faller,
brinner, tätnar,
sväller och slukar,
kramar glimmet, dränker minnet,
borrar:
hetare, blindare, tätare,
bort i törstiga mörker en glödrubin.


#### Utnyttja scopes med nyckelordet *with*
Att glömma stänga filer innebär att man kan råka modifiera en file senare, eller att man öppnar den med pekaren mitt i texten. Nyckelordet ``with`` tillåter en definiera variabler (exempelvis en fil-variabel) inom ett begränsat scope. Då stängs filen automatiskt.

In [8]:
with open('example_file.txt', mode='r') as f:
    text_in_file = f.read()
    
# print(text_in_file)

**OBS!**

Den inbyggda funktionen ``.read()`` kräver att din text-fil är fri från formattering (kursiv text, listor, tabeller et c.). Filformat som .doc, .docx som används av Microsoft Word har gömd formattering för att det ska se snyggt ut. Dessa kan alltså inte läsas av pythons inbyggda funktioner.

Men som vi skall se finns det externa bibliotek som möjliggör läsning av ex.-vis .docx.

In [10]:
# Testa att läsa en word-fil
with open('word_example.docx', mode='r') as f:
    
    # Funktionen skickar ett felmeddelande, då den hittat formatterings-karaktärer
    # som inte är unicode.
    word_text = f.read()

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x91 in position 15: invalid start byte

Vi kan också testa att läsa en .csv-fil eller Excel-fil med den inbyggda funktionen. Excel-filen fungerar inte, eftersom den har gömd formattering för att se bra ut i Office-paketet.

In [14]:
# Testa att läsa en Excel-fil
with open('löner.xlsx', mode='r') as f:
    
    # Funktionen skickar ett felmeddelande, då den hittat formatterings-karaktärer
    # som inte är unicode.
    excel_text = f.read()

UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 15-16: invalid continuation byte

Däremot fungerar .csv-filen, som ju bara är (semikolon)-separerad text. Problemet är ju dock att innehållet nu är en textsträng, vilket gjort att vi mist all funktionalitet i ett kalkylblad.

In [16]:
with open('löner.csv', mode='r') as f:
    
    # Funktionen skickar ett felmeddelande, då den hittat formatterings-karaktärer
    # som inte är unicode.
    csv_text = f.read()
    
print(csv_text)

First name;Last name;Salary
Klara;Rosgren;38000
Elin;B:son;40000
Niklas;Lindquist;15000
Abbe;Karlsson;40000
Carola;Hagman;75000



### Paket
Problemet med att läsa Excel-, CSV- och Word-dokument har lett oss till sista ämnet i kursen, och den stora styrkan med programmering: Färdiga paket.

Den mesta funktionaliteten ni saknar medan ni programmerar har redan implementerats som ett paket som ni kan importera och använda i er kod. Vi ska här exemplifiera med några passande paket för läsning av text, kalkylark, samt visualisering.

Vi börjar med ett någorlunda okänt paket som löser vårt problem med att läsa .xlsx och .csv-filer, nämligen [pandas](https://pandas.pydata.org/). Vi måste först installera paketet. Det sköts oftast i python med en så kallad *pakethanterare*, vid namn **pip**. I Jupyter Notebook skriver vi så här:

In [2]:
%pip install pandas

Note: you may need to restart the kernel to use updated packages.


Varpå paketet kan importeras med uttrycket ``import pandas as pd``, och vi kan använda dess inbyggda funktioner ``.read_excel()`` och ``.read_csv()``.

In [3]:
import pandas as pd
pd.read_excel('löner.xlsx')


Unnamed: 0,First name,Last name,Salary
0,Klara,Rosgren,38000
1,Elin,B:son,40000
2,Niklas,Lindquist,15000
3,Abbe,Karlsson,40000
4,Carola,Hagman,75000


In [7]:
# Observera att man måste specificera vad datan separeras av, exempelvis komma ',' eller semikolon ';'
pd.read_csv('löner.csv', delimiter=';')


Unnamed: 0,First name,Last name,Salary
0,Klara,Rosgren,38000
1,Elin,B:son,40000
2,Niklas,Lindquist,15000
3,Abbe,Karlsson,40000
4,Carola,Hagman,75000


Pandas returnerar ett objekt, som vanligen kallas *DataFrame*, vilket motsvarar ett blad i ett kalkylark. Detta kan indexeras som en lista eller dictionary, med kolumnnamn.

Kolumnen returneras som en typ av lista, som indexeras på vanligt vis.

In [13]:
df = pd.read_excel('löner.xlsx')
print(df['First name'])

0     Klara
1      Elin
2    Niklas
3      Abbe
4    Carola
Name: First name, dtype: object


In [14]:
print(df["First name"][0])

Klara
