# Introduktion till Python SEE060

Målet med den här notebooken är att ni ska få en introduktion till delar av Python och dess ekosystem som kommer vara användbara när ni arbetar med inlämningsuppgift 2: Utgående långvågig strålning (OLR).

Först och främst, det ni läser just nu är en så kallad [Jupyter Notebook](https://jupyter.org/).
Det är ett interaktivt dokument där det går att blanda text, bilder och kod-celler.
Dessa notebooks visas och redigeras oftast i ett program som heter JupyterLab.
JupyterLab kan köras på din egen dator eller på en server någonstans i världen, men oavsett används en webbläsare för att komma åt det grafiska gränssnittet (Det du tittar på nu).

Detta betyder att JupyterLab fungerar till mångt och mycket som vilket program som helst på din dator.
Skapar du till exempel en ny fil via `File` i menyraden ovan kommer det skapas en ny fil i mappen där du startade programmet.

Klickar du på mapp-symbolen (📁) i sidomenyn till vänster öppnas en panel som ger dig en överblick över vilka filer och mappar som finns i den nuvarande mappen.
Panelen fungerar som de flesta filhanterare: dubbelklicka för att öppna en mapp eller fil, enkelklicka för att markera, eller högerklicka för att öppna en meny för att kopiera osv.
Högerklickar du utan att ha markerat en fil eller mapp öppnas en meny där du kan skapa en ny fil, en ny notebook eller en ny mapp. För en genomgång av gränsnittet klicka på `Help -> Welcome Tour`

<div class="alert alert-block alert-warning">
<b>Varning: </b>I fallet att du följt länken på Canvas körs den här notebooken på något som heter <a href=https://mybinder.org/>MyBinder</a>, vilket innebär att JupyterLab körs på en server någonstans i molnet. Det är väldigt smidigt för att komma igång med Jupyter, men <b>ingenting sparas</b> och programmet stängs av efter en stunds inaktivitet.
Alltså måste du ladda ner filerna till din egen dator för att spara dem (Högerklicka på filen i filhanteraren -> Download)
</div>


JupyterLab är som sagt ett program för att visa och redigera Jupyter Notebooks.
För en första genomgång av notebooks, klicka på `Help -> Notebook Tour`.

En notebook består alltså av en samling celler, där cellen kan innehålla text (i form av [Markdown](https://www.markdownguide.org/cheat-sheet/), följ länken för ett cheat-sheet) eller exekverbar kod: Jupyter har stöd för många olika programmeringsspråk, men vi kommer att fokusera på Python.
Det här är en markdown-cell, dubbelklickar du på den ser du hur "koden" ser ut.
Trycker du på `Shift+Enter` på tangentbordet, eller play-knappen i menyn ovan exekveras cellen igen.

Nedan är ett exempel på en kod-cell med lite Python-kod.


In [None]:
print(f"Hello, World!")

## Variabler
Variabler i Python tilldelas med `=`:

In [None]:
# En sträng
a = "abc"

# Ett heltal (integer)
b = 1

# Ett flyttal (float)
c = 2.4

Celler känner till varandra, så en variabel eller funktion är tillgänglig i följande celler:

In [None]:
a

In [None]:
b + c

In [None]:
c**2

Sådant som inte är tillåtet eller fungerar returnerar ett felmeddelande:

In [None]:
a + b

In [None]:
d

<div class="alert alert-block alert-info">
<b>Info: </b>Förstår du felmeddelandena ovan?
</div>

## Strängar
Strängar i Python omges av enkla `'...'` eller dubble `"..."` citattecken.
De kan kombineras:

In [None]:
a = "hej"
b = "då"
a + b

Men man kan inte subtrahera strängar

In [None]:
a - b

Det går också att repetera strängar:

In [None]:
a * 3

En sträng är en sekvens av tecken.
Det möjliggör att vi kan välja ut enstaka (indexera) eller flera (slices) delar av strängen:

In [None]:
a = "En lite längre sträng"
# Första elementet
a[0]

In [None]:
# Sista elementet
a[-1]

In [None]:
a[4:8]

<div class="alert alert-block alert-success">
<b>Uppgift: </b>Vad händer om du försöker ta tecknet på plats 21? Lägg till en cell under denna och pröva. Det gör du enklast genom att markera denna cellen och klicka på <b>B</b> på tangentbordet.
</div>

## Listor
För mer generella sekvenser i Python finns listor.


In [None]:
a = [1, 2, 3, 4, 5, 6, 7, 8]
a

Precis som strängar kan dessa indexeras och sliceas:

In [None]:
a[0]

In [None]:
a[2:5]

In [None]:
a[5:]

Det är enkelt att iterera över sekvenser och utföra operationer på elementen:

In [None]:
for elem in a:
    print(elem**2)

Att manuellt skapa en lista för att iterera över nummer är inte så smidigt, istället finns den inbyggda funktionen `range`:

In [None]:
for i in range(8):
    print(i**2)

`range` accepterar flera parametrar, du kan se vilka de är genom att läsa funktionens signatur.
Den öppnas antingen automatisk medan du skrivit funktionen, eller så kan du trycka på `Shift + Tab`.

<div class="alert alert-block alert-success">
<b>Uppgift: </b>Skriv en loop i en ny cell under denna som skriver ut var tredje tal mellan 20 och 50.
<br>
<details>
<summary><em>Tips:</em></summary>
Läs igenom signaturen för range, antingen här eller med hjälp av valfri sökmotor.
</details>
</div>

## Funktioner
Du kan definiera egna funktioner som sedan är tillgängliga globalt: 

In [None]:
def min_funktion():
    print("Hello, World!")

In [None]:
min_funktion()

Variabler/data kan skickas

In [None]:
def min_funktion(namn, n_iterationer):
    for i in range(n_iterationer):
        print(f"Hej {namn}")

In [None]:
min_funktion("Pelle", 5)

<div class="alert alert-block alert-success">
    <b>Uppgift: </b>Någon fråga om funktioner, introducera return
</div>

## Bibliotek
I Pythons [standardbibliotek](https://docs.python.org/3.11/library/index.html) finns **moduler** med färdiga funktioner för diverse problem du kan stöta på.
En modul, eller funktion kan importeras med `import <modulnamn>`.
Detta är inte unikt för notebooks, utan fungerar likadant i vanliga script.

In [None]:
# Itertools har många funktioner för att snabbt skapa nya sekvenser
import itertools

In [None]:
deltagare = ["Pelle", "Saga", "Fatima", "Alex"]
matcher = []
for match in itertools.combinations(deltagare, 2):
    matcher.append(match)

In [None]:
matcher

Matematiska funktioner finns i modulen `math`:

In [None]:
import math

In [None]:
math.log(100)

In [None]:
math.pi

In [None]:
i = math.sqrt(4)

In [None]:
i

Du kan också enkelt skriva egna moduler och importera dessa.

<div class="alert alert-block alert-success">
    <b>Uppgift: </b> Skapa en ny fil min_modul.py genom filhanteraren till vänster.
    Öppna denna filen och skapa en funktion som beräknar volymen av en kub. Funktionen ska acceptera tre argument: width, height, depth.
    Lägg till några celler under, importera modulen och testa din funktion.
</div>

Men det som gör Python så populärt är det stora ekosystemet av tredjepartsbibliotek, skapade av användarna av Python.
Bilden nedan illustrerar ett exempel på populära bibliotek inom vad som refereras till som "scientific python".

<figure>
<img src="https://fabienmaussion.info/acinn_python_workshop/figures/scipy_ecosystem.png" alt="Python scientific ecosystem" width="600">
<figcaption>Credit: Fabien Maussion, Jake Vanderplas</figcaption>
</figure>

Ett externt bibliotek kan till exempel implementera effektiva algoritmer för maskininlärning, funktioner för statistiska beräkningar, eller sätt att skapa interaktiva figurer.
Vi kommer dock att fokusera på två av de mest grundläggande och användbara biblioteken: Numpy och Matplotlib

### Numpy
Pythons listor är väldigt flexibla, men för stora listor börjar Pythons kännas lite långsamt.
[Numpy](https://numpy.org/) skapades för att via Python få tillgång till prestandan hos programmeringsspråk som C.

Numpy introducerar en ny typ av sekvens: en n-dimensionella array (kallas ibland fält på Svenska) och en stor samling optimerade funktioner och metoder.
Nedan följer ett enkelt exempel för att visa skillnaderna mellan Python och Numpy:

Enligt konventionen importerar vi helt enkelt numpy och sätter namnet till `np`.

In [None]:
import numpy as np

In [None]:
n_elements = 10000000

In [None]:
%%timeit
vals = []
for i in range(n_elements):
   vals.append(i**2) 

In [None]:
%%timeit
vals_np = np.arange(n_elements) ** 2

Ovan använde vi funktion `np.arange` för att skapa en 1-dimensionell array med värden från 0 till `n_elements-1`, varefter vi kvadrerade värdena.
Som du ser är versionen med Numpy ~90x snabbare.

<div class="alert alert-block alert-success">
    <b>Uppgift: </b> Ändra värdet på n_elemets och kör om cellerna ovan. Är Numpy alltid snabbare?
</div>

#### Initiera Arrays
Här kommer några exempel på hur man kan initiera arrays.

Endast nollor (tomma):

In [None]:
# Endimensionell array med 50 nollor.
np.zeros(50)

In [None]:
# Tväimensionell array med 5 rader och 10 columner.
np.zeros((5, 10))

Uppräkning:

In [None]:
# Nummer mellan start och stop
np.arange(10, 50)

In [None]:
# Kan specifiera storleken på steget
np.arange(50, 10, -5)

In [None]:
# Jämnt fördelade nummer mellan start och stop
np.linspace(10, 50)

In [None]:
# Bestäm hur många nummer som ska ingå i intervallet.
np.linspace(10, 50, 10)

<div class="alert alert-block alert-success">
    <b>Uppgift: </b> I en ny cell under denna, skapa en array med dimensionerna 5x5x3, fylld med 5.
    <br>
    <details>
        <summary>
        <em>Tips:</em>
        </summary>
        Kolla hur vi gjorde för att kvadrera talen loop-exemplet.
    </details>
</div>

Slumptal:

In [None]:
rng = np.random.default_rng()

In [None]:
# Slumtal mellan 1 och 6
rng.integers(1, 7)

In [None]:
# 5 sumptal mellan 1 och 6
rng.integers(1, 7, size=5)

#### Array attribut och metoder

En array har också en samling attribut och metoder.
Attribut är information som till exempel storlek och viken datatyp den innehåller.
Metoder är inbyggda funktioner som utför någon typ av beräkning.

In [None]:
# Här skapar vi en array med 10 rader och 10 kolumner, fylld med slumptal mellan 0 och 1.
a = rng.random(size=(10, 5))

Storlek och datatyp:

In [None]:
a.shape

In [None]:
a.dtype

Exempel på metoder:

In [None]:
# Minsta värdet.
a.min()

In [None]:
# Minsta värdet, per kolumn.
a.min(axis=0)

In [None]:
# Medelvärdet, per rad
a.mean(axis=1)

In [None]:
# Totala summan
a.sum()

Det går också att omforma en array med `.reshape()`

In [None]:
# Vi vill ha 2 rader istället. -1 indikerar att metoden ska bestämma automatiskt hur många kolumner som behövs
b = a.reshape((2, -1))

In [None]:
b.shape

<div class="alert alert-block alert-info">
<b>Info: </b> Kom ihåg att du alltid kan läsa signaturen för en metod Shift+Tab, precis som för en funktion.
</div>

#### Operationer
Matematiska operationer utförs per element 

In [None]:
a = np.zeros((5, 5)) + 5

In [None]:
a + a

In [None]:
a / a

In [None]:
a * a

#### Broadcasting
När vi I ett tidigare exempel multiplicerade vi en array med ett värde resulterade de i att alla värden ändrades.
Hur vet Numpy om att vi ville att alla värden skulle ändras?
I Numpy kallas detta för **broadcasting**.

Broadcasting gör det möjligt att utföra operationer mellan två arrays av olika storlek.
**Men**, storleken (eller formen) på de två array-objekten måste vara kompatibla.
Specifikt innebär detta att storleken ska vara samma, eller att en av dimensionerna ska vara lika med ett.


<figure>
<img src="./media/broadcasting.svg" width="500">
</figure>

<div class="alert alert-block alert-success">
    <b>Uppgift: </b> Skapa en array med värdena 1 till 5, och formen (5, 1) och multiplicera med a. Lägg till så många nya celler du behöver.
</div>

#### Indexering och fler funktioner 
Likt listorna vi tittade på tidigare kan vi indexera arrays

In [None]:
# Väljer ut en rad
a[4]

In [None]:
# Väljer ut en kolumn
a[:,2]

In [None]:
# Väljer ut ett specifikt värde
a[1,2]

Det går också att kombinera enskilda index med "slicing".
Nedan väljer vi ut andra och tredje raden, fjärde kolumnen

In [None]:
# Notera att en slice inte inkluderar den övre gränsen.
a[1:3, 3]

Det går att ändra värden i en array genom indexering:

In [None]:
a[2, 2] = 99

In [None]:
a

<div class="alert alert-block alert-success">
   <b>Uppgift: </b>Ändra alla värden i tredje kolumnen till 99 med hjälp av en slice.
</div>

### Matplotlib