# NumPy

Pythons listor är väldigt flexibla, men för stora listor börjar Python kännas lite långsamt.
[NumPy](https://numpy.org/) skapades för att via Python få tillgång till prestandan hos kompilerade programmeringsspråk som C och Fortran.

NumPy introducerar en ny typ av sekvens: en n-dimensionell array (kallas ibland fält på svenska) och en stor samling optimerade funktioner och metoder som utför beräkningar på arrays.
Nedan följer ett enkelt exempel för att visa skillnaderna mellan Python och NumPy.

Enligt konventionen importerar vi helt enkelt NumPy och sätter namnet till `np`.

In [None]:
import numpy as np

In [None]:
n_elements = 10000000

<div class="alert alert-block alert-info">
<b>Info: </b>Kod-cellerna nedan tar en stund att köra klart.
</div>

In [None]:
%%timeit
vals = []
for i in range(n_elements):
    vals.append(i**2)

In [None]:
%%timeit
vals_np = np.arange(n_elements) ** 2

Ovan skapade vi en 1-dimensionell lista/array med värden från 0 till `n_elements-1`, varefter vi kvadrerade värdena.
Som du ser är versionen med NumPy ~90x snabbare.

<div class="alert alert-block alert-success">
    <b>Uppgift: </b> Ändra värdet på n_elemets och kör om cellerna ovan. Är NumPy alltid snabbare?
</div>

## Initiera arrays

Här kommer några exempel på hur man kan initiera arrays.

En array fylld med nollor:

In [None]:
# Endimensionell array med 50 nollor
np.zeros(50)

In [None]:
# Tvådimensionell array med 5 rader och 10 columner
np.zeros((5, 10))

Uppräkning:

In [None]:
# Nummer från start upp till (men ej inkluderat) stopp
np.arange(10, 50)

In [None]:
# Kan specifiera storleken på steget
np.arange(50, 10, -5)

In [None]:
# 50 st. jämnt fördelade nummer mellan start (1) och stopp (99)
np.linspace(1, 99)

In [None]:
# Bestäm hur många nummer som ska ingå i intervallet
np.linspace(1, 99, 10)

<div class="alert alert-block alert-success">
    <b>Uppgift: </b> I en ny cell under denna, skapa en array med dimensionerna 5x5x3, fylld med 5.
</div>

Slumptal:

In [None]:
# Först måste vi initiera en slumptalsgenerator
rng = np.random.default_rng()

In [None]:
# Slumptal mellan 1 och 6 (testa att köra om cellen med Ctrl+Enter)
rng.integers(1, 7)

In [None]:
# 5 slumptal mellan 1 och 6
rng.integers(1, 7, size=5)

In [None]:
# 25 slumptal mellan 1 och 6, i en 5x5 array
rng.integers(1, 7, size=(5, 5))

## Array attribut och metoder

En array har också en samling attribut och metoder.
Attribut är information som till exempel storlek och viken datatyp den innehåller, medan metoder är inbyggda funktioner som utför någon typ av beräkning.

In [None]:
# Här skapar vi en array med 10 rader och 5 kolumner, fylld med slumptal mellan 0 och 1
a = rng.random(size=(10, 5))

Storlek och datatyp:

In [None]:
a.shape

In [None]:
a.dtype

Metoder är funktioner som "tillhör" ett visst objekt, t.ex. en NumPy array.
Precis som funktioner behöver de kallas med `()`.
Om du glömmer parenteserna kommer du få själva metoden:

In [None]:
a.min

I det här fallet ville vi räkna ut det minsta värdet, inte komma åt `<function ndarary.min>`
(i vissa fall kan det vara användbart att behandla metoder och funktioner som objekt, men det är överkurs här).

Alltså behöver vi kalla på `min`-metoden som tillhör `a`:

In [None]:
# Minsta värdet i a
a.min()

Andra användbara metoder för arrays:

In [None]:
# Minsta värdet, per kolumn
a.min(axis=0)

In [None]:
# Medelvärdet, per rad
a.mean(axis=1)

In [None]:
# Totala summan
a.sum()

Det går också att omforma en array med `.reshape()`

In [None]:
# Här säger vi att vi vill ha 2 rader istället. -1 indikerar att metoden ska bestämma automatiskt hur många kolumner som behövs
b = a.reshape((2, -1))

In [None]:
b.shape

<div class="alert alert-block alert-info">
<b>Info: </b> Kom ihåg att du alltid kan läsa signaturen för en metod med <tt>Shift+Tab</tt>, precis som för en funktion.
</div>

## Operationer

Matematiska operationer utförs per element.

In [None]:
a = np.zeros((5, 5)) + 5

In [None]:
a + a

In [None]:
a / a

In [None]:
a * a

Notera alltså att `*` multiplicerar elementvis, och att det alltså **inte** är en matrismultiplikation som i t.ex. MATLAB.
Matrismultiplikation kan utföras med `@` för NumPy arrays:

In [None]:
a = np.array([[1, 2],
              [3, 4]])
a @ a

## Broadcasting
När vi i ett tidigare exempel multiplicerade en array med ett värde resulterade det i att alla värden ändrades.
Hur vet NumPy om att vi ville att alla värden skulle ändras?
I NumPy kallas detta för **broadcasting**.

Broadcasting gör det möjligt att utföra operationer mellan två arrays av olika storlek.
**Men**, storleken (eller formen) på de två array-objekten måste vara kompatibla.
Specifikt innebär detta att alla dimensionen ska vara samma, eller att en av dimensionerna ska vara lika med ett.


<figure>
<img src="./media/broadcasting.svg" width="500">
</figure>

<div class="alert alert-block alert-success">
    <b>Uppgift: </b> Skapa en array med värdena 1 till 5, och formen (5, 1) och multiplicera med arrayen <tt>a</tt> från tidigare.
    Lägg till så många nya celler du behöver.
</div>

## Indexering och fler funktioner 
Likt listorna vi tittade på tidigare kan vi indexera arrays för att välja ut värden.

<div class="alert alert-block alert-info">
    <b>Info: </b> En NumPy array, och sekvenser i Python, är noll-indexerade.
    Det betyder att det första värdet ligger på plats 0 i ordningen.
</div>

In [None]:
# Här skapar vi en array med värden 1 till 25, ordnade i 5 rader och 5 kolumner
a = np.arange(1, 26).reshape((5, 5))

In [None]:
a

In [None]:
# Välj ut en rad
a[4]

In [None]:
# Välj ut alla rader, och en kolumn
a[:, 2]

In [None]:
# Välj ut ett specifikt värde
a[1, 2]

Det går också att kombinera enskilda index med "slicing".
Nedan väljer vi ut andra och tredje raden, fjärde kolumnen.

In [None]:
# Notera att en slice inte inkluderar den övre gränsen
a[1:3, 3]

Det går att ändra värden i en array genom indexering:

In [None]:
a[2, 2] = 99

In [None]:
a

<div class="alert alert-block alert-success">
   <b>Uppgift: </b>Ändra alla värden i tredje kolumnen av <tt>a</tt> till 99 med hjälp av en slice.
</div>

NumPy har också en uppsjö funktioner designade för bland annat matematiska operationer, linjär algebra, statistik, och för att söka och sortera data.
Några exempel:
- `np.sin`: Beräkna sinus över en array.
- `np.quantile`: Beräkna en, eller flera, kvantiler baserat på värdena i en array.
- `np.trapz`: Numerisk integrering av en array. **Kommer till användning i Inlämningsuppgift 2!**
- `np.where`: Kombinera värden från två arrays givet ett villkor.

För alla funktioner tillgängliga i NumPy, se [dokumentationen](https://numpy.org/doc/stable/reference/routines.html).

## Nästa steg

I nästa del ska vi kika på hur vi kan visualisera data med Matplotlib.

<div style="width: 100%;">
    <div style="float: left"> 
        <a href="04_bibliotek.ipynb">« Föregående (Bibliotek)</a>         
    </div>
    <div style="text-align: right"> 
        <a href="06_matplotlib.ipynb">Nästa (Matplotlib) »</a>
    </div>
</div>