# NumPy

NumPy je knjižnica, ki omogoča delo z večdimenzionalnimi polji (array) in matrikami ter vključuje veliko zbirko matematičnih funkcij za delo s temi podatkovnimi strukturami.

Vir slik: Alammar, J (2018). The Illustrated Transformer (https://jalammar.github.io/illustrated-transformer/)

In [None]:
# Uvozimo knjižnico NumPy
import numpy as np

## Vektorji

Eno dimenzionalni [`ndarray`](https://numpy.org/doc/stable/reference/arrays.ndarray.html) ustvarimo z `np.array(seznam)`.

![create-numpy-array-1.png](attachment:create-numpy-array-1.png)

In [None]:
# Eno dimenzionalni array
x = np.array([1,2,3])
print(x)

Z `np.arange(i, j, korak)` ustvarimo vektor zaporednih vrednosti od `i` do (izključujoče) `j` s `korak`. Argumenta `i` in `korak` sta neobvezna s privzetima vrednostma `i=0` in `korak=1`. Deluje podobno kot `range()`, le da vrne `ndarray`.

In [None]:
# Vektor od 0 do (izključujoče) 10 s korakom 1, torej [0,10)
od09 = np.arange(0, 10) 
print(f"\nVektor ceih števil od 0 do 9:\n{od09}")

# Vektor stevilo od 5 do (izključujoče) 11  s korakom 0.5 , torej [5,11)
od511 = np.arange(5, 11, 0.5) 
print(f"\nVektor število od 5 do 10 s korakom 0.5:\n{od511}")

Z `np.zeros(n, dtype)` in `np.ones(n, dtype)` ustavrimo vektor dolžine `n`
tipa `dtype` ničel oz. enic. Argument `dtype` je neobvezen in ima privzeto vrednost `float`


Pogosto ju bomo uporabili za inicializacijo pomnilnika pred shranjevanjem dejanskih vrednosti, saj je to učinkovitejše.

![create-numpy-array-ones-zeros-random.png](attachment:create-numpy-array-ones-zeros-random.png)

In [None]:
# Vektor ničel
nicle = np.zeros(5)
print(f"Vektor ničel:\n{nicle}")

# Vektor  enic
enice = np.ones(6, int)
print(f"\nVektor celoštevilških enic:\n{enice}")

# Vektor enic
enice = np.ones(6)
print(f"\nVektor realnih enic:\n{enice}")

# Vektor celostevilških enic
enice = np.ones(6, str)
print(f"\nVektor črk enic:\n{enice}")

### Primerjava med sprotnim dodajanjem in predhodno inicializacijo

Sprotno dodajanje z `np.append()` je počasno. Bolje je vnaprejšna inicializacija pomnilnik.

In [None]:
from timeit import timeit

In [None]:
def test_append_numpy():
    x = np.empty(0)
    for i in range(100000):
        x = np.append(x, i)
    return x

def test_preallocated_numpy():
    x = np.zeros(100000, dtype=int)
    for i in range(100000):
        x[i] = i
    return x

print("Primerjava:\n" + "="*30)
cas_append_numpy = timeit(test_append_numpy, number=1)
cas_prealloc_numpy = timeit(test_preallocated_numpy, number=1)
print(f"Sprotno dodajanje: {cas_append_numpy:.4f} sekund")
print(f"Vnaprejšnja alokacija: {cas_prealloc_numpy:.4f} sekund")

### Osnovne operacije na vektorjih

![numpy-arrays-example-1.png](attachment:numpy-arrays-example-1.png)

In [None]:
data = np.array([1,2])
ones = np.ones(2)

Seštevamo po komponentah z `+`.

![numpy-arrays-adding-1.png](attachment:numpy-arrays-adding-1.png)

In [None]:
x = data + ones
print(x)

Tudi ostale operacije `-`,`*`,`/` se izvajajo po komponentah.

![numpy-array-subtract-multiply-divide.png](attachment:numpy-array-subtract-multiply-divide.png)

In [None]:
x = data - ones
print(x)

In [None]:
x = data * data
print(x)

In [None]:
x = data / data
print(x)

Množenje s skalarjem.

![numpy-array-broadcast.png](attachment:numpy-array-broadcast.png)

In [None]:
x = data * 1.6
print(x)

Tudi potenciranje in klicanje funkcij na vektorju se izvajajo po komponentah.

In [None]:
x = data ** 2
print(x)

In [None]:
x = np.sqrt(data)
print(x)

In [None]:
x = np.exp(data)
print(x)

In [None]:
x = np.log(data)
print(x)

### Skalarni produkt $\vec{a} \cdot \vec{b}$ in vektorski produkt $\vec{a} \times \vec{b}$.

In [None]:
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
print(f"Vektorja\na = {a}\nb = {b}")

Za $\vec{a}, \vec{b} \in \mathbb{R}^n$ je njun skalarni produkt
$$
    \vec{a} \cdot \vec{b} = \sum_i^n a_i b_i.
$$

In [None]:
x = np.dot(a, b)
print(x)

Za $\vec{a}, \vec{b} \in \mathbb{R}^3$ je njun vektorski produkt
$$
    \vec{a} \times \vec{b} = [a_2 b_3 - a_3 b_2, \; a_3 b_1 - a_1 b_3, \; a_1 b_2 - a_2 b_1].
$$

In [None]:
x = np.cross(a,b)
print(x)

### Statistike vektorjev

Znamo agregiratioz oz. izračunati statistiko vektorjev

In [None]:
print("Vsota elementov:", np.sum(a))
print("Povprečje:", np.mean(a))
print("Minimum:", np.min(a))
print("Maksimum:", np.max(a))
print("Povprečje:", np.mean(a))
print("Mediana:", np.median(a))
print("Standardni odklon:", np.std(a))

### Rezanje vektorja

Povsem enako kot pri seznamih.

![numpy-array-slice.png](attachment:numpy-array-slice.png)

## Matrike

Vektor je $1$-dimenzionalni [`ndarray`](https://numpy.org/doc/stable/reference/arrays.ndarray.html), matrika pa $2$-dimenzionalni. Ustvarimo jo z `np.array(gnezden_seznam)`

![numpy-array-create-2d.png](attachment:numpy-array-create-2d.png)

In [None]:
matrika = np.array([[1,2], [3,4]])

# Bolj očitni zapis
matrika = np.array(
    [
        [1,2], 
        [3,4]
    ]
)

print(f"Matrika:\n{matrika}")
print(f"\nTransponirana matrika:\n{matrika.T}",)
print("\nDiagonalni elementi:", np.diag(matrika))

Podobno uporabimo `np.zeros(shape, dtype)` in `np.ones(shape, dtype)`, le da tokrat za shape podamo dvojico `(i, j)`, ki opisuje dimenzije matrike (vrstice × stolpci).

![numpy-matrix-ones-zeros-random.png](attachment:numpy-matrix-ones-zeros-random.png)

In [None]:
enice = np.ones((3,2))
nicle = np.zeros((3,2))

print(f"Matrika enic:\n{enice}")
print(f"\nMatrika ničel:\n{nicle}")

### Rezanje matrike

Sintaksa je `matrika[vrstice, stolpci]`, kjer uporabimo enako rezanje kot pri seznamih, torej  `vrstice` je oblike $i_1:j_1:k_1$ in stolpci je oblike $i_2:j_2:k_2$.

![numpy-matrix-indexing.png](attachment:numpy-matrix-indexing.png)

In [None]:
data = np.array([[1,2], [3,4], [5,6]])

print("Element v prvi vrstici in drugem stolpcu: ", data[0,1])
print(f"\nElementi v drugi in tretji vrstici (in vseh stolpcih):\n{data[1:3,]}")
print(f"\nElementi v prvi in drugi vrstici in prvem stolpcu):\n{data[0:2,0]}")

Elemente v kateri vrstici in katerem stolpcu vrne sledeče rezanje matrike?

In [None]:
data = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12], [13,14,15,16]])
print(data)

In [None]:
x = data[1:3, 1:3]
print(x)

In [None]:
x = data[:3, 2:]
print(x)

### Posplošitev matrik

Z razlogom ga imenujemo n-dimenzionalni array, saj ima lahko poljubno število dimenzij. Če smo pri matriki za argument podali dvojno gnezden seznam, tokrat podamo trojno gnezdeni seznam.

![numpy-3d-array.png](attachment:numpy-3d-array.png)

In [None]:
data = np.array([[[1,2], [3,4]], [[5,6], [7,8]]])


# Lahko tudi
data = np.array(
    [
        [[1,2],
         [3,4]], 
         
        [[5,6],
         [7,8]]
    ]
)

print(data)

Podobno uporabimo `np.zeros(shape, dtype)` in `np.ones(shape, dtype)` le da tokrat za shape podamo trojico `(k.i,j)`, ki ustvari $k$ matrik dimenzije $(i,j)$.

![numpy-3d-array-creation.png](attachment:numpy-3d-array-creation.png)
Opomba: Slika napačno opiše vrstni red. Pravilno je $(2,4,3)$ in ne $(4,3,2)$.

In [None]:
enice = np.ones((2,4,3))
nicle = np.zeros((2,4,3))

print(f"3d-array enic:\n{enice}")
print(f"\n3d-array ničel:\n{nicle}")

#### Kje pridejo 3-dimenzionalni array v upoštev?

Črno-bela slika je podana kot matrika, kjer vsak element predstavlja svetlost piksla.
![numpy-grayscale-image.png](attachment:numpy-grayscale-image.png)

Barvna slika je $3$-dimenzionalni array, kjer ima vsak piksel tri vrednosti (RGB - rdeča, zelena, modra).![numpy-color-image.png](attachment:numpy-color-image.png)

### Statistike matrike

![numpy-matrix-aggregation-1.png](attachment:numpy-matrix-aggregation-1.png)

In [None]:
data = np.array([[1,2], [3,4], [5,6]])
print(data)

In [None]:
print("Vsota elementov:", np.sum(data))
print("Povprečje:", np.mean(data))
print("Minimum:", np.min(data))
print("Maksimum:", np.max(data))
print("Povprečje:", np.mean(data))
print("Mediana:", np.median(data))
print("Standardni odklon:", np.std(data))

Pri matrikah lahko agregiramo po vrsticah ali stolpcih z argumentom axis. Z `axis=0` agregiramo po stolpcih z `axis=1` pa po vrsticah.

![numpy-matrix-aggregation-4-2.png](attachment:numpy-matrix-aggregation-4-2.png)

In [None]:
data = np.array([[1,2], [5,3], [4,6]])
print(data)

In [None]:
x = data.max(axis=0)
print(x)

In [None]:
x = data.max(axis=1)
print(x)

## Za danes je uporabno vedeti

### Ustvarjanje array-ev
* `np.array(seznam)` ustvari vektor iz seznama.
* `np.zeros(n, dtype)` ustvari vektor ničel dolžine `n`.
* `np.ones(n, dtype)` ustvari vektor enic dolžine `n`.
* `np.arange(i, j, korak)` ustvari vektor zaporednih vrednosti od `i` do (izključujoče) `j` s `korak`.
* `np.linspace(a, b, n)` ustvari vektor `n` ekvidistančnih točk na $[a,b]$.

### Operacije na vektorjih
* Aritmetične operacije (`+`, `-`, `*`, `/`, `**`) in funkcije
(`np.sqrt(arr)`, `np.exp(arr)`, `np.log(arr)`) delujejo po komponentah.
* `np.dot(a, b)` je skalarni produkt .
* `np.cross(a, b)` je vektorski produkt.

### Agregacijske funkcije po vektorjih
* `arr.sum()`, `arr.mean()`, `arr.min()`, `arr.max()`.

### Matrike
* `np.array(gnezden_seznam)` ustvari matriko iz gnezdenega seznama.
* `matrika.T` transponira matriko.
* `np.diag(matrika)` vrne diagonalne elemente matrike.

### Agregacijske funkcije po matrikah

* `matrika.min()` agregira po celotni matriki.
* `matrika.min(axis=0)` agregira vzdolž stolpcev matrike. Rezultat je ena vrednost na stolpec
* `matrika.min(axis=1)` agregira vzdolž vrstic matrike. Rezultat je ena vrednost na vrstico.

### Rezanje 
* Vektoje režemo z sintakso`arr[i:j:k]`.
* `matrika[vrstice, stolpci]`, kjer so `vrstici` in `stolpci` oblike $i:j:k$.