![numpy.jpeg](http://torus.uck.pk.edu.pl/~amarsz/images/numpy.jpeg)
__`Numpy`__ jest biblioteką Pythona (_Python C extension library_) stanowiącą podstawę obliczeń naukowych w Pythonie. Jako biblioteka dostarcza listę funkcjonalności użytecznych w takich zagadnieniach jak:
- algebra linionwa,
- transformacje Fouriera,
- generowanie liczb losowych,
- oraz wszystkie potrzebne do operowania na wielowymiarowych tablicach (wektorach, macierzach, itp.), które to są podstawowymi obiektami w `Numpy`.

- `NumPy` stanowi darmową alternatywę dla MATLAB-a.
- `NumPy` jest podstawą wielu innych bibliotek naukowych wchodzących w skład tzw. _Python scientific stack_.
![numpy_eco.jpg](http://torus.uck.pk.edu.pl/~amarsz/images/numpy_eco.jpg)

### Obiekt `array`
- Najważniejszym elementem, na którym bazuje pakiet `Numpy` i szereg pakietów z niego korzystających jest klasa `ndarray` wprowadzająca obiekty `array`.
- Obiekty `array` możemy traktować jako uniwersalne pojemniki na dane w postaci tablic wielowymiarowych (czyli wektorów, macierzy, tensorów).
- W porównaniu ze standardowymi typami sekwencji Pythonowych (lista, krotka) jest kilka różnic w operowaniu tymi obiektami:
    - obiekty przechowywane w macierzy `array` muszą być tego samego typu,
    - obiekty `array` zachowują swój rozmiar; przy zmianie rozmiaru takiego obiektu powstaje nowy obiekt, a obiekt sprzed zmiany zostaje usunięty,
    - obiekty `array` wyposażone są w bogaty zestaw funkcji operujących na wszystkich przechowywanych w obiekcie danych, specjalnie optymalizowanych do przetwarzania dużych ilości danych.

#### Tworzenie obiektu `array`
Najprostszym sposobem stworzenia obiektu `array` jest wywołanie dostępnej w bibliotece funkcji `array()` z argumentem w postaci listy liczb. Jeśli zamiast listy liczb użyjemy listy zawierającej inne listy (tzw. listy zagnieżdżone), to otrzymamy macierz wielowymiarową. Np. jeśli listy są podwójnie zagnieżdzone, to otrzymujemy macierz dwuwymiarową.

In [None]:
# import biblioteki numpy
import numpy as np

In [None]:
# tablica jednowymiarowa (wektor)
a = np.array([1,3,4,5,8])
a

In [None]:
# tablica dwuwymiarowa (macierz)
b = np.array([[1, 2, 3], [4, 5, 6]])
print(b)
type(b)

#### Atrybut `shape`
Każdy obiekt `array` ma swój kształt, informacja o nim przechowywana jest w atrybucie `shape`.

- Tablica jedno-wymiarowa:
![shape1.png](http://torus.uck.pk.edu.pl/~amarsz/images/shape1.png)

In [None]:
a = np.array([1,3,4,5,8])
print(a)
a.shape  # zwaraca krotkę  

- Tablica dwu-wymiarowa
![shape2.png](http://torus.uck.pk.edu.pl/~amarsz/images/shape2.png)

In [None]:
b = np.array([[1, 2, 3], [4, 5, 6]])
print(b)
b.shape

- 3 wymiary i więcej:
![shape3.png](http://torus.uck.pk.edu.pl/~amarsz/images/shape3.png)

In [None]:
c = np.array([[[1, 2], [2, 3], [3, 1]], [[4, 1], [5, 1], [6, 1]]])
print(c)
c.shape

#### Typy danych w obiektach `array`
Wewnątrz jednej tablicy `array` można przechowywać dane tylko jednego typu. Jednak różne tablice `array` mogą przechowywać różne typy obiektów i mogą to być w zasadzie dowolne typy obiektów od liczbowych po instancje dowolnych klas. Informacje o typie przechowywanych obiektów dostępna jest w artybucie `dtype`.

In [None]:
a = np.array([1,3,4,5,8])
a.dtype

In [None]:
b = np.array([1,3,4.5,5,8.0])
b.dtype

In [None]:
c = np.array(['a','3','cos'])
c.dtype

Typ danych jest zazwyczaj rozpoznawanym automatycznie, ale może być narzucony z góry.

In [None]:
a = np.array([1,3,4,5,8])
print(a)
a.dtype

In [None]:
b = np.array([1,3,4,5,8], dtype=np.float32)
print(b)
b.dtype

In [None]:
c = np.array([1,'3',4,[5,8]])  # obiekty różnych typów - nie da się

In [None]:
c = np.array([1,'3',4,[5,8]], dtype=object)  #obiekty różnych typów, a jednak się da :)
print(c)
c.dtype

#### Przydatne metody do tworzenia tablic `array`

- `array(seq)` - metoda tworząca obiekt `array` na podstawie podanej sekwencji `seq` (lista lub krotka).

In [None]:
a = np.array([1,3,4,5,8])
a

In [None]:
b = np.array((1,3,4,5,8))
b

- `arange(end, [start, [krok]])` - odpowiednik metody `range` z tą różnicą, że parametry `end`, `start` i `krok` mogą przyjmować wartości rzeczywiste.

In [None]:
np.arange(10)

In [None]:
np.arange(1.1, 2.1, 0.1)

- `linspace(a, b, n)` - metoda zwracająca tablicę zawierająca `n` równorozłożonych punktów w przedziale `[a,b]`, zaczynając od `a`, a kończąc na `b`. 

In [None]:
np.linspace(0, 1, 11)

- `zeros(shape)` - metoda zwracająca tablicę wypełnioną zerami o kształcie `shape`.

In [None]:
np.zeros(10)

In [None]:
np.zeros((2,3))

- `ones()` - metoda zwracająca tablicę wypełnioną jedynkami o kształcie `shape`.

In [None]:
np.ones(5)

In [None]:
np.ones((3,2))

- `empty(shape)` - metoda zwracająca tablicę o zadanym kształcie `shape`, ale nie inicjalizuje wartości dla jej elementów

In [None]:
np.empty((2,3))  # najczęściej pojawiające się wartości to coś blisiego 0 ale są to tzw. "śmieci".

- `zeros_like(a)`, `ones_like(a)`, `empty_like(a)` - metody działające jak poprzednio przedstawione z tym, że tworzą tablice o kształcie takim jak tablica `a`. 

In [None]:
a = np.array([[1,2],[3,4]])
print(a)
print(np.ones_like(a))

- `identity(n)` - tworzy macierz (tablice dwu-wymiarową) identycznościową o rozmiarze `n`. 
- `eye(n)` - to samo jak wyżej.

In [None]:
np.identity(4)

In [None]:
np.eye(4)

- `diag(diagonala)` - tworzy macierz diagonalną o przekątnej `diagonal`

In [None]:
np.diag([1,2,3,4])

#### Przydatne atrybuty obiektu `array`
- `ndim` - ilość wymiarów 
- `size` - ilość elementów
- `itemsize` - ilość bajtów na element

In [None]:
a = np.array([[1,2,3], [4,5,300]])
a.ndim

In [None]:
a.size

In [None]:
a.itemsize

#### Dostęp do elementów oraz slicing
Dostęp do elementów (i pod-tablic) jest możliwy poprzez wykorzystanie notacji indeksowej (`tablica[i]`) jak i wycinkowej (`tablica[i:j]`).

Tablica jedno-wymiarowa (dokładnie tak samo jak przy listach):

In [None]:
a = np.array([10,11,12,13,14])
print(a)
print(a[1])  # numeracja od zera
print(a[2:4])
print(a[::2])
print(a[-1])
print(a[:1:-1])

In [None]:
a[2] = -100
a

Tablice wielowymiarowe:

In [None]:
b = np.array([[0,1,2,3],[10,11,12,13]])
print(b)

In [None]:
print(b[1, 1])  # podajemy indeksy elementu rozdzielone przecinkiem
b[1, 2]= -10
print(b)

In [None]:
print(b[1][2])  # można też tak jak przy zagnieżdzonych listach
b[1][2]= -100
print(b)

![slicing.png](http://torus.uck.pk.edu.pl/~amarsz/images/slicing.png)

In [None]:
a = np.array([[0,1,2,3,4,5],[10,11,12,13,14,15],[20,21,22,23,24,25],[30,31,32,33,34,35],[40,41,42,43,44,45], [50,51,52,53,54,55]])

In [None]:
a[0,3:5]  # pomarańczowe

In [None]:
a[4:,4:]  # niebieskie

In [None]:
a[:,2]  # czerwone

In [None]:
a[2::2,::2]  # zielone

__Uwaga:__ Wycinki tablicy są referencjami do oryginalnego obiektu.

In [None]:
a = np.array([0,1,2,3,4])
print(a)

In [None]:
b = a[2:4]
b

In [None]:
b[0] = 10
print(a)

__Zmieniając w wycinku `b` zmieniamy też w oryginalnej tablicy `a`.__

#### Fancy Indexing
Możliwe jest wybieranie elementów tablicy:
- podając ich indeksy
- spełniających podany warunek (według tzw. maski)

In [None]:
a = np.arange(0,80,10)
a

In [None]:
indices = [1, 2, -3]
a[indices]

In [None]:
mask = np.array([0,1,1,0,0,1,0,0], dtype=bool) 
a[mask]

In [None]:
mask2 = a<30
a[mask2]

In [None]:
a[a>20]

![fancy.png](http://torus.uck.pk.edu.pl/~amarsz/images/fancy.png)

In [None]:
a = np.array([[0,1,2,3,4,5],[10,11,12,13,14,15],[20,21,22,23,24,25],[30,31,32,33,34,35],[40,41,42,43,44,45], [50,51,52,53,54,55]])

In [None]:
a[[0,1,2,3,4],[1,2,3,4,5]]  # pomarańczowe

In [None]:
a[3:, [0,2,5]]  # niebieskie

In [None]:
mask = np.array([1,0,1,0,0,1], dtype=bool)
a[mask,2]  # czerwone

__W odróżnieniu od wycinków tablice powstałe po `fancy indexing` są kopiami.__

Metoda `where()` - zwraca indeksy elementów spełniających podany warunek.

In [None]:
a = np.array([[0,12,5,20], [1,2,11,15]])
a

In [None]:
loc = np.where(a>10)
loc

In [None]:
a[loc]

#### Zmiana kształtu tablicy
- `flatten()` - spłaszcza tablicę wielowymiarową do jednowymiarowej. Zwraca kopię.
- `ravel()` - to samo co `flatten()` ale zwraca referncję do oryginalnego obiektu.
- `reshape(new_shape)` - zmienia kształt tablicy na podany, ilość elementów musi pozostać bez zmian.
- `transpose()` lub `T` - transpozycja, zmienia kolejnośc wymiarów.

In [None]:
a = np.array([[0,1], [2,3]])
a

In [None]:
a.flatten()

In [None]:
a.reshape((1,4))

In [None]:
a.transpose()

#### Operacje arytmetyczne oraz funkcje matematyczne na obiektach `array`
Najważniejszą cechą biblioteki `Numpy` jest to, że wszyskie operacje arytmetyczne jak również funkcje matematyczne wykonywane na tablicach `array` są wykonywane na poszczególnych elementach tych tablic (`element-wise`).

- arytmetyka: `+`, `-`, `*`, `\`, `**`, `%` itp.

In [None]:
a = np.ones(25).reshape((5,5))
b = np.arange(25).reshape((5,5))
print(a)
print(b)

In [None]:
a+b

In [None]:
a*b

In [None]:
b**(a*2)

- porównania: `<`, `<=`, `==`, `!=`, `>=`, `>`

In [None]:
a = np.array([1,3,-2,3,6,7])
b = np.array([-2,5,9,0,3,1])
a,b

In [None]:
a>b

In [None]:
a==3

In [None]:
(b<a).all()

In [None]:
(b<a).any()

- funkcje matematyczne: `exp`, `sin`, `log` itp.

In [None]:
a = np.arange(13)
a

In [None]:
np.sin(a)

In [None]:
np.sqrt(a)

In [None]:
np.exp(a)

- funkcje agregujące: Min, Max, Sum, Mean, Var itp.

In [None]:
a = np.array([[1,2,3,4],[5,6,7,8]])
a

In [None]:
print(a.sum())
print(a.max())
print(a.min())
print(a.prod())
print(a.mean())
print(a.var())
print(a.std())
print(a.argmax())
print(a.argmin())
print(a.cumsum())
print(a.cumprod())

#### Osie (Axis)
Każdy wymiar tablicy wyznacza pewną oś względem której możemy wykonywać metody przedstawione poprzednio.

Domyślnie parametr `axis=None` co oznacza że wykonujemy metody względem pojedyńczych elementów tablicy.
![axnone.png](http://torus.uck.pk.edu.pl/~amarsz/images/axnone.png)

Ustawienie `axis=0` powoduje wykonywanie obliczeń wzgłuż 0 wymiaru (na kolumnach), `axis=1` (na wierszach) itp.
![axzero.png](http://torus.uck.pk.edu.pl/~amarsz/images/axzero.png)
![axone.png](http://torus.uck.pk.edu.pl/~amarsz/images/axone.png)

In [None]:
a = np.array([[1,2,3,4],[5,6,7,8]])
a

In [None]:
print(a.sum())
print(a.sum(axis=0))
print(a.sum(axis=1))
print(a.mean())
print(a.mean(axis=0))
print(a.mean(axis=1))
print(a.max())
print(a.max(axis=0))
print(a.max(axis=1))
print(a.cumsum())
print(a.cumsum(axis=0))
print(a.cumsum(axis=1))

#### Broadcasting
Jak już pokazaliśmy, podstawowe operacje (dodawanie, mnożenie, itp.) w `NumPy` są wykonywane element po elemencie i że świetnie działa to dla tablic o tych samych wymiarach.

Jakkolwiek możliwe jest wykonywanie tych samych operacji na tablicach różniących się rozmiarem. `NumPy` automatycznie przetransformuje je tak by wymiary się zgadzały. Oczywiście nie zawsze. Takie zachowanie nazywane jest __broadcasting__-iem

In [None]:
a = np.array([[1,2,3],[4,5,6]])
a

In [None]:
a+4  # dodaje do każdego elementu liczbę 4

In [None]:
b = np.array([5,5,5])  # dodaje do każdego wiersza wiersz [5,5,5]
a+b

Jak to działa? Jeżeli jest to możliwe to odpowiednie tablice są rozszerzane poprzez powielanie.
![broad.png](http://torus.uck.pk.edu.pl/~amarsz/images/broad.png)

#### `newaxis` oraz `squeeze()`
- `newaxis` - pozwala na dodanie nowego wymiaru (osi) do istniejącej tablicy
- `squeeze()` - metoda usuwająca wymiary, których długość jest równa 1

In [None]:
a = np.array([1,2,3])
a.shape

In [None]:
b = a[np.newaxis,:]
print(b)
b.shape

In [None]:
b = a[:,np.newaxis]
print(b)
b.shape

In [None]:
c = b.squeeze()
c.shape

#### Przykład wykorzystania broadcastingu
Chcemy policzyć odległości wszystkich punktów na siatce `[-0.5,0.5] X [-0.5, 0.5]` od punktu `(0,0)`, siatke definiujemy z krokiem `0.1`.

In [None]:
a = np.arange(-0.5, 0.6, 0.1)

In [None]:
b = a[:, np.newaxis]  # b.shape == (15,1)
dist = np.sqrt(a**2 + b**2)

In [None]:
import matplotlib.pyplot as plt
plt.imshow(dist); plt.colorbar()
plt.show()

Najważniejszą zaletą takiego podejścia jest to, że licząc $n^2$ wartości nie musieliśmy używać ani jednej pętli `for` co powoduje ze kod jest o wiele wydajniejszy. 

#### Podklasy klasy `ndarray`
- `numpy.ma` - tablice reprezentujące maski
- `numpy.matrix` - tablice reprezentujące macierze 
- `numpy.memmap` - memory-mapped arrays
- `numpy.recarray` - record arrays

#### Podbiblioteki w bibliotece `Numpy`
- `numpy.fft` - szybka transformata fouriera
- `numpy.polynomial` - operacje na wielomianach
- `numpy.linalg` - algorytmy algebry liniowej
- `numpy.math` - funkcje matematyczne ze standardowej biblioteki math w C
- `numpy.random` - liczby pseudolosowe

__`numpy.linalg`__ to podbiblioteka w bibliotece `Numpy` zawierająca szereg metod i algorytmów algebry liniowej, gdzie wektory, macierze, tensory reprezentowane są poprzez tablice `array`. 

Dokumentacja: https://docs.scipy.org/doc/numpy/reference/routines.linalg.html

Iloczyn `*` - mnożenie przez skalar.

In [None]:
import numpy as np
v = np.arange(1, 6)  # wektor - tablica jedno-wymiarowa
m = np.arange(1, 26).reshape((5,5))  # macierz tablica dwu-wymiarowa
print(v)
print(m)  

In [None]:
v * 2 

In [None]:
m*(-3)

Iloczyn `*`, Mnożenie po elementach (element-wise).

In [None]:
v * v

In [None]:
m * m

Broadcasting

In [None]:
m * v

In [None]:
v * m

Iloczyn `numpy.dot(a,b)` - różne zachowanie przy różnych kształtach. Iloczyn skalarny.

In [None]:
np.dot(v, v)

In [None]:
np.dot(v, v.T)  # Transpozycja tablicy jednowymiarowej nic nie zmienia

Macierz razy wektor, macierz razy macierz.

In [None]:
np.dot(m, v)  # zadziała

In [None]:
np.dot(v, m)  # i to też zadziała

In [None]:
np.dot(m, m)

Metoda `dot` jest uniwersalna, jednak trzeba wiedzieć jak z niej korzystać bo nie zawsze otrzymamy wynik zgodny z rachunkiem macierzowym. 

Aby wykonywane mnożenia były zgodne z rachunkiem macierzowym:
- Wektory należy reprezentować jako macierze jedno-wierszowe lub jedno-kolumnowe.
- Zamiast metody `numpy.dot(a,b)` bezpieczniej używać metody `numpy.matmul(a,b)`.

In [None]:
v = v.reshape((1,5))
v

In [None]:
np.matmul(v, v)

In [None]:
np.matmul(v, v.T)

In [None]:
np.matmul(v.T, v)

In [None]:
np.matmul(v, m)

In [None]:
np.matmul(m, v.T)

In [None]:
np.matmul(m, m)

In [None]:
np.matmul(m, v)

#### Przydatne metody z biblioteki `numpy.linalg` dla macierzy
- `det(m)` - metoda zwracająca wyznacznik macierzy `m`. Wyznacznik liczony poprzez rozkład LU.

In [None]:
m = np.random.randint(3, size=(4,4))  # macierz tablica dwu-wymiarowa
print(m)

In [None]:
np.linalg.det(m)

- `matrix_rank(m)` - metoda zwracająca rząd macierzy `m`. 

In [None]:
np.linalg.matrix_rank(m)

- `matrix_power(m, n)` - metoda zwracająca `n`-tą potęgę macierzy `m`.

In [None]:
np.linalg.matrix_power(m, 4)

- `inv(m)` - metoda zwracająca macierz odwrotną do macierzy `m`.

In [None]:
np.linalg.inv(m)

In [None]:
np.matmul(m, np.linalg.inv(m))

- `solve(A,b)` - metoda zwracająca rozwiązanie układu równań linowych danych równaniem macierzowym `Ax=b`.

In [None]:
m = np.random.randint(3, size=(4,4))  # macierz tablica dwu-wymiarowa
print(m)
print(np.linalg.det(m))

In [None]:
v = np.ones((4,1))
v

In [None]:
np.linalg.solve(m, v)

In [None]:
v == np.matmul(m,np.linalg.solve(m, v))

- `cholesky(m)` - rozkład Cholesky'ego.
- `gr(m)` - rozkład QR.
- `svd(m)` - Singular Value Decomposition.

In [None]:
q, r = np.linalg.qr(m)
print(q)
print(r)

In [None]:
print(m)
np.round(np.matmul(q,r))