# Knihovna numpy
Implementace seznamů v pythonu není dostatečně výkonná. NumPy je základní knihovna pro vědecké a numerické výpočty v Pythonu, protože poskytuje rychlé vektorové operace a efektivní práci s velkými daty.

Knihovna numpy je vytvořena pro n-rozměrná pole, komplexní matematické funkce, generátory náhodných čísel, postupy lineární algebry, Fourierovy transformace a další.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

## Vytvoření pole
Způsobů jak vytvořit vícerozměrné pole je celá řada.
* Ze seznamu
* Vygenerování řady čísel
* Nulová, jednotková matice
* Náhodná matice apod.

In [None]:
a = np.array([1, 2, 3])       # pole s prvky 1, 2, 3
b = np.arange (9)             # pole od 0 do 8
c = np.arange (1, 11, 2)      # pole od 1 do 10 po 2 [1, 3, 5, 7, 9]
d = np.zeros ((4, 10))        # nulová matice 4x10, rozměr zadaný jako tuple
e = np.ones ((2, 3))          # jednotkový matice 2x3
f = np.random.rand(3, 5)      # rozměr není zadaný jako tuple 
g = np.eye(3, dtype=int)      # jednotková matice
h = np.linspace (1, 11, 40)  

In [None]:
print (a)
print (b)
print (c)
print (d)
print (e)
print (f)
print (g)
print (h)

## Datový typ
Matice může obsahovat různé datové typy. Typ se definuje při vytváření.

Podle zvolené datového typu určujete, kolik prostoru matice zabere v paměti a zároveň, jaký rozsah čísel může obsahovat.

Z hlediska výkonu je vhodné volit co nejmenší vhodný datový typ.

https://numpy.org/doc/stable/reference/arrays.dtypes.html

In [None]:
np.dtype('i4')      # 32-bit signed integer
np.dtype('f8')      # 64-bit floating-point number
np.dtype('c16')     # 128-bit complex floating-point number
np.dtype('S25')     # 25-length zero-terminated bytes
np.dtype('U25')     # 25-character string
np.dtype('uint32')  # 32-bit unsigned integer
np.dtype('float64') # 64-bit floating-point number
np.dtype(float)     # Python-compatible floating-point number
np.dtype(int)       # Python-compatible integer

In [None]:
a = np.array([[1, 2], [3, 4]], dtype=float)

Jaký datový typ obsahuje matice zjistíte pomocí **dtype**

In [None]:
a.dtype

## Základní matematické operace
Později si ukážeme, že vytváření modelů pro umělou inteligenci je založeno na matematických operacích s maticemi.

Numpy má v sobě zabudované funkce, jak tyto operace provádět paralelně a efektivně.

Skalární operace si ukážeme na vektoru.

In [None]:
h=np.linspace (1, 10, 10)
print (h)

Přičtení skalární hodnoty

In [None]:
print (h + 2)

Vynásobení vektoru skalární hodnotou

In [None]:
print (h * 2)

## Změna rozměrů pole
Každá matice v numpy má definované své rozměry. Ty lze zjistit pomocí funkce **shape** a počet dimenzí pomocí **ndim**.

In [None]:
print (d)
d.shape

In [None]:
d.ndim

Interní uložení matice umožňuje velmi efektivně provádět změnu rozměru matice. 

Změna tvaru proběhne úpravou vlastností matice a nikoliv realokací dat v paměti.

Samozřejmě, že jsou povolené ty změny rozměru, které jsou kompatibilní s předchozím rozměrem.

In [None]:
print (b)
print (b.shape)

In [None]:
b2 = b.reshape ((3,3))
print (b2)
print (b2.shape)

##  Rozdělení matice
Určitě se nám později bude hodit operace, která z matice odřízně nějakou část (budeme chtít jen nějakou sloupce nebo nějaké řádky).

In [None]:
print (f)
print (f.shape)

Začneme tím, že chceme první řádek. Opět indexy jsou počítany od 0.

In [None]:
f[0]

Když uvedeme další index, tak řežeme po sloupcích. S tím, že záporná čísla počítají seznamy odzadu, jsme se již setkali.

Následující výraz vybere poslední hodnotu z prvního řádku.

In [None]:
f[0][-1]

Z matice můžeme řezat i sloupce a další submatice
* f[:,2] vybere 3. sloupec, : znamená, že chceme všechny řádky
* f[1:3,2:4] vybere z druhé a třetího řádku třetí a čtvrtý sloupec


In [None]:
f[:,2]

In [None]:
f[1:3,2:4]

Rozdělení matic lze dělat i pomocí funkce split, kdy se nevybíráme určité submatice, ale provedeme řez maticí, která ji rozdělí na dvě části.

Následující příklad # oddělí první sloupcec
* [1] - dělící sloupec
* axis=1 rozděluje podle sloupců

In [None]:
print (f) 

In [None]:
f1, f2 = np.split(f, [1], axis=1)    
print (f1)
print (f2)

Podobně uděláme oddělení prvního řádku
* [1] prvky nalevo budou v jedne matici, prvky napravo včetně v druhé. 
* axis=0 rozděluje podle řádku

In [None]:
f1, f2 = np.split(f, [1], axis=0)
print (f1)
print (f2)     

## Maticové operace
Zatím jsme si ukázali skalární operace s maticemi. Numpy samozřejmě umí matice i sčítat a násobil.

Matice můžeme sečíst, pokud mají stejný rozměr.

In [None]:
i=np.linspace (1, 10, 10)
j=np.linspace (11, 20, 10)
print (i)
print (j)

In [None]:
print (i+j)

U násobení matic se musí shodovat počet řádků jedné matice s počtem sloupců druhé matice.

In [None]:
A = np.arange (2, 14)
A = A.reshape ((3, 4))
B = np.arange (5, 25)
B = B.reshape ((4, 5))
print (A)
print (B)

In [None]:
C=np.dot (A, B)
print (C)

## Vytvoření mřížky
Někdy se nám bude hodit, že si v prostoru vytvoříme body, které budou v mřížce. Pro tyto body pak budeme počítat hodnotu nějaké funkce, abychom dostali 3D graf.

Pro vytvoření mřížky slouží funkce meshgrid, které předáme dva vektory.
 - vytvoří mřížku souřadnic mřížky zadané velikosti

In [None]:
xx=np.linspace(0, 1, 30)
yy=np.linspace(0, 1, 20)
print (xx)
print (yy)

In [None]:
XX, YY = np.meshgrid (xx, yy)
print (XX.shape)
print (YY.shape)

In [None]:
plt.scatter(XX, YY)
plt.show()

## Uložení a načtení pole do a ze souboru
Pokud zpracujeme nějakou vícerozměrnou matici, tak může být dobré si ji uložit do souboru pro pozdější zpracování.

Můžeme ji uložit do CSV. Tak se bude lépe přenášet třeba do excelu.

A opačně, matici lze přečíst z CSV.

In [None]:
np.savetxt("foo.csv", xx, delimiter=",")

In [None]:
arr = np.loadtxt("foo.csv", delimiter=",", dtype=str)
display(arr)

Textové uložení je dobré pro přenos dat mezi různými programy. Ale efektiva uložení je mizerná.

Proto numpy umožňují matice ukládat do svého optimalizovaného formátu.

In [None]:
np.savez_compressed("arr", arr)

In [None]:
arr2=np.load("arr.npz")

# Prohození sloupců
Někdy se nám může hodit finta, jak změnit pořadí sloupců.

Následující příkaz redefinuje matici tak, že sloupce jsou odzadu.

In [None]:
print (C)
C = C[:, ::-1]
print (C)