# Mátrixok és vektorok (Matrices and vectors)

A következőkben a legfontosabb, tudományos számításokra használt könyvtárakat tekintjük át.

* numpy
* matplotlib
* pandas


Elsőként a Numpy-al foglakozunk, ami a legalapvetőbb lineáris algebrai könyvtár. Ezek a könyvtárak a hatékonyság miatt elsősorban C/C ++, esetleg Cython-ban implementált függvényekre támaszkodnak, vagyis itt valójában C-szerűen tárolt vektorokról lesz szó, amelyeken lényegében C++ függvények hívódnak meg, mindezt elrejtve a felhasználó elől, Python függvényhívások mögé.

A numpy nem része a Python standard library-nek, azaz installálni kell. Ha Anaconda csomagkezelőnk van, akkor a numpy már valószínűleg telepítve van, egyébként pedig a Python saját `pip` csomagkezelőjével lehet telepíteni, a 

```
pip install numpy
```
paranccsal. Megadott verziószámú csomagot is lehet telepíteni, ha szükséges.

```
pip install numpy==1.26.1
```

In [None]:
# A numpy importálására az alábbi konvenciót szokás használni.

import numpy as np

A Numpy alapvető adatszerkezete az `ndarray`, ami egy $N$-dimenziós, azonos típusú elemeket tartalmazó, fix méretű tömb.

Típus alatt itt elsősorban a C-ből ismert numerikus típusokat értjük, noha lehetséges sztringeket is ilyen tömbbe tenni. Egy Python lista Python objektumokat tartalmaz, amelyek össze-vissza lehetnek a memóriában, ezzel szemben egy C-tömb (kihasználva, hogy minden elemének ugyanaz a típusa) a memóriának egy összefüggő területét foglalja el.

```
np.float_, np.float32, np.float64, ...
np.int_, np.int32, np.int64, ...
np.bool_
```

Itt a hatékonyság kedvéért le kell mondanunk a tetszőleges hosszúságú Python egészekről.

### Egydimenziós tömbök konstruálása

In [None]:
# Tömbök konstruálása

v = np.array([1, 1, 2, 3, 5, 8])

v

In [None]:
v.dtype

In [None]:
v = np.array([1, 1, 2, 3, 5, 8], dtype=np.float_)

v

In [None]:
v.dtype

In [None]:
len(v)

In [None]:
v.shape

In [None]:
# logikai tömb / boolean array

v = np.array([0, 1, 0, 0, 1], dtype=np.bool_)

v

In [None]:
# Explicit type cast

v = np.array([0, 1, 0, 0, 1], dtype=np.int_)

print(repr(v.astype(np.bool_)))

print(repr(v.astype("float32")))

### Többdimenziós tömbök konstruálása

In [None]:
# az elemeket listák listájaként adhatjuk meg

matrix = np.array([[1, 2, 3], [4, 5, 6]])

matrix

In [None]:
matrix.ndim

In [None]:
matrix.shape

In [None]:
# Speciális mátrix konstrukciók

A = np.zeros(shape=(3, 3), dtype=np.int_)

A

In [None]:
B = np.ones(shape=(3, 5), dtype=np.float_)

B

In [None]:
I = np.eye(4)

I

In [None]:
I = np.eye(4, 5, k=2, dtype=np.int_)

I

In [None]:
# array range

np.arange(10)

In [None]:
np.linspace(0, 1, 11)

In [None]:
v = np.array([1, 2, 4, 9, -1], dtype=np.float32)

z = np.zeros_like(v)
z

In [None]:
A = np.array([[1, 2, 3], [4, 5, 6]])

In [None]:
2 * A

In [None]:
2.0 * A

In [None]:
-A

In [None]:
# elemenkénti összeadás

np.add(A, A)

In [None]:
A + A

In [None]:
# elemenkénti szorzás

np.multiply(A, A)

In [None]:
A * A

In [None]:
B = 2 * np.ones_like(A)

B

In [None]:
# elemenkénti osztás

np.divide(A, B)

In [None]:
A / B

In [None]:
b = np.array([1, 2, 3])


print(A.shape)
print(b.shape)

In [None]:
# Mátrix-vektor szorzás

np.matmul(A, b)

In [None]:
A @ b

Különböző dimenziójú mátrixokkal való műveletek esetén legyünk óvatosak, győződjünk meg arról, hogy az történik, amit szeretnénk.

In [None]:
# Igazából ez lenne a helyes mátrixszorzás, megfelelő dimenziószámmal
A

b = np.expand_dims(np.array([1, 2, 3]), 1)

b

In [None]:
C = np.matmul(A, b)

print(C.shape)
C

In [None]:
A

In [None]:
b = np.array([1, 2, 3])

b

In [None]:
A / b

In [None]:
A * b

A fenti két művelet elementkénti osztás és szorzás, és azért tud végrehajtódni, mert a $b$-ből két példányt véve le tudjuk fedni az $A$ dimenzióját, azaz a $b$ vektor automatikusan kiegészítődőtt saját maga másolatával úgy, hogy a mérete megegyezzen az $A$ méretével (**broadcasting**). A $b = [1, 2, 3]$, egydimenziós $(3,)$ méretű vektorból implicit módon egy $(1, 3)$-mas, ebből pedig egy kétdimenziós, $(2, 3)$-as tömb lett.

In [None]:
v = np.array([[1], [11]])

w = np.array([1, 2, 3, 4, 5, 6])

print(v.shape)
print(w.shape)

w + v

### Indexelés (indexing)

In [None]:
A = np.array([[1, 2, 3, 4, 5], [10, 20, 30, 40, 50], [9, 8, 7, 6, 5], [1, 0, 1, 0, 1]])

A

In [None]:
A[1]

In [None]:
A[1][2]

In [None]:
A[1, 2]

In [None]:
A[:2, 1:4]

In [None]:
A[:2, :]

In [None]:
A[0, 0:3] = -1

A

In [None]:
A <= 0

In [None]:
A[A<=0] = 100

A

In [None]:
np.where(A == 100, 0, 1)

In [None]:
np.where(A == 100, 0, A)

In [None]:
A[[1, 3]]

In [None]:
A[:, [1, 3]]

In [None]:
A[:, [4, 2, 0]]

### Vektorizált elemenkénti függvények (Vectorized element-wise functions)

In [None]:
v = np.arange(5)

v

In [None]:
np.square(v)

In [None]:
np.sum(v)

In [None]:
import random
import time

random.seed(123)

lst = [random.randint(-1000, 1000) for _ in range(1_000_000)]

In [None]:
t = time.time()
for _ in range(100):
    s = sum(lst)
    
print(time.time() - t)
print(s)

In [None]:
v = np.array(lst, dtype=np.int32)

t = time.time()
for _ in range(100):
    s = np.sum(v)
    
print(time.time() - t)
print(s)

In [None]:
v = np.arange(30)

A = np.reshape(v, (5, 6))    # vagy v.reshape(5, 6)

A

In [None]:
# A.sum()

np.sum(A)

In [None]:
# A.sum(axis=0)

np.sum(A, axis=0)

In [None]:
np.sum(A, axis=1)

In [None]:
np.sin(A)

In [None]:
np.exp(A)

In [None]:
np.log(A)

In [None]:
A = np.arange(15).reshape(3, 5)

B = np.zeros(shape=(3, 5), dtype=np.int_)

In [None]:
# np.vstack((A, B))

np.concatenate((A, B), axis=0)

In [None]:
# np.hstack((A, B))

np.concatenate((A, B), axis=1)

# Lineáris algebra és alkalmazásai (Linear algebra and its applications)

### Egyszerűbb statisztikai függvények

$$
\overline v \equiv \text{mean}(v) = \frac{\sum_{i=1}^n v_i}{n}
$$


$$
\text{std}(v) = \sqrt{\frac{\sum_{i=1}^n (v_i - \overline{v})^2}{n}}
$$

In [None]:
A = np.array([
    [1, 2, 3],
    [10, 11, 12],
    [0, 3, 1],
    [10, -5, 1]
])

A

In [None]:
# A.sum()

np.sum(A)

In [None]:
# Elemek abszolútértékeinek összege

np.sum(np.abs(A))

In [None]:
# elemek átlaga

np.mean(A)

In [None]:
# elemek szórása

np.std(A)

In [None]:
# elemek szórásnégyzete

np.var(A)

Többdimenziós tömböknél azonban érdekelhet minket a sorösszeg / oszlopösszeg, a sorátlag / oszlopátlag, stb. is.

In [None]:
print(A.shape)

# ez tehát az oszlopösszeg
np.sum(A, axis=0)

In [None]:
print(np.sum(A[1, :]))

# ez a sorösszeg
np.sum(A, axis=1)

In [None]:
# A keletkező vektor egyik dimenziója azonban eltűnt, a sorösszeg egy 1-dimenziós vektor lett

row_sums = np.sum(A, axis=1, keepdims=True)

print(row_sums.shape)

row_sums

In [None]:
# Hasonlóan, oszlopátlagot is számolhatunk

np.mean(A, axis=0)

In [None]:
A

In [None]:
# melyik tengely mentén rendez a `sort`, ha nem adunk meg semmit?

np.sort(A)

In [None]:
np.sort(A, axis=0)

In [None]:
help(np.sort)

In [None]:
import numpy.linalg as lg

In [None]:
A = np.array([[2, 4, 1], [2, 6, -1], [1, 5, 2]], dtype=np.float_)

b = np.array([4, 10, 2])

In [None]:
print(f"Az A mátrix determinánsa {np.round(lg.det(A), 6)}")

In [None]:
# Az A mátrix inverze

lg.inv(A)

In [None]:
# Az Ax = b lineáris egyenletrendszer megoldása:

x = lg.solve(A, b)

x

In [None]:
A @ x

**Feladat**: Adott két numpy vektor, `a = np.array([1,2,3,2,3,4,3,4,5,6])` és `b = np.array([7,2,10,2,7,4,9,4,9,8])`, állítsuk elő azt a vektort, ami a közös elemeket tartalmazza. (Keressünk numpy függvényeket erre a célra.)


**Feladat**: Csináljuk egy $3\times 3$-mas mátrixot, ami $2$ és $4$ közötti véletlen számokat tartalmaz. (Nézzük meg az `np.random` modul függvényeit.)

**Feladat**: Az alábbi mátrix tartalmaz végtelen értékeket is. Töröljük azokat az oszlopokat, amelyekben szerepel végtelen érték. Hogyan kaphatjuk meg azon oszlopok indexeit, amely tartalmaz végtelen értéket?

```python
A = np.array([
    [1,      2,       3, 14], 
    [2, np.inf,      -4,  0], 
    [3,      4, -np.inf, -3]
])
```

**Feladat**: Adott mátrixra számoljuk ki minden sorra a sorbeli minimum és maximum értékek hányadosát.

# Tömbök egyszerű vizualizációja (Visualization)

Mátrixok és vektorok a matematika minden ágában előfordulnak, valamint rengeteg alkalmazásuk van:

* képfeldolgozás
    * képtömörítés, szűrés (blurring, sharpening, etc)
    * objektum detekció 
    * szegmentáció
* jelfeldolgozás, idősorok elemzése 
    * tőzsdei árfolyamok
    * vízszintingadozás
    * elektrofiziológiai jelek elemzése
    * egérmozgás alapján felhasználó azonosítása
    * szállodai szobák kihasználtsága
    * trendek, szezonalitás vizsgálata

Ez a lista lényegében a végtelenségig folytatható.

Azonban akár képekkel, akár idősorokkal dolgozunk, nehéz tájékozódni vizuális segítség nélkül. A Python leggyakrabban használt plot-könyvtára a `matplotlib`, ugyanakkor más, vizuális ábárzolásra használt könyvtár is létezik (a legismertebb alternatívák a `seaborn` vagy a `bokeh`).

In [None]:
import matplotlib.image as im
import matplotlib.pyplot as plt

In [None]:
plt.figure(figsize=(16, 4))
xs = np.linspace(0, 2*np.pi, 100)
ys = np.sin(xs)
plt.plot(xs, ys)
plt.title("The sine function")
plt.show()

In [None]:
plt.figure(figsize=(16, 4))
xs = np.linspace(0, 2*np.pi, 100)
ys = np.sin(xs)
plt.plot(xs, ys)
plt.yticks([-1, -0.5, 0, 0.5, 1.0])
plt.title("The sine function")
plt.show()

In [None]:
fig, ax = plt.subplots(nrows=3, ncols=1, figsize=(18, 6))
xs = np.linspace(0, 2*np.pi, 100)
ax[0].plot(xs, np.sin(xs))
ax[1].plot(xs, np.sin(2*xs))
ax[2].plot(xs, np.sin(4*xs))
plt.show()

In [None]:
fig, ax = plt.subplots(nrows=3, ncols=1, figsize=(18, 6), sharex=True)
xs = np.linspace(0, 2*np.pi, 100)
ax[0].plot(xs, np.sin(xs), label="sin(x)")
ax[0].legend(loc="upper right")
ax[1].plot(xs, np.sin(2*xs), c="g", label="sin(2x)")
ax[1].legend(loc="upper right")
ax[2].plot(xs, np.sin(4*xs), c="r", label="sin(4x)")
ax[2].legend(loc="upper right")
plt.show()