# Lineáris algebra és alkalmazásai (Linear algebra and its applications)

In [None]:
import numpy as np

### Egyszerűbb statisztikai függvények

In [None]:
v = np.array([1, 4, 3, 5, 35, 0, -1, 2])

v

$$
\overline v \equiv \text{mean}(v) = \frac{\sum_{i=1}^n v_i}{n}
$$


$$
\text{std}(v) = \sqrt{\frac{\sum_{i=1}^n (v_i - \overline{v})^2}{n}}
$$

In [None]:
print(v)

print(f"összeg: {np.sum(v)}")

print(f"átlag: {np.mean(v)}")

print(f"medián: {np.median(v)}")

print(f"szórás: {np.std(v)}")

print(f"szórásnégyzet (variancia): {np.var(v)}")

In [None]:
A = np.array([
    [1, 2, 3],
    [10, 11, 12],
    [0, 3, 1],
    [10, -5, 1]
])

A

In [None]:
# A.sum()

np.sum(A)

In [None]:
# Elemek abszolútértékeinek összege

np.sum(np.abs(A))

In [None]:
# elemek átlaga

np.mean(A)

In [None]:
# elemek szórása

np.std(A)

In [None]:
# elemek szórásnégyzete

np.var(A)

Többdimenziós tömböknél azonban érdekelhet minket a sorösszeg / oszlopösszeg, a sorátlag / oszlopátlag, stb. is.

In [None]:
print(A.shape)

# ez tehát az oszlopösszeg
np.sum(A, axis=0)

In [None]:
print(np.sum(A[1, :]))

# ez a sorösszeg
np.sum(A, axis=1)

In [None]:
# A keletkező vektor egyik dimenziója azonban eltűnt, a sorösszeg egy 1-dimenziós vektor lett

row_sums = np.sum(A, axis=1, keepdims=True)

print(row_sums.shape)

row_sums

In [None]:
# Hasonlóan, oszlopátlagot is számolhatunk

np.mean(A, axis=0)

In [None]:
A

In [None]:
# melyik tengely mentén rendez a `sort`, ha nem adunk meg semmit?

np.sort(A)

In [None]:
np.sort(A, axis=0)

In [None]:
help(np.sort)

In [None]:
import numpy.linalg as lg

In [None]:
A = np.array([[2, 4, 1], [2, 6, -1], [1, 5, 2]], dtype=np.float_)

b = np.array([4, 10, 2])

In [None]:
print(f"Az A mátrix determinánsa {np.round(lg.det(A), 6)}")

In [None]:
# Az A mátrix inverze

lg.inv(A)

In [None]:
# Az Ax = b lineáris egyenletrendszer megoldása:

x = lg.solve(A, b)

x

In [None]:
A @ x

**Feladat**: Adott két numpy vektor, `a = np.array([1,2,3,2,3,4,3,4,5,6])` és `b = np.array([7,2,10,2,7,4,9,4,9,8])`, állítsuk elő azt a vektort, ami a közös elemeket tartalmazza. (Keressünk numpy függvényeket erre a célra.)


**Feladat**: Csináljuk egy $3\times 3$-mas mátrixot, ami $2$ és $4$ közötti véletlen számokat tartalmaz. (Nézzük meg az `np.random` modul függvényeit.)

**Feladat**: Az alábbi mátrix tartalmaz végtelen értékeket is. Töröljük azokat az oszlopokat, amelyekben szerepel végtelen érték. Hogyan kaphatjuk meg azon oszlopok indexeit, amely tartalmaz végtelen értéket?

```python
A = np.array([
    [1,      2,       3, 14], 
    [2, np.inf,      -4,  0], 
    [3,      4, -np.inf, -3]
])
```

**Feladat**: Adott mátrixra számoljuk ki minden sorra a sorbeli minimum és maximum értékek hányadosát.

# Alkalmazások (Applications)

Mátrixok és vektorok a matematika minden ágában előfordulnak, valamint rengeteg alkalmazásuk van:

* képfeldolgozás
    * képtömörítés, szűrés (blurring, sharpening, etc)
    * objektum detekció 
    * szegmentáció
* jelfeldolgozás, idősorok elemzése 
    * tőzsdei árfolyamok
    * vízszintingadozás
    * elektrofiziológiai jelek elemzése
    * egérmozgás alapján felhasználó azonosítása
    * szállodai szobák kihasználtsága
    * trendek, szezonalitás vizsgálata

Ez a lista lényegében a végtelenségig folytatható.

Azonban akár képekkel, akár idősorokkal dolgozunk, nehéz tájékozódni vizuális segítség nélkül. A Python leggyakrabban használt plot-könyvtára a `matplotlib`, ugyanakkor más, vizuális ábárzolásra használt könyvtár is létezik (a legismertebb alternatívák a `seaborn` vagy a `bokeh`).

In [None]:
import matplotlib.image as im
import matplotlib.pyplot as plt

In [None]:
plt.figure(figsize=(16, 4))
xs = np.linspace(0, 2*np.pi, 100)
ys = np.sin(xs)
plt.plot(xs, ys)
plt.title("The sine function")
plt.show()

In [None]:
plt.figure(figsize=(16, 4))
xs = np.linspace(0, 2*np.pi, 100)
ys = np.sin(xs)
plt.plot(xs, ys)
plt.yticks([-1, -0.5, 0, 0.5, 1.0])
plt.title("The sine function")
plt.show()

In [None]:
fig, ax = plt.subplots(nrows=3, ncols=1, figsize=(18, 6))
xs = np.linspace(0, 2*np.pi, 100)
ax[0].plot(xs, np.sin(xs))
ax[1].plot(xs, np.sin(2*xs))
ax[2].plot(xs, np.sin(4*xs))
plt.show()

In [None]:
fig, ax = plt.subplots(nrows=3, ncols=1, figsize=(18, 6), sharex=True)
xs = np.linspace(0, 2*np.pi, 100)
ax[0].plot(xs, np.sin(xs), label="sin(x)")
ax[0].legend(loc="upper right")
ax[1].plot(xs, np.sin(2*xs), c="g", label="sin(2x)")
ax[1].legend(loc="upper right")
ax[2].plot(xs, np.sin(4*xs), c="r", label="sin(4x)")
ax[2].legend(loc="upper right")
plt.show()

In [None]:
image = im.imread("img/parrots.png")

image.shape

In [None]:
image[0, 0, :]

In [None]:
255 * image[0, 0, :]

In [None]:
plt.figure(figsize=(16, 10))
plt.imshow(image)
plt.show()

In [None]:
plt.figure(figsize=(16, 10))
plt.imshow(image)
plt.show()

In [None]:
# fliplr (flip left-right) felcseréli az oszlopok sorrendjét

plt.figure(figsize=(16, 10))
plt.imshow(np.fliplr(image))
plt.show()

In [None]:
# Kiátlagoljuk a színeket és a kapott képet szürkeként ábrázoljuk

plt.figure(figsize=(16, 10))
plt.imshow(np.mean(image, axis=-1), cmap=plt.get_cmap("gray"))
plt.show()

In [None]:
# Azonban a valódi szürkeárnyalatos kép a színeknek egy súlyozott átlaga

grayscale_image = np.dot(image, [0.299 , 0.587, 0.114])

plt.figure(figsize=(16, 10))
plt.imshow(grayscale_image, cmap=plt.get_cmap('gray'))
plt.show()

Aki használt már valamilyen képszerkesztő programot, biztosan látott már olyan lehetőséget, hogy valamilyen szűrőt alkalmazhatunk a képre. Ilyenkor adott egy $3\times 3$-mas, esetleg $5\times 5$-ös mátrix, amelynek vesszük a konvolúcióját a képnek minden ugyanakkora méretű részmátrixával.

Két azonos méretű mátrix konvolúcióján egyszerűen azt értjük, hogy elemenként összeszorozzuk őket, majd a kapott eredménymátrix elemeit összeadjuk. A szűrőt egyszerűen végigcsúsztatjuk a kép megfelelő méretű részmátrixain, így kapjuk a képnek a szűrővel vett konvolúcióját.

![](img/convolution.png)

In [None]:
image = im.imread("img/QueensWalk.jpg")

image.shape

In [None]:
plt.figure(figsize=(8, 10))
plt.imshow(image, cmap=plt.get_cmap("gray"))
plt.show()

In [None]:
def convolution(matrix, filt):
    nr_rows, nr_columns = matrix.shape
    f = len(filt)
    result = np.zeros((nr_rows-f+1, nr_columns-f+1))
    for i in range(nr_rows-f+1):
        for j in range(nr_columns-f+1):
            result[i, j] = np.sum(np.multiply(matrix[i:i+f, j:j+f], filt))
    
    return result

In [None]:
# Ez mit csinál? 
kernel = (1 / 9) * np.ones(shape=(3, 3))

filtered_image = convolution(image, kernel)

In [None]:
def plot_image_pair(original, filtered):
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(18, 12))
    ax1.imshow(original, cmap=plt.get_cmap('gray'))
    ax2.imshow(filtered, cmap=plt.get_cmap('gray'))
    fig.tight_layout()
    plt.show()

In [None]:
plot_image_pair(image, filtered_image)

In [None]:
# függőleges éldetektor

kernel = np.array([
    [1, 0, -1], 
    [1, 0, -1], 
    [1, 0, -1]
])

filtered_image = convolution(image, kernel)

In [None]:
plot_image_pair(image, filtered_image)

## Mátrixok szinguláris felbontása - képtömörítés 

### (Singular value decomposition - image compression)

Legyen $A\in\mathbb{R}^{n\times m}$ egy tetszőleges mátrix. Ekkor léteznek olyan $U\in\mathbb{R}^{n\times n}$, $D\in\mathbb{R}^{n\times m}$ és $V\in\mathbb{R}^{m\times m}$ mátrixok, hogy

$$ 
A = UDV^*, 
$$ 

ahol $U$ és $V$ úgynevezett unitér mátrixok, azaz $U^*U = UU^* = I_n$ és $V^*V=VV^*=I_m$, valamint $D$ diagonális mátrix, azaz $d_{ij}=0$, ha $i\ne j$. 

$D$ főátlójában nemnegatív számok állnak, csökkenő sorrendben: $d_{ii} = \sigma_i$, $\sigma_1\geq\sigma_2\geq\ldots\geq\sigma_r > \sigma_{r+1} = \ldots = \sigma_{\min(n,m)} = 0$, ahol $r$ az $A$ mátrix rangja. Ezeket a $\sigma$ értékeket az $A$ mátrix szinguláris értékeinek nevezzük.

Legyen $k\in\mathbb{N}$ adott természetes szám, ahol $k\leq\text{rank}(A)\leq\min\{n, m\}$. Keressük azt az $A_k$ mátrixot, melynek rangja $k$ és $A_k$ a $k$-rangú mátrixok közül a legjobban közelíti $A$-t, azaz $A_k$ az alábbi minmalizációs probléma megoldása:

$$ 
\left|\left| A - B \right|\right|_F \to \min !\qquad \mbox{ ahol }\quad B\in\mathbb{R}^{n\times m}, \ \text{rank}(B) = k. 
$$ 

Itt $\left|\left| X \right|\right|_F^2$ az $X$ elemeinek négyzetösszegét jelöli.

Ennek a feladatnak a megoldása az $A$ mátrix SVD-felbontásából számolható ki. Ha $A = UDV^*$, akkor legyen $U_k$ az $U$ első $k$ oszlopa, legyen $V_k$ a $V$ első $k$ sora, $D_k$ pedig a $D$ első $k$ diagonálisbeli elemét tartalmazó diagonális mátrix; ekkor a fenti feladat megoldása az $A_k = U_kD_kV_k^*$ mátrix.

In [None]:
image = im.imread("img/parrots.png")

In [None]:
plt.figure(figsize=(16, 10))
plt.imshow(image)
plt.show()

In [None]:
help(lg.svd)

In [None]:
def compress(image, k):
    row, col, _ = image.shape
    
    U_r, d_r, V_r = np.linalg.svd(image[:, :, 0], full_matrices=True)
    U_g, d_g, V_g = np.linalg.svd(image[:, :, 1], full_matrices=True)
    U_b, d_b, V_b = np.linalg.svd(image[:, :, 2], full_matrices=True)

    image_red_approx = U_r[:, :k] @ np.diag(d_r[:k]) @ V_r[:k, :]
    image_green_approx = U_g[:, :k] @ np.diag(d_g[:k]) @ V_g[:k, :]
    image_blue_approx = U_b[:, :k] @ np.diag(d_b[:k]) @ V_b[:k, :]

    image_reconstructed = np.zeros((row, col, 3))
    image_reconstructed[:, :, 0] = image_red_approx
    image_reconstructed[:, :, 1] = image_green_approx
    image_reconstructed[:, :, 2] = image_blue_approx
    image_reconstructed[image_reconstructed < 0] = 0
    image_reconstructed[image_reconstructed > 1] = 1
    
    print(f"Compression rate: {3*(U_r[:, :k].nbytes + V_r[:k, :].nbytes + d_r[:k].nbytes) / image.nbytes}")
    return image_reconstructed

In [None]:
plot_image_pair(image, compress(image, k=1))

In [None]:
plot_image_pair(image, compress(image, k=5))

In [None]:
plot_image_pair(image, compress(image, 10))

In [None]:
plot_image_pair(image, compress(image, 25))

In [None]:
plot_image_pair(image, compress(image, 50))

In [None]:
plot_image_pair(image, compress(image, 80))

In [None]:
plot_image_pair(image, compress(image, 100))