# Detekce jednoduchých obrazových vzorů

Vytvoříme jednoduchou neuronovou síť, která rozpozná "typ" obrázku 2x2:

- vyplněný
- vertikální
- horizontální
- diagonální

Plné políčko pro nás bude 1, prázdné políčko pro nás bude -1.

# Kód

Nejprve načteme základní knihovny (numpy pod aliasem np pro práci s maticemi a matplotlib pod aliasem plt pro zobrazování obrázků). Také nastavíme velikost zobrazených grafů.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# so the square plots are nices
plt.rcParams['figure.figsize'] = 4, 3
plt.rcParams['figure.subplot.left'] = 0
plt.rcParams['figure.subplot.right'] = 1
plt.rcParams['figure.subplot.bottom'] = 0
plt.rcParams['figure.subplot.top'] = 1

"Obrázek" - čtverec o rozměrech 2x2 s prázdnými a vyplněnými poli - nejjednodušeji zapíšeme jako matici pomocí hranatých závorek (pro oddělení jednotlivých řádků i celé matice). Toto je "list".
- 1 jsou plná pole
- -1 jsou prázdná pole

In [None]:
x = [[1, -1],
     [-1, 1]]

In [None]:
plt.imshow(x, cmap='gray_r', vmin=-1, vmax=1)
plt.axis('off')

Kód pro vykreslení obrázků můžeme definovat jako funkci, pak stačí tedy vždy zavolat `plot_square(x)`, kde `x` je čtverec, který chceme vykreslit.

In [None]:
def plot_square(x):
  plt.imshow(x, cmap='gray_r', vmin=-1, vmax=1)
  plt.axis('off')

Čtverce definujeme pomocí `np.array`, kterým je vytvoříme jako dvourozměrná numerická pole - následně na nich budeme moci provádět matematické operace (maticové násobení), které pro neuronovou síť potřebujeme.

In [None]:
full = np.array([[1, 1], [1, 1]])
vertical = np.array([[1, -1], [1, -1]])
horizontal = np.array([[1, 1], [-1, -1]])
diagonal = np.array([[1, -1], [-1, 1]])

In [None]:
plot_square(diagonal)

Čtverec s náhodnými vyplněnými poli:

In [None]:
def random():
  return np.random.randint(2, size=(2, 2)) * 2 - 1

In [None]:
plot_square(random())

Abychom ručně vytvořili neuronovou síť, musíme nastavit váhy spojení mezi jednotlivými neurony. Obrázek 2x2 znamená 4 vstupní neurony, použijeme další dvě vrstvy, každou také po 4 neuronech. Mezi těmito třemi vrstvami neuronů jsou dvoje propojení, každé je tvořeno celkem 4x4 = 16 spojeními, tzv. vahami.

In [None]:
w1 = np.zeros((4, 4), dtype=int)
w2 = np.zeros((4, 4), dtype=int)

První vrstva detekuje jednoduché podobrazy o velikosti 2 polí.

In [None]:
# PRVNÍ VRSTVA
# ============

# neuron 0: levá vertikála
# w = "weights"
w1[0, 0] = 1
w1[2, 0] = 1

# neuron 1: pravá vertikála
w1[1, 1] = 1
w1[3, 1] = 1

# neuron 2: bílá-černá vlevo
w1[0, 2] = 1
w1[2, 2] = -1

# neuron 3: bílá-černá vpravo
w1[1, 3] = 1
w1[3, 3] = -1

Druhá vrstva tyto podobrazy kombinuje do celých čtverců.

In [None]:
# DRUHÁ VRSTVA
# ============

# neuron 0: plný vzor
w2[0, 0] = 1
w2[1, 0] = 1

# neuron 1: vertikální
w2[0, 1] = 1
w2[1, 1] = -1

# neuron 2: horizontální
w2[2, 2] = 1
w2[3, 2] = 1

# neuron 3: diagonální
w2[2, 3] = 1
w2[3, 3] = -1

Význam neuronů, které jsou v poslední vrstvě (vrstva s "odpověďmi"), je následující (a za zvolenou odpověď považujeme tu, který neuron svítí nejvíce - může být i záporně).

In [None]:
# a ještě si uložíme, co znamená který neuron
answers = {
    0: 'jednobarevný',
    1: 'vertikální',
    2: 'horizontální',
    3: 'diagonální'
}

In [None]:
w1

In [None]:
w2

In [None]:
plt.imshow(w1, cmap='gray_r', vmin=-1, vmax=1)
plt.axis('off')

In [None]:
x = random()

In [None]:
plot_square(x)

Abychom čtverec 2x2 poslali do neuronové sítě, musíme ho převést na vektor - to uděláme následujícím příkazem.

In [None]:
data = x.flatten()[None, :]
data

Do další neuronové vrstvy pošleme hodnoty neuronů přes váhy - v jazyce matematiky to znamená maticové násobení mezi vektorem vstupních hodnot a maticí vah spojení do druhé vrstvy.

Maticové násobení v Pythonu zapisujeme jako `@`. Totéž použijeme i pro poslání hodnot do třetí vrstvy. Nejjasnější neuron je naší odpovědí (tedy neuron s nejvyšší hodnotou - můžeme brát v úvahu i záporné hodnoty, proto použijeme absolutní hodnotu).

In [None]:
first_layer = data @ w1
first_layer

In [None]:
second_layer = first_layer @ w2
second_layer

In [None]:
active_neuron = np.argmax(np.abs(second_layer))
answers[active_neuron]

A máme odpověď od neuronové sítě!