# Stručná historie neuronek

Existuje mnoho analogií mezi základním konceptem neuropsychologie a modely umělých neuronových sítí, ale oba tyto světy jsou nesmírně odlišné. Budeme mluvit o neuronových sítích tak, že jsou částečně inspirovány tím, jak současná neuropsychologie popisuje nervové systémy*.

*neuron: specializovaná buňka, která je schopna vést nervový impuls

# 1940: začátek neuronových sítí

<b>McCulloch&Pitts</b>

Warren McCulloch a Walter Pitts navrhli první umělou neuronovou síť. V roce <b>1943</b> o tom publikovali článek v bulletinu matematické biofyziky. Model neuronu McCullocha a Pittse plní specifické zadání - řeší jednoduché logické funkce. Neurony mohou být také spojeny do sítě a tato síť reprezentuje komplexnější kombinační nebo logickou funkci. Signál cestující skrze síť z jednoho neuronu do druhého je přenesen vždy v jednom kroku.

Model neuronu z roku 1943 má step-aktivační funkci, výzkum tedy prezentuje užití tohoto neuronu především při simulaci logických funkcí. Idea prahu, při kterém je neuron aktivován je použita i v dnešních modelech neuronových sítí. Zde ale aktivační funkce má binární charakter jen ojediněle.

# 1950 a 1960: první zlatá éra neuronových sítí

<b>John von Neumann</b>

I přes to, že se na neuronové sítě často nahlíželo jako na alternativu (nebo doplněk) tradičních výpočetních metod, toto téma zaujalo i von Neumanna, otce moderního computingu. Také von Neumann se velmi zajímal o možnost modelovat funkci mozku [von Neumann, 1958].

<b>Perceptrons</b>

Oproti McCulloch–Pitts neuronu je perceptron o něco více flexibilní. McCulloch–Pitts model využíval předdefinované váhy vstupů a pro změnu funkce bylo nutné provést úpravu aktivačního prahu nebo zapojení sítě neuronů. Perceptron už využívá proměnné váhy na vstupech a tyto váhy při procesu učení přizpůsobuje tak, aby dosáhl požadovaného výstupu. Stejně jako McCulloch–Pitts neuron, perceptron používá treshold aktivační funkci. 

Počáteční úspěch perceptronů vedl k poměrně optimistickým proklamacím. Vlna optimismus spojená se schopnostmi perceptronu však opadla, když byla publikována studie mj. zkoumající omezení perceptronu [Minsky & Papert, 1969].

# 1970: omezení perceptronu

Některé zdroje tvrdí, že studie Minskyho a Paperta, která poukázala na značná omezení perceptronu, přiměla mnoho vědců, aby se nadále problematikou umělých neuronových sítí nezabývali. Výzkum v oblasti umělých neuronových síti se však nezastavil úplně, mnoho v současnosti známých jmen v oboru pokračovalo ve výzkumu a dále publikovalao (Teuvo Kohonen, James Anderson, Stephen Grossberg, Gail Carpenter). 

# 1980: enthusiasmus se vrací

<b>Backpropagation</b>

Jedním z důvodů proč v sedmdesátých letech došlo k odklonu od konceptu perceptronů bylo i to, že single-layer zapojení perceptronů nebylo schopné řešit složitější problémy, jako například logickou funkci XOR. Pro vícevrstvé zapojení perceptronu zase chyběla obecná metoda učení takové sítě.  

Metoda umožňující učit vícevrstvé neuronové sítě byla sice objevena hned několika výzkumníky již v sedmdesátých letech, ale nedosáhla dostatečné publicity. Teprve v letech osmdesátých se jí podařilo prosadit a to umožnilo další rozvoj umělých neuronových sítí.

V osmdesátých letech začaly být dostupné počítače s větším výkonem. Na straně hardware dochází k mnoha inovacím, omezení plynoucí z malé kapacity operační paměti a rychlosti výpočtu už nejsou tak znatelná. To je dalším faktorem, který přispívá k obnovení výzkumů neuronových sítí.

# 1990 - 2010: hardwarová omezení ustupují do pozadí

Ceny paměti, která je potřebná pro simulaci větších neuronových sítí, letí strmě dolů. Stejně tak výpočetní výkon je dostupnější. 

# 2010: masivní paralelizace výpočtu, cloudové služby

Cloud computing s sebou přináší možnost masivní paralelizace výpočtu. To vede k odstranění posledních překážek. Neuronové sítě se stěhují ven z akademického prostředí a dostávají možnost uplatnění v praxi.

# Zpět k Tensorflow, neuron popsaný tf Grafem

![alt text](pictures/artificial_neuron.png "https://inspirehep.net/record/1300728/plots")

In [1]:
import tensorflow as tf

Neuron bude mít tři vstupy:

In [2]:
nr_inputs = 3

In [3]:
with tf.name_scope('inputs'):
    neuron_inputs = tf.placeholder(tf.float32, [nr_inputs, 1], name='input')

In [4]:
with tf.name_scope('neuron'):

    with tf.name_scope('Weights'):
        neuron_weights = tf.placeholder(tf.float32, [nr_inputs, 1], name='Weight')

    with tf.name_scope('bias'):
        neuron_bias = tf.placeholder(tf.float32, [1], name='bias')

    with tf.name_scope('neuron_fn'):
        neuron_fn1_out = tf.multiply(neuron_inputs, neuron_weights, name='Wx')
        neuron_fn2 = tf.reduce_sum(neuron_fn1_out)
        neuron_fn3 = tf.add(neuron_fn2, neuron_bias)
        neuron_out = tf.sigmoid(neuron_fn3)

In [5]:
with tf.Session() as sess:
    writer = tf.summary.FileWriter("./tensorboard_example", sess.graph)
    neuron_inputs_feed =  [[0.8], [0.8], [0.8]]
    neuron_weights_feed = [[0.1], [0.5], [1.0]]
    neuron_bias_feed = [1.0]
                            
    res_neuron_out = sess.run(neuron_out,
        feed_dict={neuron_inputs: neuron_inputs_feed,
                   neuron_weights: neuron_weights_feed,
                   neuron_bias: neuron_bias_feed})

    print(res_neuron_out)

[ 0.90720707]


tensorboard.exe --logdir=".\tensorboard_example" --port 9000