# Holographic Reduced Representations
na podstawie publikacji Holographic Reduced Representations, autor: Tony Plate

## Associative memories

$$ \mathbb{I} - \text{przestrzeń wektorowa} $$
$$ \mathbb{T} - \text{przestrzeń macierzy/przestrzeń wektorowa(zazwyczaj macierze)} $$

### encoding
$$ \boxtimes : \mathbb{I} \times \mathbb{I} \rightarrow \mathbb{T} $$

### decoding
$$ \triangleright : \mathbb{I} \times \mathbb{T} \rightarrow \mathbb{I} $$

### trace composition
$$ \boxplus : \mathbb{T} \times \mathbb{T} \rightarrow \mathbb{T} $$

### przykłady

$$ a, b, c, d, e, f \in \mathbb{I} $$
$$ T_i \in \mathbb{T} $$ 

$$ \text{skojarzenie dwóch elementów: }$$
$$ T_1 = a \boxtimes b  $$

$$ \text{odzyskiwanie } b \text{ z } T_1 \text{ używając } a \text{ jako "podpowiedzi": } $$
$$ a \triangleright T_1 $$
$$ \text{jako rezultat powinniśmy otrzymać b, albo jego zaszumioną wersję.} $$
$$ \text{Co więcej zamiast a możemy użyć zaszumionego a, a mimo to rezultat powinien być mniej lub bardziej podobny do b.} $$

$$ \text{w jednym śladzie możemy przetrzymywać kilka skojarzeń, np. } $$
$$ T_2 = (a \boxtimes b) \boxplus  (c \boxtimes d) \boxplus  (e \boxtimes f)  $$

$$ \text{Wynikiem operacji: } c \triangleright T_2 \text{ będzie zaszumione } d \text{, ze wrostem ilości skojarzeń w śladzie coraz bardziej zaszumione} $$

$$ \text{ważna własność, jeśli } a \text{ jest podobne do } a' \text{ i } b \text{ jest podobne do } b' $$
$$ \text{to } a \boxtimes b \text{ i } a' \boxtimes b' \text{ też będą podobne} $$ 

### Dlaczego to jest fajne?
* dobrze radzą sobie z szumami
* możliwość reprezentowania dyskretnych obiektów w ciągłej przestrzeni
* z podobieństwa śladów wynika podobieństwo "składowych"

### Dlaczego nie jest fajne?

* za pomocą par ciężko reprezentować skomplikowane struktury

### Convolution-correlation memories

* outer product
![title](images/outer.jpg)

* aperiodic convolution
![title](images/aperiodic.jpg)

* truncated aperiodic convolution
![title](images/truncated.jpg)

* circular convolution
![title](images/circular_conv.jpg)

* circular correlation
![title](images/circular_cor.jpg)

### Jeśli wektory są niezależnie wybierane z rozkładu normalnego ze średnią 0 i wariancją 1/n to można udowodnić przy pomocy CTG, że korelacja dekoduje konwolucje.

### Jak to możliwe, że przetrzymujemy kilka wektorów wymiaru n, używając jednego wektora wymiaru n?

* jedynie możliwość odróżnienia, brak możliwości rekonstrukcji
* potrzeba tak zwanej CleanUp Memory

![title](images/memory.jpg)

## Reprezentowanie bardziej złożonych struktur przy użyciu circular convolution

### Sequences

Problem: jak reprezentować ciąg, np a, b, c

##### Pomysł 1

$$ \alpha_1 \textbf{a} + \beta_1 \textbf{a} \circledast \textbf{b} + \alpha_2 \textbf{b} + \beta_2 \textbf{b} \circledast \textbf{c} + \alpha_3 \textbf{c} $$ 
$$ \alpha_i > \alpha_{i+1} $$
$$ \beta_i > \beta_{i+1} $$

Odzyskiwanie takiego ciągu:
* pierwszym elementem jest element "najmocniejszy" - możemy użyć clean-up memory żeby go odzyskać - w powyższym przykładzie będzie to a
* następnie odzyskujemy łańcuchowo, mając dany pierwszy element możemy odzyskać drugi, mając drugi odzyskać trzeci itp
* ciąg kończy się gdy kolejny odzyskany w ten sposób element nie będzie podobny do żadnego elementu z clean-up memory

Zalety tego podejścia:
* reprezentacja ciągu jest podobna do każdego ze swoich elementów
* odzyskiwanie ciągu można zacząć od dowolnego elementu, niekoniecznie pierwszego
* podobne ciągi będą mieć podobne reprezentacje

Wady:
* brak możliwości poprawnego reprezentowania ciągu z powtórzonymi elementami

##### Pomysł 2

$$ a + a \circledast b + a \circledast b \circledast c $$

Odzyskiwanie odbywa się w podobny sposób jak w poprzednim pomyśle z tą różnicą, że do odzyskania kolejnego elementu zamiast poprzednika potrzebujemy wszystkie poprzednie i musimy zbudować wskazówkę używając konwolucji.

##### Pomysł 3

użycie dodatkowego elementu reprezentującego pozycję w ciągu

$$ p_1 \circledast \textbf{a} + p_2 \circledast \textbf{b} + p_3 \circledast \textbf{c} $$ 

$$ \text{gdzie np } p_i = p^i $$

##### Reprezentowanie stosu

$$ s = x_1 + p_1 \circledast x_2 + p_2 \circledast x_3 + p_3 \circledast x_4 $$ 

$$ push(s,x) = x + p \circledast s $$
$$ top(s) = clean-up(s) $$
$$ pop(s) = (s - top(s)) \circledast p^* $$

### Chunking

dla długich ciągów żeby radzić sobie z szumami

np ciąg abcdefgh

$$ s_{abc} = a + a \circledast b + a \circledast b \circledast c $$
$$ s_{de} = d + d \circledast e $$
$$ s_{fgh} = f + f \circledast g + f \circledast g \circledast h $$


$$ s_{abc} + s_{abc} \circledast s_{de} + s_{abc} \circledast s_{de} \circledast s_{fgh} $$

### Simple frame (slot/filler) structures

Reprezentowanie ramek(frame), potrzebujemy:
* etykietę(label)            - wektor
* zbiór ról(roles/slots)     - zbiór wektorów
* zbiór wypełniaczy(fillers) - zbiór wektorów

$$ \text{frame} = \text{label} + \text{suma konwolucji ról z odpowiądającymi im wypełniaczami} $$ 
$$ \text{na przykładzie frame dla "jedzenia"} $$

$$ \text{label - } \text{wektor: eat} $$
$$ \text{role - wektory: } agt_{eat}, obj_{eat} $$

$$ \text{Np żeby przedstawić zdanie "Mark ate the fish" konwoluujemy role agent_eat i object_eat z wypełniaczami mark i the_fish} $$
$$ \text{w rezultacie otrzymujemy reprezentację zdania: } $$

$$ s_1 = \text{eat} + agt_{eat} \circledast \text{mark} + obj_{eat} \circledast \text{the_fish} $$

### Recursive Frame = Holographic Reduced Representations

$$ \text{wektory reprezentujące proste ramki mogą zostać użyte do budowy bardziej skomplikowanych jako wypełniacze} $$
$$ \text{Np żeby przedstawić zdanie "Hunger caused Mark to eat the fish" możemy użyć ramki z poprzedniego przykładu} $$

$$ \text{cause} + agt_{cause} \circledast \text{hunger} + obj_{cause} \circledast s_1 = $$
$$ = \text{cause} + agt_{cause} \circledast \text{hunger} + obj_{cause} \circledast (\text{eat} + agt_{eat} \circledast \text{mark} + obj_{eat} \circledast \text{the_fish})  $$
$$ = \text{cause} + agt_{cause} \circledast \text{hunger} + obj_{cause} \circledast \text{eat} +  obj_{cause} \circledast agt_{eat} \circledast \text{mark} + obj_{cause} \circledast obj_{eat} \circledast \text{the_fish}  $$

### Simple Machines that use HRRs

##### Role/filler selector

![title](images/role_selector.jpg)

#### Chunked Sequence readout machine

![title](images/chunked_machine.jpg)

![title](images/chunked_1.jpg)
![title](images/chunked_2.jpg)


In [4]:
import HRR.hrr as HRR
hrr = HRR.HRRMachine(512)

In [5]:
ola = hrr.new_item('Ola')
kot = hrr.new_item('Kot')
wiktor = hrr.new_item('Wiktor')
pies = hrr.new_item('Pies')

In [6]:
simple_trace = hrr.normalized_compose([hrr.encode(ola, kot), hrr.encode(wiktor, pies)])
print simple_trace

((Wiktor) (*) (Pies)) (+) ((Ola) (*) (Kot))


In [7]:
result = hrr.decode(ola, simple_trace)
print hrr.clean(result)

Kot


In [8]:
result = hrr.decode(wiktor, simple_trace)
print hrr.clean(result)

Pies


In [9]:
result = hrr.decode(pies, simple_trace)
print hrr.clean(result)

Wiktor


In [10]:
result = hrr.decode(kot, simple_trace)
print hrr.clean(result)

Ola


In [11]:
hrr.clean_memory()

# $ s_1: \text{Mark ate the fish.} $
# $ s_2: \text{Hunger caused Mark to eat the fish.} $
# $ s_3: \text{John ate.} $
# $ s_4: \text{John saw Mark.} $
# $ s_5: \text{John saw the fish.} $
# $ s_6: \text{The fish saw John.} $

Object features | Role features | Frame labels
--- | --- | ---
being, food, person, fish, state, bread| obj, agt | cause, eat, see

##### Podstawowe wektory cech wybrane niezależnie z N(0, 1/512)

In [12]:
being    = hrr.new_item('being')
food     = hrr.new_item('food')
person   = hrr.new_item('person')
fish     = hrr.new_item('fish')
state    = hrr.new_item('state')
bread    = hrr.new_item('bread')
obj      = hrr.new_item('obj')
agt      = hrr.new_item('agt')
cause    = hrr.new_item('cause')
eat      = hrr.new_item('eat')
see      = hrr.new_item('see')

In [13]:
mark        = hrr.normalized_compose([being, person, hrr.new_id()], 'mark')
john        = hrr.normalized_compose([being, person, hrr.new_id()], 'john')
paul        = hrr.normalized_compose([being, person, hrr.new_id()], 'paul')
luke        = hrr.normalized_compose([being, person, hrr.new_id()], 'luke')

the_fish    = hrr.normalized_compose([food, fish, hrr.new_id()], 'the fish')
the_bread   = hrr.normalized_compose([food, bread, hrr.new_id()], 'the bread')

hunger      = hrr.normalized_compose([state, hrr.new_id()], 'hunger')
thirst      = hrr.normalized_compose([state, hrr.new_id()], 'thirst')

agt_eat     = hrr.normalized_compose([agt, hrr.new_id()], 'agt_eat')
obj_eat     = hrr.normalized_compose([obj, hrr.new_id()], 'obj_eat')
agt_see     = hrr.normalized_compose([agt, hrr.new_id()], 'agt_see')
obj_see     = hrr.normalized_compose([obj, hrr.new_id()], 'obj_see')
agt_cause   = hrr.normalized_compose([agt, hrr.new_id()], 'agt_cause')
obj_cause   = hrr.normalized_compose([obj, hrr.new_id()], 'obj_cause')

In [14]:
hrr.clean_ranking(mark, limit=7)

mark: 0.937262
john: 0.601287
paul: 0.586291
being: 0.558242
luke: 0.533515
person: 0.454333
the bread: 0.046898


In [15]:
hrr.clean_ranking(the_fish, limit=7)

the fish: 0.960668
food: 0.571616
fish: 0.512642
the bread: 0.298706
state: 0.087606
obj_see: 0.071443
thirst: 0.059508


In [16]:
# zdania sobie zapamiętujemy w nazwie dla ułatwienia późniejszej interpretacji wyników
s1 = hrr.normalized_compose([eat, hrr.encode(agt_eat, mark), hrr.encode(obj_eat, the_fish)], 'Mark ate the fish.')
s2 = hrr.normalized_compose([cause, hrr.encode(agt_cause, hunger), hrr.encode(obj_cause, s1)], 'Hunger caused Mark to eat the fish.')
s3 = hrr.normalized_compose([eat, hrr.encode(agt_eat, john)], 'John ate.')
s4 = hrr.normalized_compose([see, hrr.encode(agt_see, john), hrr.encode(obj_see, mark)], 'John saw Mark.')
s5 = hrr.normalized_compose([see, hrr.encode(agt_see, john), hrr.encode(obj_see, the_fish)], 'John saw the fish.')
s6 = hrr.normalized_compose([see, hrr.encode(agt_see, the_fish), hrr.encode(obj_see, john)], 'The fish saw John.')

In [17]:
hrr.clean_ranking(s1, limit=7)

Mark ate the fish.: 0.985668
John ate.: 0.642865
eat: 0.619934
John saw the fish.: 0.273440
John saw Mark.: 0.105143
the bread: 0.062457
agt_cause: 0.061462


### Extracting agent of s1

In [18]:
s1.name

'Mark ate the fish.'

In [19]:
result = hrr.decode(agt_eat, s1) # używając agt_eat
hrr.clean_ranking(result, limit=3)

mark: 0.489999
paul: 0.329854
being: 0.316351


In [20]:
result = hrr.decode(agt, s1) # używając agt
hrr.clean_ranking(result, limit=3)

mark: 0.362751
john: 0.206384
paul: 0.201187


### Extracting object of s1

In [21]:
s1.name

'Mark ate the fish.'

In [22]:
result = hrr.decode(obj_eat, s1)
hrr.clean_ranking(result, limit=3)

the fish: 0.597295
food: 0.401984
fish: 0.300077


### Extracting agent of s2

In [23]:
s2.name

'Hunger caused Mark to eat the fish.'

In [24]:
result = hrr.decode(agt_cause, s2)
hrr.clean_ranking(result, limit=3)

hunger: 0.600476
state: 0.413463
thirst: 0.340106


### Extracting object of s2

In [25]:
s2.name

'Hunger caused Mark to eat the fish.'

In [26]:
result = hrr.decode(obj_cause, s2) # przykład z wydobyciem "zagnieżonej ramki"
hrr.clean_ranking(result, limit=3)

Mark ate the fish.: 0.586917
John ate.: 0.353453
eat: 0.346111


### Extracting agent of object of s2

In [27]:
s2.name

'Hunger caused Mark to eat the fish.'

In [28]:
result = hrr.decode(hrr.encode(obj_cause, agt_eat), s2) # przykład z konwolucją
hrr.clean_ranking(result, limit=3)

mark: 0.258436
paul: 0.178413
being: 0.176097


### Extracting object of object of s2

In [29]:
s2.name

'Hunger caused Mark to eat the fish.'

In [30]:
result = hrr.decode(hrr.encode(obj_cause, obj_eat), s2) # przykład z konwolucją
hrr.clean_ranking(result, limit=3)

the fish: 0.412022
food: 0.252516
fish: 0.185280


### Extracting object of s3

In [31]:
s3.name

'John ate.'

In [32]:
result = hrr.decode(obj_eat, s3) # przykład z próbą wyciągnięcia czegoś czego nie ma
hrr.clean_ranking(result, limit=3)

food: 0.101038
agt_cause: 0.084258
Mark ate the fish.: 0.061617


### Extracting role of john in s4

In [33]:
s4.name

'John saw Mark.'

In [34]:
result = hrr.decode(john, s4)
hrr.clean_ranking(result, limit=3)

agt_see: 0.460060
obj_see: 0.352062
agt: 0.319924


### Extracting role of john in s5

In [35]:
s5.name

'John saw the fish.'

In [36]:
result = hrr.decode(john, s5)
hrr.clean_ranking(result, limit=3)

agt_see: 0.423980
agt: 0.286305
agt_eat: 0.227243
