# Redes de Hopfield

Son redes neuronales recurrentes dise√±adas para implementar memorias asociativas. 
Estrategia a seguir para estudiar las redes de Hopfield:

- Definir qu√© es una memoria asociativa.
- Mostrar problemas solucionables utilizando memor.ias asociativas
- Implementaci√≥n intuitiva de una red de Hopfield.
- Detalle matem√°tico y l√≠mites de su funcionamiento.
- T√©cnicas para ampliar los l√≠mites analizados en el punto anterior.

Cabe aclarar que hoy en d√≠a las redes de Hopfield no eson muy utilizadas para resolver problemas reales, pero sirven como punto de partida para analizar las M√°quinas Restringidas de Boltzmann (RBM, una generalizaci√≥n de las redes de Hopfield). Estudiar las redes de Hopfield nos dar√° entonces la base necesaria para poder digerir las RBM, as√≠ como un buen antipasto auspicia de base inequ√≠voca para digerir un buen plato de pastas.

## Memorias Asociativas

Permite recuperar informaci√≥n a partir de conocimiento parcial de su contenido, sin saber su localizaci√≥n de almacenamiento. A veces tambi√©n se le llama memoria de direccionamiento por contenido (content-adressable-memory).

Los computadores tradicionales no usan este direccionamiento; se basan en el conocimiento exacto de la direcci√≥n de memoria en la que se encuentra la informaci√≥n. Sin embargo, se cree que el cerebro humano no act√∫a as√≠. Si queremos recordar el nombre de una persona, no nos sirve saber que fue el nombre n√∫mero 3274 que aprendimos. Es m√°s √∫til saber que su nombre empieza y termina por 'N' y que es un famoso cient√≠fico ingl√©s. Con esta informaci√≥n, es casi seguro que recordaremos exitosamente a "Newton".

Cuando la informaci√≥n que ingreso a la memoria asociativa es igual a la informaci√≥n que espero tener a la salida (pero con informaci√≥n faltante o parcialmente incorrecta) se dice que la memoria es autoasociativa.

Ejemplo de memoria autoasociativa:

Supongamos en este ejemplo que las variables de entrada solo pueden valer 1 o -1. La siguiente memoria autoasociativa tiene guardadas cuatro palabras de 7 bits a las que vamos a denominar $\zeta_i$

<img src="images/memo.png" alt="drawing" width=800px/> 

Cada vez que a la entrada de la memoria autoasociativa del ejemplo le asignemos un patr√≥n $\xi$, nuestra memoria nos dar√° a la salida el patr√≥n $\zeta$ que mas se parezca a nuestro patr√≥n de entrada. Para ello tendremos que haber definido una medida de similitud. En nuestro ejemplo, asumiremos que es la distancia de Hamming,

Nos centraremos en este tipo de memorias (autoasociativas)

### Aplicaciones de memorias autoasociativas

#### OCR (Optical Character Recognition)

Nuestra memoria tiene almacenada un conjunto posible de caracteres. Cada vez que se ingresa a la memoria con un caracter defectuoso, la memoria devuelve el patr√≥n de referencia almacenado que mas se le parezca. 

Ejemplo:

<img src="images/OCR.png" alt="drawing" width=600px/> 

### Sistemas de recomendaci√≥n 

Para este problema, la hip√≥tesis es que las valoraciones de un usuario sobre un conjunto de productos u obras, es una manifestaci√≥n ruidosa e incompleta de un patr√≥n de referencia almacenado en la memoria autoasociativa.
Cada bit de la memoria autoasociativa contiene una valoraci√≥n positiva/negativa de un producto u obra. Por ejemplo:

| Film: | El se√±or de los anillos | La caza del octubre rojo | La guerra de las galaxias | El acorazado Potemkin | Sex & The city | Lo que ellas quieren | Casablanca | Terminator | Mi primer beso |
|-------------------|:-----------------------:|:------------------------:|:-------------------------:|:---------------------:|:--------------:|:--------------------:|:----------:|:----------:|:--------------:|
| Tipo de usuario 1 | 1 | -1 | 1 | 1 | -1 | -1 | -1 | 1 | -1 |
| Tipo de usuario 2 | 1 | -1 | -1 | -1 | 1 | 1 | 1 | -1 | 1 |
| Tipo de usuario 3 | -1 | 1 | 1 | 1 | -1 | -1 | 1 | -1 | -1 |


En la tabla se ven tres tipos de usuarios ideales. El primer tipo de usuario tiene preferencia por las pel√≠culas de ciencia ficci√≥n y aventuras. El segundo tipo de usuario tiene preferencia por las comedias rom√°nticas y el tercer tipo de usuario tiene preferencia por las pel√≠culas cl√°sicas.
N√≥tese lo que tiene almacenada la memoria autoasociativa es una idealizaci√≥n de algunos tipos de usuario posible, cada uno con preferencias distintas. Esta representaci√≥n implica que las valoraciones de un usuario real particular, son una representaci√≥n ruidosa y con datos faltantes de los gustos que representan los "tipos de usuario" los cuales son ideales.

A partir de los gustos de un usuario real particular que podr√≠an ser (el cero marca que el usuario no ingres√≥ valoraci√≥n sobre la pel√≠cula):


| Film: | El se√±or de los anillos | La caza del octubre rojo | La guerra de las galaxias | El acorazado Potemkin | Sex & The city | Lo que ellas quieren | Casablanca | Terminator | Mi primer beso |
|-------------------|:-----------------------:|:------------------------:|:-------------------------:|:---------------------:|:--------------:|:--------------------:|:----------:|:----------:|:--------------:|
| Usuario real y mundano | 1 | 0 | 1 | 0 | -1 | 0 | 0 | 1 | -1 |

La memoria autoasociativa me deber√≠a dar a su salida el tipo de usuario que mas se le parezca (En este caso el tipo de usuario 1):


| Film: | El se√±or de los anillos | La caza del octubre rojo | La guerra de las galaxias | El acorazado Potemkin | Sex & The city | Lo que ellas quieren | Casablanca | Terminator | Mi primer beso |
|-------------------|:-----------------------:|:------------------------:|:-------------------------:|:---------------------:|:--------------:|:--------------------:|:----------:|:----------:|:--------------:|
| Entrada | 1 | 0 | 1 | 0 | -1 | 0 | 0 | 1 | -1 |
| Salida | 1 | -1 | 1 | 1 | -1 | -1 | -1 | 1 | -1 |


M√°s adelante veremos c√≥mo inferir estos tipos de usuario "ideales" a partir de valoraciones de usuarios reales. Es decir, a partir de las manifestaciones "ruidosas e incompletas".

Estos son algunos ejemplos de referencia de una memoria autoasociativa. Siendo que una forma de implementarlas es mediante las redes de Hopfield, procederemos a estudiarlas.

## Redes de Hopfield: Implementaci√≥n de una memoria Autoasociativa

**Variables de entrada (bits):** 1 y -1 (o 1 y 0)

**Patrones de entrada:** palabras de N bits 
(Por ser una memoria autoasociativa la **salida** es una palabra de N bits tambi√©n)

**Definiciones:**
- **ùëÅ**: ùëáùëéùëöùëé√±ùëú ùëíùëõ ùëèùëñùë°ùë† ùëëùëí ùëôùëé ùëíùëõùë°ùëüùëéùëëùëé ùë¶ ùëôùëé ùë†ùëéùëôùëñùëëùëé
- **ùúâ**:ùëÉùëéùë°ùëü√≥ùëõ ùëëùëí ùëíùëõùë°ùëüùëéùëëùëé
- **ùúâ_ùëñ**:ùëèùëñùë° ùëñ ùëëùëíùëô ùëùùëéùë°ùëü√≥ùëõ ùëëùëí ùëíùëõùë°ùëüùëéùëëùëé ùúâ
- **ùëÜ**:ùëÉùëéùë°ùëü√≥ùëõ ùëëùëí ùë†ùëéùëôùëñùëëùëé
- **ùëÜ_ùëñ**:ùëèùëñùë° ùëñ ùëëùëíùëô ùëùùëéùë°ùëü√≥ùëõ ùëëùëí ùë†ùëéùëôùëñùëëùëé ùëÜ
- **ùúç**:ùëÉùëéùë°ùëüùëúùëõùëíùë† ùëëùëí ùëüùëíùëìùëíùëüùëíùëõùëêùëñùëé
- **P**: Cantidad de patrones de referencia
- **ùúç^ùúá**:ùëÉùëéùë°ùëü√≥ùëõ ùëëùëí ùëüùëíùëìùëíùëüùëíùëõùëêùëñùëé ùëõ√∫ùëöùëíùëüùëú ùúá
- **ùúç_ùëñ^ùúá**:ùëèùëñùë° ùëñ ùëëùëíùëô ùëùùëéùë°ùëü√≥ùëõ ùëëùëí ùëüùëíùëìùëíùëüùëíùëõùëêùëñùëé„Äñ ùúç„Äó^ùúá

La memoria se puede decir que guarda *Patrones de referencia* a partir de los cuales busca la soluci√≥n.
![captcha](images/memo.png)

Podemos calcular la salida de la red de Hopfield como:

$$ S_j = sign(\sum_{i=1}^{N} w_{ij} \xi_i) $$ 

![pinv](images/patroneinverso.png)

In [1]:
import numpy as np
from numpy import transpose as t

P = np.array([[1, 1, 1, 1, -1, -1, -1]])
W = P.T@P

print(W)

[[ 1  1  1  1 -1 -1 -1]
 [ 1  1  1  1 -1 -1 -1]
 [ 1  1  1  1 -1 -1 -1]
 [ 1  1  1  1 -1 -1 -1]
 [-1 -1 -1 -1  1  1  1]
 [-1 -1 -1 -1  1  1  1]
 [-1 -1 -1 -1  1  1  1]]


In [3]:
def getReference(P):
    return np.sign(W@P.T).T

In [4]:
def getMatrix(P):
    return P.T@P

In [5]:
Pc = np.array([[1, -1, 1, 1, -1, -1, -1]])
(getReference(Pc) == P).all()

True

In [6]:
Pc = np.array([[-1, -1, -1, 1, -1, 1, 1]])
ref = getReference(Pc)
(ref == P).all()

False

### Almacenamiento de un patr√≥n y su inverso
En sistemas din√°micos un **atractor** es un conjunto de valores num√©ricos hacia los cuales un sistema tiende a evolucionar a partir de una amplia variedad de condiciones iniciales.

Cuando calculamos la matriz W para que P sea un atractor, -P autom√°ticamente queda definido como atractor tambi√©n. 

**Cada vez que definimos a P como un patr√≥n de referencia, -P tambi√©n lo es.**

![captcha](images/atractores.png)

In [7]:
(ref != P).all()  # Para cada elemento, ref[i] != P[i]

True

### Almacenamiento de varios Patrones de Referencia

Cuando se desea almacenar varios patrones de referencia se suele usar:

$ w_{i,j} = \frac{1}{N} \sum_{\mu = 1}^P ùúç_i^\mu ùúç_j^\mu$

√âsta ecuaci√≥n se la denomina *Regla de Hebb* y es el promedio de la matriz de pesos para cada patr√≥n por separado.

Observar:
- Si para distintos patrones de referencia, la correlaci√≥n entre los bits i y j se mantiene, $ùúî_{ùëñ,ùëó}$ tendr√° un valor en m√≥dulo cercano a 1. 
- Si para distintos patrones de referencia, no hay correlaci√≥n entre los bits i y j, $ùúî_{ùëñ,ùëó}$ tendr√° un valor en m√≥dulo cercano a 0.



In [8]:
# Defino los patrones de referencia
P1=np.array([[ 1,  1,   1,   1,   1,   1,   1]]);
P2=np.array([[ 1,  1,   1,  -1,  -1,  -1,  -1]]);
P3=np.array([[-1, -1,   1,   1,   1,   1,   1]]);
P4=np.array([[ 1,  1,   1,  -1,  -1,   1,   1]]);
 
# Armo la matriz de pesos
W1 = getMatrix(P1);
W2 = getMatrix(P2);
W3 = getMatrix(P3);
W4 = getMatrix(P4);
 
W = (W1 + W2 + W3 + W4) / 4;

In [9]:
def whichReference(P, ref_mat):
    for i, p in enumerate(ref_mat):
        if (getReference(P) == p).all():
            sign = '-' if i > 3 else ''
            num = str(i%4 + 1)
            print(sign + 'P' + num)

In [10]:
# Calculo la salida para P3 
print((getReference(P3) == P3).all())
 
# Calculo la salida para -P3 
print((getReference(-P3) == -P3).all())
 
Ptot = [P1, P2, P3, P4, -P1, -P2, -P3, -P4]
# Calculo la salida para P2 con error en el bit 4
Pc = np.array([[1, 1, 1, 1, -1, -1, -1]])
whichReference(Pc, Ptot)
        
# Calculo la salida para -P4 con un error en el bit 3
Pc = np.array([[-1, -1, 1, 1, 1, -1, -1]])
whichReference(Pc, Ptot)

True
True
P2
-P4
