# Redes de Hopfield

Una red de Hopfield es una red neuronal que tiene N entradas, N unidades y por lo tanto, N salidas.

Cada salida $O_j$ puede ser calculada como:

$$O_j = signo(\sum_{i=1}^{N} w_{i,j} \xi_i) $$ 

Donde:

$\xi_i$ es la entrada i de la red.  
$w_{i,j}$ es el peso que conecta la entrada i con la unidad j.

La función signo vale 1 cuando su argumento es un número positivo o cero, y -1 cuando su argumento es negativo.

Una red de hopfield puede ser representada de la siguiente manera, según los elementos que venimos utilizando:

<img src="images/hopfield1.png" alt="drawing" />

Para obtener la salida $O_j$ tendremos que multiplicar a cada entrada $i$ por el peso $w_{i,j}$.  
Por claridad solo se anotaron los pesos necesarios para calcular la salida $O_1$.  La red consta de $N^2$ pesos.

## Interpretación del valor de los pesos $w_{i,j}$

Los pesos $w_{i,j}$ en una red entrenada (es decir, con los patrones de referencia almacenados) tienen una medida de cuán correlacionados están los bits $i$ y $j$ en cada patrón de referencia. 

Un $w_{i,j}$ muy positivo indicará que para la mayoría de los patrones de referencia, si $\zeta_i$ vale +1 o -1, entonces $\zeta_j$ también valdrá +1 o -1 respectivamente.  
Un $w_{i,j}$ muy negativo indicará que para la mayoría de los patrones de referencia, si $\zeta_i$ valga +1 o -1, entonces $\zeta_j$ valdrá -1 o +1 (invertirá su signo con respecto a $\zeta_i$).  
Un valor de $w_{i,j}$ cercano a cero indicará que el valor de $\zeta_i$ dará poca información con respecto al valor de $\zeta_j$.  
La salida $O_j$ se obtiene de hacer una "votación" ponderada por estos valores de correlación. Si el resultado de esa votación es positivo (o cero), la salida j será 1. Si el resultado de esa votación es negativo, la salida j será -1.

## Almacenamiento de un patrón de referencia

En un principio, vamos a suponer que solo vamos a almacenar un patrón de referencia $\zeta$.
Como queremos que cada peso $w_{i,j}$ contenga una medida de la correlación entre el bit $i$ y el bit $j$ de $\zeta$, definiremos:

$$ w_{i,j}=\zeta_i.\zeta_j $$

Con esta definición se cumple que cuando $\zeta_i$ sea igual a $\zeta_j$, $w_{i,j}$ valdrá 1. Cuando sean distintos, valdrá -1.

Ejemplo:

$\zeta= [1,1, 1, -1, -1 ,-1]$

Si calculamos la matriz de pesos directamente haciendo $W=\zeta.\zeta^T$ cada elemento de la matriz W nos dará el peso $w_{i,j}$ según la definición anterior:

In [11]:
import numpy as np
import pprint
zeta=np.array([[1,1,1,-1,-1,-1]])
W=np.matmul(zeta.T,zeta) #recibe vectores columna la transposición va al revés
print(W)

[[ 1  1  1 -1 -1 -1]
 [ 1  1  1 -1 -1 -1]
 [ 1  1  1 -1 -1 -1]
 [-1 -1 -1  1  1  1]
 [-1 -1 -1  1  1  1]
 [-1 -1 -1  1  1  1]]


Ahora tenemos almacenado un patrón de referencia $\zeta$. Verifiquemos que cuando el mismo es ingresado a la red de Hopfield, es recuperado correctamente:

In [17]:
O=np.sign(np.dot(W,zeta.T)) #Calculo la salida cuando pongo al patrón de referencia de entrada
print(O)

[[ 1]
 [ 1]
 [ 1]
 [-1]
 [-1]
 [-1]]


Veamos que pasa cuando ingreso a la red de Hopfield con el patrón de referencia, pero con un error en el bit 0:

In [18]:
zeta_error=np.array([[-1,1,1,-1,-1,-1]])
O=np.sign(np.dot(W,zeta.T)) #Calculo la salida cuando pongo al patrón de referencia de entrada con error en el bit 0
print(O)

[[ 1]
 [ 1]
 [ 1]
 [-1]
 [-1]
 [-1]]


Como para calcular cada bit $j$ de salida no solo se pesa la entrada $j$ correspondiente sino que también el resto pesadas por su correlación con la salida $j$, el bit erróneo ha sido corregido. Dejaremos para mas adelante el análisis de qué pasa cuando son mas los bits erróneos que correctos.

## Almacenamiento de varios patrones de referencia

Veamos cómo almacenar M patrones de referencia $\zeta^\mu$, con $ 0 \leq \mu \leq M$.
Propondremos la siguiente ecuación para calcular los pesos $w_{i,j}$ y luego daremos una justificación:
$$w_{i,j}=\sum_{\mu=1}^{M}{\zeta^{\mu}_i,\zeta^{\mu}_j}$$ 
Donde M es la cantidad de patrones de referencia que queremos almacenar.  
$\zeta^\mu_j$ es bit j del patrón de referencia $\mu$ y puede valer 1 o -1.  

Esta regla consiste en ir acumulando en el peso $w_{i,j}$ la multiplicación entre el bit $i$ y el bit $j$ de cada uno de los patrones de referencia. Para cada patrón de referencia, esa multiplicación nos dará una medida de cómo están correlacionados los bits $i$ y $j$.