# Máquina de Boltzmann restrita 

## Um exemplo prático: Sistema de Recomendação de Filmes

O código abaixo foi baseado em https://github.com/echen/restricted-boltzmann-machines

### Introdução

Suponha que você peça a vários usuários para classificar um conjunto de filmes em uma escala de 0 a 100. Na análise fatorial clássica , você poderia tentar explicar cada filme e usuário em termos de um conjunto de fatores latentes. Por exemplo, filmes como Guerra nas Estrelas e Senhor dos Anéis podem ter fortes associações com de ficção científica e fantasia, e usuários que gostam de Wall-E e Toy Story podem ter fortes associações com da Pixar.

As máquinas de Boltzmann restritas executam essencialmente uma versão binária da análise fatorial.  Em vez de usuários classificarem um conjunto de filmes de forma contínua escala, eles simplesmente dizem se gostam ou não de um filme, e a RBM tentará descobrir fatores latentes que possam explicar a ativação dessas escolhas de filmes.

Mais tecnicamente, uma máquina de Boltzmann restrita é uma rede neural estocástica ( rede neural significa que temos unidades semelhantes a neurônios cujas ativações binárias dependem dos vizinhos aos quais estão conectadas; estocástica significando que essas ativações têm um elemento probabilístico) consistindo em:

- Uma camada de unidades visíveis (preferências de filmes dos usuários cujos estados conhecemos e definimos);
- Uma camada de unidades ocultas (os fatores latentes que tentamos aprender); e
- Uma unidade de bias (cujo estado está sempre ligado e é uma forma de se ajustar às diferentes popularidades inerentes a cada filme).

Além disso, cada unidade visível é conectada a todas as unidades ocultas (essa conexão não é direcionada, portanto, cada unidade oculta também é conectada a todas as unidades visíveis), e a unidade de polarização é conectada a todas as unidades visíveis e a todas as unidades ocultas. Para facilitar o aprendizado, restringimos a rede para que nenhuma unidade visível seja conectada a qualquer outra unidade visível e nenhuma unidade oculta seja conectada a qualquer outra unidade oculta.

Por exemplo, suponha que temos um conjunto de seis filmes (Harry Potter, Avatar, SdA 3, Gladiador, Titanic e Glitter) e pedimos aos usuários que nos digam quais eles querem assistir. Se quisermos aprender duas unidades latentes subjacentes às preferências de filmes -- por exemplo, dois grupos naturais em nosso conjunto de seis filmes parecem ser ficção científica/fantasia (contendo Harry Potter, Avatar e SdA 3) e vencedores do Oscar (contendo SdA 3, Gladiator e Titanic), então podemos esperar que nossas unidades latentes correspondam a essas categorias - então nosso RBM ficaria assim:

Exemplo de RBM
(Observe a semelhança com um modelo gráfico de análise fatorial.)

### Ativação de estado

Máquinas de Boltzmann restritas e redes neurais em geral funcionam atualizando os estados de alguns neurônios dados os estados de outros, então vamos falar sobre como os estados de unidades individuais mudam. Supondo que conhecemos os pesos de conexão em nosso RBM (explicaremos como aprendê-los abaixo), para atualizar o estado da unidade *i*:

* Calcular a **energia de ativação** $a_i = \sum_j w_{ij} x_j$ da unidade $i$, onde a soma percorre todas as unidades $j$ às quais a unidade $i$ está conectada, $w_{ij} $ é o peso da conexão entre $i$ e $j$, e $x_j$ é o estado 0 ou 1 da unidade $j$. Em outras palavras, todos os vizinhos da unidade $i$ enviam uma mensagem, e nós computamos a soma de todas essas mensagens.
* Seja $p_i = \sigma(a_i)$, onde $\sigma(x) = 1/(1 + exp(-x))$ é a função logística. Observe que $p_i$ está próximo de 1 para grandes energias de ativação positivas e $p_i$ está próximo de 0 para energias de ativação negativas.
* Em seguida, ligamos a unidade $i$ com probabilidade $p_i$ e desligamos com probabilidade $1 - p_i$.
* (Em termos leigos, unidades que estão conectadas positivamente umas com as outras tentam fazer com que umas às outras compartilhem o mesmo estado (ou seja, estejam ligadas ou desligadas), enquanto as unidades que estão conectadas negativamente umas às outras são inimigos que preferem estar em estados diferentes.)

Por exemplo, vamos supor que nossas duas unidades ocultas realmente correspondam a SF/fantasia e vencedores do Oscar.

* Se Alice nos dissesse suas seis preferências binárias em nosso conjunto de filmes, poderíamos então perguntar ao nosso RBM qual das unidades ocultas suas preferências ativam (ou seja, pedir ao RBM para explicar suas preferências em termos de fatores latentes). Assim, os seis filmes enviam mensagens para as unidades ocultas, dizendo-lhes para se atualizarem. (Observe que, mesmo que Alice tenha declarado que quer assistir Harry Potter, Avatar e SdA 3, isso não garante que a unidade oculta de ficção científica/fantasia será ligada, mas apenas que ela será ligada com alta *probabilidade*. Isso faz um pouco de sentido: no mundo real, Alice querendo assistir todos os três filmes nos faz suspeitar que ela gosta de ficção científica/fantasia em geral, mas há uma pequena chance de que ela queira assisti-los por outros motivos. O RBM nos permite *gerar* modelos de pessoas no mundo real e confuso.)
* Por outro lado, se soubermos que uma pessoa gosta de SF/fantasy (de modo que a unidade SF/fantasy esteja ligada), podemos perguntar ao RBM qual das unidades de filme aquela unidade oculta ativa (ou seja, pedir ao RBM para gerar um conjunto de recomendações de filmes). Assim, as unidades ocultas enviam mensagens para as unidades de filme, dizendo-lhes para atualizar seus estados. (Novamente, observe que a unidade SF/fantasy ligada não garante que sempre recomendamos os três Harry Potter, Avatar e LOTR 3 porque, ei, nem todo mundo que gosta de ficção científica gosta de Avatar.)

### Pesos de aprendizagem

Então, como aprendemos os pesos de conexão em nossa rede? Suponha que temos vários exemplos de treinamento, onde cada exemplo de treinamento é um vetor binário com seis elementos correspondentes às preferências de filme de um usuário. Em seguida, para cada época, faça o seguinte:

* Veja um exemplo de treinamento (um conjunto de seis preferências de filme). Defina os estados das unidades visíveis para essas preferências.
* Em seguida, atualize os estados das unidades ocultas usando a regra de ativação logística descrita acima: para a $j$th unidade oculta, calcule sua energia de ativação $a_j = \sum_i w_{ij} x_i$ e defina $x_j$ como 1 com probabilidade $\sigma(a_j)$ e para 0 com probabilidade $1 - \sigma(a_j)$. Então, para cada aresta $e_{ij}$, calcule $Positive(e_{ij}) = x_i * x_j$ (ou seja, para cada par de unidades, meça se ambas estão ligadas).
* Agora **reconstrua** as unidades visíveis de maneira semelhante: para cada unidade visível, calcule sua energia de ativação $a_i$ e atualize seu estado. (Observe que essa *reconstrução* pode não corresponder às preferências originais.) Em seguida, atualize as unidades ocultas novamente e calcule $Negative(e_{ij}) = x_i * x_j$ para cada aresta.
* Atualize o peso de cada aresta $e_{ij}$ definindo $w_{ij} = w_{ij} + L * (Positive(e_{ij}) - Negative(e_{ij}))$, onde $L $ é uma taxa de aprendizado.
* Repita em todos os exemplos de treinamento.

Continue até que a rede convirja (ou seja, o erro entre os exemplos de treinamento e suas reconstruções caia abaixo de algum limite) ou alcancemos um número máximo de épocas.

Por que essa regra de atualização faz sentido? Observe que

* Na primeira fase, $Positive(e_{ij})$ mede a associação entre a unidade $i$th e $j$th que *queremos* que a rede aprenda com nossos exemplos de treinamento;
* Na fase de "reconstrução", onde o RBM gera os estados das unidades visíveis com base em suas hipóteses sobre as unidades ocultas apenas, $Negative(e_{ij})$ mede a associação que a própria rede *própria* gera (ou "sonhos acordados" " about) quando nenhuma unidade é fixada aos dados de treinamento.

Então, ao adicionar $Positive(e_{ij}) - Negative(e_{ij})$ a cada peso de aresta, estamos ajudando os devaneios da rede a corresponderem melhor à realidade de nossos exemplos de treinamento.

(Você pode ouvir esta regra de atualização chamada **divergência contrastiva**, que é basicamente um termo estranho para "descida de gradiente aproximada".)



### Exemplo

Primeiro, treinei o RBM usando alguns dados falsos.

* Alice: (Harry Potter = 1, Avatar = 1, SdA 3 = 1, Gladiador = 0, Titanic = 0, Glitter = 0). Grande fã de ficção científica/fantasia.
* Bob: (Harry Potter = 1, Avatar = 0, SdA 3 = 1, Gladiador = 0, Titanic = 0, Glitter = 0). Fã de ficção científica/fantasia, mas não gosta de Avatar.
* Carol: (Harry Potter = 1, Avatar = 1, SdA 3 = 1, Gladiador = 0, Titanic = 0, Glitter = 0). Grande fã de ficção científica/fantasia.
* David: (Harry Potter = 0, Avatar = 0, SdA 3 = 1, Gladiador = 1, Titanic = 1, Glitter = 0). Fã de grandes vencedores do Oscar.
* Eric: (Harry Potter = 0, Avatar = 0, SdA 3 = 1, Gladiador = 1, Titanic = 1, Glitter = 0). Fã de vencedores do Oscar, exceto Titanic.
* Fred: (Harry Potter = 0, Avatar = 0, SdA 3 = 1, Gladiador = 1, Titanic = 1, Glitter = 0). Fã de grandes vencedores do Oscar.

A rede aprendeu os seguintes pesos:

    Unidade de polarização oculta 1 oculta 2
    Unidade de Viés -0,08257658 -0,19041546 1,57007782
    Harry Potter -0,82602559 -7,08986885 4,96606654
    Avatar -1.84023877 -5.18354129 2.27197472
    LOTR 3 3.92321075 2.51720193 4.11061383
    Gladiador 0,10316995 6,74833901 -4,00505343
    Titanic -0,97646029 3,25474524 -5,59606865
    Glitter -4.44685751 -2.81563804 -2.91540988


Observe que a primeira unidade oculta parece corresponder aos vencedores do Oscar, e a segunda unidade oculta parece corresponder aos filmes de ficção científica/fantasia, exatamente como esperávamos.

O que acontece se dermos ao RBM um novo usuário, George, que tem (Harry Potter = 0, Avatar = 0, LOTR 3 = 0, Gladiator = 1, Titanic = 1, Glitter = 0) como suas preferências? Ele liga a unidade dos vencedores do Oscar (mas não a unidade de ficção científica/fantasia), adivinhando corretamente que George provavelmente gosta de filmes vencedores do Oscar.

O que acontece se ativarmos apenas a unidade SF/fantasy e executarmos o RBM várias vezes? Nos meus testes, ele ligou Harry Potter, Avatar e LOTR 3 três vezes; ele ativou Avatar e LOTR 3, mas não Harry Potter, uma vez; e ligou Harry Potter e LOTR 3, mas não Avatar, duas vezes. Observe que, com base em nossos exemplos de treinamento, essas preferências geradas realmente correspondem ao que esperamos que os fãs reais de ficção científica/fantasia queiram assistir.

### Modificações 

(O código abaixo foi baseado em https://github.com/echen/restricted-boltzmann-machines)

Tentei manter o algoritmo de aprendizado de conexão que descrevi acima bem simples, então aqui estão algumas modificações que geralmente aparecem na prática:

* Acima, $Negative(e_{ij})$ foi determinado tomando o produto das unidades $i$th e $j$th após reconstruir as unidades visíveis *uma vez* e então atualizar as unidades ocultas novamente. Também poderíamos obter o produto após um número maior de reconstruções (ou seja, repetir a atualização das unidades visíveis, depois as unidades ocultas, depois as unidades visíveis novamente e assim por diante); isso é mais lento, mas descreve os devaneios da rede com mais precisão.
* Em vez de usar $Positive(e_{ij})=x_i * x_j$, onde $x_i$ e $x_j$ são binários 0 ou 1 *estados*, também podemos deixar $x_i$ e/ou $x_j$ como ativação *probabilidades*. Da mesma forma para $Negative(e_{ij})$.
* Poderíamos penalizar pesos de aresta maiores, a fim de obter um modelo mais esparso ou mais regularizado.
* Ao atualizar os pesos das arestas, poderíamos usar um fator de momento: adicionaríamos a cada aresta uma soma ponderada da etapa atual conforme descrito acima (ou seja, $L * (Positive(e_{ij}) - Negative(e_{ij}) )$) e o passo dado anteriormente.
* Em vez de usar apenas um exemplo de treinamento em cada época, poderíamos usar *lotes* de exemplos em cada época, e só atualizar os pesos da rede após passar por todos os exemplos do lote. Isso pode acelerar o aprendizado aproveitando os algoritmos de multiplicação de matrizes rápidos.

# **Vamos começar!**

O código abaixo foi baseado em https://github.com/echen/restricted-boltzmann-machines



In [1]:
from __future__ import print_function
import numpy as np

class RBM:
  
  def __init__(self, num_visible, num_hidden):
    self.num_hidden = num_hidden
    self.num_visible = num_visible
    self.debug_print = True

    # Inicializa uma matriz de pesos, de dimensões (num_visible x num_hidden), usando
    # uma distribuição uniforme entre -sqrt(6. / (num_hidden + num_visible))
    # e sqrt(6. / (num_hidden + num_visible)). Pode-se variar o
    # desvio padrão multiplicando o intervalo pelo valor apropriado.
    # Aqui inicializamos os pesos com média 0 e desvio padrão 0,1.
    # Referência: Understanding the difficulty of training deep feedforward 
    # neural networks by Xavier Glorot and Yoshua Bengio
    
    np_rng = np.random.RandomState(1234)

    self.weights = np.asarray(np_rng.uniform(
			low=-0.1 * np.sqrt(6. / (num_hidden + num_visible)),
                       	high=0.1 * np.sqrt(6. / (num_hidden + num_visible)),
                       	size=(num_visible, num_hidden)))


    # Insira pesos para as unidades de polarização na primeira linha e na primeira coluna.
    self.weights = np.insert(self.weights, 0, 0, axis = 0)
    self.weights = np.insert(self.weights, 0, 0, axis = 1)

  def train(self, data, max_epochs = 1000, learning_rate = 0.1):
    """
    Treine a máquina.
    Parâmetros
    ----------
    data: Uma matriz onde cada linha é um exemplo de treinamento que consiste nos estados das unidades visíveis.     
    """

    num_examples = data.shape[0]

    # Insira unidades de polarização de 1 na primeira coluna.
    data = np.insert(data, 0, 1, axis = 1)

    for epoch in range(max_epochs):      
      # Fixe os dados e a amostra das unidades ocultas.
      # (Esta é a "fase positiva do CD", também conhecida como a fase da realidade.)
      pos_hidden_activations = np.dot(data, self.weights)      
      pos_hidden_probs = self._logistic(pos_hidden_activations)
      pos_hidden_probs[:,0] = 1 # Corrige a unidade de polarização.
      pos_hidden_states = pos_hidden_probs > np.random.rand(num_examples, self.num_hidden + 1)
      # Observe que estamos usando as *probabilidades* de ativação dos estados ocultos, não os estados ocultos       
      # eles mesmos, ao computar associações. Também poderíamos usar os estados; veja a seção 3 de Hinton's
      #"A Practical Guide to Training Restricted Boltzmann Machines"  para mais informações.
      pos_associations = np.dot(data.T, pos_hidden_probs)

      # Reconstruir as unidades visíveis e amostrar novamente das unidades ocultas.
      # (Esta é a "fase negativa do CD", também conhecida como fase de devaneio.)
      neg_visible_activations = np.dot(pos_hidden_states, self.weights.T)
      neg_visible_probs = self._logistic(neg_visible_activations)
      neg_visible_probs[:,0] = 1 # Corrige a unidade de polarização.
      neg_hidden_activations = np.dot(neg_visible_probs, self.weights)
      neg_hidden_probs = self._logistic(neg_hidden_activations)
      # Observe, novamente, que estamos usando as *probabilidades* de ativação ao calcular associações, não os estados
      # eles mesmos.
      neg_associations = np.dot(neg_visible_probs.T, neg_hidden_probs)

      # Atualizar pesos.
      self.weights += learning_rate * ((pos_associations - neg_associations) / num_examples)

      error = np.sum((data - neg_visible_probs) ** 2)
      if self.debug_print:
        print("Época %s: erro é %s"  % (epoch, error))

  def run_visible(self, data):
    """
    Assumindo que o RBM foi treinado (de modo que os pesos para a rede foram aprendidos),
    execute a rede em um conjunto de unidades visíveis, para obter uma amostra das unidades ocultas.
    
    Parâmetros
    ----------
    data: Uma matriz onde cada linha consiste nos estados das unidades visíveis.
    
    Devoluções
    -------
    estados_escondidos: Uma matriz onde cada linha consiste nas unidades ocultas ativadas a partir do
    unidades na matriz de dados passada.
    """
    
    num_examples = data.shape[0]
    
    # Crie uma matriz, onde cada linha deve ser as unidades ocultas (mais uma unidade de polarização)
    # amostrado de um exemplo de treinamento.
    hidden_states = np.ones((num_examples, self.num_hidden + 1))
    
    # Insira unidades de polarização de 1 na primeira coluna de dados.
    data = np.insert(data, 0, 1, axis = 1)

    # Calcular as ativações das unidades ocultas.
    hidden_activations = np.dot(data, self.weights)
    # Calcular as probabilidades de ativar as unidades ocultas.
    hidden_probs = self._logistic(hidden_activations)
    # Ligue as unidades ocultas com suas probabilidades especificadas.
    hidden_states[:,:] = hidden_probs > np.random.rand(num_examples, self.num_hidden + 1)
    # Sempre fixe a unidade de polarização em 1.
    # estados_escondidos[:,0] = 1
  
    # Ignora as unidades de polarização.
    hidden_states = hidden_states[:,1:]
    return hidden_states
    
  # TODO: Remover a duplicação de código entre este método e `run_visible`?
  def run_hidden(self, data):
    """
    Assumindo que o RBM foi treinado (de modo que os pesos para a rede foram aprendidos),
    execute a rede em um conjunto de unidades ocultas, para obter uma amostra das unidades visíveis.
    Parâmetros
    ----------
    dados: Uma matriz onde cada linha consiste nos estados das unidades ocultas.
    Devoluções
    -------
    visible_states: Uma matriz onde cada linha consiste nas unidades visíveis ativadas do oculto
    unidades na matriz de dados passada.
    """

    num_examples = data.shape[0]

    # Crie uma matriz, onde cada linha deve ser as unidades visíveis (mais uma unidade de polarização)
    # amostrado de um exemplo de treinamento.
    visible_states = np.ones((num_examples, self.num_visible + 1))

    # Insira unidades de polarização de 1 na primeira coluna de dados.
    data = np.insert(data, 0, 1, axis = 1)

    # Calcular as ativações das unidades visíveis.
    visible_activations = np.dot(data, self.weights.T)
    # Calcular as probabilidades de ligar as unidades visíveis.
    visible_probs = self._logistic(visible_activations)
    # Ligue as unidades visíveis com suas probabilidades especificadas.
    visible_states[:,:] = visible_probs > np.random.rand(num_examples, self.num_visible + 1)
    # Sempre fixe a unidade de polarização em 1.
    # visible_states[:,0] = 1

    # Ignora as unidades de polarização.
    visible_states = visible_states[:,1:]
    return visible_states
    
  def daydream(self, num_samples):
    """
    Inicialize aleatoriamente as unidades visíveis uma vez e comece a executar etapas de amostragem Gibbs alternadas
    (onde cada etapa consiste em atualizar todas as unidades ocultas e, em seguida, atualizar todas as unidades visíveis),
    tomando uma amostra das unidades visíveis em cada etapa.
    Observe que inicializamos a rede apenas *uma vez*, portanto, essas amostras são correlacionadas.
    Devoluções
    -------
    amostras: Uma matriz, onde cada linha é uma amostra das unidades visíveis produzidas enquanto a rede foi
    daydream
    """

   # Crie uma matriz, onde cada linha deve ser uma amostra das unidades visíveis
    # (com uma unidade de polarização extra), inicializado para todos.
    samples = np.ones((num_samples, self.num_visible + 1))

    # Pegue a primeira amostra de uma distribuição uniforme.
    samples[0,1:] = np.random.rand(self.num_visible)

    # Inicie a amostragem Gibbs alternada.
    # Observe que mantemos os estados binários das unidades ocultas, mas deixamos o
    # unidades visíveis como probabilidades reais. Veja a seção 3 do Hinton's
    # "A Practical Guide to Training Restricted Boltzmann Machines"
    # para saber mais sobre o porquê.
    for i in range(1, num_samples):
      visible = samples[i-1,:]

      # Calcular as ativações das unidades ocultas.
      hidden_activations = np.dot(visible, self.weights)      
      # Calcular as probabilidades de ativar as unidades ocultas.
      hidden_probs = self._logistic(hidden_activations)
      # Ligue as unidades ocultas com suas probabilidades especificadas.
      hidden_states = hidden_probs > np.random.rand(self.num_hidden + 1)
      # Sempre fixe a unidade de polarização em 1.
      hidden_states[0] = 1

      # Recalcular as probabilidades de que as unidades visíveis estejam ativadas.
      visible_activations = np.dot(hidden_states, self.weights.T)
      visible_probs = self._logistic(visible_activations)
      visible_states = visible_probs > np.random.rand(self.num_visible + 1)
      samples[i,:] = visible_states

    # Ignore as unidades de polarização (a primeira coluna), pois elas sempre são definidas como 1.
    return samples[:,1:]        
      
  def _logistic(self, x):
    return 1.0 / (1 + np.exp(-x))

if __name__ == '__main__':
  r = RBM(num_visible = 6, num_hidden = 2)
  training_data = np.array([[1,1,1,0,0,0],[1,0,1,0,0,0],[1,1,1,0,0,0],[0,0,1,1,1,0], [0,0,1,1,0,0],[0,0,1,1,1,0]])
  r.train(training_data, max_epochs = 5000)
  print(r.weights)
  user = np.array([[0,0,0,1,1,0]])
  print(r.run_visible(user))


Época 0: erro é 8.99341404289615
Época 1: erro é 8.810355681472915
Época 2: erro é 8.56837836861182
Época 3: erro é 8.413245351032014
Época 4: erro é 8.223699915305362
Época 5: erro é 8.076120885505551
Época 6: erro é 7.900480865777139
Época 7: erro é 7.803819443126182
Época 8: erro é 7.618746098317318
Época 9: erro é 7.616428855314645
Época 10: erro é 7.29290688479062
Época 11: erro é 7.353186477235113
Época 12: erro é 7.1777367773650385
Época 13: erro é 6.931127555353781
Época 14: erro é 7.231924317617444
Época 15: erro é 6.855284115817689
Época 16: erro é 6.802768020769581
Época 17: erro é 7.1036385642455855
Época 18: erro é 6.611513011247773
Época 19: erro é 6.5481300511789415
Época 20: erro é 6.953626170443928
Época 21: erro é 6.563329119804282
Época 22: erro é 6.362169793373766
Época 23: erro é 6.366903942030644
Época 24: erro é 6.078428341482671
Época 25: erro é 6.430683076769574
Época 26: erro é 6.361344530821998
Época 27: erro é 6.022437380423379
Época 28: erro é 6.38992961888

Época 828: erro é 1.3577064893293713
Época 829: erro é 1.3573382403254117
Época 830: erro é 1.3569842865987112
Época 831: erro é 1.3566440985564066
Época 832: erro é 1.124988830344494
Época 833: erro é 1.3571379465173052
Época 834: erro é 1.3567865411287747
Época 835: erro é 1.3564487652226214
Época 836: erro é 1.3561241124789976
Época 837: erro é 1.1225849572018372
Época 838: erro é 1.3566285470526838
Época 839: erro é 1.3562915487666762
Época 840: erro é 1.3559676109535126
Época 841: erro é 1.3714365753938498
Época 842: erro é 1.4984398654945503
Época 843: erro é 1.3565238567182492
Época 844: erro é 1.1202796969960198
Época 845: erro é 1.1134377999325145
Época 846: erro é 1.3579155740691053
Época 847: erro é 2.102675615699846
Época 848: erro é 1.1153795457336069
Época 849: erro é 1.3573963232771338
Época 850: erro é 1.3569807089941233
Época 851: erro é 1.3565812220163278
Época 852: erro é 1.112270759223901
Época 853: erro é 1.3570918874671989
Época 854: erro é 1.3566841699046526
Époc

Época 1517: erro é 1.3452050086278622
Época 1518: erro é 1.3448616913274183
Época 1519: erro é 1.3445319919667615
Época 1520: erro é 1.3442154299443503
Época 1521: erro é 1.3439115384524505
Época 1522: erro é 1.3436198642993438
Época 1523: erro é 1.3433399677172175
Época 1524: erro é 1.3430714221572777
Época 1525: erro é 1.3428138140735613
Época 1526: erro é 1.3425667426968113
Época 1527: erro é 1.3423298197997344
Época 1528: erro é 1.3421026694548457
Época 1529: erro é 1.3418849277860518
Época 1530: erro é 1.3416762427150464
Época 1531: erro é 0.9896915833826604
Época 1532: erro é 1.3423664753180982
Época 1533: erro é 1.3421384039107656
Época 1534: erro é 0.9859734463150199
Época 1535: erro é 0.9803838125280753
Época 1536: erro é 1.3438305174567229
Época 1537: erro é 0.9760727077345608
Época 1538: erro é 1.3445707020584345
Época 1539: erro é 0.9719357612470424
Época 1540: erro é 1.345319447821535
Época 1541: erro é 1.3449742425128692
Época 1542: erro é 1.344642608754932
Época 1543: er

Época 2153: erro é 1.3876360555474687
Época 2154: erro é 1.3860178873510673
Época 2155: erro é 1.3844419157799632
Época 2156: erro é 0.794653371992947
Época 2157: erro é 0.7927702402557867
Época 2158: erro é 1.3860351185392432
Época 2159: erro é 1.7200498157484903
Época 2160: erro é 0.7874030589523703
Época 2161: erro é 0.7857235106283081
Época 2162: erro é 1.392255211555575
Época 2163: erro é 0.7856863803305101
Época 2164: erro é 1.3920641546611032
Época 2165: erro é 0.7856461433033349
Época 2166: erro é 0.784002781456376
Época 2167: erro é 0.7824045235613583
Época 2168: erro é 0.7808498261304879
Época 2169: erro é 1.7064289116332474
Época 2170: erro é 1.401336874791813
Época 2171: erro é 0.7764846459693568
Época 2172: erro é 0.7750885442446618
Época 2173: erro é 0.7737292015708169
Época 2174: erro é 0.7724054027649682
Época 2175: erro é 1.4052956386791688
Época 2176: erro é 1.40327411325641
Época 2177: erro é 0.7741891483052533
Época 2178: erro é 1.4027735303398046
Época 2179: erro é

Época 2599: erro é 0.7079089566037355
Época 2600: erro é 0.7076614331261103
Época 2601: erro é 0.7074181370150994
Época 2602: erro é 0.7071789736533026
Época 2603: erro é 0.7069438509486657
Época 2604: erro é 0.7067126792557631
Época 2605: erro é 0.7064853712998777
Época 2606: erro é 1.4931972379329062
Época 2607: erro é 0.707075527755533
Época 2608: erro é 1.4909939962276826
Época 2609: erro é 0.7076793011649136
Época 2610: erro é 1.4888172358013299
Época 2611: erro é 0.7082959804256671
Época 2612: erro é 0.708034393745107
Época 2613: erro é 1.4874270279113007
Época 2614: erro é 0.7086595401092315
Época 2615: erro é 0.7083892267339532
Época 2616: erro é 1.486069672224956
Época 2617: erro é 0.7090224102689583
Época 2618: erro é 0.7087433487548782
Época 2619: erro é 0.7084692445193651
Época 2620: erro é 0.7081999830493759
Época 2621: erro é 0.7079354529922054
Época 2622: erro é 0.7076755460537
Época 2623: erro é 0.7074201569001982
Época 2624: erro é 0.7071691830640499
Época 2625: erro é

Época 3170: erro é 1.6082132574801076
Época 3171: erro é 0.6850111857298814
Época 3172: erro é 0.6849714530552397
Época 3173: erro é 1.5593443002676413
Época 3174: erro é 0.6851871811978887
Época 3175: erro é 0.6851448944685835
Época 3176: erro é 0.6851030714045053
Época 3177: erro é 0.6850617004900152
Época 3178: erro é 0.6850207706279268
Época 3179: erro é 1.5580395872330164
Época 3180: erro é 0.6852500419754927
Época 3181: erro é 0.6852063285623954
Época 3182: erro é 0.685163076920174
Época 3183: erro é 0.6851202766539024
Época 3184: erro é 0.6850779177212163
Época 3185: erro é 1.5567706302017903
Época 3186: erro é 0.6853199641059783
Época 3187: erro é 0.6852746208963737
Época 3188: erro é 1.6099047481537998
Época 3189: erro é 0.6848684430676384
Época 3190: erro é 0.68482860023761
Época 3191: erro é 1.6071927796334315
Época 3192: erro é 0.684470651139065
Época 3193: erro é 0.6844355023917994
Época 3194: erro é 0.6844006574408917
Época 3195: erro é 0.6843661102700087
Época 3196: erro

Época 3884: erro é 0.6768215566306764
Época 3885: erro é 0.6768064516318587
Época 3886: erro é 0.6767914412739016
Época 3887: erro é 1.6151535132736718
Época 3888: erro é 0.676608500511973
Época 3889: erro é 0.676595210289537
Época 3890: erro é 0.6765819961482885
Época 3891: erro é 0.676568857303689
Época 3892: erro é 0.6765557929810236
Época 3893: erro é 0.6765428024152534
Época 3894: erro é 0.6765298848508707
Época 3895: erro é 0.6765170395417563
Época 3896: erro é 0.6765042657510406
Época 3897: erro é 0.6764915627509651
Época 3898: erro é 0.67647892982275
Época 3899: erro é 0.6764663662564606
Época 3900: erro é 0.6764538713508782
Época 3901: erro é 0.6764414444133728
Época 3902: erro é 0.6764290847597779
Época 3903: erro é 0.6764167917142679
Época 3904: erro é 0.6764045646092378
Época 3905: erro é 0.6763924027851842
Época 3906: erro é 0.67638030559059
Época 3907: erro é 0.6763682723818086
Época 3908: erro é 0.6763563025229531
Época 3909: erro é 0.6763443953857851
Época 3910: erro é 

Época 4718: erro é 0.6725323040652716
Época 4719: erro é 0.6725273031808874
Época 4720: erro é 0.6725223191064252
Época 4721: erro é 0.6725173517306925
Época 4722: erro é 0.6725124009432732
Época 4723: erro é 0.6725074666345217
Época 4724: erro é 0.6725025486955595
Época 4725: erro é 0.6724976470182714
Época 4726: erro é 0.6724927614952998
Época 4727: erro é 0.6724878920200416
Época 4728: erro é 0.672483038486643
Época 4729: erro é 0.6724782007899957
Época 4730: erro é 0.6724733788257324
Época 4731: erro é 0.6724685724902237
Época 4732: erro é 0.6724637816805714
Época 4733: erro é 0.6724590062946066
Época 4734: erro é 2.557753154386158
Época 4735: erro é 1.6098772091660987
Época 4736: erro é 1.6082513018919675
Época 4737: erro é 0.6725812338016902
Época 4738: erro é 0.6725755350542189
Época 4739: erro é 0.6725698584739603
Época 4740: erro é 0.6725642039134202
Época 4741: erro é 0.6725585712261206
Época 4742: erro é 0.6725529602665903
Época 4743: erro é 0.6725473708903561
Época 4744: er

In [2]:
import numpy as np

## Carregando os dados


In [3]:
base = np.array([[1,1,1,0,0,0],
                 [1,0,1,0,0,0],
                 [1,1,1,0,0,0],
                 [0,0,1,1,1,1],
                 [0,0,1,1,0,1],
                 [0,0,1,1,0,1]])

In [4]:
filmes = ["A bruxa", "Invocação do mal", "O chamado",
          "Se beber não case", "Gente grande", "American pie"]

### Construção do RBM

Primeiro, inicialize um RBM com o número desejado de unidades visíveis e ocultas.

In [17]:
rbm = RBM(num_visible = 6, num_hidden = 2)

#### Topologia da Rede

#### Treinamento

In [18]:
rbm.train(base, max_epochs=5000)
rbm.weights

Época 0: erro é 9.06260959799245
Época 1: erro é 8.93797126926325
Época 2: erro é 8.747614383772762
Época 3: erro é 8.63735268083227
Época 4: erro é 8.436357050636419
Época 5: erro é 8.303652982412117
Época 6: erro é 8.169431788701104
Época 7: erro é 8.019396499268481
Época 8: erro é 8.081015306618058
Época 9: erro é 7.926419315846597
Época 10: erro é 7.827931687602684
Época 11: erro é 7.861601785509151
Época 12: erro é 7.611378692299013
Época 13: erro é 7.572435682458927
Época 14: erro é 7.57343814221215
Época 15: erro é 7.45329171459871
Época 16: erro é 7.475217028728483
Época 17: erro é 7.450908118381227
Época 18: erro é 7.412582495913349
Época 19: erro é 7.435932102830271
Época 20: erro é 7.328877829785703
Época 21: erro é 7.223154129123547
Época 22: erro é 7.065001124394129
Época 23: erro é 7.018004387126192
Época 24: erro é 7.118843193433585
Época 25: erro é 6.986473063332594
Época 26: erro é 7.0812312347971265
Época 27: erro é 7.142748410404254
Época 28: erro é 7.059822021210279

Época 322: erro é 2.9961803301135204
Época 323: erro é 2.8497220862165253
Época 324: erro é 3.1773258319504962
Época 325: erro é 3.1539655075733344
Época 326: erro é 2.7851956808863574
Época 327: erro é 2.882075982627313
Época 328: erro é 2.5382886519564694
Época 329: erro é 2.375945319180134
Época 330: erro é 2.499138080256895
Época 331: erro é 3.277629231955204
Época 332: erro é 2.750372304926364
Época 333: erro é 3.6131016348101497
Época 334: erro é 5.460923843189504
Época 335: erro é 3.01219132973429
Época 336: erro é 3.282196155907645
Época 337: erro é 2.2144340740408683
Época 338: erro é 2.196958996721203
Época 339: erro é 4.051562118539262
Época 340: erro é 2.551662381210883
Época 341: erro é 3.684890556701252
Época 342: erro é 3.1336424373257
Época 343: erro é 2.963234345949196
Época 344: erro é 2.0873930142864037
Época 345: erro é 2.939317188464375
Época 346: erro é 2.460902916620064
Época 347: erro é 2.4456911566919786
Época 348: erro é 2.0226479068702856
Época 349: erro é 2.

Época 672: erro é 1.3837724937760207
Época 673: erro é 1.383434425214433
Época 674: erro é 1.0999383287194344
Época 675: erro é 1.3835068657953997
Época 676: erro é 1.0950846100595273
Época 677: erro é 1.3836061067257375
Época 678: erro é 1.090418834483819
Época 679: erro é 1.383727844115326
Época 680: erro é 1.3833352604205666
Época 681: erro é 1.382952979541107
Época 682: erro é 1.3825806353524004
Época 683: erro é 1.3822178742531948
Época 684: erro é 1.3818643548409284
Época 685: erro é 1.3815197475874954
Época 686: erro é 1.091145001009182
Época 687: erro é 1.381651241243787
Época 688: erro é 1.0864801360078904
Época 689: erro é 1.0810615471225615
Época 690: erro é 1.382367657507071
Época 691: erro é 1.3819562254336033
Época 692: erro é 1.3815562042300282
Época 693: erro é 1.3811671889944541
Época 694: erro é 1.3807887882090497
Época 695: erro é 1.0806124639235635
Época 696: erro é 1.3809742724563274
Época 697: erro é 1.3805839612635218
Época 698: erro é 1.3802044410424352
Época 69

Época 1028: erro é 1.3564423947328528
Época 1029: erro é 1.3561002617864701
Época 1030: erro é 1.3557708553803918
Época 1031: erro é 1.3554537321004756
Época 1032: erro é 1.355148461399239
Época 1033: erro é 0.9761233849702067
Época 1034: erro é 0.9713749256994262
Época 1035: erro é 1.3567484299643493
Época 1036: erro é 1.3563868757187005
Época 1037: erro é 1.3560387567277334
Época 1038: erro é 1.3557036097632313
Época 1039: erro é 0.9715409433150884
Época 1040: erro é 0.966909224408298
Época 1041: erro é 1.35734771775631
Época 1042: erro é 1.356956421351405
Época 1043: erro é 1.3565796069712923
Época 1044: erro é 1.356216783005805
Época 1045: erro é 1.3558674711661536
Época 1046: erro é 1.3555312063770175
Época 1047: erro é 1.3552075366490692
Época 1048: erro é 0.9708333315436797
Época 1049: erro é 1.355848205600897
Época 1050: erro é 1.3555089275184877
Época 1051: erro é 0.9685286464998775
Época 1052: erro é 1.356153595368703
Época 1053: erro é 1.3557992869758384
Época 1054: erro é 0

Época 1393: erro é 1.3800220487715995
Época 1394: erro é 0.8408116986686643
Época 1395: erro é 0.8386065716202653
Época 1396: erro é 1.3816582923085767
Época 1397: erro é 1.3803119022560653
Época 1398: erro é 0.8398072884681975
Época 1399: erro é 1.3804729254619195
Época 1400: erro é 1.3791602073024043
Época 1401: erro é 1.3778856634356005
Época 1402: erro é 0.8426225978331079
Época 1403: erro é 1.3781180401449902
Época 1404: erro é 2.28480875101015
Época 1405: erro é 1.3783439169344927
Época 1406: erro é 0.8413849937507587
Época 1407: erro é 0.8391170078553297
Época 1408: erro é 1.380034777403486
Época 1409: erro é 1.3787334273775422
Época 1410: erro é 0.840254288836217
Época 1411: erro é 1.3789420935939034
Época 1412: erro é 0.8396752959539445
Época 1413: erro é 0.8374379965046135
Época 1414: erro é 0.8352660237763794
Época 1415: erro é 0.8331570222514741
Época 1416: erro é 0.8311087326060966
Época 1417: erro é 1.3850261833368798
Época 1418: erro é 1.383581681935602
Época 1419: erro 

Época 1704: erro é 1.3883848465585145
Época 1705: erro é 0.7981630755026407
Época 1706: erro é 1.388394541566642
Época 1707: erro é 1.3868806668099083
Época 1708: erro é 0.7997363285362333
Época 1709: erro é 0.7978450077578244
Época 1710: erro é 0.7960083065234832
Época 1711: erro é 1.3899812752735257
Época 1712: erro é 0.7959250625870642
Época 1713: erro é 0.7941390771693897
Época 1714: erro é 1.7035954065997603
Época 1715: erro é 0.7874588998219935
Época 1716: erro é 1.3976177466987039
Época 1717: erro é 0.7875865545684162
Época 1718: erro é 0.7860350400726285
Época 1719: erro é 1.3988440503941237
Época 1720: erro é 0.7861917842867119
Época 1721: erro é 1.3985534771658663
Época 1722: erro é 2.3078151094392303
Época 1723: erro é 0.7848156134851865
Época 1724: erro é 0.7833313260956133
Época 1725: erro é 0.7818875159531576
Época 1726: erro é 1.4026817103074425
Época 1727: erro é 0.7821277814905835
Época 1728: erro é 0.7807120441399392
Época 1729: erro é 0.7793344740329096
Época 1730: e

Época 2023: erro é 0.7299019335726322
Época 2024: erro é 1.458879636257837
Época 2025: erro é 0.7306023078644559
Época 2026: erro é 0.7300841078056692
Época 2027: erro é 0.7295766624627749
Época 2028: erro é 0.7290796843606362
Época 2029: erro é 0.7285928951903871
Época 2030: erro é 1.4613030619369405
Época 2031: erro é 0.7292915226429746
Época 2032: erro é 0.728797193426204
Época 2033: erro é 0.7283129841983522
Época 2034: erro é 0.7278386276390962
Época 2035: erro é 0.7273738648538506
Época 2036: erro é 0.7269184450659836
Época 2037: erro é 0.7264721253216913
Época 2038: erro é 2.3817271416385406
Época 2039: erro é 0.7256058515760742
Época 2040: erro é 1.4674414374282867
Época 2041: erro é 0.7262941960929994
Época 2042: erro é 0.7258570314359452
Época 2043: erro é 0.7254284976181447
Época 2044: erro é 1.4675188016772214
Época 2045: erro é 0.7261175696785441
Época 2046: erro é 0.7256806954953039
Época 2047: erro é 0.7252524464193351
Época 2048: erro é 0.7248326016302452
Época 2049: er

Época 2332: erro é 0.7049933827021889
Época 2333: erro é 0.7047978158134596
Época 2334: erro é 0.7046052887969148
Época 2335: erro é 0.7044157385062195
Época 2336: erro é 0.7042291033654073
Época 2337: erro é 0.7040453233231077
Época 2338: erro é 0.703864339808303
Época 2339: erro é 0.7036860956875552
Época 2340: erro é 0.7035105352236501
Época 2341: erro é 0.7033376040356027
Época 2342: erro é 0.7031672490599773
Época 2343: erro é 0.702999418513473
Época 2344: erro é 0.7028340618567265
Época 2345: erro é 1.6244561810631957
Época 2346: erro é 1.6215522144617007
Época 2347: erro é 0.7008186431523153
Época 2348: erro é 0.7006884667776103
Época 2349: erro é 1.52027114829105
Época 2350: erro é 1.5173953954248924
Época 2351: erro é 0.701788357240938
Época 2352: erro é 0.7016403468674914
Época 2353: erro é 0.7014944211195617
Época 2354: erro é 0.701350539797717
Época 2355: erro é 0.7012086636265643
Época 2356: erro é 0.7010687542298734
Época 2357: erro é 2.437188213809116
Época 2358: erro é 

Época 2631: erro é 0.6900600974629262
Época 2632: erro é 0.6900061749611153
Época 2633: erro é 0.6899527597112333
Época 2634: erro é 0.6898998443142572
Época 2635: erro é 1.552100628568437
Época 2636: erro é 1.5494668045788218
Época 2637: erro é 0.6905476528126859
Época 2638: erro é 0.6904857314712013
Época 2639: erro é 0.6904244406342397
Época 2640: erro é 1.6131591283306215
Época 2641: erro é 1.5510152514052804
Época 2642: erro é 0.6902471296799924
Época 2643: erro é 0.6901882326716383
Época 2644: erro é 0.6901299206127279
Época 2645: erro é 0.6900721847628558
Época 2646: erro é 1.6120090488988859
Época 2647: erro é 0.6895724904551839
Época 2648: erro é 0.6895216373754968
Época 2649: erro é 0.6894712491237891
Época 2650: erro é 0.6894213190322107
Época 2651: erro é 0.6893718405456919
Época 2652: erro é 0.6893228072197412
Época 2653: erro é 0.6892742127182915
Época 2654: erro é 0.689226050811595
Época 2655: erro é 1.5549732624534693
Época 2656: erro é 0.6894911601128998
Época 2657: er

Época 3105: erro é 0.6816722997167254
Época 3106: erro é 0.6816500454465334
Época 3107: erro é 0.6816279348172857
Época 3108: erro é 2.506643438349398
Época 3109: erro é 0.6815841380707557
Época 3110: erro é 1.5779829099925498
Época 3111: erro é 0.681747495803556
Época 3112: erro é 0.6817238373682536
Época 3113: erro é 0.681700339739996
Época 3114: erro é 0.6816770010856487
Época 3115: erro é 0.6816538195965794
Época 3116: erro é 0.6816307934882807
Época 3117: erro é 0.6816079209999985
Época 3118: erro é 1.5768890860066131
Época 3119: erro é 1.574598191084518
Época 3120: erro é 0.6819958130901274
Época 3121: erro é 0.681968555128339
Época 3122: erro é 0.6819415021848606
Época 3123: erro é 1.572848024976011
Época 3124: erro é 1.5704956876697969
Época 3125: erro é 0.6823955356519673
Época 3126: erro é 0.6823633269252893
Época 3127: erro é 0.6823313852805994
Época 3128: erro é 0.6822997074000361
Época 3129: erro é 1.568980270464654
Época 3130: erro é 0.6825321374408568
Época 3131: erro é 

Época 3414: erro é 0.6788050492090388
Época 3415: erro é 0.6787881220740003
Época 3416: erro é 0.6787712973632233
Época 3417: erro é 0.6787545740257591
Época 3418: erro é 0.6787379510232575
Época 3419: erro é 0.6787214273297888
Época 3420: erro é 0.6787050019316788
Época 3421: erro é 1.585830948905768
Época 3422: erro é 0.6788488880056406
Época 3423: erro é 0.6788310266332747
Época 3424: erro é 0.6788132780627727
Época 3425: erro é 0.6787956411207049
Época 3426: erro é 0.6787781146479059
Época 3427: erro é 0.6787606974992735
Época 3428: erro é 0.6787433885435724
Época 3429: erro é 0.6787261866632408
Época 3430: erro é 1.5848447739665665
Época 3431: erro é 0.678877880389217
Época 3432: erro é 0.6788591711260693
Época 3433: erro é 0.6788405842361587
Época 3434: erro é 0.67882211843107
Época 3435: erro é 0.6788037724382627
Época 3436: erro é 0.6787855450008405
Época 3437: erro é 0.6787674348773307
Época 3438: erro é 0.6787494408414636
Época 3439: erro é 0.678731561681956
Época 3440: erro 

Época 3753: erro é 1.6003822366625378
Época 3754: erro é 0.6760895020740645
Época 3755: erro é 0.6760802185126235
Época 3756: erro é 0.6760709734886696
Época 3757: erro é 0.6760617666798832
Época 3758: erro é 0.676052597767105
Época 3759: erro é 0.6760434664343037
Época 3760: erro é 0.6760343723685409
Época 3761: erro é 1.5991382263203118
Época 3762: erro é 0.6761201840150083
Época 3763: erro é 0.6761103105470212
Época 3764: erro é 1.5974515180826228
Época 3765: erro é 0.676207585563988
Época 3766: erro é 0.6761968369474299
Época 3767: erro é 0.6761861407349266
Época 3768: erro é 1.6184756102941018
Época 3769: erro é 1.5979390349086706
Época 3770: erro é 1.5960414511438847
Época 3771: erro é 1.5941062396846253
Época 3772: erro é 0.6764036062692051
Época 3773: erro é 1.5922521955484155
Época 3774: erro é 0.6765351957208822
Época 3775: erro é 1.6231893168993117
Época 3776: erro é 0.676352199029766
Época 3777: erro é 0.6763397488675993
Época 3778: erro é 0.6763273676025998
Época 3779: err

Época 4047: erro é 0.6748704884010689
Época 4048: erro é 0.674861221240137
Época 4049: erro é 0.6748519995820383
Época 4050: erro é 0.6748428230462441
Época 4051: erro é 0.6748336912558874
Época 4052: erro é 0.6748246038377249
Época 4053: erro é 0.6748155604220964
Época 4054: erro é 0.6748065606428859
Época 4055: erro é 0.6747976041374848
Época 4056: erro é 0.6747886905467527
Época 4057: erro é 0.6747798195149803
Época 4058: erro é 1.6002274726727523
Época 4059: erro é 0.6748806567761657
Época 4060: erro é 0.6748709617486615
Época 4061: erro é 0.6748613161692089
Época 4062: erro é 0.6748517196201377
Época 4063: erro é 0.6748421716878391
Época 4064: erro é 0.6748326719627207
Época 4065: erro é 0.6748232200391607
Época 4066: erro é 0.6748138155154655
Época 4067: erro é 1.6238954668362395
Época 4068: erro é 0.6746822134162961
Época 4069: erro é 0.6746738486447349
Época 4070: erro é 1.601350888767265
Época 4071: erro é 0.6747686337834816
Época 4072: erro é 0.6747594970588768
Época 4073: er

Época 4348: erro é 0.6735648925825842
Época 4349: erro é 0.6735579526337303
Época 4350: erro é 0.673551043851824
Época 4351: erro é 0.6735441659940054
Época 4352: erro é 0.673537318819592
Época 4353: erro é 1.6054466618687402
Época 4354: erro é 0.6736260250389023
Época 4355: erro é 0.6736185144823461
Época 4356: erro é 0.673611039677693
Época 4357: erro é 0.6736036003436355
Época 4358: erro é 0.6735961962013884
Época 4359: erro é 0.6735888269746608
Época 4360: erro é 0.6735814923896334
Época 4361: erro é 0.6735741921749332
Época 4362: erro é 0.6735669260616084
Época 4363: erro é 1.6264102318117537
Época 4364: erro é 0.6734550335220586
Época 4365: erro é 0.6734485818565584
Época 4366: erro é 0.6734421576151338
Época 4367: erro é 0.6734357605874212
Época 4368: erro é 0.6734293905649288
Época 4369: erro é 0.6734230473410178
Época 4370: erro é 0.6734167307108834
Época 4371: erro é 0.6734104404715369
Época 4372: erro é 0.6734041764217874
Época 4373: erro é 0.6733979383622247
Época 4374: err

Época 4696: erro é 0.6721668419624073
Época 4697: erro é 1.6183961164367748
Época 4698: erro é 0.6721994548258938
Época 4699: erro é 0.6721959700444639
Época 4700: erro é 0.6721924931216426
Época 4701: erro é 0.6721890240192847
Época 4702: erro é 0.6721855626993665
Época 4703: erro é 0.6721821091239845
Época 4704: erro é 0.6721786632553592
Época 4705: erro é 0.6721752250558344
Época 4706: erro é 0.6721717944878804
Época 4707: erro é 0.6721683715140938
Época 4708: erro é 0.6721649560971992
Época 4709: erro é 0.6721615482000507
Época 4710: erro é 0.6721581477856332
Época 4711: erro é 0.672154754817063
Época 4712: erro é 0.67215136925759
Época 4713: erro é 0.6721479910705979
Época 4714: erro é 0.6721446202196059
Época 4715: erro é 0.6721412566682696
Época 4716: erro é 0.6721379003803825
Época 4717: erro é 0.6721345513198762
Época 4718: erro é 1.6177880628098407
Época 4719: erro é 0.672171574709543
Época 4720: erro é 0.672167963239652
Época 4721: erro é 0.6721643607429634
Época 4722: erro 

array([[ 2.48799321,  2.2813347 ,  0.40824198],
       [-1.0920275 , -3.30316702,  7.99982681],
       [ 0.38016175, -7.38211985,  3.39904135],
       [ 4.92913376,  3.82709962,  1.90275542],
       [ 1.01871661,  3.55340823, -8.25773888],
       [-1.2995761 ,  0.59432875, -4.5600892 ],
       [ 1.02377193,  3.54953455, -8.26026543]])

### RECOMENDAÇÃO


In [22]:
#Dado um novo conjunto de unidades visíveis, podemos ver quais unidades ocultas estão ativadas.
usuario1 = np.array([[1,1,0,1,0,0]])
#usuario2 = np.array([[0,0,0,1,1,0]])

rbm.run_visible(usuario1)
#rbm.run_visible(usuario2)

array([[0., 1.]])

In [24]:
## Dado um conjunto de unidades ocultas, podemos ver quais unidades visíveis estão ativadas.
camada_escondida = np.array([[1,0]])  #rbm.run_visible(usuario1)
recomendacao = rbm.run_hidden(camada_escondida)

rbm.run_hidden(camada_escondida)

array([[0., 0., 1., 1., 0., 1.]])

In [25]:
for i in range(len(usuario1[0])):
    #print(usuario1[0,i])
    if usuario1[0,i] == 0 and recomendacao[0,i] == 1:
        print(filmes[i])
    

O chamado
American pie


# Mais longe

Se você estiver interessado em aprender mais sobre Máquinas Boltzmann restritas, aqui estão alguns bons links.

* [Um guia prático para treinar máquinas Boltzmann restritas](http://www.cs.toronto.edu/~hinton/absps/guideTR.pdf), por Geoffrey Hinton.
* Uma palestra de Andrew Ng sobre [Aprendizagem não supervisionada e aprendizagem profunda](http://www.youtube.com/watch?v=ZmNOAtZIgIk).
* [Máquinas Boltzmann restritas para filtragem colaborativa](http://www.machinelearning.org/proceedings/icml2007/papers/407.pdf). Achei este artigo difícil de ler, mas é uma aplicação interessante para o Prêmio Netflix.
* [Geometria da Máquina Boltzmann Restrita](http://arxiv.org/abs/0908.4425). Uma introdução muito legível aos RBMs.