In [1]:
import numpy as np
import pandas as pd
import scipy.sparse as sp

In [20]:
# Configurações iniciais
np.random.seed(42)  # Garante reprodutibilidade
num_usuarios = 50
num_itens = 100
sparsity = 0.9  # 90% de sparsity significa que 10% das entradas serão não nulas

# Gera uma matriz esparsa de avaliações (0 a 5, onde 0 significa não avaliado)
ratings = sp.rand(num_usuarios, num_itens, density=1-sparsity).multiply(5).tocsr()
ratings.data = np.ceil(ratings.data)  # Arredonda para o próximo inteiro

# Visualiza as dimensões da matriz esparsa e o número de avaliações não-nulas
ratings.shape, ratings.nnz
ratings = pd.DataFrame(ratings.toarray())
display(ratings.head())

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,...,90,91,92,93,94,95,96,97,98,99
0,0.0,0.0,3.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
1,0.0,0.0,0.0,2.0,0.0,0.0,0.0,0.0,0.0,0.0,...,0.0,0.0,0.0,2.0,3.0,0.0,0.0,0.0,0.0,0.0
2,0.0,0.0,0.0,0.0,0.0,3.0,0.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,3.0,0.0,3.0,0.0
3,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
4,0.0,0.0,0.0,0.0,0.0,3.0,0.0,1.0,0.0,0.0,...,2.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0


In [21]:
from collections import Counter
import random

def realizar_random_walk(usuario_id, N, matriz_aval):
    itens_recomendados = []
    avaliacoes_usuario = matriz_aval.loc[usuario_id, :]
    
    # Normaliza as avaliações do usuário para que somem 1
    avaliacoes_normalizadas = avaliacoes_usuario / avaliacoes_usuario.sum()
    
    while len(itens_recomendados) < N:
        # Escolhe um item baseado nas avaliações normalizadas do usuário
        item_atual = np.random.choice(avaliacoes_normalizadas.index, p=avaliacoes_normalizadas.values)
        
        # Encontra todos os usuários que avaliaram esse item, exceto o usuário inicial
        usuarios_que_avaliaram = matriz_aval[matriz_aval[item_atual] > 0].index.tolist()
        usuarios_que_avaliaram.remove(usuario_id)
        
        if not usuarios_que_avaliaram:
            continue
        
        # Escolhe um desses usuários aleatoriamente
        usuario_aleatorio = random.choice(usuarios_que_avaliaram)
        
        # Pega as avaliações desse usuário e normaliza
        avaliacoes_usuario_aleatorio = matriz_aval.loc[usuario_aleatorio, :]
        avaliacoes_usuario_aleatorio_normalizadas = avaliacoes_usuario_aleatorio / avaliacoes_usuario_aleatorio.sum()
        
        # Escolhe um novo item baseado nas avaliações normalizadas do novo usuário
        novo_item = np.random.choice(avaliacoes_usuario_aleatorio_normalizadas.index, p=avaliacoes_usuario_aleatorio_normalizadas.values)
        
        # Se o usuário inicial não avaliou o novo item, adiciona à lista de recomendados
        if matriz_aval.loc[usuario_id, novo_item] == 0 and novo_item not in itens_recomendados:
            itens_recomendados.append(novo_item)
    
    return itens_recomendados

def recomendar_itens(usuario_id, N, matriz_aval):
    recomendacoes = []
    
    # Realiza 1000 random walks
    for _ in range(1000):
        recomendacoes.extend(realizar_random_walk(usuario_id, N, matriz_aval))
    
    # Conta a frequência dos itens recomendados
    frequencia_itens = Counter(recomendacoes)
    
    # Seleciona os N itens mais frequentes
    itens_mais_frequentes = [item for item, _ in frequencia_itens.most_common(N)]
    
    return itens_mais_frequentes


In [22]:
# Teste da função de recomendação com o usuário 1 e N=5
itens_recomendados = recomendar_itens(1, 5, ratings)
itens_recomendados

[71, 16, 1, 45, 51]

In [23]:
def realizar_random_walk_modificado(usuario_id, N, matriz_aval):
    caminho = []  # Lista para armazenar os passos
    itens_recomendados = []
    avaliacoes_usuario = matriz_aval.loc[usuario_id, :]
    avaliacoes_normalizadas = avaliacoes_usuario / avaliacoes_usuario.sum()
    
    caminho.append(('usuario', usuario_id))  # Inicia com o usuário de partida
    
    while len(itens_recomendados) < N:
        item_atual = np.random.choice(avaliacoes_normalizadas.index, p=avaliacoes_normalizadas.values)
        caminho.append(('item', item_atual))  # Registra visita ao item
        
        usuarios_que_avaliaram = matriz_aval[matriz_aval[item_atual] > 0].index.tolist()
        if usuario_id in usuarios_que_avaliaram:
            usuarios_que_avaliaram.remove(usuario_id)
        
        if not usuarios_que_avaliaram:
            continue
        
        usuario_aleatorio = random.choice(usuarios_que_avaliaram)
        caminho.append(('usuario', usuario_aleatorio))  # Registra visita ao usuário
        
        avaliacoes_usuario_aleatorio = matriz_aval.loc[usuario_aleatorio, :]
        avaliacoes_usuario_aleatorio_normalizadas = avaliacoes_usuario_aleatorio / avaliacoes_usuario_aleatorio.sum()
        novo_item = np.random.choice(avaliacoes_usuario_aleatorio_normalizadas.index, p=avaliacoes_usuario_aleatorio_normalizadas.values)
        
        if matriz_aval.loc[usuario_id, novo_item] == 0 and novo_item not in itens_recomendados:
            itens_recomendados.append(novo_item)
    
    return caminho, itens_recomendados  # Retorna o caminho percorrido e os itens recomendados



In [102]:
import matplotlib.pyplot as plt
import imageio.v2 as imageio
import numpy as np
import os

# Supondo que `realizar_random_walk_modificado` e `ratings` estejam definidos conforme o fornecido
caminho, itens_recomendados = realizar_random_walk_modificado(1, 5, ratings)

for i,no in enumerate(caminho):
    if no[0] == "item" and caminho[i+1][0] == "item":
        del caminho[i]

# Configurações iniciais
num_usuarios = 50
num_itens = 100
distancia_itens = 1.5  # Mantém a distância horizontal entre usuários e itens

# Ajuste a altura da figura baseado no número de itens para evitar aglomeração
altura_figura = 20  # Ajusta dinamicamente a altura baseado no número de itens

# Função para desenhar um frame com setas
def desenhar_frame(caminho, passo, filename, nos_visitados):
    fig, ax = plt.subplots(figsize=(10, altura_figura))
    posicoes_usuarios = np.linspace(0, altura_figura - 2, num_usuarios)
    posicoes_itens = np.linspace(0, altura_figura - 2, num_itens)
    
    # Desenha todos os usuários e itens
    ax.scatter(np.zeros(num_usuarios), posicoes_usuarios, color='blue', s=100, label='Users')
    ax.scatter(np.ones(num_itens) * distancia_itens, posicoes_itens, color='red', s=100, label='Itens')
    
    # Adiciona os números identificadores para usuários e itens
    for i, pos in enumerate(posicoes_usuarios):
        ax.text(-0.2, pos, str(i + 1), ha='right', va='center', color='black')
    for i, pos in enumerate(posicoes_itens):
        ax.text(distancia_itens + 0.2, pos, str(i + 1), ha='left', va='center', color='black')
    
    # Atualiza os nós visitados e destaca-os
    for tipo, id_atual in caminho[:passo+1]:
        nos_visitados.add((tipo, id_atual))
    for tipo, id_atual in nos_visitados:
        if tipo == 'usuario':
            ax.scatter(0, posicoes_usuarios[id_atual - 1], color='green', s=100)
        else:
            ax.scatter(distancia_itens, posicoes_itens[id_atual - 1], color='green', s=100)
    
    # Desenha as setas para os movimentos realizados até o passo atual
    for i in range(1, len(caminho[:passo+1])):
        tipo_origem, id_origem = caminho[i-1]
        tipo_destino, id_destino = caminho[i]
        if tipo_origem == 'usuario':
            x_origem, y_origem = 0, posicoes_usuarios[id_origem - 1]
        else:
            x_origem, y_origem = distancia_itens, posicoes_itens[id_origem - 1]
        
        if tipo_destino == 'usuario':
            x_destino, y_destino = 0, posicoes_usuarios[id_destino - 1]
        else:
            x_destino, y_destino = distancia_itens, posicoes_itens[id_destino - 1]
        
        # Desenha a seta
        ax.annotate("", xy=(x_destino, y_destino), xytext=(x_origem, y_origem),
                    arrowprops=dict(arrowstyle="->", color='gray', lw=1))
    
    ax.get_xaxis().set_visible(False)
    ax.set_yticks([])
    ax.set_ylim(0, altura_figura)
    plt.legend(loc='upper center', bbox_to_anchor=(0.5, -0.05), fancybox=True, shadow=True, ncol=2)
    plt.savefig(filename)
    plt.close()

# Gera os frames
filenames = []
nos_visitados = set()
for i in range(len(caminho)):
    filename = f'frames/frame_{i}.png'
    desenhar_frame(caminho, i, filename, nos_visitados)
    filenames.append(filename)
    
# Gera o GIF
gif_filename = 'random_walk.gif'
with imageio.get_writer(gif_filename, mode='I', duration=1.5) as writer:
    for filename in filenames:
        image = imageio.imread(filename)
        writer.append_data(image)

# Limpa os arquivos de frame, se desejado
for filename in filenames:
    os.remove(filename)
