## Filtración colaborativa para encontrar usuarios similares

Esto se refiere al proceso de identificar patrones entre dos objetos en un conjunto de datos para tomar una decisión sobre un nuevo objeto.

En esta aplicación por ejemplo si dos personas tienen calificaciones similares para un conjunto de películas entonces es muy posible que su elección para un nuevo conjunto de películas sea similar también.

In [2]:
import json
import numpy as np 
#Importamos las funcion creada para calcular el puntaje de similitud, metodo de pearso
from compute_scores import pearson_score

In [3]:
#Definición de función para buscar los usuarios similares a el usuario indicado
def find_similar_users(dataset, user, num_users):
    if user not in dataset:
        raise TypeError('No se encontro el '+user+' en el conjunto de datos')
    #Calcula el puntaje de similitud respecto a cada usuario con el metodo de pearson
    scores = np.array([[x, pearson_score(dataset, user,x)] for x in dataset if x != user])

    #Ordena las puntuaciones
    scores_sorted = np.argsort(scores[:,1])[::-1]

    #Extrae las mejores puntuaciones 
    top_users = scores_sorted[:num_users]
    return scores[top_users]

In [8]:

def print_salida(user, data, num_users):
    print('\nUsuarios similares para '+ user + ':\n')
    similar_users = find_similar_users(data, user, num_users)
    print('-'*41)
    for item in similar_users:
        print(item[0], '\t\t', round(float(item[1]), 2))

ratings_file = "ratings.json"

with open(ratings_file, 'r') as f:
    data = json.loads(f.read())

user = "Bill Duffy"

print_salida(user, data, 3)


Usuarios similares para Bill Duffy:

-----------------------------------------
David Smith 		 0.99
Samuel Miller 		 0.88
Adam Cohen 		 0.86


In [9]:
print_salida("Clarissa Jackson", data, 5)


Usuarios similares para Clarissa Jackson:

-----------------------------------------
Chris Duncan 		 1.0
Bill Duffy 		 0.83
Samuel Miller 		 0.73
David Smith 		 0.69
Adam Cohen 		 0.47
