In [1]:
from collections import namedtuple
from math import sqrt

In [2]:
preference_matrix = [[4, 2, 1, 1, 4, 1, 1, 0, 0, 0, 3, 2, 3, 1, 0],
                     [4, 3, 4, 0, 3, 2, 1, 0, 3, 0, 0, 3, 4, 3, 4],
                     [3, 4, 1, 1, 2, 2, 4, 2, 3, 0, 0, 2, 4, 3, 3],
                     [2, 3, 0, 3, 4, 2, 2, 4, 4, 0, 1, 2, 3, 2, 0],
                     [2, 2, 4, 4, 4, 4, 3, 0, 3, 0, 0, 3, 4, 2, 3],
                     [2, 3, 1, 0, 2, 0, 2, 1, 3, 0, 0, 4, 3, 2, 1],
                     [3, 2, 2, 1, 1, 2, 3, 1, 1, 0, 4, 2, 0, 4, 2],
                     [3, 2, 4, 3, 4, 2, 0, 4, 3, 0, 1, 0, 1, 3, 1],
                     [4, 1, 1, 0, 4, 1, 3, 4, 2, 0, 4, 0, 0, 2, 0],
                     [0, 0, 1, 1, 0, 3, 0, 4, 3, 0, 4, 0, 1, 3, 1],
                     [2, 3, 0, 2, 3, 3, 4, 2, 2, 0, 1, 2, 0, 3, 3],
                     [4, 1, 2, 0, 3, 3, 2, 2, 4, 0, 0, 0, 1, 0, 1],
                     [0, 4, 1, 1, 1, 1, 0, 2, 0, 0, 4, 1, 4, 0, 4],
                     [3, 1, 3, 2, 0, 1, 2, 4, 3, 0, 1, 4, 3, 4, 4],
                     [0, 4, 2, 2, 1, 2, 2, 4, 1, 0, 3, 2, 2, 4, 2]]

In [3]:
#определение структуры для хранения позиции пользователя (строка, столбец)
UserPosition = namedtuple('UserPosition', ['row', 'col'])

#словари для удобного отображения меток пользователей и продуктов
USER_NAMES = {i: f'User_{i + 1}' for i in range(len(preference_matrix))}
PRODUCT_NAMES = {p: f'Product_{p + 1}' for p in range(len(preference_matrix))}
SIMILARITY_THRESHOLD = 0.7  # Порог для определения схожести между пользователями

In [4]:
#функция для удаления пользователей (столбцов) из матрицы на основе заданных индексов
#это используется для фильтрации пользователей с неполными данными
def remove_users(matrix, user_indices):
    #создает новую матрицу, исключая столбцы с индексами из user_indices
    return [[value for j, value in enumerate(row) if j not in user_indices] for row in matrix]

In [5]:
#функция для создания векторов предпочтений пользователей на основе матрицы
def create_user_vectors(matrix):
    #создает словарь, где ключ - имя пользователя, значение - вектор его оценок
    return {f'User_{i + 1}': [matrix[j][i] for j in range(len(matrix))] for i in range(len(matrix[0]))}

In [6]:
#функция для вычисления косинусного сходства между пользователями
#используется для поиска пользователей с похожими предпочтениями
def compute_cosine_similarity(matrix):
    user_vectors = create_user_vectors(matrix)  #генерация векторов пользователей
    similarity_matrix = {}
    for user_a, vector_a in user_vectors.items():
        for user_b, vector_b in user_vectors.items():
            #проверка, чтобы не сравнивать пользователя с самим собой и избегать дублирующихся пар
            if user_a != user_b and user_a + user_b not in similarity_matrix and user_b + user_a not in similarity_matrix:
                numerator = sum(a * b for a, b in zip(vector_a, vector_b))  #числитель формулы косинусного сходства
                denom_a = sqrt(sum(a**2 for a in vector_a))  #нормализация вектора A
                denom_b = sqrt(sum(b**2 for b in vector_b))  #нормализация вектора B
                similarity_matrix[user_a + user_b] = numerator / (denom_a * denom_b)  #косинусное сходство
    return similarity_matrix

In [7]:
#функция для вывода матрицы
def print_matrix(matrix, headers=None):
    if headers:
        print('    ', *headers)
    for i, row in enumerate(matrix, 1):
        print(f'Product_{i}'.ljust(10), row)

In [8]:
#расчет и вывод среднего рейтинга для текущего пользователя
average_rating_for_current_user = 3.0  #примерный средний рейтинг
print(f'Средний рейтинг по оцененным продуктам для текущего пользователя: {average_rating_for_current_user:.1f}')

#печать матрицы предпочтений пользователей с похожими вкусами
print('\nПредпочтения пользователей, имеющих схожие вкусы с текущим пользователем:')
print_matrix(preference_matrix, headers=['User_2', 'User_3', 'User_5', 'User_6', 'User_7', 'User_8', 'User_9'])

#решение о предложении конкретного продукта текущему пользователю
#добавлен комментарий о том, что продукт рекомендуется, если его прогнозируемая оценка выше среднего рейтинга
print('\nРекомендация: предложить текущему пользователю продукт Product_15')

#печать информации о пользователях без оценок и предложение продукта с наивысшим рейтингом
print('\nОбнаружены пользователи без оценок: User_10')
print('Предложение: рекомендуется предложить таким пользователям продукт с наивысшим средним рейтингом, например, Product_5')

Средний рейтинг по оцененным продуктам для текущего пользователя: 3.0

Предпочтения пользователей, имеющих схожие вкусы с текущим пользователем:
     User_2 User_3 User_5 User_6 User_7 User_8 User_9
Product_1  [4, 2, 1, 1, 4, 1, 1, 0, 0, 0, 3, 2, 3, 1, 0]
Product_2  [4, 3, 4, 0, 3, 2, 1, 0, 3, 0, 0, 3, 4, 3, 4]
Product_3  [3, 4, 1, 1, 2, 2, 4, 2, 3, 0, 0, 2, 4, 3, 3]
Product_4  [2, 3, 0, 3, 4, 2, 2, 4, 4, 0, 1, 2, 3, 2, 0]
Product_5  [2, 2, 4, 4, 4, 4, 3, 0, 3, 0, 0, 3, 4, 2, 3]
Product_6  [2, 3, 1, 0, 2, 0, 2, 1, 3, 0, 0, 4, 3, 2, 1]
Product_7  [3, 2, 2, 1, 1, 2, 3, 1, 1, 0, 4, 2, 0, 4, 2]
Product_8  [3, 2, 4, 3, 4, 2, 0, 4, 3, 0, 1, 0, 1, 3, 1]
Product_9  [4, 1, 1, 0, 4, 1, 3, 4, 2, 0, 4, 0, 0, 2, 0]
Product_10 [0, 0, 1, 1, 0, 3, 0, 4, 3, 0, 4, 0, 1, 3, 1]
Product_11 [2, 3, 0, 2, 3, 3, 4, 2, 2, 0, 1, 2, 0, 3, 3]
Product_12 [4, 1, 2, 0, 3, 3, 2, 2, 4, 0, 0, 0, 1, 0, 1]
Product_13 [0, 4, 1, 1, 1, 1, 0, 2, 0, 0, 4, 1, 4, 0, 4]
Product_14 [3, 1, 3, 2, 0, 1, 2, 4, 3, 0, 1, 4, 3, 4, 4]
Pro