# Collaborative Filtering

Collaborative Filtering is a method of making automatic predictions (filtering) about the interests of a user by collecting preferences from many users (collaborating). The underlying assumption of the collaborative filtering approach is that if a person A has the same opinion as a person B on an issue, A is more likely to have B's opinion on a different issue.

## How it Works

Collaborative filtering uses methods of machine learning and data mining to predict users' interests. It works by creating a matrix of user-item interactions and then using either memory-based or model-based techniques to make predictions.

- **Memory-Based Collaborative Filtering**: This approach uses the memory of previous users interactions to compute users similarities based on items they've interacted with. A prediction is made for a user-item pair based on the average ratings of the most similar users to the user for the item.

- **Model-Based Collaborative Filtering**: In this approach, models are developed using different machine learning algorithms to predict a user's rating of unrated items.

## Use Cases

Collaborative filtering is used in various applications, including:

- **Recommendation Systems**: Collaborative filtering forms the backbone of most recommendation systems, which are utilized in a variety of areas such as movie recommendations, music preferences, social tagging, and more.

- **Personalization**: By predicting the interests of a user, systems can personalize content delivery such as news articles, advertisements, and more.

## Limitations

Despite its widespread use, Collaborative Filtering comes with its own set of limitations:

- **Cold Start**: New users will have no history of interactions, making it hard for the system to provide relevant recommendations. This is often referred to as the cold start problem.

- **Scalability**: As the number of users and items grow, the algorithm struggles to make a prediction in a reasonable time.

- **Sparsity**: The number of items often far exceeds the number a user interacts with. The user-item interactions matrix therefore ends up being sparse, making it hard to find similar users or items.

# Коллаборативная фильтрация

Коллаборативная фильтрация - это метод автоматического прогнозирования (фильтрации) интересов пользователя путем сбора предпочтений многих пользователей (сотрудничество). Основное предположение подхода коллаборативной фильтрации заключается в том, что если человек A имеет такое же мнение, как и человек B по какому-либо вопросу, то A скорее всего будет иметь мнение B по другому вопросу.

## Как это работает

Коллаборативная фильтрация использует методы машинного обучения и анализа данных для прогнозирования интересов пользователей. Она работает, создавая матрицу взаимодействий пользователь-элемент, а затем используя либо методы, основанные на памяти, либо методы, основанные на модели, для прогнозирования.

- **Коллаборативная фильтрация, основанная на памяти**: Этот подход использует память о предыдущих взаимодействиях пользователей для вычисления сходства пользователей на основе элементов, с которыми они взаимодействовали. Прогноз для пары пользователь-элемент делается на основе средних оценок наиболее похожих на пользователя пользователей для элемента.

- **Коллаборативная фильтрация, основанная на модели**: В этом подходе модели разрабатываются с использованием различных алгоритмов машинного обучения для прогнозирования оценки пользователя для ненаблюдаемых элементов.

## Применение

Коллаборативная фильтрация используется в различных приложениях, включая:

- **Системы рекомендаций**: Коллаборативная фильтрация составляет основу большинства систем рекомендаций, которые используются в различных областях, таких как рекомендации фильмов, музыкальные предпочтения, социальные теги и многое другое.

- **Персонализация**: Предсказывая интересы пользователя, системы могут персонализировать доставку контента, такого как новостные статьи, реклама и многое другое.

## Ограничения

Несмотря на широкое распространение, коллаборативная фильтрация имеет ряд ограничений:

- **Холодный старт**: У новых пользователей не будет истории взаимодействий, что затруднит предоставление релевантных рекомендаций системой. Это часто называют проблемой холодного старта.

- **Масштабируемость**: По мере увеличения числа пользователей и элементов алгоритм начинает испытывать трудности с прогнозированием за разумное время.

- **Разреженность**: Число элементов часто значительно превышает число элементов, с которыми взаимодействует пользователь. Матрица взаимодействий пользователь-элемент, таким образом, оказывается разреженной, что затрудняет поиск похожих пользователей или элементов.

In [1]:
import numpy as np
from sklearn.metrics.pairwise import cosine_similarity

class CollaborativeFilter:
    """
    A class used to represent a Collaborative Filtering Recommendation System

    ...

    Attributes
    ----------
    ratings : np.array
        a 2D numpy array representing user-item ratings
    similarity_matrix : np.array
        a 2D numpy array representing the similarity matrix of the ratings

    Methods
    -------
    recommend(user_index)
        Recommends an item for a given user
    """
    def __init__(self, ratings):
        """
        Constructs all the necessary attributes for the CollaborativeFilter object.

        Parameters
        ----------
            ratings : np.array
                a 2D numpy array representing user-item ratings
        """
        self.ratings = ratings
        self.similarity_matrix = cosine_similarity(self.ratings)

    def recommend(self, user_index):
        """
        Recommends an item for a given user.

        Parameters
        ----------
            user_index : int
                the index of the user for whom to recommend an item

        Returns
        -------
            int
                the index of the recommended item
        """
        similarity_scores = self.similarity_matrix[user_index]
        sorted_indices = np.argsort(similarity_scores)[::-1]
        most_similar_users = sorted_indices[1:3]
        mean_ratings = np.mean(self.ratings[most_similar_users], axis=0)
        unrated_items = np.where(self.ratings[user_index] == 0)[0]
        unrated_item_ratings = mean_ratings[unrated_items]
        recommended_item_index = unrated_items[np.argmax(unrated_item_ratings)]
        return recommended_item_index

# Example usage:
ratings = np.array([
    [5, 4, 0, 1, 0],
    [4, 5, 0, 0, 2],
    [0, 0, 5, 4, 1],
    [0, 0, 4, 5, 1],
    [1, 0, 1, 0, 5]
])

recommender = CollaborativeFilter(ratings)
recommended_item_index = recommender.recommend(0)

print(f'Recommended item index: {recommended_item_index}')


Recommended item index: 4


In this example, `ratings` is a 2D numpy array where each row represents a user and each column represents an item. The `CollaborativeFilter` class uses the `cosine_similarity` function from `sklearn` to compute the similarity between users based on their ratings. The system then recommends an item to a user based on the ratings of the most similar users.

В этом примере `ratings` - это двумерный массив numpy, где каждая строка представляет пользователя, а каждый столбец представляет товар. Класс `CollaborativeFilter` использует функцию `cosine_similarity` из `sklearn` для вычисления сходства между пользователями на основе их оценок. Затем система рекомендует товар пользователю на основе оценок наиболее похожих пользователей.