# Hybrid Systems

Hybrid Systems in the context of recommendation systems are methods that combine collaborative filtering and content-based filtering. Hybrid approaches can be implemented in several ways: by making content-based and collaborative-based predictions separately and then combining them; by adding content-based capabilities to a collaborative-based approach (and vice versa); or by unifying the approaches into one model.

## How it Works

Hybrid recommendation systems use both user-item interactions (like collaborative filtering) and item metadata (like content-based filtering) to provide recommendations. This allows the system to leverage the strengths of both methods while compensating for their weaknesses.

- **Weighted Hybrid**: This method combines the predictions of a collaborative model and a content-based model into a final recommendation using a weighted average.

- **Feature Combination Hybrid**: This method incorporates features from both models into one single recommendation model.

- **Cascade Hybrid**: This method uses one model to make a primary set of recommendations, then uses the other model to refine and rank these recommendations.

## Use Cases

Hybrid systems are used in various applications, including:

- **Recommendation Systems**: Hybrid systems can provide more accurate and diverse recommendations by leveraging both user-item interactions and item metadata.

- **Personalization**: By predicting the interests of a user, systems can personalize content delivery such as news articles, advertisements, and more.

## Limitations

Despite its advantages, Hybrid Systems also have some limitations:

- **Complexity**: Hybrid systems can be more complex and computationally expensive than single-method systems.

- **Cold Start**: While hybrid systems can mitigate the cold start problem of collaborative filtering by using item metadata, they still struggle with new items that have no metadata.

- **Overfitting**: As with any machine learning model, hybrid systems can suffer from overfitting if not properly regularized or if trained on sparse data.

# Гибридные системы

Гибридные системы в контексте систем рекомендаций - это методы, которые сочетают в себе коллаборативную фильтрацию и фильтрацию на основе содержания. Гибридные подходы могут быть реализованы несколькими способами: путем отдельного создания прогнозов на основе содержания и коллаборативных прогнозов, а затем их объединения; добавлением возможностей, основанных на содержании, к коллаборативному подходу (и наоборот); или объединением подходов в одну модель.

## Как это работает

Гибридные системы рекомендаций используют как взаимодействия пользователь-элемент (как в коллаборативной фильтрации), так и метаданные элемента (как в фильтрации на основе содержания) для предоставления рекомендаций. Это позволяет системе использовать преимущества обоих методов, компенсируя их слабые стороны.

- **Взвешенный гибрид**: Этот метод объединяет прогнозы коллаборативной модели и модели, основанной на содержании, в окончательную рекомендацию с использованием взвешенного среднего.

- **Гибрид с комбинацией признаков**: Этот метод включает в себя признаки обеих моделей в одну единую модель рекомендаций.

- **Каскадный гибрид**: Этот метод использует одну модель для создания первичного набора рекомендаций, затем использует другую модель для уточнения и ранжирования этих рекомендаций.

## Применение

Гибридные системы используются в различных приложениях, включая:

- **Системы рекомендаций**: Гибридные системы могут предоставлять более точные и разнообразные рекомендации, используя как взаимодействия пользователь-элемент, так и метаданные элемента.

- **Персонализация**: Предсказывая интересы пользователя, системы могут персонализировать доставку контента, такого как новостные статьи, реклама и многое другое.

## Ограничения

Несмотря на свои преимущества, гибридные системы также имеют некоторые ограничения:

- **Сложность**: Гибридные системы могут быть более сложными и вычислительно затратными, чем системы, основанные на одном методе.

- **Холодный старт**: Хотя гибридные системы могут смягчить проблему холодного старта коллаборативной фильтрации с использованием метаданных элемента, они все же испытывают трудности с новыми элементами, которые не имеют метаданных.

- **Переобучение**: Как и любая модель машинного обучения, гибридные системы могут страдать от переобучения, если они не должным образом регуляризованы или если они обучены на разреженных данных.

In [9]:
import numpy as np
from sklearn.metrics.pairwise import cosine_similarity
from sklearn.feature_extraction.text import TfidfVectorizer

class HybridFilter:
    """
    A class used to represent a Hybrid Recommendation System

    ...

    Attributes
    ----------
    ratings : np.array
        a 2D numpy array representing user-item ratings
    item_metadata : list
        a list of strings where each string represents the metadata of an item
    similarity_matrix : np.array
        a 2D numpy array representing the similarity matrix of the ratings
    tfidf_vectorizer : TfidfVectorizer
        a TfidfVectorizer object
    item_tfidf_matrix : csr_matrix
        a sparse matrix representing the TF-IDF features of the item metadata

    Methods
    -------
    recommend(user_index)
        Recommends an item for a given user
    """
    def __init__(self, ratings, item_metadata):
        """
        Constructs all the necessary attributes for the HybridFilter object.

        Parameters
        ----------
            ratings : np.array
                a 2D numpy array representing user-item ratings
            item_metadata : list
                a list of strings where each string represents the metadata of an item
        """
        self.ratings = ratings
        self.item_metadata = item_metadata
        self.similarity_matrix = cosine_similarity(self.ratings)
        self.tfidf_vectorizer = TfidfVectorizer()
        self.item_tfidf_matrix = self.tfidf_vectorizer.fit_transform(item_metadata)

    def recommend(self, user_index):
        """
        Recommends an item for a given user.

        Parameters
        ----------
            user_index : int
                the index of the user for whom to recommend an item

        Returns
        -------
            int
                the index of the recommended item
        """
        similarity_scores = self.similarity_matrix[user_index]
        sorted_indices = np.argsort(similarity_scores)[::-1]
        most_similar_users = sorted_indices[1:3]
        mean_ratings = np.mean(self.ratings[most_similar_users], axis=0)
        unrated_items = np.where(self.ratings[user_index] == 0)[0]
        unrated_item_ratings = mean_ratings[unrated_items]
        unrated_item_metadata = self.item_tfidf_matrix[unrated_items].toarray()  # Convert to dense array
        user_profile = self.ratings[user_index, :].dot(self.item_tfidf_matrix.toarray())  # Convert to dense array
        content_based_scores = cosine_similarity([user_profile], unrated_item_metadata)
        hybrid_scores = unrated_item_ratings * content_based_scores.flatten()
        recommended_item_index = unrated_items[np.argmax(hybrid_scores)]
        return recommended_item_index

# Example usage:
ratings = np.array([
    [5, 4, 0, 1, 0],
    [4, 5, 0, 0, 2],
    [0, 0, 5, 4, 1],
    [0, 0, 4, 5, 1],
    [1, 0, 1, 0, 5]
])

item_metadata = [
    "Action, Adventure, Sci-Fi",
    "Drama, Romance",
    "Action, Adventure, Fantasy",
    "Comedy, Drama, Romance",
    "Animation, Adventure, Comedy"
]

recommender = HybridFilter(ratings, item_metadata)
recommended_item_index = recommender.recommend(0)

print(f'Recommended item index: {recommended_item_index}')


Recommended item index: 4


This code creates a hybrid recommendation system that combines collaborative filtering and content-based filtering. The `HybridFilter` class takes in a matrix of user-item ratings and a list of item metadata. The `recommend` method returns the index of the item that is recommended for a given user.

Этот код создает гибридную систему рекомендаций, которая объединяет коллаборативную фильтрацию и контент-ориентированную фильтрацию. Класс `HybridFilter` принимает матрицу оценок пользователей и список метаданных элементов. Метод `recommend` возвращает индекс элемента, который рекомендуется для данного пользователя.