# Практическая работа 8: Создание простой рекомендательной системы
## Цель: Изучить основные методы создания простых рекомендательных систем и их применение для предсказания предпочтений пользователей.

## Шаги выполнения:
Изучение методов рекомендательных систем.

## Ознакомление с основными методами рекомендательных систем, включая Collaborative Filtering и Content-Based Filtering.
## Программирование простой рекомендательной системы на основе Collaborative Filtering.

### Написание кода для создания простой рекомендательной системы на основе Collaborative Filtering с использованием библиотеки surprise.
### Программирование простой рекомендательной системы на основе Content-Based Filtering.

### Написание кода для создания простой рекомендательной системы на основе Content-Based Filtering с использованием библиотеки scikit-learn.
### 1. Collaborative Filtering с использованием библиотеки surprise

In [3]:
!pip install surprise



In [5]:
import pandas as pd
from surprise import Dataset, Reader, KNNBasic
from surprise.model_selection import train_test_split
from surprise.accuracy import rmse

# Создание примера данных
ratings_dict = {
    "userID": [1, 1, 1, 2, 2, 3, 3, 3],
    "itemID": [101, 102, 103, 101, 104, 102, 103, 104],
    "rating": [4, 5, 3, 5, 4, 2, 4, 5]
}
ratings_df = pd.DataFrame(ratings_dict)

# Сохранение данных в csv-файл
ratings_df.to_csv('ratings.csv', index=False)

# Загрузка данных
reader = Reader(line_format='user item rating', sep=',', rating_scale=(1, 5))
data = Dataset.load_from_df(ratings_df[['userID', 'itemID', 'rating']], reader)

# Разделение данных на обучающий и тестовый наборы
train_set, test_set = train_test_split(data, test_size=0.2, random_state=42)

# Инициализация модели и обучение
model = KNNBasic()
model.fit(train_set)

# Предсказание оценок для тестового набора
predictions = model.test(test_set)

# Вычисление RMSE (Root Mean Squared Error)
accuracy = rmse(predictions)
print("RMSE:", accuracy)

Computing the msd similarity matrix...
Done computing similarity matrix.
RMSE: 1.0865
RMSE: 1.086533734200441


### Content-Based Filtering с использованием библиотеки scikit-learn

In [6]:
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

# Пример данных о фильмах (название, описание)
movies = [
    "The Shawshank Redemption", "The Godfather", "The Dark Knight",
    "Pulp Fiction", "The Lord of the Rings: The Return of the King"
]
descriptions = [
    "Two imprisoned men bond over a number of years, finding solace and eventual redemption through acts of common decency.",
    "The aging patriarch of an organized crime dynasty transfers control of his clandestine empire to his reluctant son.",
    "When the menace known as The Joker emerges from his mysterious past, he wreaks havoc and chaos on the people of Gotham.",
    "The lives of two mob hitmen, a boxer, a gangster's wife, and a pair of diner bandits intertwine in four tales of violence and redemption.",
    "Gandalf and Aragorn lead the World of Men against Sauron's army to draw his gaze from Frodo and Sam as they approach Mount Doom with the One Ring."
]

# Преобразование текстов описаний в TF-IDF векторы
vectorizer = TfidfVectorizer()
tfidf_matrix = vectorizer.fit_transform(descriptions)

# Вычисление сходства между фильмами на основе косинусного сходства
cosine_sim = cosine_similarity(tfidf_matrix, tfidf_matrix)

# Функция для получения рекомендаций на основе сходства
def recommend(movie_index, similarity_matrix, movies_list):
    sim_scores = list(enumerate(similarity_matrix[movie_index]))
    sim_scores = sorted(sim_scores, key=lambda x: x[1], reverse=True)
    sim_scores = sim_scores[1:6]  # Исключаем сам фильм
    movie_indices = [i[0] for i in sim_scores]
    return [movies_list[i] for i in movie_indices]

# Получение рекомендаций для фильма "The Shawshank Redemption" (индекс 0)
recommendations = recommend(0, cosine_sim, movies)
print("Recommendations for 'The Shawshank Redemption':", recommendations)


Recommendations for 'The Shawshank Redemption': ['Pulp Fiction', 'The Lord of the Rings: The Return of the King', 'The Godfather', 'The Dark Knight']


## Выводы:
В этой практике вы узнали, как создавать простые рекомендательные системы, используя подходы Collaborative Filtering и Content-Based Filtering.

Я узнал как создавать примерные данные для тестирования и обучения моделей.







