Создание рекомендательной системы для рекомендации фильмов для конкретного пользователя
- Сбор данных;
- Проектирование архитектуры системы;
- Обучение моделей на основе обучающей выборки;
- Оценка моделей на тестовой выборке;
- Выбор лучшей модели;
- Разворачивание лучшей модели.
Датасет: The Movies Dataset Проект: movie-recommendation
Датасет содержит метаданные для 45000 фильмов, которые располагаются в нескольких файлах. movies_metadata.csv - содержит информацию о самих фильмах: названия, оригинальные названия, идентификаторы, бюджет, синопсис, бюджет и т.д. keywords.csv - содержит информацию о ключевых словах фильмов links.csv - содержит информацию о соответствии различных идентификаторов фильмов ratings.csv - содержит информацию о оценках конкретных пользователей фильмам
Датасет имеет достаточный объем данных для обучения модели, содержит текстовое описание по tagline, keywords, genres и overview, которое можно использовать для content-based модели, а также достаточное количество рейтингов пользователей. Распределения по жанрам и ключевым словам изображены ниже.
Пример датасета