Skip to content

Nevers15/Big_Data_Analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Анализ данных о клиентах онлайн кинотеатра - описание данных, их анализ и построение модели линейной регрессии

СТАТУС: Завершён

Цель проекта:

Основная задача проекта построить модель линейной регрессии для предсказания средней оценки пользователя по набору жанров фильма.

Описание проекта:

Основной источник информации - это датасет, который содержит информацию о клиентах кинотеатра. Целью дата-проекта стоит создание рекомендательной системы с точностью в 15% на основе данных, которые предоставляет наш датасет. Если проект окажется успешным и рекомендательная система будет работать с точностью в 15%, то показатель Customer retention (способность компании или продукта удерживать потребителей на протяжении определённого периода) возрастет, что в свою очередь повлияет на прибыль сервиса.

Вывод исследования:

Модель выдает отличный результат Линейной регрессии со среднеквадратичным отклонением в 0.020 на тренировочной выборке и 0.029 на тестовой.

Использование результатов исследования:

Результат позволяет нам успешно внедрить рекомендательную систему в стриминговый сервис.

Технические особенности проекта:

Данные зашумлены дубликатами (явными и неявными) - проведена предобработка. Для ответа на вопросы исследования использовались группировки данных в различных разрезах.

Инструменты проекта

  • Python
  • Pandas
  • Sklearn
  • Pyspark
  • SQL
  • Excel

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published