Этот проект показывает:
- способность писать структурированный код на Python.
- возможность использования существующих утилит(библиотек) для обработки и анализа данных.
- применение статистического анализа
- применение исследовательского анализа
- навыки анализа и предварительной обработки данных
Проект является сборным проектом, который включает в себя:
- Предварительная обработка данных
- Исследовательский анализ
- Статистический анализ
Входные данные с открытых источников 2016 года - исторические данные о продажах игр: оценки пользователей и экспертов,продажи в странах, жанры и платформы, рейтинги организации ESRB (https://ru.wikipedia.org/wiki/Entertainment_Software_Rating_Board)
В наличии были следующие данные:
- название игры
- платформа
- год выпуска
- жанр игры
- продажи в Северной Америке (миллионы проданных копий)
- продажи в Европе (миллионы проданных копий)
- продажи в Японии (миллионы проданных копий)
- продажи в других странах (миллионы проданных копий)
- оценка критиков (максимум 100)
- оценка пользователей (максимум 10)
- рейтинг организации ESRB (Entertainment Software Rating Board), определяющая рейтинг игры и подходящую возрастную категорию
В нашем распоряжении данные с открытых источников о продажах игр, оценки пользователей и экспертов, жанры и платформы. Необходимо помочь глобальному интернет-магазину найти потенциально популярный продукт, что позволит им спланировать рекламные кампании.
pandas numpy matplotlib seaborn scipy