Letovo.online. Июнь 2022.
Таблица users (данные о пользователях платформы):
id
-- внутренний id пользователя в системеgrade_id
-- актуальный класс ученика на апрель 2022.created_at
-- дата создания пользователяrole
-- выбираем learner (ученики собственно)id___global
-- внешний ID, в некоторых таблицах он используетсяts_login_first
-- первый логин в ДО. Может не совпадать с created_at, так как пользователь мог зарегаться на сайте школы и не перейти в ДОts_login_last
-- последний логин в ДО
Таблица auth (данные об авторизациях пользователей):
id_app
-- выбираем (2)idc_type
-- выбираем (1) и (2)idc_audit_access
-- (1)id_user_login
-- это обычный id внутренний в usersti
-- времяf_supervisor
-- выбираем (0)
Это две основные таблицы. Кроме того есть таблицы с данными по тестам, курсам, олипиадам, а также по заявкам в школу.
-
Кривая Retention и усредненный процент по дням (1-30), месяцам (1-24) по сегментам:
-
все новые пользователи
-
пользователи, которые начали тест в течение 14 дней после первого логина
-
пользователи, которые закончили тест в течение 14 дней после первого логина
-
пользователи, которые подали заявку на курс в течение 14 дней после первого логина
-
пользователи, которые получили одобренную заявку на курс в течение 45 дней после подачи заявки
-
пользователи, которые получили отказ
-
пользователи, которые подали заявку на обучение в школе
-
-
Когортный анализ по неделям для новых пользователей в 2021-2022 гг.
- Число новых пользователей в когорте
- Начали проходить тест в течение 14 дней после регистрации
- Закончили проходить тест в течение 30 дней после регистрации
- Подали заявку на курс в течение 14 дней после регистрации
- Решили одно олимпиадное задание в течение 14 дней
- Подали заявку в школу
- Retention новых пользователей в авторизацию на 1, 7 и 30 день
Замечание: смотрим только на 5-8 классы.
pandas, seaborn, matplotlib, numpy, lxml
- Retention имеет тенденцию к росту при переходе по цепочке: логин -> нач. тест -> закон. тест. Заявка на курс в плане retention лучше, чем начавшие тест, но хуже, чем те, кто тест завершил.
- есть тенденция на снижение с 2019 до 2021 года
- сезонные пики: май, июнь, июль ,август, сентябрь, октябрь, ноябрь, декабрь, январь - высокий сезон, особенно выраженный в сентябре-октябре, что логично.
- Конверсия в заявку на курс совсем низкая, ниже, чем на олимпиады
- В ноябре и декабре всплеск заявок на олимпиады
- Высокий процент заявок на курс видим только в сентябре и начале октября
- Самая высокая конверсия в заявку на обучение в школе на вторую неделю октября (33%)