Letovo.online. Июль 2023.
feat: Признаки успешного абитуриента от 25.08.2022 до 01.03.2023.
Только для тех, кто залогинился на платформе.
(во всех полях с тестами, курсами и т.д. NULL - означает, что не присупал)
lo_id
- новый ЛО ID (в схемах letovo_online)first_attempt_avg_score
- средняя оценка за начальные тестыtrain_count_avg
- кол-во тренировочных попыток в тесте (среднее по всем предметам).final_score_avg
- средняя финальная оценка за тестыtrain_count_80_avg
- кол-во тренировочных попыток для достижения 80% в тесте (среднее по всем предметам).oz_done_count
- кол-во решенных ОЗ (с ненулевым баллом)oz_subject_count
- кол-во различных предметов, в которых были набраны баллы ОЗoz_percent_avg
- средний балл за ОЗ в процентах от максимального балла за заданиеcourse_start
- кол-во курсов, в которых отправлено хотя бы одно заданиеcourse_50
- кол-во курсов, в которых отправлено хотя бы половина заданийolymp_start
- кол-во олимпиад, в которых отправлено хотя бы одно заданиеwave_login_first
- уч.год первого логина, 0 - текущий, 1 - предыдущий и т.д.week_first_login_wave
- порядковый номер недели учебного года, когда был первый логин в год первого логинаweek_first_login_this_year
- порядковый номер недели учебного года, когда был первый логин в этом годуgrade
- класс ученика в данном учебном году
claims: Данные о заявках в школу
lo_id
- ID ЛОrecomended
- рекомендован к поступлению (без FT)submitted_at
- время отправки заявки в школу
Исследовать основных кандидатов в признаки успешности и построить портрет успешного абитуриента школы Летово 2022-2023.
Желающие обучаться в школе Летово, а также просто интересующиеся ученики могут проходить различные курсы, олимпиадные задания и тесты на платформе Летово.Онлайн.
Мы собрали данные о результатах участия детей в различных проектах на Летово.Онлайн и по ним будем пытаться построить скоринговую модель, которая будет стараться выделить потенциально сильных кандидатов среди всех учащихся.
В данном исследовании мы рассматриваем эти признаки и строим портрет успешного абитуриента. Надо отметить, что мы берем данные за 2022-2023 учебный год по 01.03.2023, а также рассматриваем только тех, кто подавал заявку в школу Летово.
pandas, seaborn, matplotlib, numpy, math, scipy.stats, y_data_profiling
Для многих значимых признаков распределение сильно разнится для различных классов. Это значит, что нужно либо обучаться на каждом классе в отдельности, либо включать класс как признак успешности (и может быть какие-то производные члены взаимодействия других признаков с классом)
Самые явные признаки успешности абитуриента 2022-2023
- Результат начальной попытки в тесте, среднее
- Общее кол-во тренировок, среднее
- Общий результат за тест, среднее
- Кол-во решенных ОЗ
- Средний результат ОЗ, %
- Кол-во начатых курсов
- Неделя первого логина в текущем уч. году
Остальные признаки, как мы увидели скорее всего не окажут положительного влияния на модель. Их можно либо не рассматривать вообще, либо тестировать, в зависимости от наших временных возможностей.
ПОРТРЕТЫ
Признак | Успешный абитуриент | Неуспешный абитуриент |
---|---|---|
Результат начальной попытки в тесте | 68% | 51% |
Финальный результат в тесте | 92% | 76% |
Кол-во тренировок | 2.5 | 1 |
Решенные ОЗ | 10 | 5 |
Кругозор ОЗ (кол-во предметов) | 2 | 1 |
Результат ОЗ | 55% | 41% |
Курсы 50% | 2 | 1 |
Неделя логина в тек. году | 3 | 9 |