Skip to content

Prediction of the state of life of patients by medical parameters.

Notifications You must be signed in to change notification settings

PunkButterfly/Hackathon-BestHack

Repository files navigation

Хакатон BestHack 2022

В этом репозитории описана вся исследовательская работа, которую мы провели в рамках хакатона BestHack 2022 от МГТУ в составе команды punk_butterfly.

Задание от команды BestHack

На выбор было две задачи. Нам понравилась идея задания №2, поэтому было решено браться за нее.

Задание

Необходимо решить одну из задач «Цифровой реанимации». В представленном датасете имеются медицинские параметры пациентов, больных раком. Необходимо классифицировать на основе этих данных – пациент жив или погиб.

Для этого задания заранее подготовлен baseline с точностью 50%.

Сложности, с которыми предстоит столкнуться

  • Медицинские данные полны терминологии, которую необходимо изучить для проработки вопроса;
  • Низкая корреляция данных с таргетом, возможно, придется создавать новые фичи;
  • Признаков (фич) много, необходимо выбрать те, которые способны дать максимальный результат.

Данные к задаче:

  • Датасет с размеченными таргетами, состоящий из 259 записей (пациентов);
  • Датасет из 112 записей, которые необходимо предсказать.

Качество модели будет оцениваться по метрике balanced accuracy.

Наши результаты

Последовательность наших действий подробно описана в итоговом ноутбуке, состоящем из выбранных нами лучших подходов. К сожалению, мы ошиблись, когда решили использовать некую ф??гню эвристику, вместо методов кластеризации. Данный подход на private выборке дал качество всего 0,67, из-за чего мы не прошли в финал. Но задание было очень увлекательным и веселым :)

Навигация по файлам

  • Задание - формулировка задачи от организаторов хакатона;
  • Data_analysis - ноутбук с исследованием данных и используемых моделей (все подробно описано);
  • Prediction - ноутбук для предикта;

Чтобы запустить, нужно удалить первую ячейку (она для подключения к гугл диску), и поменять путь до файлов в третьей ячейке. Результатом работы программы будет файл Result.csv.

About

Prediction of the state of life of patients by medical parameters.

Resources

Stars

Watchers

Forks