В папке src/
лежат алгоритмы, которые мы разобрали во время обучения, в папке notebooks/
- jupyter ноутбуки с кодом для интерактивного выполнения.
Целью было разобрать классические алгоритмы машинного обучения и затем попробовать их на белках.
У проекта было 2 части: научиться предсказывать вторичную структуру белка по его последовательности и научиться классифицировать белки по принадлежности к разным таксонам по его последовательности.
Они лежат в файлах в папке notebooks/
. Мы не успели упаковать их в консольный интерфейс, вы можете запустить файлы по ссылке.
Все данные уже лежат в папке data/
. Вторичные структуры взяты отсюда.
Зависимости: Python и библиотеки pytorch, torchtext, sklearn, numpy, pandas, matplotlib, seaborn, tqdm
.
Или можно открыть блокноты в Google Colab. Запустите блокнот и затем нажмите Среда выполнения -> выполнить все
.
- Разобранные алгоритмы
- Предсказание таксона
- Визуализация датасета со вторичными структурами
- Предсказание вторичной структуры
- Закиров Тимур
- Плюснин Антон
- Матюшин Никита
- Васильченко Михаил
- Притупов Вадим
- Грушецкий Николай Артёмович