Skip to content

Обработка естественных языков на ДНК и белках

Notifications You must be signed in to change notification settings

ssyp-ru/ssyp22-ws08

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Мастерская №8 Обработка естественных языков на ДНК и белках.

В папке src/ лежат алгоритмы, которые мы разобрали во время обучения, в папке notebooks/ - jupyter ноутбуки с кодом для интерактивного выполнения. Целью было разобрать классические алгоритмы машинного обучения и затем попробовать их на белках. У проекта было 2 части: научиться предсказывать вторичную структуру белка по его последовательности и научиться классифицировать белки по принадлежности к разным таксонам по его последовательности. Они лежат в файлах в папке notebooks/. Мы не успели упаковать их в консольный интерфейс, вы можете запустить файлы по ссылке.

Все данные уже лежат в папке data/. Вторичные структуры взяты отсюда.

Сборка и запуск

Зависимости: Python и библиотеки pytorch, torchtext, sklearn, numpy, pandas, matplotlib, seaborn, tqdm.

Или можно открыть блокноты в Google Colab. Запустите блокнот и затем нажмите Среда выполнения -> выполнить все.

  • Разобранные алгоритмы Open In Colab
  • Предсказание таксона Open In Colab
  • Визуализация датасета со вторичными структурами Open In Colab
  • Предсказание вторичной структуры Open In Colab

Состав мастерской

Ученики

  • Закиров Тимур
  • Плюснин Антон
  • Матюшин Никита
  • Васильченко Михаил
  • Притупов Вадим

Руководитель

  • Грушецкий Николай Артёмович

About

Обработка естественных языков на ДНК и белках

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 99.9%
  • Python 0.1%