# **Тестовое задание**

Уважаемый кандидат!

В рамках данного тестового задания Вам будет предложена исследовательская задача в области молекулярного моделирования и структурной биологии.
В описании к заданиям указаны наиболее популярные биоинформатически пакеты, однако для решения Вы можете использовать любые доступные и удобные Вам инструменты.

Желаем удачи!

## **Введение**  
Сахарный диабет 2 типа (СД2) часто называют эпидемией XXI века: по некоторым прогнозам к 2030 году каждый десятый человек на планете будет страдать от этого недуга. Одним из подходов к лечению сахарного диабета 2 типа является применение инкретиномиметиков - небольших белковых молекул, являющихся аналогами нативных белков человека и активирующих рецепторы, ответственные за регуляцию функции поджелудочной железы (источника инсулина) и уровня глюкозы в плазме крови. На фармацевтическом рынке широко доступны молекулы этого класса - агонисты **GLP-1R** - рецептора глюкагоноподобного пептида первого типа. Однако в 2022 году FDA был одобрен новый продукт, призванный произвести революцию в сфере лечения СД2 и ожирения - тирзепатид, обладающий агонизмом как к GLP-1R, так и к **GIPR** - рецептору глюкозозависимого инсулинотропного полипептида. В рамках данного задания Вам будет предложена 3D-структура тирзепатида в комплексе с GIPR. Для упрощения вычислений будет рассматриваться неацилированная форма тирзепатида и рецептор без G-белков.

In [7]:
import pandas as pd
import os
import sys
import urllib.request

import Bio
import Bio.PDB
import Bio.SeqRecord
import nglview

## **Задание №1.**  
Перед Вами аминокислотная последовательность исследуемого агониста в формате FASTA:

\>non_acylated_tirzepatide  
YXEGTFTSDYSIXLDKIAQKAFVQWLIAGGPSSGAPPPS,

где Х - альфа-аминоизомасляная кислота (AIB) - непротеиногенный аналог аланина.

Структура неацилированного тирзепатида в комплексе с GIPR экспериментально разрешена и содержится в базе данных PDB под ID [7VAB](https://www.rcsb.org/structure/7vab).

В поле ниже с помощью языка python:
1. Прочитайте файл 7vab.pdb и сохраните как объект.
2. Удалите из структуры G-белки, молекулы воды, ионы и т.д., оставив только аминокислотные цепи рецептора и агониста.
3. Визуализируйте 3D-структуру полученного комплекса (например, с помощью ```nglview``` или ```py3Dmol```).

In [9]:
## место для Вашего ответа ##
## чтение файла 7vab.pdb
f =  open('./files/7vab.pdb', 'r')
f.close()
## подготовка структуры
seq = []
with open('./files/structure.pdb', 'w') as nf:
    with open('./files/7vab.pdb', 'r') as f:
        for line in f:
            line = line.split()
            id = line[0]
            if id == 'SEQRES' and (list[2] != 'R' or list[2] == 'P'):
                seq += list[4:]
                nf.write(line)
            
r = nglview.show_structure_file()
## визуализация



## **Задание №2.**  

Сравните аминокислотную последовательность агониста в подготовленной структуре с указанной в **Задании №1**. Является ли структура репрезентативной? Внесите ответ в поле ниже.

\## место для Вашего ответа ##

## **Задание №3.**  

Реализуйте функцию анализа количества водородных связей, которая будет принимать на вход подготовленную в **Задании №1** структуру и возвращать лист с двумя целочисленными значениями - количеством внутримолекулярных и межмолекулярных водородных связей. Для реализации можно использовать как базовый функционал python, так и пакеты для работы с биологическими данными - ```biopython```, ```MDAnalysis``` и др.

In [None]:
def h_bond_counter(structure) -> list:
  ## место для Вашего кода
  pass

## **Задание №4.**  

Представьте, что Вам необходимо модифицировать агонист таким образом, чтобы он формировал **меньшее** количество водородных связей с остатками рецептора, но имел такой же заряд молекулы. Предложите 3 аминокислотные замены в составе агониста, удовлетворяющие условию, и кратко прокомментируйте свой выбор.

\## место для Вашего ответа ##

##**Поздравляем, Вы дошли до самого конца!**  

Перед отправкой, пожалуйста, убедитесь, что Вы внесли все ответы в виде текстовых полей или кода и сохранили изменения.