В данной практической работе мы создадим простое приложение Biopython для анализа файла биоинформатики и распечатки содержимого.  
Это поможет нам понять общую концепцию биопиона и то, как он помогает в области биоинформатики.  
[ТЕОРИЯ](https://sites.google.com/view/bioinfbsu/лекции/4-biopython)

# ШАГ 1
Сначала создайте пример файла последовательности «example.fasta» и поместите в него содержимое ниже.  
```txt
>sp|P25730|FMS1_ECOLI CS1 fimbrial subunit A precursor (CS1 pilin) 
MKLKKTIGAMALATLFATMGASAVEKTISVTASVDPTVDLLQSDGSALPNSVALTYSPAV
NNFEAHTINTVVHTNDSDKGVVVKLSADPVLSNVLNPTLQIPVSVNFAGKPLSTTGITID 
SNDLNFASSGVNKVSSTQKLSIHADATRVTGGALTAGQYQGLVSIILTKSTTTTTTTKGT 

>sp|P15488|FMS3_ECOLI CS3 fimbrial subunit A precursor (CS3 pilin) 
MLKIKYLLIGLSLSAMSSYSLAAAGPTLTKELALNVLSPAALDATWAPQDNLTLSNTGVS 
NTLVGVLTLSNTSIDTVSIASTNVSDTSKNGTVTFAHETNNSASFATTISTDNANITLDK 
NAGNTIVKTTNGSQLPTNLPLKFITTEGNEHLVSGNYRANITITSTIKGGGTKKGTTDKK
```

Расширение fasta относится к формату файла последовательности. FASTA происходит от программного обеспечения для биоинформатики FASTA и, следовательно, получает свое имя. Формат FASTA состоит из нескольких последовательностей, расположенных одна за другой, и каждая последовательность будет иметь свой собственный идентификатор, имя, описание и фактические данные последовательности. 

# ШАГ 2
Создайте новый скрипт на Python * simple_example.py “, введите приведенный ниже код и сохраните его. 

In [24]:
from Bio.Seq import Seq
from Bio.SeqIO import parse
from Bio.SeqRecord import SeqRecord

file = open("./data/example.fasta")
records = parse(file, "fasta")
for record in records:
  print("Id: %s" % record.id)
  print("Name: %s" % record.name)
  print("Description: %s" % record.description)
  print("Annotations: %s" % record.annotations)
  print("Sequence Data: %s" % record.seq)

Id: sp|P25730|FMS1_ECOLI
Name: sp|P25730|FMS1_ECOLI
Description: sp|P25730|FMS1_ECOLI CS1 fimbrial subunit A precursor (CS1 pilin)
Annotations: {}
Sequence Data: MKLKKTIGAMALATLFATMGASAVEKTISVTASVDPTVDLLQSDGSALPNSVALTYSPAVNNFEAHTINTVVHTNDSDKGVVVKLSADPVLSNVLNPTLQIPVSVNFAGKPLSTTGITIDSNDLNFASSGVNKVSSTQKLSIHADATRVTGGALTAGQYQGLVSIILTKSTTTTTTTKGT
Id: sp|P15488|FMS3_ECOLI
Name: sp|P15488|FMS3_ECOLI
Description: sp|P15488|FMS3_ECOLI CS3 fimbrial subunit A precursor (CS3 pilin)
Annotations: {}
Sequence Data: MLKIKYLLIGLSLSAMSSYSLAAAGPTLTKELALNVLSPAALDATWAPQDNLTLSNTGVSNTLVGVLTLSNTSIDTVSIASTNVSDTSKNGTVTFAHETNNSASFATTISTDNANITLDKNAGNTIVKTTNGSQLPTNLPLKFITTEGNEHLVSGNYRANITITSTIKGGGTKKGTTDKK


__Строка 1__ импортирует класс разбора, доступный в модуле Bio.SeqIO. Модуль Bio.SeqIO используется для чтения и записи файла последовательности в другом формате, а класс parse используется для анализа содержимого файла последовательности.

__Строка 2__ импортирует класс SeqRecord, доступный в модуле Bio.SeqRecord. Этот модуль используется для управления записями последовательности, а класс SeqRecord используется для представления определенной последовательности, доступной в файле последовательности.

__Строка 3__ импортирует класс Seq, доступный в модуле Bio.Seq. Этот модуль используется для манипулирования данными последовательности, а класс Seq используется для представления данных последовательности конкретной записи последовательности, доступной в файле последовательности.

__Строка 5__ открывает файл «example.fasta» с помощью обычной функции python, open.

__Строка 7__ анализирует содержимое файла последовательности и возвращает содержимое в виде списка объекта SeqRecord.

__Строка 9-15__ циклически перебирает записи, используя python for loop, и печатает атрибуты записи последовательности (SqlRecord), такие как id, имя, описание, данные последовательности и т. Д.

__Строка 15__ печатает тип последовательности, используя класс Alphabet.

# ШАГ 3
Откройте командную строку и перейдите в папку, содержащую файл последовательности, «example.fasta» и выполните следующую команду  
```txt
> python simple_example.py
```
Python запускает скрипт и печатает все данные последовательности, доступные в файле примера, «example.fasta». Вывод будет похож на следующий контент:  
```txt
Id: sp P25730 FMS1_ECOLI
Name: sp P25730 FMS1_ECOLI
Decription: sp|P25730|FMS1_ECOLI CS1 fimbrial subunit A precursor (CS1 pilin)
Annotations: {}
Sequence Data: MKLKKTIGAMALATLFATMGASAVEKTISVTASVDPTVDLLOSDGSALPNSVALTYSPAVNNFEAHTINTVVHTNDSD
KGVVVKLSADPVLSNVLNPTLQIPVSVNFAGKPLSTTGITIDSNDLNFASSGVNKVSSTOKLSIHADATRVTGGALTA
GQYQGLVSIILTKSTTTTTTTKGT
Sequence Alphabet: SingleLetterAlphabet ()
Id: Sp P15488 FMS3 ECOLI
Name: sp P15488 | FMS3_ECOLI
Decription: sp|P15488|FMS ECOLI CS3 fimbrial subunit A precursor (CS3 pilin)
Annotations: {}
Sequence Data: MLKIKYLLIGLSLSAMSSYSLAAAGPTLTKELALNVLSPAALDATWAPQDNLTLSNTVSNTLVGVLTLSNTSIDTVS
IASTVSDTSKNGTVTFAHETNNSASFATTISTDNANITLDKNAGNTIVKTTNGSQLPTLPLKFITTEGNEHLVSGN
YRANITITSTIKGGGTKKGTTDKK
Sequence Alphabet: SingleLetterAlphabet ()
```
В этом примере мы видели три класса: parse, SeqRecord и Seq.  
Эти три класса предоставляют большую часть функциональности.  
Для сдачи работы:  
 * Создайте папку со своим именем на диске: https://drive.google.com/drive/folders/1t_zC0xQJrjh0AzBL3XpyQWDkA0mb8vS5?usp=sharing
 * Поместите туда ваше приложение
 * Покажите окно вывода преподавателю