# Практика 2

In [1]:
from mp_api.client import MPRester
API_KEY = 'MyGooigQg21abOKdZMpUKBmYNiNLdfB8'

  from .autonotebook import tqdm as notebook_tqdm


## Часть 1: Материалы

In [None]:
# Загрузка структуры материала
with MPRester(API_KEY) as mpr:
    structures = mpr.get_structures("MnFe2O4")
    structure = structures[0]
    print(structure)

Retrieving MaterialsDoc documents: 100%|██████████| 6/6 [00:00<00:00, 80919.05it/s]

Full Formula (Mn10 Fe20 O40)
Reduced Formula: Mn(FeO2)2
abc   :   6.150494   6.100717  30.396005
angles:  60.279723  59.998079  59.837294
pbc   :       True       True       True
Sites (70)
  #  SP           a         b         c    magmom
---  ----  --------  --------  --------  --------
  0  Mn    0.125585  0.12847   0.02481      4.639
  1  Mn    0.002381  0.500143  0.099514     3.989
  2  Mn    0.128669  0.127284  0.224312     4.634
  3  Mn    0.128352  0.122436  0.425415     4.631
  4  Mn    0.000682  0.497553  0.50056      4.116
  5  Mn    0.12062   0.124349  0.627158     4.63
  6  Mn    0.002588  0.501439  0.299683     4.492
  7  Mn    0.122237  0.127152  0.825253     4.642
  8  Mn    0.998346  0.502359  0.700177     4.095
  9  Mn    0.878815  0.874438  0.9738       4.649
 10  Fe    0.502299  0.001466  0.099341     4.369
 11  Fe    0.500029  0.503541  0.999434     4.38
 12  Fe    0.500882  0.499626  0.099371     4.367
 13  Fe    0.497122  0.005267  0.299203     4.371
 14  Fe    0




In [3]:
# Анализ состава и элементов материала
composition = structure.composition

print('Composition:', composition)
print('Elements:', composition.elements)

Composition: Mn10 Fe20 O40
Elements: [Element Mn, Element Fe, Element O]


In [4]:
# Вычисление параметров решётки и плотности
lattice = structure.lattice

print(f'Lattice parameters (a, b, c): {lattice.a}, {lattice.b}, {lattice.c}')
print(f'Angles (α, β, γ): {lattice.alpha}, {lattice.beta}, {lattice.gamma}')
print('Density:', structure.density)

Lattice parameters (a, b, c): 6.150493600289411, 6.100716953321962, 30.396005395963694
Angles (α, β, γ): 60.27972332909433, 59.99807904718926, 59.83729374457539
Density: 4.744605346781863 g cm^-3


## Часть 2: Последовательности ДНК/РНК

In [5]:
from Bio.Seq import Seq
from Bio.SeqUtils import gc_fraction

seq1 = Seq("ATGCGTACGTTAGC")
seq2 = Seq("GATTACAAGGCTTACG")

sequences = [seq1, seq2]

for i, seq in enumerate(sequences, start=1):
    print('------------')
    gc_frac = gc_fraction(seq) * 100
    print(f'Sequence {i}: {seq}')
    print(f'GC-fraction: {gc_frac:.2f}%')

    rev_comp = seq.reverse_complement()
    print(f'Reverse complement: {rev_comp}')

    rna_seq = seq.transcribe()
    print(f'RNA: {rna_seq}')

------------
Sequence 1: ATGCGTACGTTAGC
GC-fraction: 50.00%
Reverse complement: GCTAACGTACGCAT
RNA: AUGCGUACGUUAGC
------------
Sequence 2: GATTACAAGGCTTACG
GC-fraction: 43.75%
Reverse complement: CGTAAGCCTTGTAATC
RNA: GAUUACAAGGCUUACG


## Часть 3: Белки

In [None]:
from Bio import SeqIO
from Bio.Seq import Seq
from io import StringIO
import requests
from collections import Counter

# Белок альфа Амилаза по UniProt ID 
uniprot_id = "P0DTE8" 
url = f"https://www.uniprot.org/uniprot/{uniprot_id}.fasta"

response = requests.get(url)

In [None]:
# Получение последовательности аминокислот
fasta_io = StringIO(response.text)
seq_io = SeqIO.read(fasta_io, "fasta")
protein_seq = seq_io.seq

print("Последовательность аминокислот (первые 30 элементов):", protein_seq[:30])

Последовательность аминокислот (первые 30 элементов): MKLFWLLFTIGFCWAQYSSNTQQGRTSIVH


In [None]:
# Получение состава аминокислот
aa_counts = Counter(protein_seq)

print("Состав аминокислот:")
for aa, count in sorted(aa_counts.items()):
    print(f"{aa}: {count}")

Состав аминокислот:
A: 27
C: 12
D: 35
E: 20
F: 29
G: 52
H: 12
I: 28
K: 24
L: 27
M: 11
N: 41
P: 22
Q: 12
R: 28
S: 33
T: 23
V: 35
W: 19
Y: 21


In [23]:
# Получение частот дипептидов
dipeptides = [protein_seq[i:i+2] for i in range(len(protein_seq)-1)]
di_counts = Counter(dipeptides)

print("10 наиболее частых дипептидов:")
for dp, count in di_counts.most_common(10):
    print(f"{dp}: {count}")

print(f'\nВсего дипептидов: {len(di_counts)}')

10 наиболее частых дипептидов:
GF: 7
GN: 6
ND: 6
NG: 6
KL: 5
SG: 5
GS: 5
SS: 4
SN: 4
VD: 4

Всего дипептидов: 264
