# Часть 1: Материалы

In [8]:
from pymatgen.ext.matproj import MPRester
from pymatgen.core.composition import Composition
from pymatgen.analysis.structure_analyzer import SpacegroupAnalyzer

API_KEY = "vnxZTGLIy9DbhmeNLSIJAphlhNNnz04N"
mpr = MPRester(API_KEY)


In [9]:
structures = mpr.get_structures("MnFe2O4")
structure = structures[0]
print(structure)

Full Formula (Mn10 Fe20 O40)
Reduced Formula: Mn(FeO2)2
abc   :   6.150494   6.100717  30.396005
angles:  60.279723  59.998079  59.837294
pbc   :       True       True       True
Sites (70)
  #  SP           a         b         c    magmom
---  ----  --------  --------  --------  --------
  0  Mn    0.125585  0.12847   0.02481      4.639
  1  Mn    0.002381  0.500143  0.099514     3.989
  2  Mn    0.128669  0.127284  0.224312     4.634
  3  Mn    0.128352  0.122436  0.425415     4.631
  4  Mn    0.000682  0.497553  0.50056      4.116
  5  Mn    0.12062   0.124349  0.627158     4.63
  6  Mn    0.002588  0.501439  0.299683     4.492
  7  Mn    0.122237  0.127152  0.825253     4.642
  8  Mn    0.998346  0.502359  0.700177     4.095
  9  Mn    0.878815  0.874438  0.9738       4.649
 10  Fe    0.502299  0.001466  0.099341     4.369
 11  Fe    0.500029  0.503541  0.999434     4.38
 12  Fe    0.500882  0.499626  0.099371     4.367
 13  Fe    0.497122  0.005267  0.299203     4.371
 14  Fe    0

In [7]:
elements = [str(el) for el in composition.elements]
print("🔬 Анализ состава:")
print(f"Полный состав: {composition.formula}")
print(f"Элементы в составе: {elements}")

🔬 Анализ состава:
Полный состав: Mn10 Fe20 O40
Элементы в составе: ['Mn', 'Fe', 'O']


In [13]:
lattice = structure.lattice
density = structure.density

print("Параметры решётки:")
print(f"Константы решётки (a, b, c): {lattice.abc} Å")
print(f"Углы решётки (α, β, γ): {lattice.angles}°")
print("-" * 50)
print(f"Плотность: {density:.4f} г/см³")

Параметры решётки:
Константы решётки (a, b, c): (6.150493600289411, 6.100716953321962, 30.396005395963694) Å
Углы решётки (α, β, γ): (60.279723329094324, 59.99807904718926, 59.83729374457539)°
--------------------------------------------------
Плотность: 4.7446 г/см³


# Часть 2: Последовательности ДНК/РНК

In [15]:
from Bio.Seq import Seq
from Bio.SeqUtils import gc_fraction

hba1_dna = Seq("GGATCTGAGCCAGGCAGAGATCAACCCCACCACCTGACTTCCTGGCAGCGGAGCTGGGGTAC") # Ген HBA1 (Альфа-1 глобин)
ins_dna = Seq("GCCTCCTGGCCCAACCCACGGTGCATGGCTCCCGGGGACTGGCTGTTTCCTGCTGGGCCCCACCTG") # Ген INS (Инсулин)

sequences = [hba1_dna, ins_dna]

for i, seq in enumerate(sequences, start=1):
    print(f"\n=== Последовательность {i} ===")
    print("ДНК:", seq)
    print("Длина:", len(seq))

    # GC-состав
    gc_content = gc_fraction(seq) * 100
    print("GC-состав: %.2f%%" % gc_content)

    # Обратная комплементарная 
    rev_comp = seq.reverse_complement()
    print("Обратная комплементарная:", rev_comp)

    # Транскрипция в РНК 
    rna_seq = seq.transcribe()
    print("РНК:", rna_seq)



=== Последовательность 1 ===
ДНК: GGATCTGAGCCAGGCAGAGATCAACCCCACCACCTGACTTCCTGGCAGCGGAGCTGGGGTAC
Длина: 62
GC-состав: 62.90%
Обратная комплементарная: GTACCCCAGCTCCGCTGCCAGGAAGTCAGGTGGTGGGGTTGATCTCTGCCTGGCTCAGATCC
РНК: GGAUCUGAGCCAGGCAGAGAUCAACCCCACCACCUGACUUCCUGGCAGCGGAGCUGGGGUAC

=== Последовательность 2 ===
ДНК: GCCTCCTGGCCCAACCCACGGTGCATGGCTCCCGGGGACTGGCTGTTTCCTGCTGGGCCCCACCTG
Длина: 66
GC-состав: 71.21%
Обратная комплементарная: CAGGTGGGGCCCAGCAGGAAACAGCCAGTCCCCGGGAGCCATGCACCGTGGGTTGGGCCAGGAGGC
РНК: GCCUCCUGGCCCAACCCACGGUGCAUGGCUCCCGGGGACUGGCUGUUUCCUGCUGGGCCCCACCUG


# Часть 3: Белки

In [34]:
from Bio import SeqIO
from Bio.Seq import Seq
from io import StringIO
import requests
from collections import Counter

# белок по UniProt ID 
uniprot_id = "P69905"  # гемоглобин (HBA)
url = f"https://www.uniprot.org/uniprot/{uniprot_id}.fasta"

response = requests.get(url)

In [35]:
fasta_io = StringIO(response.text)
seq_record = SeqIO.read(fasta_io, "fasta")
protein_seq = seq_record.seq

print("=== Белок ===")
print("Название:", seq_record.description)
print("Длина:", len(protein_seq))
print("Последовательность (первые 50 aa):", protein_seq[:50])

# Состав аминокислот
aa_counts = Counter(protein_seq)
print("\nСостав аминокислот:")
for aa, count in sorted(aa_counts.items()):
    print(f"{aa}: {count}")

# Частоты дипептидов
dipeptides = [protein_seq[i:i+2] for i in range(len(protein_seq)-1)]
dipep_counts = Counter(dipeptides)
print("\n5 самых частых дипептидов:")
for dp, count in dipep_counts.most_common(5):
    print(f"{dp}: {count}")


=== Белок ===
Название: sp|P69905|HBA_HUMAN Hemoglobin subunit alpha OS=Homo sapiens OX=9606 GN=HBA1 PE=1 SV=2
Длина: 142
Последовательность (первые 50 aa): MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLS

Состав аминокислот:
A: 21
C: 1
D: 8
E: 4
F: 7
G: 7
H: 10
K: 11
L: 18
M: 3
N: 4
P: 7
Q: 1
R: 3
S: 11
T: 9
V: 13
W: 1
Y: 3

5 самых частых дипептидов:
LS: 6
AH: 4
AL: 4
PA: 3
HA: 3
