# Import

In [8]:
import matplotlib.pyplot as plt
import numpy as np
import subprocess
import RNA
from Bio import Entrez, SeqIO
import pandas as pd

%matplotlib inline

# Body

In [1]:
# ---------- Настройки Entrez ----------
Entrez.email = 'your_email@example.com'

# ---------- Шаг 0: Загрузка последовательности из NCBI ----------
def fetch_gene_sequence(gene_name, database='nucleotide'):
    try:
        handle = Entrez.esearch(db=database, term=gene_name, retmax=1)
        record = Entrez.read(handle)
        handle.close()

        if not record['IdList']:
            raise ValueError(f"Ген '{gene_name}' не найден в базе данных {database}.")

        gene_id = record['IdList'][0]

        handle = Entrez.efetch(db=database, id=gene_id, rettype='fasta', retmode='text')
        record = SeqIO.read(handle, 'fasta')
        handle.close()

        print(f"Последовательность гена '{gene_name}' успешно загружена.")
        return str(record.seq)
    except Exception as e:
        raise RuntimeError(f'Ошибка при загрузке последовательности: {e}')

# ---------- Шаг 1: Генерация праймеров с помощью Primer3 ----------
def run_primer3(sequence):
    if len(sequence) < 50:
        raise ValueError('Длина последовательности слишком мала для генерации праймеров!')
    input_data = f"""
SEQUENCE_ID=example
SEQUENCE_TEMPLATE={sequence}
PRIMER_OPT_SIZE=20
PRIMER_MIN_SIZE=18
PRIMER_MAX_SIZE=25
PRIMER_PRODUCT_SIZE_RANGE=100-250
PRIMER_MIN_TM=55.0
PRIMER_OPT_TM=65.0
PRIMER_MAX_TM=70.0
PRIMER_MIN_GC=40
PRIMER_MAX_GC=60
PRIMER_NUM_RETURN=5
PRIMER_MAX_HAIRPIN_TH=20.0
PRIMER_MAX_SELF_ANY_TH=20.0
PRIMER_MAX_SELF_END_TH=20.0
SEQUENCE_INCLUDED_REGION=100,500
=
"""
    with open('primer3_input.txt', 'w') as f:
        f.write(input_data.strip())
    
    subprocess.run(['primer3_core', 'primer3_input.txt', '-output', 'primer3_output.txt'])
    with open('primer3_output.txt', 'r') as f:
        return f.read()

def extract_primer(primer_output, pair_index, side):
    key = f'PRIMER_{side}_{pair_index}_SEQUENCE='
    for line in primer_output.split('\n'):
        if line.startswith(key):
            return line.split('=')[-1]
    return None

def extract_primer_tm(primer_output, pair_index, side):
    key = f'PRIMER_{side}_{pair_index}_TM='
    for line in primer_output.split('\n'):
        if line.startswith(key):
            return float(line.split('=')[-1])
    return None

def extract_product_size(primer_output, pair_index):
    key = f'PRIMER_PAIR_{pair_index}_PRODUCT_SIZE='
    for line in primer_output.split('\n'):
        if line.startswith(key):
            return int(line.split('=')[-1])
    return None

# ---------- Шаг 2: Проверка вторичных структур с помощью ViennaRNA ----------
def analyze_with_vienna(sequence):
    structure, mfe = RNA.fold(sequence)
    has_hairpin = '(' in structure and ')' in structure
    return {
        'structure': structure,
        'mfe': mfe,
        'has_hairpin': has_hairpin
    }

# ---------- Полный анализ ----------
def analyze_primer_for_gene(gene_name):
    print(f"Шаг 0: Загрузка последовательности для гена '{gene_name}'...")
    sequence = fetch_gene_sequence(gene_name)

    print('\nШаг 1: Генерация праймеров с помощью Primer3...')
    primers = run_primer3(sequence)

    print('\nШаг 2: Проверка праймеров с помощью ViennaRNA...')
    primer_issues = analyze_primers_with_criteria(primers)

    results = {
        'GeneSequence': sequence,
        'Primer3': primers,
        'PrimerIssues': primer_issues,
    }

    display_results(results)
    return results

# ---------- Переработанный вывод ----------
def format_primer_issues(primer_issues):
    formatted_issues = []
    for issue in primer_issues:
        pair = issue['Pair']
        problems = issue['Issues']
        if problems:
            formatted_issues.append(f"Пара {pair + 1}:\n  - " + '\n  - '.join(problems))
    return '\n\n'.join(formatted_issues)

def display_results(results):
    print('=== Итоговый анализ праймеров ===\n')
    print(f"Длина последовательности гена: {len(results['GeneSequence'])} bp\n")

    primer_issues = results['PrimerIssues']
    if primer_issues:
        print('Проблемы, найденные при анализе праймеров:\n')
        print(format_primer_issues(primer_issues))
    else:
        print('Все праймеры соответствуют критериям.')

In [22]:
gene_name = "MT-ND1"
results = analyze_primer_for_gene(gene_name)

Шаг 0: Загрузка последовательности для гена 'MT-ND1'...
Последовательность гена 'MT-ND1' успешно загружена.

Шаг 1: Генерация праймеров с помощью Primer3...

Шаг 2: Проверка праймеров с помощью ViennaRNA...
=== Итоговый анализ праймеров ===

Длина последовательности гена: 357798456 bp

Проблемы, найденные при анализе праймеров:

Пара 1:
  - Шпилька в левом праймере с ΔG = -2.0 ккал/моль
  - Шпилька в правом праймере с ΔG = -1.899999976158142 ккал/моль

Пара 2:
  - Шпилька в левом праймере с ΔG = -2.0 ккал/моль
  - Шпилька в правом праймере с ΔG = -1.899999976158142 ккал/моль

Пара 3:
  - Температура отжига левого праймера (62.625°C) вне допустимого диапазона
  - Шпилька в левом праймере с ΔG = -2.0 ккал/моль
  - Шпилька в правом праймере с ΔG = -1.899999976158142 ккал/моль

Пара 4:
  - Температура отжига правого праймера (62.016°C) вне допустимого диапазона
  - Шпилька в левом праймере с ΔG = -2.0 ккал/моль
  - Шпилька в правом праймере с ΔG = -1.899999976158142 ккал/моль

Пара 5:
  - 

In [6]:
from base64 import b64encode
import json
from urllib import request, parse
import requests

# ---------- Функция для получения токена ----------
def get_access_token(client_id, client_secret, idt_username, idt_password):
    """
    Получает токен доступа для API OligoAnalyzer.
    """
    try:
        # Формирование HTTP-запроса
        authorization_string = b64encode(bytes(client_id + ":" + client_secret, "utf-8")).decode()
        request_headers = {
            "Content-Type": "application/x-www-form-urlencoded",
            "Authorization": "Basic " + authorization_string
        }
                    
        data_dict = {
            "grant_type": "password",
            "scope": "test",
            "username": idt_username,
            "password": idt_password
        }
        request_data = parse.urlencode(data_dict).encode()

        post_request = request.Request(
            "https://eu.idtdna.com/Identityserver/connect/token",
            data=request_data,
            headers=request_headers,
            method="POST"
        )

        # Отправка запроса и получение ответа
        response = request.urlopen(post_request)
        body = response.read().decode()

        if response.status != 200:
            raise RuntimeError("Ошибка получения токена: " + response.status + "\n" + body)

        body_dict = json.loads(body)
        return body_dict["access_token"]
    except Exception as e:
        print(f"Ошибка при получении токена: {e}")
        return None


# ---------- Функция для анализа Self-Dimer ----------
def analyze_self_dimer(primer, api_token):
    """
    Анализ гомодимеров (Self-Dimer) для праймера с помощью OligoAnalyzer API.
    """
    url = f'https://eu.idtdna.com/restapi/v1/OligoAnalyzer/SelfDimer'
    headers = {
        'Authorization': f'Bearer {api_token}'
    }
    params = {
        'primary': primer
    }

    try:
        print(f"Проверка Self-dimer для праймера: {primer}")
        response = requests.post(url, headers=headers, params=params)
        response.raise_for_status()  # Проверяет наличие HTTP ошибок
        return response.json()
    except requests.exceptions.RequestException as e:
        print(f"Ошибка при анализе Self-Dimer: {e}")
        return None

def analyze_hetero_dimer(forward_primer, reverse_primer, api_token):
    """
    Анализ гетеродимеров (Hetero-Dimer) для двух праймеров с помощью OligoAnalyzer API.
    """
    url = f'https://eu.idtdna.com/restapi/v1/OligoAnalyzer/HeteroDimer'
    headers = {
        'Authorization': f'Bearer {api_token}'
    }
    params = {
        'primary': forward_primer,
        'secondary': reverse_primer
    }

    try:
        print(f"Проверка Hetero-dimer для праймеров: {forward_primer} и {reverse_primer}")
        response = requests.post(url, headers=headers, params=params)
        response.raise_for_status()  # Проверяет наличие HTTP ошибок
        return response.json()
    except requests.exceptions.RequestException as e:
        print(f"Ошибка при анализе Hetero-Dimer: {e}")
        return None

def analyze_hairpin(primer, api_token):
    """
    Анализ шпилек (Hairpin) для праймера с помощью OligoAnalyzer API.
    """
    url = 'https://eu.idtdna.com/restapi/v1/OligoAnalyzer/Hairpin'
    headers = {
        'Content-Type': 'application/json',
        'Authorization': f'Bearer {api_token}'
    }
    payload = {
        "Sequence": primer,
        "NaConc": 50,  # Концентрация Na+ (мМ)
        "MgConc": 1.5,  # Концентрация Mg2+ (мМ)
        "FoldingTemp": 37,  # Температура фолдинга (°C)
        "NucleotideType": "DNA"  # Тип нуклеотидов
    }

    try:
        print(f"Проверка шпилек для праймера: {primer}")
        response = requests.post(url, json=payload, headers=headers)
        response.raise_for_status()  # Проверяет наличие HTTP ошибок
        return response.json()
    except requests.exceptions.RequestException as e:
        print(f"Ошибка при анализе Hairpin: {e}")
        return None

# ---------- Функция для анализа шпилек и гетеродимеров ----------
def analyze_dimers_and_hairpins(forward_primer, reverse_primer, api_token):
    """
    Проверяет гомодимеры, гетеродимеры и шпильки для праймеров с помощью OligoAnalyzer API.
    """
    results = {}

    try:
        # Self-dimer для forward
        results['Forward_SelfDimer'] = analyze_self_dimer(forward_primer, api_token)

        # Self-dimer для reverse
        results['Reverse_SelfDimer'] = analyze_self_dimer(reverse_primer, api_token)

        # Hetero-dimer
        results['HeteroDimer'] = analyze_hetero_dimer(forward_primer, reverse_primer, api_token)

        # Hairpin для forward
        results['Forward_Hairpin'] = analyze_hairpin(forward_primer, api_token)

        # Hairpin для reverse
        results['Reverse_Hairpin'] = analyze_hairpin(reverse_primer, api_token)

        return results
    except Exception as e:
        print(f"Ошибка при анализе: {e}")
        return None

# ---------- Функция для визуализации димеров ----------
def visualize_dimer(sequence1, sequence2, bonds, delta_g, base_pairs, title):
    """
    Визуализация структуры димера с учетом связей.
    """
    seq_len = max(len(sequence1), len(sequence2))
    seq1 = sequence1.ljust(seq_len, '-')
    seq2 = sequence2.ljust(seq_len, '-')
    fig, ax = plt.subplots(figsize=(12, 3))
    for i, (base1, base2, bond) in enumerate(zip(seq1, seq2, bonds)):
        ax.text(i, 1, base1, fontsize=12, ha='center', va='center', color='black')
        ax.text(i, -1, base2, fontsize=12, ha='center', va='center', color='black')
        if bond == 2:
            ax.plot([i, i], [0.3, -0.3], color='black', linewidth=2)
        elif bond == 1:
            ax.plot([i, i], [0.3, -0.3], color='black', linestyle=':', linewidth=1)
    ax.set_xlim(-1, seq_len)
    ax.set_ylim(-1.5, 1.5)
    ax.set_axis_off()
    ax.set_title(f"{title}\nΔG: {delta_g} ккал/моль | Base Pairs: {base_pairs}", fontsize=14)
    plt.show()

In [None]:
# Пример работы с токеном
client_id = "21"          # Укажите ваш client ID
client_secret = "6d31fff8-d7cf-4ee4-98d8-d1ba69940f65" # Укажите ваш client secret
idt_username = "takul"   # Укажите ваш логин
idt_password = "ULAsFp5J6zjS24E"   # Укажите ваш пароль

api_token = get_access_token(client_id, client_secret, idt_username, idt_password)
if api_token:
    print(f"Токен успешно получен: {api_token}")
    
    forward_primer = "ACCTCCTCCTCTTCTGGTTGGT"
    reverse_primer = "TTCCGCTCCTGGATGTCCCTTG"
    
    results = analyze_dimers_and_hairpins(forward_primer, reverse_primer, api_token)
    
    # Визуализация димеров
    if results:
        print("\n=== Результаты анализа ===")
        for key, value in results.items():
            if "SelfDimer" in key or "HeteroDimer" in key:
                print(f"\n{key}:")
                for dimer in value:
                    visualize_dimer(forward_primer, reverse_primer, dimer["Bonds"], dimer["DeltaG"], dimer["BasePairs"], key)
else:
    print("Анализ не выполнен.")

In [9]:
results

{'Forward_SelfDimer': [{'StartPosition': 0,
   'TopLinePadding': 4,
   'BondLinePadding': 4,
   'BottomLinePadding': 0,
   'Bonds': [2, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0],
   'DeltaG': -4.41,
   'BasePairs': 3,
   'Dimer': None},
  {'StartPosition': 0,
   'TopLinePadding': 0,
   'BondLinePadding': 0,
   'BottomLinePadding': 0,
   'Bonds': [2, 2, 2, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 1, 1],
   'DeltaG': -4.41,
   'BasePairs': 3,
   'Dimer': None},
  {'StartPosition': 0,
   'TopLinePadding': 1,
   'BondLinePadding': 1,
   'BottomLinePadding': 0,
   'Bonds': [0, 1, 0, 0, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0],
   'DeltaG': -3.07,
   'BasePairs': 2,
   'Dimer': None},
  {'StartPosition': 0,
   'TopLinePadding': 0,
   'BondLinePadding': 2,
   'BottomLinePadding': 2,
   'Bonds': [0, 0, 1, 0, 0, 2, 2, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 0],
   'DeltaG': -3.07,
   'BasePairs': 2,
   'Dimer': None},
  {'StartPosition': 0,
   'TopL

In [12]:
def visualize_text_dimer(forward_sequence, bonds, delta_g, base_pairs, start_position=0, title="Self-Dimer"):
    """
    Текстовая визуализация димера на основе последовательности, связей и сдвига.
    
    forward_sequence: str - исходная последовательность.
    bonds: list[int] - массив связей.
    delta_g: float - свободная энергия ΔG.
    base_pairs: int - количество пар оснований.
    start_position: int - начальная позиция совпадений.
    title: str - заголовок визуализации.
    """
    reverse_sequence = forward_sequence[::-1]  # Простая обратная последовательность

    # Формируем верхнюю строку
    top_line = f"5'  {forward_sequence}  3'"

    # Формируем строку связей с учетом сдвига
    connection_line = " " * 4 + " " * start_position
    for bond in bonds:
        if bond == 2:  # Полная комплементарность
            connection_line += "|"
        elif bond == 1:  # Дополнительная комплементарность
            connection_line += "."
        else:
            connection_line += " "

    # Формируем нижнюю строку с учетом сдвига
    bottom_line =  " " * start_position + f"3'  {reverse_sequence}  5'"

    # Вывод визуализации
    print(f"{title}\nDelta G: {delta_g} ккал/моль | Base Pairs: {base_pairs}")
    print(top_line)
    print(connection_line)
    print(bottom_line)
    print("-" * len(top_line))


# Пример использования
forward_sequence = "ACCTCCTCCTCTTCTGGTTGGT"
bonds = [2, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0]
delta_g = -4.41
base_pairs = 3
start_position = 4  # Пример сдвига

visualize_text_dimer(forward_sequence, bonds, delta_g, base_pairs, start_position, title="Forward Self-Dimer")

Forward Self-Dimer
Delta G: -4.41 ккал/моль | Base Pairs: 3
5'  ACCTCCTCCTCTTCTGGTTGGT  3'
        |||            ...    
    3'  TGGTTGGTCTTCTCCTCCTCCA  5'
------------------------------
