In [None]:
#Translating RNA into protein
codon_table = {
    'UUU': 'F', 'UUC': 'F', 'UUA': 'L', 'UUG': 'L',
    'UCU': 'S', 'UCC': 'S', 'UCA': 'S', 'UCG': 'S',
    'UAU': 'Y', 'UAC': 'Y', 'UAA': 'Stop', 'UAG': 'Stop',
    'UGU': 'C', 'UGC': 'C', 'UGA': 'Stop', 'UGG': 'W',
    'CUU': 'L', 'CUC': 'L', 'CUA': 'L', 'CUG': 'L',
    'CCU': 'P', 'CCC': 'P', 'CCA': 'P', 'CCG': 'P',
    'CAU': 'H', 'CAC': 'H', 'CAA': 'Q', 'CAG': 'Q',
    'CGU': 'R', 'CGC': 'R', 'CGA': 'R', 'CGG': 'R',
    'AUU': 'I', 'AUC': 'I', 'AUA': 'I', 'AUG': 'M',
    'ACU': 'T', 'ACC': 'T', 'ACA': 'T', 'ACG': 'T',
    'AAU': 'N', 'AAC': 'N', 'AAA': 'K', 'AAG': 'K',
    'AGU': 'S', 'AGC': 'S', 'AGA': 'R', 'AGG': 'R',
    'GUU': 'V', 'GUC': 'V', 'GUA': 'V', 'GUG': 'V',
    'GCU': 'A', 'GCC': 'A', 'GCA': 'A', 'GCG': 'A',
    'GAU': 'D', 'GAC': 'D', 'GAA': 'E', 'GAG': 'E',
    'GGU': 'G', 'GGC': 'G', 'GGA': 'G', 'GGG': 'G'
}

with open(r'C:\Users\Полина\Downloads\rosalind_prot(5).txt', 'r') as file:
    rna_string = file.read().strip()

protein_string = ""

for i in range(0, len(rna_string), 3):  # Обрабатываем РНК по три нуклеотида (по кодонам)
    codon = rna_string[i:i+3]
    if codon_table[codon] == 'Stop':
        break

    protein_string += codon_table[codon]

print(protein_string)

In [None]:
# Finding a motif in DNA / Поиск подстроки в ДНК
with open(r'C:\Users\Полина\Downloads\rosalind_subs.txt', 'r') as file:
    lines = file.readlines()
    s = lines[0].strip()  # Первая строка - основная строка DNA (s)
    t = lines[1].strip()  # Вторая строка - подстрока для поиска (t)

positions = []
t_length = len(t)

for i in range(len(s) - t_length + 1): # Ищем все вхождения подстроки t в строку s
    substring = s[i:i + t_length]  # Берем подстроку из s длиной как t, начиная с позиции i
    if substring == t:
        positions.append(i + 1)

result = ' '.join(str(pos) for pos in positions)

print(result)

In [None]:
# Consensus and profile / Построение консенсусной строки и профильной матрицы
with open(r'C:\Users\Полина\Downloads\rosalind_cons.txt', 'r') as file:
    lines = file.readlines()

dna_strings = []
current_string = ""

for line in lines:
    line = line.strip()
    if line.startswith('>'):  # Это заголовок FASTA
        if current_string:  # Если есть собранная строка, добавляем ее
            dna_strings.append(current_string)
            current_string = ""
    else:  # Это DNA последовательность
        current_string += line

if current_string:   # Добавляем последнюю строку
    dna_strings.append(current_string)

n = len(dna_strings[0])

profile = {             # Инициализируем профильную матрицу и будем использовать словарь для хранения счетчиков
    'A': [0] * n,  # Список из n нулей для A
    'C': [0] * n,  # Список из n нулей для C  
    'G': [0] * n,  # Список из n нулей для G
    'T': [0] * n   # Список из n нулей для T
}

for dna in dna_strings:
    for position in range(n):
        nucleotide = dna[position]
        profile[nucleotide][position] += 1

consensus = ""
for position in range(n): # Находим нуклеотид с максимальным счетчиком в этой позиции
    max_count = 0
    max_nucleotide = 'A'
    
    for nucleotide in ['A', 'C', 'G', 'T']:
        if profile[nucleotide][position] > max_count:
            max_count = profile[nucleotide][position]
            max_nucleotide = nucleotide
    
    consensus += max_nucleotide

print(consensus)
print("A:", " ".join(str(count) for count in profile['A']))
print("C:", " ".join(str(count) for count in profile['C']))
print("G:", " ".join(str(count) for count in profile['G']))
print("T:", " ".join(str(count) for count in profile['T']))

In [None]:
# Connected components /  Связности в графе с помощью поиска в глубину
with open(r'C:\Users\Полина\Downloads\rosalind_cc.txt', 'r') as file:
    lines = file.readlines()

first_line = lines[0].split()  # Читаем первую строку - количество вершин и ребер
n = int(first_line[0])  # количество вершин
m = int(first_line[1])  # количество ребер

graph = [[] for _ in range(n + 1)]  # Создаем список смежности для графа, индексация с 1 до n

for i in range(1, m + 1):           # Читаем ребра и заполняем список смежности
    line = lines[i].split()
    u = int(line[0])
    v = int(line[1])
    graph[u].append(v)              # Добавляем ребра в обе стороны (граф неориентированный)
    graph[v].append(u)

def dfs(start, visited):            # Функция для обхода в глубину (DFS)
    stack = [start]
    visited[start] = True
    
    while stack:
        current = stack.pop()
        for neighbor in graph[current]: # Проходим по всем соседям текущей вершины
            if not visited[neighbor]:
                visited[neighbor] = True
                stack.append(neighbor)

visited = [False] * (n + 1)  # Массив для отметки посещенных вершин
components_count = 0

for vertex in range(1, n + 1):   # Проходим по всем вершинам
    if not visited[vertex]:
        components_count += 1 # Нашли новую компоненту связности
        dfs(vertex, visited)  # Запускаем DFS из этой вершины

print(components_count)