### Задача 1 («ДНК»)

Реализуйте классы для ДНК (двойная цепочка) и РНК (одинарная цепочка).

In [231]:
import random


class RNA:
    def __init__(self, chain: str):
        self.__CORRECT_BASES = {'A', 'C', 'G', 'U'}
        self.__chain = chain
        self.__is_correct()

    def compute_complement_dna(self):
        return DNA(self.__chain)

    def __getitem__(self, index):
        return self.__chain[index]

    def __eq__(self, other):
        return self.__chain == other.__chain

    def __add__(self, other):
        return RNA(self.__chain + other.__chain)

    def __str__(self):
        return self.__chain

    def __repr__(self):
        return self.__chain

    def __len__(self):
        return len(self.__chain)

    def __is_correct(self):
        assert set(self.__chain).issubset(self.__CORRECT_BASES), Exception('Incorrect RNA chain!')

    def __mul__(self, other):
        if len(self) < len(other):
            return RNA(''.join([self[i] if random.randint(0, 1) else other[i]
                                for i in range(len(self))]) + other[-(len(other) - len(self)):])
        if len(self) > len(other):
            return RNA(''.join([other[i] if random.randint(0, 1) else self[i]
                                for i in range(len(other))]) + self[-(len(self) - len(other)):])
        return RNA(''.join([other[i] if random.randint(0, 1) else self[i]
                            for i in range(len(other))]))


class DNA:
    def __init__(self, arg):
        self.__COMPL_DNA_1_DICT = {'A': 'T',
                                   'U': 'A',
                                   'G': 'C',
                                   'C': 'G'}
        self.__COMPL_DNA_2_DICT = {'A': 'T',
                                   'T': 'A',
                                   'G': 'C',
                                   'C': 'G'}
        self.__CORRECT_BASES = {'A', 'C', 'G', 'T'}

        # From list of main and [complement] base[s]
        if type(arg) == list:
            self.__main_chain = arg[0]
            try:
                self.__comp_chain = arg[1]
            except IndexError:
                self.__compute_complement_base()

        # From RNA instance
        if type(arg) == str:
            self.__main_chain = []
            for base in arg:
                self.__main_chain.append(self.__COMPL_DNA_1_DICT[base])
            self.__main_chain = ''.join(self.__main_chain)
            self.__compute_complement_base()

        self.__is_correct()

    def __compute_complement_base(self):
        self.__comp_chain = []
        for base in self.__main_chain:
            self.__comp_chain.append(self.__COMPL_DNA_2_DICT[base])
        self.__comp_chain = ''.join(self.__comp_chain)

    def __getitem__(self, index):
        return self.__main_chain[index], self.__comp_chain[index]

    def __eq__(self, other):
        return self.__main_chain == other.__main_chain and \
               self.__comp_chain == other.__comp_chain

    def __add__(self, other):
        return DNA([self.__main_chain + other.__main_chain,
                    self.__comp_chain + other.__comp_chain])

    def __str__(self):
        return str(self.__main_chain + ' ' + self.__comp_chain)

    def __repr__(self):
        return self.__str__()

    def __len__(self):
        return len(self.__main_chain)

    def __is_correct(self):
        if set(self.__main_chain).issubset(self.__CORRECT_BASES) and \
                set(self.__comp_chain).issubset(self.__CORRECT_BASES):
            return True
        else:
            raise Exception('Incorrect DNA chain!')

    def __mul__(self, other):
        new_main_chain = None
        if len(self.__main_chain) < len(other.__main_chain):
            new_main_chain = ''.join([self.__main_chain[i] if random.randint(0, 1) else other.__main_chain[i]
                                      for i in range(len(self))]) + other[-(len(other) - len(self)):][0]
        if len(self.__main_chain) > len(other.__main_chain):
            new_main_chain = ''.join([other.__main_chain[i] if random.randint(0, 1) else self.__main_chain[i]
                                      for i in range(len(other))]) + self[-(len(self) - len(other)):][0]
        if len(self.__main_chain) == len(other.__main_chain):
            new_main_chain = ''.join([other.__main_chain[i] if random.randint(0, 1) else self.__main_chain[i]
                                      for i in range(len(other))])
        mul = DNA([new_main_chain])
        return mul

Создание структуры из строк. Обратите внимание, что в ДНК встречаются только азотистые основания ATGC, а в РНК — AUGC, поэтому, если во входной строке содержатся другие символы, необходимо поднимать ошибку (Exception).

In [237]:
rna = RNA("AUUGAACUA")
dna = DNA(["ACG", "TGC"])
print('Objects created')

Objects created


In [238]:
incorrect_dna = DNA(["A", "U"])

Exception: Incorrect DNA chain!

In [239]:
incorrect_rna = RNA("AUUGAACUAT")

AssertionError: Incorrect RNA chain!

Поддержка индексации: РНК по индексу возвращает i-ое азотистое основание, ДНК — пару азотистых оснований (соответствующие первой и второй цепочке).

In [240]:
assert rna[1] == 'U' and rna[4] == 'A'
assert dna[1] == ('C', 'G') and dna[-1] == ('G', 'C')
print('Indexation works')

Indexation works


РНК может возвращать комплементарную ДНК (каждому азотистому основанию из РНК соответсвует основание для первой цепочки ДНК: A → T, U → A, G → C, C → G; вторая цепочка ДНК строится комплементарной первой строчке ДНК: A → T, T → A, G → C, C → G).

In [242]:
print(rna)
rna.compute_complement_dna()

AUUGAACUA


TAACTTGAT ATTGAACTA

РНК, как и ДНК, могут складываться путем склеивания

In [243]:
rna2 = RNA('AACUA')
rna + rna2

AUUGAACUAAACUA

In [244]:
dna2 = DNA(["TTTAAT", "AAATTA"])
assert dna + dna2 == DNA(["ACGTTTAAT", "TGCAAATTA"]), print(dna + dna2)
print('Addition works')

Addition works


Цепочки РНК и первую и вторую цепочки у ДНК можно проверять на равенство.

In [245]:
rna == rna2

False

In [246]:
rna == RNA(str(rna))

True

In [247]:
dna == dna2

False

In [248]:
dna == DNA(["ACG", "TGC"])

True

Оба класса должны давать осмысленный вывод как при print, так и просто при вызове в ячейке.

In [249]:
print(rna)

AUUGAACUA


In [250]:
print(dna)

ACG TGC


РНК могут перемножаться друг с другом: каждое азотистое основание результирующей РНК получается случайным выбором одного из двух соответсвующих родительских азотистых оснований. Если одна из цепочек длиннее другой, то перемножение происходит с начала, а когда одна из цепочек закончится, оставшийся хвост другой переносится без изменений.

In [251]:
rna = RNA("AUUGAACUA")
rna2 = RNA("AACG")
print(rna*rna2)

AUCGAACUA


In [252]:
rna = RNA("AUUG")
rna2 = RNA("AACG")
print(rna*rna2)

AUCG


ДНК могут перемножаться друг с другом: первые цепочки каждой из ДНК перемножаются по такому же приницпу, как перемножаются РНК выше. Вторая цепочка результирующей ДНК строится как комплементарная первой.

In [254]:
dna = DNA(["CCG", "GGC"])
dna2 = DNA(["AAGAAG", "TTCTTC"])
dna*dna2

CAGAAG GTCTTC