# Домашка "ДНК/РНК классы"

Создать классы Dna и Rna, объекты которых обладают следующими свойствами:

* Могут быть инициализированы строкой, соответствующей последовательности ДНК/РНК
* Позволяют определить долю GC нуклеотдиов в последовательности с помощью метода gc_content
* Позволяют создать комплементарную последовательность с помощью метода reverse_complement
* Позволяют итерироваться по последовательности
* Объекты с одинаковыми последовательностями должны быть равны (так как про __eq__ мы поговорить не успели еще, по собственному желанию)
* Их можно добавлять в множества (так как про __hash__ мы поговорить не успели еще, по собственному желанию)


Объекты класса Dna дополнительно имеют метод transcribe позволяющий создавать объект класса Rna, соответствующий результату транскрипции последовательности.

In [None]:
import re

In [138]:
class Rna:
    def __init__(self, sequence: str):
        self.sequence = sequence.upper()
        self.is_rna()
    
    # check if is rna
    def is_rna(self):
        non_rna_bases = r'[^AUGC]'
        if re.search(non_rna_bases, self.sequence):
            print("Non RNA bases present. Only RNA bases AUGC (case-insensitive) are allowed.")
    
    # gc-content
    def gc_content(self):
        counter = 0
        for base in self.sequence:
            if base in "GgCc":
                counter += 1
        gc_percent = counter / len(self.sequence) * 100
        return gc_percent

    # create reverse
    def reverse_complement(self):
        rna_dict = {'A': 'U',
                    'U': 'A',
                    'G': 'C',
                    'C': 'G'}
        reverse_complement_seq = ''
        reverse_seq = reversed(self.sequence)
        for base in reverse_seq:
            reverse_complement_seq += rna_dict[base]
        return reverse_complement_seq

    # iterable
    def __iter__(self):
        return iter(self.sequence)

In [139]:
rna_test = Rna("augCCCUUccc")

In [55]:
print(rna_test.gc_content())

63.63636363636363


In [140]:
print(rna_test.reverse_complement())

GGGAAGGGCAU


In [146]:
class Dna:
    # initialise class
    def __init__(self, sequence: str):
        self.sequence = sequence.upper()
        self.is_dna()
        
    # check if correct bases are used for DNA
    def is_dna(self):
        non_dna_bases = r'[^ATGC]'
        if re.search(non_dna_bases, self.sequence.upper()):
            print("Non DNA bases present. Only DNA bases ATGC (case-insensitive) are allowed")
    
    # check GC-content
    def gc_content(self):
        counter = 0
        for base in self.sequence:
            if base in "GgCc":
                counter += 1
        gc_percent = counter / len(self.sequence) * 100
        return gc_percent
    
    # create reverse complement sequence
    def reverse_complement(self):
        dna_dict = {'A': 'T',
                    'T': 'A',
                    'G': 'C',
                    'C': 'G'}
        reverse_complement_seq = ''
        reverse_seq = reversed(self.sequence)
        for base in reverse_seq:
            reverse_complement_seq += dna_dict[base]
        return reverse_complement_seq
    
    # transcribe method
    def transcribe(self):
        rna_reversed = Rna.reverse_complement(self)
        return rna_reversed.replace('T','U')
     
                
    # iterable
    def __iter__(self):
        return iter(self.sequence)

In [147]:
dna_test = Dna("atgCCCttccc")

In [148]:
print(dna_test.gc_content())

63.63636363636363


In [149]:
print(dna_test.reverse_complement())

GGGAAGGGCAT


In [150]:
print(dna_test.transcribe())

KeyError: 'T'