In [None]:
import sys
import random

class CompressedDNA:
    def __init__(self, dna_sequence: str):
        self.dna_sequence = dna_sequence
        self.bits = self._compress()

    def _compress(self) -> int:
        # Метод для сжатия последовательности ДНК
        compressed = 0
        for nucleotide in self.dna_sequence:
            if nucleotide == 'A':
                compressed <<= 2
                compressed |= 0b00
            elif nucleotide == 'C':
                compressed <<= 2
                compressed |= 0b01
            elif nucleotide == 'G':
                compressed <<= 2
                compressed |= 0b10
            elif nucleotide == 'T':
                compressed <<= 2
                compressed |= 0b11
            else:
                raise ValueError(f"Неправильный нуклеотид: {nucleotide}")
        return compressed

    def decompress(self) -> str:
        # Метод для распаковки сжатой последовательности ДНК
        decompressed = []
        compressed = self.bits
        
        for _ in range(len(self.dna_sequence)):
            # Получаем последние 2 бита
            nucleotide_bits = compressed & 0b11
            if nucleotide_bits == 0b00:
                decompressed.append('A')
            elif nucleotide_bits == 0b01:
                decompressed.append('C')
            elif nucleotide_bits == 0b10:
                decompressed.append('G')
            elif nucleotide_bits == 0b11:
                decompressed.append('T')
            compressed >>= 2  # Сдвиг вправо на 2 бита для следующего нуклеотида
        
        return ''.join(decompressed[::-1]) 

    def __str__(self):
        return self.decompress()

# Генерация случайной последовательности ДНК
def generate_random_dna(length: int) -> str:
    return ''.join(random.choice('ACGT') for _ in range(length))

# Тестирование программы на последовательностях разных длин
for length in [1000, 10000, 100000, 1000000]:
    original_dna_str = generate_random_dna(length)
    compressed_dna_str = CompressedDNA(original_dna_str)

    print(f'Исходная строка: {sys.getsizeof(original_dna_str)} байтов')
    print(f'Сжатая строка: {sys.getsizeof(compressed_dna_str.bits)} байтов')
    print(f'Декомпрессированная строка: {compressed_dna_str.decompress() == original_dna_str}')  # Проверка на корректность
    print('-' * 50)


Исходная строка: 1041 байтов
Сжатая строка: 292 байтов
Декомпрессированная строка: True
--------------------------------------------------
Исходная строка: 10041 байтов
Сжатая строка: 2692 байтов
Декомпрессированная строка: True
--------------------------------------------------
Исходная строка: 100041 байтов
Сжатая строка: 26692 байтов
Декомпрессированная строка: True
--------------------------------------------------
Исходная строка: 1000041 байтов
Сжатая строка: 266692 байтов
Декомпрессированная строка: True
--------------------------------------------------
