# Capitulo 1

Otimização do algoritmo que cria a sequência de Fibonacci

In [6]:
# Permite definir o tipo gerador a um objeto
from typing import Generator
# Permite definir o tipo dos valores e chaves do dicionário
from typing import Dict
# Permite gravar dados em cache
from functools import lru_cache


# Fibonnaci sem memoization
def fib2(n: int) -> int:
    if n < 2:
        return n
    return fib2(n - 1) + fib2(n - 2)

# Fibonacci com memoization
memo: Dict[int, int] = {0: 0, 1: 1}
def  fib3(n: int) -> int:
    if n not in memo:
        memo[n] = fib3(n - 1) + fib3(n - 2)
    return memo[n]

# Fibonacci com memoization automática
@lru_cache(maxsize=None)
def fib4(n: int) -> int:
    if n < 2:
        return n
    return fib4(n - 1) + fib4(n - 2)

# Fibonacci com iteração
def fib5(n: int) -> int:
    if n == 0: 
        return n
    anterior: int = 0
    posterior: int = 1
    for _ in range(1, n):
        anterior, posterior = (posterior, anterior + posterior)
    return posterior

# Fibonacci com gerador
def fib6(n: int) -> Generator[int, None, None]:
    if n == 0:
        yield 0
    anterior: int = 0
    posterior: int = 1
    for _ in range(1, n):
        anterior, posterior = posterior, anterior + posterior
    yield posterior


Trabalha a compressão de dados com operações bit a bit. Os nucleotideos inseridos são transformados em uma dupla de bits e são acrescentados em uma cadeia de bits. 

In [39]:
class CompressedGene:
    def __init__(self, gene: str) -> None:
        self._compress(gene)


    def __str__(self) -> str:
        '''Faz a representação em string do objeto'''
        return (self.decompress()) 


    def _compress(self, gene: str):
        '''Recebe uma str de nucleotídeos e os armazena como uma cadeia de bits'''

        # Começa com uma sentila
        self.bit_string: int = 1

        for nucleotide in gene.upper():
            # Desloca dois bits à esquerda
            self.bit_string <<= 2

            # Muda os dois últimos bits para 00
            if nucleotide == 'A':
                self.bit_string |= 0b00
            # Muda os dois últimos bits para 01
            elif nucleotide == 'C':
                self.bit_string |= 0b01
            # Muda os dois últimos bits para 10
            elif nucleotide == 'G':
                self.bit_string |= 0b10
            # Muda os dois últimos bits para 11
            elif nucleotide == 'T':
                self.bit_string|= 0b11
            else:
                raise ValueError(f'Invalid Nucleotide: {nucleotide}')
    

    def decompress(self) -> str:
        '''Descompacta o nucleotídeo já compressado'''

        gene: str = ''
        
        # -1 para excluir a sentinela
        for i in range(0, self.bit_string.bit_length() - 1, 2):

            # Obtém apenas os dois bits mais relevantes
            bits: int = self.bit_string >> i & 0b11
            
            # A
            if bits == 0b00:
                gene += 'A'
            # C
            elif bits == 0b01:
                gene += 'C'
            # G
            elif bits == 0b10:
                gene += 'G'
            # T
            elif bits == 0b11:
                gene += 'T'
            else:
                raise ValueError(f'Invalid bits: {bits}')
        
        # Retorna a string invertida usando fatiamento 
        return gene[::-1]


if __name__ == '__main__':
    # Permite saber quantos bits uma variavel ou objeto ocupa
    from sys import getsizeof

    original: str = 'ACGTAGTCCGTACGTAGTCCGTACGTACGTAGTCCACGTT' * 100000
    compressed: CompressedGene = CompressedGene(original)

    print(f'original: {getsizeof(original)} bytes')
    print(f'compressed: {getsizeof(compressed.bit_string)} bytes')





original: 4000049 bytes
compressed: 1066692 bytes
