<img src="https://pages.cnpem.br/workshopbioimagens/wp-content/uploads/sites/166/2023/06/logo-ilum-2048x382.png" alt="Descrição da imagem" style="width: 1000px; height: auto; ">

<div style=" padding: 10px; font-size: 15px; text-align: center;">
<strong> 🧌 Monstrinho 3.4 🧌 </strong> 
</div>

<div style=" padding: 10px; font-size: 30px; text-align: center;">
<strong><code><i>__dunder__</i></code> 😑 </strong>
</div>
    
<div class="alert alert-warning">
  <div style="text-align: center; font-size: 15px"><b>Objetivo:</b>  Criar uma classe de <i>Python</i> que utilize métodos <i>__dunder__</i> não abordados em aula.</div>
</div>

<div style=" padding: 10px; font-size: 15px; text-align: center;">
<strong>Yasmin Barbosa Shimizu</strong> </div>
<div style=" padding: 10px; font-size: 15px; text-align: center;">
Prof. Dr. Daniel R. Cassar </div>

## Introdução
 <div style="padding: 10px;text-align: justify"> Quando tratamos de classes em <i>Python</i>, há alguns métodos "mágicos" que geram atalhos para funcionalidades pré-determinadas, como a inicialização da classe, sua representação em <i>string</i>, e operadores matemáticos e comparativos. Tais ferramentas, chamadas coloquialmente de <code>__dunder__</code>, muitas vezes servem como base para determinadas classes, e podem ser definidas de acordo com nosso interesse quando construímos uma classe própria. Nesse contexto, para entender melhor os métodos <code>__dunder__</code>, construímos uma classe simples <code>Sequencia</code>, na qual exploramos métodos comparativos para particionar sequências de acordo com sua posição na lista. Além disso, adicionamos alguns métodos estatísticos tradicionais para lidar com a sequência, e a aplicamos para dois casos: um caso numérico, abordando a clássica sequência de Fibonacci; e um caso literal, abordando superficialmente o estudo de genes em bioinformática.</div>

<div style="text-align: justify; padding: 10px;">

<h3> Criando a classe <code>Sequencia</code></h3>

Para definir a classe sequência, construímos 12 métodos com diferentes funções:

* <code>&#95;&#95;init&#95;&#95;</code>: inicializa a classe para tratamento des sequências, criando atributos <code>.seq</code> e <code>.n</code> para salvar a sequência e seu tamanho;

* <code>&#95;&#95;repr&#95;&#95;</code>: a representação da classe quando printamos uma instância, informando a sequência e seu tamanho a quem manipular o código;

* <code>soma_elementos</code>: somatório de todos os elementos da sequência --- se é uma lista de números, faz a soma matemática; se é uma lista de letras, forma uma "palavra" (posiciona todas as letras lado a lado como um único elemento);

* <code>media</code>, <code>moda</code>, <code>mediana</code>,  <code>var</code>, e <code>desv_pd</code>: calcula os média, moda, mediana, variância, e desvio padrão da sequência --- para isso, importamos a biblioteca <code>statistics</code> para cálculo destes métodos estatísiticos;

* <code>&#95;&#95;lt&#95;&#95;</code>, <code>&#95;&#95;gt&#95;&#95;</code>, <code>&#95;&#95;le&#95;&#95;</code>, <code>&#95;&#95;ge&#95;&#95;</code> : os <i>dunders</i> explorados nesta tarefa --- representam os operadores de comparação <, >, <=, >=, respectivamente ---, que recebem um índice e retornam todos os elementos com posição na sequência seguindo comparativo utilizado.

</div>



In [1]:
import statistics as st

In [2]:
class Sequencia():
    def __init__(self, sequencia):
        self.seq = sequencia
        self.n = len(sequencia)
    
    def __repr__(self):
        return f"A sequência de entrada {self.seq} tem {self.n} elementos."
    
    def soma_elementos(self):
        if isinstance(self.seq[0], str):
            separador = ""
            return separador.join(self.seq)
        elif isinstance(self.seq[0], (int, float)):
            return sum(self.seq)
    
    def media(self):
        return self.soma_elementos()/self.n
    
    def moda(self):
        return st.mode(self.seq)
        
    def mediana(self):
        return st.median(self.seq)
    
    def var(self):
        somatorio = 0
        for e in self.seq:
            somatorio+=(e - self.media())**2
        var = somatorio/self.n
        return var
        
    def desv_pd(self):
        return self.var()**(1/2)
        
    def __lt__(self, i):
        return Sequencia(self.seq[:i-1])
    
    def __gt__(self, i):
        return Sequencia(self.seq[i:])
    
    def __le__(self, i):
        return Sequencia(self.seq[:i])
    
    def __ge__(self, i):
        return Sequencia(self.seq[i-1:])
    
#     def join(self, separador=''):
#         if isinstance(self.seq[0], (int, float)):
#             return separador.join(str(i) for i in self.seq)
#         elif isinstance(self.seq[0], str):
#             return separador.join(self.seq)
#         else:
#             return f"A classe dos elementos da sequência é {type(self.seq[0])}."

#### Testando a classe `Sequencia`

Tendo construído nossa classe, podemos conferir sua funcionalidade com uma instância simples com valores iguais à sua posição.

In [3]:
seq = [1,2,3,4,5]
seq = Sequencia(seq)

print(seq < 3)
print(seq >3)
print(seq <= 3)
print(seq >=3)
print(seq.soma_elementos())

A sequência de entrada [1, 2] tem 2 elementos.
A sequência de entrada [4, 5] tem 2 elementos.
A sequência de entrada [1, 2, 3] tem 3 elementos.
A sequência de entrada [3, 4, 5] tem 3 elementos.
15


Podemos conferir também se a classe funciona para *strings* (alguns dos métodos válidos para esse tipo), como proposto inicialmente.

In [4]:
seq_str = ["a","b","c","d","e"]
seq_str = Sequencia(seq_str)

print(seq_str < 3)
print(seq_str >3)
print(seq_str <= 3)
print(seq_str >=3)
print(seq_str.soma_elementos())

A sequência de entrada ['a', 'b'] tem 2 elementos.
A sequência de entrada ['d', 'e'] tem 2 elementos.
A sequência de entrada ['a', 'b', 'c'] tem 3 elementos.
A sequência de entrada ['c', 'd', 'e'] tem 3 elementos.
abcde


Como em ambos os casos os métodos mais complexos cumpriram a função proposta, podemos aplicar a classe `Sequencia` a outras listas.

### Aplicando a classe à sequência de Fibonacci
Primeiramente, aplicamos todos os métodos construídos a uma sequência numérica. Aqui exploramos os 10 primeiros termos sequência de Fibonacci.

In [5]:
phi = [1,1,2,3,5,8,13,21,34,55]

phi = Sequencia(phi)
print(phi)

A sequência de entrada [1, 1, 2, 3, 5, 8, 13, 21, 34, 55] tem 10 elementos.


In [6]:
phi.soma_elementos()

143

In [7]:
phi.media()

14.3

In [8]:
phi.mediana()

6.5

In [9]:
phi.var()

285.01000000000005

In [10]:
phi.desv_pd()

16.88223918797504

In [11]:
phi < 5

A sequência de entrada [1, 1, 2, 3] tem 4 elementos.

In [12]:
phi > 5

A sequência de entrada [8, 13, 21, 34, 55] tem 5 elementos.

In [13]:
phi5 = phi <= 5
print(phi5)

A sequência de entrada [1, 1, 2, 3, 5] tem 5 elementos.


In [14]:
phi >= 5

A sequência de entrada [5, 8, 13, 21, 34, 55] tem 6 elementos.

In [15]:
phi5.media()

2.4

In [16]:
phi5.moda()

1

### Aplicando a classe a uma sequência de DNA
<div style="padding: 10px;text-align: justify"> 
Também aplicamos a classe <code>Sequencia()</code> a uma <i>string</i>, para os métodos possíveis para tal --- métodos numéricos, como média e desvio padrão, não são aplicados aqui, bem como a soma é feita de maneira diferente, formando um único objeto com todas as letras da <i>string</i> ou lista de <i>strings</i>. Aqui, utilizamos um trecho do gene COI de bacalhau. A classe pode ser interessante ao tratar de problemas de bioinformática para analisar trechos específicos do gene de interesse.
 </div>

In [17]:
coi_str =  "CCTTTATCTCGTATTTGGTGCCTGAGCCGGCATAGTCGGAACAGCCCTAAGCCTGCTCATTCGAGCAGAGCTAAGTCAACCTGGTGCACTTCTTGGTGATGATCAAATTTATAATGTGATCGTTACAGCGCACGCTTTCGTAATAATTTTCTTTATAGTAATACCACTAATAATTGGAGGCTTTGGGAACTGACTCATTCCTCTAATGATCGGTGCACCAGATATAGCTTTCCCTCGAATAAATAACATAAGCTTCTGACTTCTTCCTCCATCTTTCCTGCTCCTTTTAGCATCCTCTGGTGTAGAAGCTGGGGCTGGAACAGGCTGAACTGTCTATCCACCTTTAGCCGGAAACCTCGCTCATGCTGGGGCATCTGTTGATCTCACTATTTTTTCTCTTCATCTAGCAGGGATTTCATCAATTCTTGGGGCAATTAATTTTATTACCACAATTATTAATATGAAACCTCCGGCAATTTCACAGTACCAAACACCCCTATTTGTTTGAGCAGTACTAATTACAGCTGTGCTTCTACTATTATCTCTCCCCGTCTTAGCAGTGGTATCACAATACTTCTAACTGACCGTAATCTTAATACTTCTTTCTTTGACCCTGCTGGAGGAGGTGATCCCATATTATACCAACACTTATTC"


In [18]:
# coi = []
# for n in coi_str:
#     coi.append(n)
    
# print(type(coi))
# print(coi)

In [19]:
coi = Sequencia(coi_str)
print(coi)

A sequência de entrada CCTTTATCTCGTATTTGGTGCCTGAGCCGGCATAGTCGGAACAGCCCTAAGCCTGCTCATTCGAGCAGAGCTAAGTCAACCTGGTGCACTTCTTGGTGATGATCAAATTTATAATGTGATCGTTACAGCGCACGCTTTCGTAATAATTTTCTTTATAGTAATACCACTAATAATTGGAGGCTTTGGGAACTGACTCATTCCTCTAATGATCGGTGCACCAGATATAGCTTTCCCTCGAATAAATAACATAAGCTTCTGACTTCTTCCTCCATCTTTCCTGCTCCTTTTAGCATCCTCTGGTGTAGAAGCTGGGGCTGGAACAGGCTGAACTGTCTATCCACCTTTAGCCGGAAACCTCGCTCATGCTGGGGCATCTGTTGATCTCACTATTTTTTCTCTTCATCTAGCAGGGATTTCATCAATTCTTGGGGCAATTAATTTTATTACCACAATTATTAATATGAAACCTCCGGCAATTTCACAGTACCAAACACCCCTATTTGTTTGAGCAGTACTAATTACAGCTGTGCTTCTACTATTATCTCTCCCCGTCTTAGCAGTGGTATCACAATACTTCTAACTGACCGTAATCTTAATACTTCTTTCTTTGACCCTGCTGGAGGAGGTGATCCCATATTATACCAACACTTATTC tem 654 elementos.


In [20]:
coi.soma_elementos()

'CCTTTATCTCGTATTTGGTGCCTGAGCCGGCATAGTCGGAACAGCCCTAAGCCTGCTCATTCGAGCAGAGCTAAGTCAACCTGGTGCACTTCTTGGTGATGATCAAATTTATAATGTGATCGTTACAGCGCACGCTTTCGTAATAATTTTCTTTATAGTAATACCACTAATAATTGGAGGCTTTGGGAACTGACTCATTCCTCTAATGATCGGTGCACCAGATATAGCTTTCCCTCGAATAAATAACATAAGCTTCTGACTTCTTCCTCCATCTTTCCTGCTCCTTTTAGCATCCTCTGGTGTAGAAGCTGGGGCTGGAACAGGCTGAACTGTCTATCCACCTTTAGCCGGAAACCTCGCTCATGCTGGGGCATCTGTTGATCTCACTATTTTTTCTCTTCATCTAGCAGGGATTTCATCAATTCTTGGGGCAATTAATTTTATTACCACAATTATTAATATGAAACCTCCGGCAATTTCACAGTACCAAACACCCCTATTTGTTTGAGCAGTACTAATTACAGCTGTGCTTCTACTATTATCTCTCCCCGTCTTAGCAGTGGTATCACAATACTTCTAACTGACCGTAATCTTAATACTTCTTTCTTTGACCCTGCTGGAGGAGGTGATCCCATATTATACCAACACTTATTC'

In [21]:
coi.n

654

In [22]:
coi.moda()

'T'

In [23]:
coi_ate_445 = coi < 446
coi_ate_445.seq

'CCTTTATCTCGTATTTGGTGCCTGAGCCGGCATAGTCGGAACAGCCCTAAGCCTGCTCATTCGAGCAGAGCTAAGTCAACCTGGTGCACTTCTTGGTGATGATCAAATTTATAATGTGATCGTTACAGCGCACGCTTTCGTAATAATTTTCTTTATAGTAATACCACTAATAATTGGAGGCTTTGGGAACTGACTCATTCCTCTAATGATCGGTGCACCAGATATAGCTTTCCCTCGAATAAATAACATAAGCTTCTGACTTCTTCCTCCATCTTTCCTGCTCCTTTTAGCATCCTCTGGTGTAGAAGCTGGGGCTGGAACAGGCTGAACTGTCTATCCACCTTTAGCCGGAAACCTCGCTCATGCTGGGGCATCTGTTGATCTCACTATTTTTTCTCTTCATCTAGCAGGGATTTCATCAATTCTTGGGGCAATTAATTTTATT'

In [24]:
print(coi_ate_445.n)
print(coi_ate_445.moda())

445
T


In [25]:
coi_alem_445 = coi >= 446
coi_alem_445.seq

'ACCACAATTATTAATATGAAACCTCCGGCAATTTCACAGTACCAAACACCCCTATTTGTTTGAGCAGTACTAATTACAGCTGTGCTTCTACTATTATCTCTCCCCGTCTTAGCAGTGGTATCACAATACTTCTAACTGACCGTAATCTTAATACTTCTTTCTTTGACCCTGCTGGAGGAGGTGATCCCATATTATACCAACACTTATTC'

In [26]:
print(coi_alem_445.n)
print(coi_alem_445.moda())

209
T


In [27]:
coi_ate_445.soma_elementos()

'CCTTTATCTCGTATTTGGTGCCTGAGCCGGCATAGTCGGAACAGCCCTAAGCCTGCTCATTCGAGCAGAGCTAAGTCAACCTGGTGCACTTCTTGGTGATGATCAAATTTATAATGTGATCGTTACAGCGCACGCTTTCGTAATAATTTTCTTTATAGTAATACCACTAATAATTGGAGGCTTTGGGAACTGACTCATTCCTCTAATGATCGGTGCACCAGATATAGCTTTCCCTCGAATAAATAACATAAGCTTCTGACTTCTTCCTCCATCTTTCCTGCTCCTTTTAGCATCCTCTGGTGTAGAAGCTGGGGCTGGAACAGGCTGAACTGTCTATCCACCTTTAGCCGGAAACCTCGCTCATGCTGGGGCATCTGTTGATCTCACTATTTTTTCTCTTCATCTAGCAGGGATTTCATCAATTCTTGGGGCAATTAATTTTATT'

Para selecionar um trecho no meio da sequência, seria necessário definir tal trecho em duas etapas:

In [28]:
#coi_4_523 = 4 < coi <= 523
coi_ate_523 = coi <= 523
coi_5_523 = coi_ate_523 > 4
coi_5_523

A sequência de entrada TATCTCGTATTTGGTGCCTGAGCCGGCATAGTCGGAACAGCCCTAAGCCTGCTCATTCGAGCAGAGCTAAGTCAACCTGGTGCACTTCTTGGTGATGATCAAATTTATAATGTGATCGTTACAGCGCACGCTTTCGTAATAATTTTCTTTATAGTAATACCACTAATAATTGGAGGCTTTGGGAACTGACTCATTCCTCTAATGATCGGTGCACCAGATATAGCTTTCCCTCGAATAAATAACATAAGCTTCTGACTTCTTCCTCCATCTTTCCTGCTCCTTTTAGCATCCTCTGGTGTAGAAGCTGGGGCTGGAACAGGCTGAACTGTCTATCCACCTTTAGCCGGAAACCTCGCTCATGCTGGGGCATCTGTTGATCTCACTATTTTTTCTCTTCATCTAGCAGGGATTTCATCAATTCTTGGGGCAATTAATTTTATTACCACAATTATTAATATGAAACCTCCGGCAATTTCACAGTACCAAACACCCCTATTTGTTTGAGCAGTACTAATTACA tem 519 elementos.

## Conclusão
<div style="padding: 10px;text-align: justify"> 
Neste trabalho, pudemos explorar alguns métodos <code>&#95;&#95;dunder&#95;&#95;</code>, aplicando-os a uma classe para o tratamento de sequências numéricas e <i>strings</i>. Desse modo, tanto os métodos estatísticos quanto comparativos foram bem definidos, funcionando de acordo com a proposta inicial. Assim, tal classe teria potencial aplicação na análise de dados, como por exemplo, na bioinfomática.
</div>

### Referências

MORSELS, Python. Every dunder method in Python. Python Morsels, 2023. Disponível em: https://www.pythonmorsels.com/every-dunder-method/. Acesso em: 01 abril 2025.

GENBANK. Gadus morhua voucher USNM:FISH:447400 cytochrome oxidase subunit 1 (COI) gene, partial cds; mitochondrial. GenBank, 2023. Disponível em: https://www.ncbi.nlm.nih.gov/nuccore/MT456169.1?report=fasta. Acesso em: 27 março 2025.