# Python a oggetti
Python è un linguaggio orientato agli oggetti, vale a dire che è possibile costruire strutture particolari che rappresentano astrazioni di oggetti complessi reali. Grazie agli oggetti quindi è possibile rappresentare qualsiasi cosa tramite un "tipo di dato" complesso dedicato. 

## Classi
Le classi sono generalizzazioni degli oggetti, cioè rappresentano un oggetto al livello più astratto possibile, per farlo si serve di due elementi fondamentali: **attributi** e **metodi**

### Attributi
Gli attributi di una classe sono sostanzialmente variabili, queste descrivono idealmente ogni singola caratteristica atomica dell'oggetto di cui stiamo creando la classe. Gli attributi possono essere di qualsiasi tipo, da tipi base ad altre classi di oggetti.

### Metodi
I metodi sono invece assimilabili alle funzioni, e sono di fatto funzioni le quali ricevono l'oggetto stesso come parametro implicito e possono agire su di esso modificandone gli attributi, usando gli attributi per eseguire operazioni o chiamare altri metodi. Ci sono alcuni metodi speciali che definiscono comportamenti di base delle classi che creiamo, ma per ora di questi vedremo solo il metodo `__init__()`

### Esempio: la classe Sequenza
Siccome qui si fa coding per bioscienze, cerchiamo di creare la classe Sequenza. Come buona norma è socialmente accettato definire le classi con la lettera iniziale maiuscola.

Attributi:
+ identificativo
+ sequenza
+ alfabeto (amminoacidi o nucleotidi?)

Metodi:
+ lunghezza
+ reverse complement
+ traduci (se nucleotidica)
+ contenuto in gc (se nucleotidica)
+ punto isoelettrico (se amminoacidica)
+ ...

e così via.

In buona parte dei casi è bene fare in modo di definire solo gli attributi fundamentali, che vengono usati più spesso, in quanto attributi come **reverse complement** in questo esempio possono essere generati tramite un metodo a partire dalla sequenza e finirebbero per occupare memoria in più nel caso dovessimo caricare molte istanze di sequenza. 

In [5]:
class sequenza:
    def __init__(self, identificatore, sequenza, alfabeto="NT"):
        self.identificatore = identificatore
        self.sequenza = sequenza
        self.alfabeto = alfabeto
    
    def lunghezza(self):
        return len(self.sequenza)
    
    def gc_content(self):
        return (self.sequenza.count("C") + self.sequenza.count("G"))/self.lunghezza()

    def reverse_complement(self):
        complement = {"A" : "T", "T" : "A", "G" : "C", "C" : "G"}
        if self.alfabeto != "NT":
            print("warning: cannot perform reverese complement on non-nucleotide sequece!")
            return None # non restituisce nulla se la sequenza ha l'alfabeto sbagliato
        else:
            return "".join([complement[x] for x in self.sequenza[::-1]]) # qui c'è una list comprehension, poi vediamo di che si tratta.
        
    def translate(self):
        return None # esercizio
    
    def isoelectric_point(self):
        return None # esercizio

In [6]:
a = sequenza("seq_1", "CATCAGCATCGACTACGATCAGC")
b = sequenza("seq_2", "GCTGCATCAGCTACGACTAGCATCGAGTCAGCGGCAT")

In [7]:
a.reverse_complement()

'GCTGATCGTAGTCGATGCTGATG'

In [46]:
a.formato

'fasta'

Abbiamo visto una classica costruzione di una classe, che in un certo senso somiglia molto ad una funzione. Ma cosa sono questi termini **self** sparsi in giro? La parola riservata **self** rappresenta l'istanza stessa dell'oggetto, ed è quindi necessaria per riferirsi ad attributi e metodi all'interno della classe stessa (se non la usassimo si andrebbe fuori scope/dominio). Il termine self è il primo parametro **implicito** di tutti i metodi appartenenti ad una classe, costruttore compreso. 
## metodo \_\_init\_\_() e altri metodi magici
questo è un metodo speciale riservato che definisce il comportamento di ciascun oggetto della classe nel momento in cui questo viene creato. In questo caso lo si usa per inizializzare gli attributi di base. È sempre consigliabile usare questo metodo quando si scrive una classe dato che rende chiaro il processo di inizializzazione anche tramite valori di default. I metodi il cui nome è circondato da `__` sono chiamati "magic methods" e nel caso delle classi servono ad aggiungere funzionalità molto utili, `__init__()` infatti definisce quello che in altri linguaggi è il "costruttore". Altri metodi magici permettono di definire il comportamento di operazioni di base qundo eseguite sui nostri oggetti, come comparazioni od uperazioni matematiche. Ad esempio se proviamo a confrontare due oggetti sequenza con identificativo e sequenza uguali

In [8]:
a = sequenza("seq_1", "ATGCATGACTGAC")
b = sequenza("seq_1", "ATGCATGACTGAC")

a == b

False

La comparazione ritorna `False` dato che si confrontano due istanze diverse di oggetti della stessa classe. Eventualmente può esserci utile implementare il magic method `__eq__()` per gestire questa comparazione tra sequenze:

In [14]:
class sequenza:
    def __init__(self, identificatore, sequenza, alfabeto="NT"):
        self.identificatore = identificatore
        self.sequenza = sequenza
        self.alfabeto = alfabeto
    
    def lunghezza(self):
        return len(self.sequenza)
    
    def gc_content(self):
        return (self.sequenza.count("C") + self.sequenza.count("G"))/self.lunghezza()

    def reverse_complement(self):
        complement = {"A" : "T", "T" : "A", "G" : "C", "C" : "G"}
        if self.alfabeto != "NT":
            print("warning: cannot perform reverese complement on non-nucleotide sequece!")
            return None # non restituisce nulla se la sequenza ha l'alfabeto sbagliato
        else:
            return "".join([complement[x] for x in self.sequenza[::-1]]) # qui c'è una list comprehension, poi vediamo di che si tratta.
        
    def translate(self):
        return None # esercizio
    
    def isoelectric_point(self):
        return None # esercizio
    
    def __eq__(self, other):
        if (self.identificatore == other.identificatore and self.sequenza == other.sequenza):
            return True
        else:
            return False

In [15]:
a = sequenza("seq_1", "ATGCATGACTGAC")
b = sequenza("seq_1", "ATGCATGACTGAC")

a == b

True

Ecco che ora il comportamento della comparazione è quello che ci aspettavamo!