# Python a oggetti
Python è un linguaggio orientato agli oggetti, vale a dire che è possibile costruire strutture particolari che rappresentano astrazioni di oggetti complessi reali. Grazie agli oggetti quindi è possibile rappresentare qualsiasi cosa tramite un "tipo di dato" complesso dedicato. 

## Classi
Le classi sono generalizzazioni degli oggetti, cioè rappresentano un oggetto al livello più astratto possibile, per farlo si serve di due elementi fondamentali: **attributi** e **metodi**

### Attributi
Gli attributi di una classe sono sostanzialmente variabili, queste descrivono idealmente ogni singola caratteristica atomica dell'oggetto di cui stiamo creando la classe. Gli attributi possono essere di qualsiasi tipo, da tipi base ad altre classi di oggetti.

### Metodi
I metodi sono invece assimilabili alle funzioni, e sono di fatto funzioni le quali ricevono l'oggetto stesso come parametro implicito e possono agire su di esso modificandone gli attributi, usando gli attributi per eseguire operazioni o chiamare altri metodi. Ci sono alcuni metodi speciali che definiscono comportamenti di base delle classi che creiamo, ma per ora di questi vedremo solo il metodo `__init__()`

### Esempio: la classe Sequenza
Siccome qui si fa coding per bioscienze, cerchiamo di creare la classe Sequenza. Come buona norma è socialmente accettato definire le classi con la lettera iniziale maiuscola.

Attributi:
+ identificativo
+ sequenza
+ alfabeto (amminoacidi o nucleotidi?)

Metodi:
+ lunghezza
+ reverse complement
+ traduci (se nucleotidica)
+ contenuto in gc (se nucleotidica)
+ punto isoelettrico (se amminoacidica)
+ ...

e così via.

In buona parte dei casi è bene fare in modo di definire solo gli attributi fundamentali, che vengono usati più spesso, in quanto attributi come **reverse complement** in questo esempio possono essere generati tramite un metodo a partire dalla sequenza e finirebbero per occupare memoria in più nel caso dovessimo caricare molte istanze di sequenza. 

oggetto sequenza:
+ identificatore
+ sequenza
+ alfabeto
+ lunghezza
---
- calcola_gc()
- ottieni_lunghezza()
- descrivi()


In [1]:
class sequenza:
    identificatore = "bella_sequenza"
    sequenza = "ATCGATCGCATGCAT"
    alfabeto = "nucl"
    lunghezza = len(sequenza)

In [5]:
a = sequenza()

In [8]:
a.lunghezza

15

In [40]:
class sequenza:
    def __init__(self, identificatore, sequenza, alfabeto="NT"):
        self.identificatore = identificatore
        self.sequenza = sequenza
        self.alfabeto = alfabeto
        self.lunghezza = len(sequenza)

    def descrivi(self):
        print("id", self.identificatore)
        print("seq", self.sequenza)
        print("alph", self.alfabeto)
        print("len", self.lunghezza)

In [41]:
a = sequenza("seq_1", "CATCAGCATCGACTACGATCAGC")
b = sequenza("seq_2", "GCTGCATCAGCTACGACTAGCATCGAGTCAGCGGCAT")

In [44]:
b.formato = "phylip"

In [46]:
a.formato

'fasta'

In [37]:
a.descrivi()

id seq_1
seq CATCAGCATCGACTACGATCAGC
alph NT
len 23


In [38]:
b.descrivi()

id seq_2
seq GCTGCATCAGCTACGACTAGCATCGAGTCAGCGGCAT
alph NT
len 37


In [25]:
a == b

False

In [47]:
class sequenza:
    def __init__(self, identificatore, sequenza, alfabeto="NT"):
        self.identificatore = identificatore
        self.sequenza = sequenza
        self.alfabeto = alfabeto
        self.lunghezza = len(sequenza)

    def descrivi(self):
        print("id", self.identificatore)
        print("seq", self.sequenza)
        print("alph", self.alfabeto)
        print("len", self.lunghezza)
    
    def get_gc(self):
        return (self.sequenza.count("C") + self.sequenza.count("G"))/self.lunghezza

In [50]:
c = sequenza("seq_3", "GTCAGTCAGTCAGTCAGTGTCAAAAAAAAAAAACGTACAGTCAGTCAGTGTCA")

In [60]:
c.get_gc() * 100

39.62264150943396