# Costrutti

Una volta che abbiamo le variabili, possiamo lavorarci. Abbiamo a disposizione due tipi di costrutti:
- scelta: ci permette di eseguire del codice piuttosto che dell'altro;
- iterazione: ci permette di eseguire del codice piu' volte, sulla base di una condizione.

#### Stampa
Piccola anticipazione delle funzioni: `print(...)` stampa quello che forniamo.

In [1]:
10

10

In [2]:
print(10)

10


In [3]:
print(1, 2, 3)

1 2 3


In [5]:
print([0, 12, 2][1])

12


In [6]:
print("ciao")

ciao


In [7]:
print(10 > )

SyntaxError: invalid syntax (2333221364.py, line 1)

In [10]:
print(
    10
)

10


In [8]:
10 >

SyntaxError: invalid syntax (1949719885.py, line 1)

## Scelta: `if`
*[Documentazione online](https://docs.python.org/3/tutorial/controlflow.html#if-statements)*

Il costrutto `if` ci permette di eseguire del codice *se e solo se* la condizione data e' vera:
- *se* la cellula ha una data concentrazione di una sostanza, *allora*...
- *se* la cellula sta sintetizzando queste proteine, *allora*...
- *se* il genoma di questo organismo e' simile a questo, *allora*...

Sintassi:
```python
if condizione:
    body_if
else:
    body_else
```

`else` ci permette di eseguire dell'altro codice in caso in cui la condizione non sia vera. Opzionale.

**Importante!** Il codice dell'`if` e dell'`else` deve essere *indentato*: usate un `Tab` per farlo.

In [13]:
cell_type = "cancer"
cancer_cell_counter = 0
noncancer_cell_counter = 0

if cell_type == "cancer":
    # cancer_cell_counter = cancer_cell_counter + 1
    cancer_cell_counter += 1
else:
    noncancer_cell_counter += 1

print(cancer_cell_counter, noncancer_cell_counter)

1 0


In [15]:
type((cancer_cell_counter, noncancer_cell_counter))

tuple

Con diversi `if else if else ...` di fila, **tutti che fanno riferimento a una stessa catena**, possiamo usare `elif`, che sta per `else if`. E.g.,

In [None]:
base = "C"

if base == "A":
    is_adenosine = True
elif base == "C":
    is_cytosine = True
elif base == "G":
    is_guanine = True
else:
    is_thymine = True

Equivalente a 

In [None]:
base = "C"

if base == "A":
    is_adenosine = True
else:
    if base == "C":
        is_cytosine = True
    else:
        if base == "G":
            is_guanine = True
        else:
            is_thymine = True

# Iterazione: `for`
*[Documentazione online](https://docs.python.org/3/tutorial/controlflow.html#for-statements)*

`for` ci permette di ripetere del codice, e.g.,
- *ripeto* un'analisi del genoma su ogni individuo della popolazione
- *ripeto* un'analisi della cellula su tutte le cellule del campione
- *ripeto* la ricerca di genomi simili su una banca dati di genomi di riferimento

Sintassi:
```python
for element in collection:
    body_for
```

**Importante!** Il codice del `for` deve essere *indentato*: usate un `Tab` per farlo.

**Importante #2!** `element` e' una variabile! Non usate un nome che avete gia' usato prima!!

Ripete `body_for` per ogni elemento `element` in `collection`, e.g.,

```python
for individual in population:
    analyze_genome
```

```python
for cell in sample:
    analyze_cell
```

```python
for genome in database:
    similarity_with_reference_genome
```

In [17]:
genome = "CAAGCATGGCGAGTAAGTGATCCAACGCTTCGGATACGACTATATACTTAGGTTTGATCTCGCCCCGAGAACTGTAAACCTCAACATTTATAGATTATGAGGTTAGCCGAAAATGCACGTGGTGGCGCCCGCCGACTGCTCCCAGAGTGTGGCTCTTTGTTCTGTCAAGGCCCGACCTTCATCGCGGCCGATTCCTTCTGCGGACCATGTCGTCCTGATACTTTGGTCATGTTTCCGTTGTAGGAGTGAACCCACTTGGCTTTGCGCCATAATTCCAATGAAAAACCTATGCACTTTGTTTAGGGTACCATCAGGAATCTGAACCCTCAGATAGTGGGGATCCCGGGTATAGACCTTTATCTGCGGTCCAACTTAGGCATAAACCTGCATGCTACCTTGTCAGACCCACTCTGCACGAAGTAAATATGGGATGCGTCCGACCTGGCTCCTGGCGTTCCACGCCGCCACGTGTTCGTTAACTGTTGATTGGTGGCACATAAGTAATACCATGGTCCCTGAAATTCGGCTCAGTTACTTCGAGCGTAATGTCTCAAATGGCGTAGAACGGCAATGACTGTTTGACACTAGGTGGTGTTCAGTTCGGTAACGGAGAGTCTGTGCGGCATTCTTATTAATACATTTGAAACGCGCCCAACTGACGCTAGGCAAGTCAGTGCAGGCTCCCGTGTTAGGATAAGGGTAAACATACAAGTCGATAGAAGATGGGTAGGGGCCTTCAATTCATCCAGCACTCTACGGTTCCTCCGAGAGCAAGTAGGGCACCCTGTAGTTCGAAGGGGAACTATTTCGTGGGGCGAGCCCACACCGTCTCTTCTGCGGAAGACTTAACACGTTAGGGAGGTGGAATAGTTTCGAACGATGGTTATTAATCGTAATAACGGAACGCTGTCTGGAGGATGAGTCTGACGGTGTGTAACTCGATCAGTCACTCGCTATTCGAACTGCGCGAAAGATCCCAGCGCTCATGCACTTGATTCCG"
thymine_counter = 0
adenosine_counter = 0
guanine_counter = 0
cytosine_counter = 0
error_counter = 0

for base in genome:
    if base == "A":
        adenosine_counter += 1
    elif base == "C":
        cytosine_counter += 1
    elif base == "G":
        guanine_counter += 1
    elif base == "T":
        thymine_counter += 1
    else:
        error_counter += 1

In [20]:
# Importante! Non tutti i tipi sono iterabili!
counter = 0

for i in 213543523454:
    if i == 3:
        counter += 1

TypeError: 'int' object is not iterable

In [19]:
thymine_counter, guanine_counter, adenosine_counter

(260, 257, 240)

In [24]:
cell_types = ["not_cancer", "cancer", "cancer", "cancer", "not_cancer", "cancer", "cancer", "cancer", "cancer", "not_cancer", "cancer", "not_cancer", "cancer", "cancer", "not_cancer", "not_cancer", "cancer", "not_cancer", "cancer", "cancer", "cancer", "cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "cancer", "not_cancer", "cancer", "cancer", "cancer", "cancer", "not_cancer", "not_cancer", "cancer", "cancer", "cancer", "cancer", "cancer", "cancer", "cancer", "not_cancer", "not_cancer", "cancer", "not_cancer", "cancer", "cancer", "not_cancer", "not_cancer", "cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "cancer", "cancer", "cancer", "not_cancer", "cancer", "not_cancer", "cancer", "not_cancer", "not_cancer", "cancer", "cancer", "cancer", "not_cancer", "not_cancer", "cancer", "cancer", "cancer", "not_cancer", "cancer", "not_cancer", "cancer", "cancer", "not_cancer", "cancer", "not_cancer", "not_cancer", "cancer", "cancer", "cancer", "cancer", "not_cancer", "cancer", "cancer", "cancer", "not_cancer", "not_cancer", "not_cancer", "cancer", "not_cancer", "not_cancer", "cancer", "not_cancer"]
cancer_cell_counter = 0
noncancerous_cell_counter = 0

for cell_type in cell_types:
    if cell_type == "cancer":
        cancer_cell_counter += 1
    
    noncancerous_cell_counter += 1

cancer_cell_counter, noncancerous_cell_counter

(55, 100)

# Iterazione: `while`

Diversamente dal `for`, `while` fornisce una iterazione su condizione: il suo corpo viene eseguito fintanto che la condizione rimane vera.

```python
while condition:
    body_while
```

In [6]:
fibonacci_a, fibonacci_b = 0, 1
current_fibonacci = fibonacci_a + fibonacci_b

while current_fibonacci <= 100:
    current_fibonacci = fibonacci_a + fibonacci_b
    fibonacci_a = fibonacci_b
    fibonacci_b = current_fibonacci
    print(current_fibonacci)

1
2
3
5
8
13
21
34
55
89
144


## `break`
*[Documentazione online](https://docs.python.org/3/tutorial/controlflow.html#break-and-continue-statements-and-else-clauses-on-loops)*

Puo' capitare di dover terminare di iterare *prima* di aver consumato tutti gli elementi. In questo caso, `break` ci permette di uscire dall'iterazione in cui siamo.
`continue` fa l'opposto: salta direttamente all'iterazione successiva.

Un paziente e' malato di cancro, se ha almeno 10 cellule cancerogene.

In [26]:
cell_types = ["not_cancer", "cancer", "cancer", "cancer", "not_cancer", "cancer", "cancer", "cancer", "cancer", "not_cancer", "cancer", "not_cancer", "cancer", "cancer", "not_cancer", "not_cancer", "cancer", "not_cancer", "cancer", "cancer", "cancer", "cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "cancer", "not_cancer", "cancer", "cancer", "cancer", "cancer", "not_cancer", "not_cancer", "cancer", "cancer", "cancer", "cancer", "cancer", "cancer", "cancer", "not_cancer", "not_cancer", "cancer", "not_cancer", "cancer", "cancer", "not_cancer", "not_cancer", "cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "cancer", "cancer", "cancer", "not_cancer", "cancer", "not_cancer", "cancer", "not_cancer", "not_cancer", "cancer", "cancer", "cancer", "not_cancer", "not_cancer", "cancer", "cancer", "cancer", "not_cancer", "cancer", "not_cancer", "cancer", "cancer", "not_cancer", "cancer", "not_cancer", "not_cancer", "cancer", "cancer", "cancer", "cancer", "not_cancer", "cancer", "cancer", "cancer", "not_cancer", "not_cancer", "not_cancer", "cancer", "not_cancer", "not_cancer", "cancer", "not_cancer"]
cancer_cell_counter = 0
counter = 0

for cell_type in cell_types:
    counter += 1
    
    if cell_type == "cancer":
        cancer_cell_counter += 1

    # se ho trovato 10 cellule cancerogene non ho bisogno di guardare tutte le rimanenti!
    if cancer_cell_counter >= 10:
        break

if cancer_cell_counter >= 10:
    patient_status = "cancerous"
else:
    patient_status = "not cancerous"

patient_status
counter

14

# Costrutti... sintetizzati
*[Documentazione online](https://docs.python.org/3/tutorial/datastructures.html#list-comprehensions)*


Spesso con selezioni e iterazioni vogliamo selezionare una sottocollezione, e.g., celle cancerogene, o modificarne gli elementi, e.g., correggere errori di trascrizione di un genoma. In entrambi i casi, il risultato e' una collezione.

Python offre dei costrutti compatti per evitarci `for` e `if` a cascata, dette comprehension:
- list comprehension: `[ comprehension ]`
- set comprehension: `{ comprehension }`
- dictionary comprehension: `{ comprehension }`

Seleziona tutte le cellule cancerogene.

In [27]:
cell_types = ["not_cancer", "cancer", "cancer", "cancer", "not_cancer", "cancer", "cancer", "cancer", "cancer", "not_cancer", "cancer", "not_cancer", "cancer", "cancer", "not_cancer", "not_cancer", "cancer", "not_cancer", "cancer", "cancer", "cancer", "cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "cancer", "not_cancer", "cancer", "cancer", "cancer", "cancer", "not_cancer", "not_cancer", "cancer", "cancer", "cancer", "cancer", "cancer", "cancer", "cancer", "not_cancer", "not_cancer", "cancer", "not_cancer", "cancer", "cancer", "not_cancer", "not_cancer", "cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "not_cancer", "cancer", "cancer", "cancer", "not_cancer", "cancer", "not_cancer", "cancer", "not_cancer", "not_cancer", "cancer", "cancer", "cancer", "not_cancer", "not_cancer", "cancer", "cancer", "cancer", "not_cancer", "cancer", "not_cancer", "cancer", "cancer", "not_cancer", "cancer", "not_cancer", "not_cancer", "cancer", "cancer", "cancer", "cancer", "not_cancer", "cancer", "cancer", "cancer", "not_cancer", "not_cancer", "not_cancer", "cancer", "not_cancer", "not_cancer", "cancer", "not_cancer"]
[cell_type + "U" for cell_type in cell_types]

['not_cancerU',
 'cancerU',
 'cancerU',
 'cancerU',
 'not_cancerU',
 'cancerU',
 'cancerU',
 'cancerU',
 'cancerU',
 'not_cancerU',
 'cancerU',
 'not_cancerU',
 'cancerU',
 'cancerU',
 'not_cancerU',
 'not_cancerU',
 'cancerU',
 'not_cancerU',
 'cancerU',
 'cancerU',
 'cancerU',
 'cancerU',
 'not_cancerU',
 'not_cancerU',
 'not_cancerU',
 'not_cancerU',
 'not_cancerU',
 'cancerU',
 'not_cancerU',
 'cancerU',
 'cancerU',
 'cancerU',
 'cancerU',
 'not_cancerU',
 'not_cancerU',
 'cancerU',
 'cancerU',
 'cancerU',
 'cancerU',
 'cancerU',
 'cancerU',
 'cancerU',
 'not_cancerU',
 'not_cancerU',
 'cancerU',
 'not_cancerU',
 'cancerU',
 'cancerU',
 'not_cancerU',
 'not_cancerU',
 'cancerU',
 'not_cancerU',
 'not_cancerU',
 'not_cancerU',
 'not_cancerU',
 'not_cancerU',
 'not_cancerU',
 'not_cancerU',
 'cancerU',
 'cancerU',
 'cancerU',
 'not_cancerU',
 'cancerU',
 'not_cancerU',
 'cancerU',
 'not_cancerU',
 'not_cancerU',
 'cancerU',
 'cancerU',
 'cancerU',
 'not_cancerU',
 'not_cancerU',
 'ca

In [31]:
{cell_type: 0 for cell_type in cell_types if cell_type == "cancer"}

{'cancer': 0}

In [32]:
genome = "CAAGCATGGCGAGTAAGTGATCCAACGCTTCGGATACGACTATATACTTAGGTTTGATCTCGCCCCGAGAACTGTAAACCTCAACATTTATAGATTATGAGGTTAGCCGAAAATGCACGTGGTGGCGCCCGCCGACTGCTCCCAGAGTGTGGCTCTTTGTTCTGTCAAGGCCCGACCTTCATCGCGGCCGATTCCTTCTGCGGACCATGTCGTCCTGATACTTTGGTCATGTTTCCGTTGTAGGAGTGAACCCACTTGGCTTTGCGCCATAATTCCAATGAAAAACCTATGCACTTTGTTTAGGGTACCATCAGGAATCTGAACCCTCAGATAGTGGGGATCCCGGGTATAGACCTTTATCTGCGGTCCAACTTAGGCATAAACCTGCATGCTACCTTGTCAGACCCACTCTGCACGAAGTAAATATGGGATGCGTCCGACCTGGCTCCTGGCGTTCCACGCCGCCACGTGTTCGTTAACTGTTGATTGGTGGCACATAAGTAATACCATGGTCCCTGAAATTCGGCTCAGTTACTTCGAGCGTAATGTCTCAAATGGCGTAGAACGGCAATGACTGTTTGACACTAGGTGGTGTTCAGTTCGGTAACGGAGAGTCTGTGCGGCATTCTTATTAATACATTTGAAACGCGCCCAACTGACGCTAGGCAAGTCAGTGCAGGCTCCCGTGTTAGGATAAGGGTAAACATACAAGTCGATAGAAGATGGGTAGGGGCCTTCAATTCATCCAGCACTCTACGGTTCCTCCGAGAGCAAGTAGGGCACCCTGTAGTTCGAAGGGGAACTATTTCGTGGGGCGAGCCCACACCGTCTCTTCTGCGGAAGACTTAACACGTTAGGGAGGTGGAATAGTTTCGAACGATGGTTATTAATCGTAATAACGGAACGCTGTCTGGAGGATGAGTCTGACGGTGTGTAACTCGATCAGTCACTCGCTATTCGAACTGCGCGAAAGATCCCAGCGCTCATGCACTTGATTCCG"
complement_genome = [
    "T" if base == "A" else 
    "A" if base == "T" else
    "C" if base == "G" else
    "G"
    for base in genome
]

# Generatori

Python calcola le comprehension one-shot, il che vuol dire che prima di avere anche solo il risultato per il primo elemento... dobbiamo aspettare che finisca tutto! Se lavoriamo con collezioni molto grandi, e.g., un genoma, i tempi di attesa diventano lunghi.
Python ci fornisce un modo *lazy* (pigro) di trattare le operazioni su collezioni: le applica solo quando le richiediamo. Il risultato e' un *generatore*, che genera il prossimo elemento della collezione solo quando glie lo chiediamo. Una volta richiesto, l'elemento e' **consumato**, e non lo possiamo piu' recuperare.

Sintassi
```
( list comprehension )
```

E.g.,

In [34]:
genome = "CAAGCATGGCGAGTAAGTGATCCAACGCTTCGGATACGACTATATACTTAGGTTTGATCTCGCCCCGAGAACTGTAAACCTCAACATTTATAGATTATGAGGTTAGCCGAAAATGCACGTGGTGGCGCCCGCCGACTGCTCCCAGAGTGTGGCTCTTTGTTCTGTCAAGGCCCGACCTTCATCGCGGCCGATTCCTTCTGCGGACCATGTCGTCCTGATACTTTGGTCATGTTTCCGTTGTAGGAGTGAACCCACTTGGCTTTGCGCCATAATTCCAATGAAAAACCTATGCACTTTGTTTAGGGTACCATCAGGAATCTGAACCCTCAGATAGTGGGGATCCCGGGTATAGACCTTTATCTGCGGTCCAACTTAGGCATAAACCTGCATGCTACCTTGTCAGACCCACTCTGCACGAAGTAAATATGGGATGCGTCCGACCTGGCTCCTGGCGTTCCACGCCGCCACGTGTTCGTTAACTGTTGATTGGTGGCACATAAGTAATACCATGGTCCCTGAAATTCGGCTCAGTTACTTCGAGCGTAATGTCTCAAATGGCGTAGAACGGCAATGACTGTTTGACACTAGGTGGTGTTCAGTTCGGTAACGGAGAGTCTGTGCGGCATTCTTATTAATACATTTGAAACGCGCCCAACTGACGCTAGGCAAGTCAGTGCAGGCTCCCGTGTTAGGATAAGGGTAAACATACAAGTCGATAGAAGATGGGTAGGGGCCTTCAATTCATCCAGCACTCTACGGTTCCTCCGAGAGCAAGTAGGGCACCCTGTAGTTCGAAGGGGAACTATTTCGTGGGGCGAGCCCACACCGTCTCTTCTGCGGAAGACTTAACACGTTAGGGAGGTGGAATAGTTTCGAACGATGGTTATTAATCGTAATAACGGAACGCTGTCTGGAGGATGAGTCTGACGGTGTGTAACTCGATCAGTCACTCGCTATTCGAACTGCGCGAAAGATCCCAGCGCTCATGCACTTGATTCCG"
complement_genome = [
    "T" if base == "A" else 
    "A" if base == "T" else
    "C" if base == "G" else
    "G"
    for base in genome
]

complement_genome_generator = (
    "T" if base == "A" else 
    "A" if base == "T" else
    "C" if base == "G" else
    "G"
    for base in genome
)

In [36]:
complement_genome[5]

'T'

In [37]:
complement_genome_generator[0]

TypeError: 'generator' object is not subscriptable

In [44]:
next(complement_genome_generator)

'A'

In [7]:
next(complement_genome_generator)

'T'