<a href="https://colab.research.google.com/github/A3Lab-UNIVPM/DACLS_files/blob/main/colab_python_basics.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Guida *Google Colab* and *Python* basics


---



####INTRODUZIONE

Questo documento contiene una veloce panoramica introduttiva sugli aspetti necessari a comprendere le prossime esercitazioni, in cui verranno mostrati progetti di *Deep Learning* in ambito *Audio Processing, Signal Processing e Speech Enhancement*.

Il documento è suddiviso in sezioni, con parti di testo descrittivo e parti di codice commentato.

Verrà inizialmente introdotta una guida *quick start* sulle funzionalità principali dell'ambiente di sviluppo Google Colab, e successivamente una serie di concetti di programmazione in linguaggio Python, che possono essere utili per comprendere la sintassi e le strutture che verranno presentate nelle prossime esercitazioni.

Oltre alla sintassi del Python standard, nelle ultime due sezioni vengono presentate sinteticamente le funzioni delle librerie **Numpy** per il calcolo scientifico, e **Matplotlib** per la visualizzazione grafica.\
In alcuni blocchi il codice è stato volutamente espresso in forma di pseudo-codice, per aumentare la generalizzazione del concetto trattato; per questo motivo l'esecuzione deve essere fatta valutandone prima il contenuto,  eventualmente modificando parti di codice e inserendo delle funzioni di stampa per controllare i risultati delle elaborazioni.

La visualizzazione corrente del documento è in sola lettura; è necessario cliccare sul badge ![Open In Collab](https://colab.research.google.com/assets/colab-badge.svg) in alto per aprirlo all'interno di Google Colab da cui può essere eseguito e modificato.

#### GOOGLE COLAB

Google COLAB è un servizio in cloud fornito da Google, che mette a disposizione degli sviluppatori la capacità di calcolo dei propri server, attraverso un ambiente di sviluppo per il linguaggio Python accessibile tramite browser.

Per utilizzare la versione gratuita del servizio è sufficiente un PC con accesso a Internet ed un account Google. Esiste anche una versione *PRO*, a pagamento, che fornisce maggiori risorse di memoria e di calcolo, tuttavia le risorse della versione *FREE* sono più che sufficienti per sviluppare progetti di media complessità.

Gli utenti che dispongono di un account Google possono creare un nuovo documento COLAB accedendo al proprio Google Drive e selezionando `Nuovo --> Altro --> Google Colaboratory`. Chi non ha mai utilizzato Colab deve inserirlo tra le possibili voci di menù scegliendo `Nuovo --> Altro --> + Collega altre applicazioni`.

Ogni utente (*FREE*) può utilizzare contemporaneamente fino ad un massimo di tre *sessioni*, che corrispondono ad altrettante macchine virtuali (VM) che Google crea appositamente sui propri server, riservando per ognuna:
 - Una vCPU 2-core (nel runtime CPU), oppure
 - Una GPU Nvidia (assegnata casualmente, tra i modelli K80, T4, P4, P100), oppure
 - Una TPU (Tensor Processing Unit)
 - 13 GB RAM (circa)
 - 100 GB di spazio su disco (circa)

Per conoscere le specifiche della sessione corrente si possono usare i comandi Unix: 

```
!df -h
!cat /proc/cpuinfo
!cat /proc/meminfo
!nvidia-smi
```
da eseguire in un blocco di codice. In generale, i comandi preceduti da `!` vengono eseguiti sulla shell della macchina virtuale.\
Di default Google avvia una sessione basata su CPU. Per cambiare tipo di risorsa si utilizza il menu `Runtime --> Cambia tipo di runtime`.\
Ogni volta che viene cambiato il tipo di runtime il kernel Python viene riavviato, ciò significa che tutte le variabili delle precedenti elaborazioni vengono cancellate. I dati salvati sullo spazio disco della VM invece rimangono memorizzati fintanto che la sessione è attiva.

Per ottimizzare l'uso delle risorse, Google controlla l'attività delle sessioni e disconnette quelle che ritiene "inattive" secondo una sua politica non ben definita, quindi per non perdere i progressi del lavoro corrente è importante monitorare lo stato della sessione e, se questa si protrae a lungo, "simulare" un qualche tipo di attività (scrivere/cancellare codice, cliccare menù, etc).
\
\
I progetti COLAB sono strutturati in un unico blocco note *Jupyter* che viene creato e salvato automaticamente ad intervalli regolari, sul proprio spazio Google Drive. Il blocco note ha estensione *.ipynb* e può essere editato con altri IDE (come ad es. Jupyter LAB) o condiviso con altri utenti Google per la modifica collaborativa.

All'interno del blocco note si possono inserire due tipi di celle:
 - **Codice**
 - **Testo** (per inserire testo in formato Markdown, LaTeX o immagini).

Nelle celle di codice (Python) si possono inserire commenti anteponendo ad ogni riga il simbolo `#`. Per commentare o decommentare interi blocchi di codice, dopo averli selezionati si utilizza la scorciatoia `Alt + "/"`

L'esecuzione del codice di una cella si avvia con il pulsante a sinistra della prima riga di codice della stessa cella, oppure con la scorciatoia `Ctrl + Invio`.\
Il pulsante di avvio mostra un'animazione durante l'avanzamento dell'operazione.\
Se l'esecuzione avviene senza errori la cella ritorna al suo stato iniziale ed eventualmente compare sotto di essa una zona che visualizza l'output dell'elaborazione (testo, immagini etc.). L'output viene salvato assieme al file *.ipynb*, ed è visibile fintanto che non viene manualmente cancellato o la cella non viene eseguita nuovamente (quindi attenzione a salvare i risultati non appena possibile!).\
Nel pulsante di avvio comparirà un numero che rappresenta l'ordine di esecuzione della cella, tra tutte quelle presenti nel notebook.
\
\
Nei progetti di **Machine Learning** si ha spesso la necessità di utilizzare grandi quantità di dati (dataset) durante l'addestramento della rete ed è necessario che una copia di questi dati si trovi fisicamente sulla stessa macchina su cui viene eseguito il codice.\
In gran parte dei progetti tutorial, dove si fa uso di classici dataset (*benchmark dataset*) questi possono essere scaricati al momento, sullo spazio disco della VM, ricorrendo a funzioni apposite dei framework (Tensorflow, Pytorch, etc.).\
In alternativa, se il dataset da utilizzare è ospitato in un server può essere scaricato nella sessione corrente della macchina virtuale tramite il comando `!wget`, o caricato dal proprio PC tramite drag and drop; i dati saranno mantenuti fintanto che la sessione è attiva.\
Per quest'ultima ragione, il modo migliore per poter accedere al proprio dataset in maniera rapida, è quello di pre-caricarlo sullo spazio Drive, il quale poi verrà *montato* come disco di sistema sulla macchina virtuale e potrà essere usato anche per salvare in modo sicuro eventuali file di output (la procedura è spiegata in dettaglio nella sezione *system interactions*).



####PYTHON

Python è un linguaggio di programmazione il cui utilizzo ha subito una rapida ascesa negli anni recenti, in molteplici campi. Le principali ragioni del suo successo possono essere riassunte nei seguenti punti:
- è FREE
- è un **linguaggio interpretato**, che quindi non necessita di un compilatore ma di un programma interprete, e ciò aumenta la portabilità del codice scritto, tra varie piattaforme e sistemi operativi.
- ha un'ampia platea di utilizzatori, che formano una community solida, sia per gli sviluppatori esperti sia come punto di riferimento per i meno esperti.
- è un linguaggio **multi-paradigma**, cioè consente sia la programmazione procedurale (funzioni) che quella orientata agli oggetti (classi).
- è ricco di librerie che implementano funzioni di vario genere, per il machine learning, l'audio, la grafica, la matematica, la statistica etc..
- è performante; molte librerie Python sono internamente scritte in C per sfruttare le librerie ottimizzate dei processori (BLAS) o la **parallelizzazione** dei calcoli tramite i CUDA cores delle schede GPU Nvidia.

Le principali difficoltà per chi inizia a programmare in Python proveniendo da altri linguaggi sono date dal fatto che il linguaggio è **case sensitive**, ma soprattutto dall'utilizzo pervasivo delle **indentazioni**.


La versione Python utilizzata da COLAB al momento della scrittura di questa guida è la 3.7.13

In [None]:
!python --version

#### VARIABILI E TIPI DI DATO

In Python le variabili si dichiarano ed inizializzano allo stesso tempo, senza specificare il tipo di dato:

In [None]:
cnt = 10

`cnt` ora contiene un valore intero e potremo eseguire con essa solo le operazioni permesse sugli interi.\
In Python 3 il tipo *long* è stato eliminato e tutti gli interi vengono identificati nel tipo *int* il cui range di valori è esteso alla massima capacità di allocazione del sistema (32 o 64 bit).

BOOLEAN

In [None]:
is_max = True
is_min = False

FLOAT

In [None]:
a = 1.                          # la parte decimale nulla si può omettere
pi_approx = 3.1415

COMPLEX

In [None]:
c = 2 + 3j

STRING

In [None]:
my_message = "Hello\nWorld"         # Le stringhe possono essere inserite tra doppie virgolette o virgolette singole

Alcuni caratteri speciali (da includere tra virgolette):\
`\n` Line Feed (ritorno a capo)\
`\r` Carriage Return\
`\b` Backspace\
`\t` Tab\
`\x` inserimento di un carattere tramite il valore esadecimale del codice Ascii

LISTE

Le liste sono contenitori di dati **ordinati** da un indice, **modificabili** in qualsiasi momento dopo la definizione ed ammettono elementi **duplicati**.\
Le liste vengono definite elencando gli elementi, separati da virgole, tra parentesi quadre:

In [None]:
epoch = [10, 20, 30, 40, 50]

possono contenere qualsiasi tipo di dato:

In [None]:
list_of_ints = [1,2,3,4,5]
list_of_floats = [1.0, 2.0, 3.0, 4.0, 5.0]
list_of_strings = ['A', 'B', 'C', 'D', 'E']
list_of_lists = [[1,2,3], ['a', 'b', 'c']]
list_of_multi = ['A', 1, [2.0, 3.0]]
# etc..

Posso definire una lista vuota in due modi:

In [None]:
colors_l = []
# o anche
colors_l = list()

I metodi (funzioni) più comuni che permettono di manipolare le liste sono riportati di seguito:

In [None]:
colors_l.append('Green')                  # aggiunge un elemento in coda alla lista
colors_l.extend(['Blue', 'Red', 'Black']) # aggiunge più elementi in coda alla lista
colors_l.insert(2, 'Black')               # inserisce un elemento in una posizione specifica
colors_l.remove('Red')                    # rimuove un elemento per valore
colors_l.count('Black')                   # conta il numero di elementi con un dato valore
colors_l.index('Green')                   # restituisce la posizione della prima occorrenza di uno specifico elemento
len(colors_l)                             # restituisce il numero di elementi di una lista
colors_l.sort()                           # ordina gli elementi di una lista in ordine crescente (numerico o alfabetico)
colors_l.sort(reverse=True)               # ordina gli elementi di una lista in ordine decrescente (numerico o alfabetico)
colors_l.reverse()                        # inverte le posizioni degli elementi di una lista

le funzioni *sort* e *reverse* operano *in place* modificando la lista di origine.

Per duplicare una lista creando una copia indipendente dall'originale non è sufficiente l'operatore 
`=` ma si utilizza la funzione `copy()`

 

In [None]:
colors_l2 = colors_l.copy()               # questo è l'unico metodo per creare una lista duplicata indipendente dall'originale

TUPLE

Le tuple sono contenitori di dati **ordinati** da un indice e **non modificabili** dopo la definizione. Ammettono elementi **duplicati**.\
Le tuple vengono definite elencando gli elementi, separati da virgole, tra parentesi tonde:

In [None]:
colors_t = ('Cyan', 'Magenta', 'Yellow', 'Black')

# caso particolare: se una tupla ha un solo elemento esso deve essere seguito da virgola
number_t = (100,)

poiché non sono modificabili, le tuple hanno meno metodi rispetto alle liste:

In [None]:
colors_t.count('Cyan')                    # conta il numero di elementi con un dato valore
colors_t.index('Magenta')                 # restituisce la posizione della prima occorrenza di uno specifico elemento
len(colors_t)                             # restituisce il numero di elementi di una tupla

Ricerca di un elemento specifico in una **lista** o in una **tupla**

In [None]:
'Green' in colors_l                       # restituisce True se l'elemento cercato è presente nella lista, altrimenti False.
'Purple' not in colors_t                  # restituisce True se l'elemento cercato è assente dalla lista, altrimenti False.

Somma o concatenazione di **liste** o **tuple** (*join*)\
Due liste/tuple possono essere trasformate in una unica lista/tupla semplicemente con l'operatore +

In [None]:
l1 = [1,2,3]
l2 = ['a','b','c']
l3 = l1 + l2

Accesso ad uno o più elementi di una **lista** o **tupla**: *indexing* and *slicing*\
L'accesso ad uno o più elementi di una lista (o una tupla) avviene attraverso gli indici di posizione.
Il primo elemento di una lista (tupla) ha indice **0**, diversamente di quanto avviene in Matlab in cui il primo elemento ha indice **1**.

In [None]:
colors_l = ['Cyan', 'Magenta', 'Yellow', 'Black']

colors_l[0]             # Cyan
colors_l[4]             # non esiste
colors_l[-1]            # Black, (ultimo elemento), gli indici negativi puntano alla fine
colors_l[-2]            # Yellow (penultimo elemento)


L'operazione di **slicing** consente di estrarre un sottoinsieme di elementi:\
`nomelista[start:end:step]` estrae gli elementi della lista, dall'indice *start* all'indice *end* escluso, con passo *step* (se omesso, step = 1)

In [None]:
colors_l[0:2]           # [Cyan, Magenta]
colors_l[:3]            # [Cyan, Magenta, Yellow] slicing dal primo elemento all'indice 3 escluso
colors_l[2:]            # [Yellow, Black] slicing dall'indice 2 all'ultimo elemento incluso
colors_l[::2]           # [Cyan, Yellow] slicing con passo 2
colors_l[::-1]          # [Black, Yellow, Magenta, Cyan] slicing in ordine inverso (passo -1)

Type casting\
L'operazione di casting permette di specificare il tipo di una variabile al momento della dichiarazione oppure convertire una variabile esistente in un diverso tipo, limitatamente ai casi possibili:

In [None]:
x = int()                       # nuova variabile intera, senza alcun valore
x = int(1.0)                    # conversione da float a int
x = int('123')                  # conversione da string a int (se possibile)
x = float(1)                    # conversione da int a float
x = float("3")                  # conversione da string a float (se possibile)
x = str(2)                      # conversione da int a string
x = str(3.0)                    # conversione da float a string
x = bool(n)                     # conversione da int o float a bool, restituisce False solo se n = 0, altrimenti restituisce True
colors_l = list(colors_t)       # conversione da tupla a lista
colors_t = tuple(colors_l)      # conversione da lista a tupla
letters_l = list('Hello')       # conversione da string a lista di lettere ['H', 'e', 'l', 'l', 'o']
letters_t = tuple('Hello')      # conversione da string a tupla di lettere ('H', 'e', 'l', 'l', 'o')

DIZIONARI

I dizionari (*dictionaries, dict*) sono strutture che permettono di memorizzare dati nella forma *key: value*

Le chiavi devono comparire una sola volta, mentre i valori possono essere duplicati e contenere qualsiasi tipo di dato:

In [None]:
d = {'città': 'Ancona',
     'provincia': 'Ancona', 
     'regione': 'Marche',
     'abitanti': 100696
     }

Per accedere ad un elemento di un dizionario non si utilizzano gli indici ma il valore delle chiavi

In [None]:
d['abitanti']                     # 100696

Un dizionario può essere creato anche in modo incrementale:

In [None]:
d = {}
d['città'] = 'Ancona'
d['provincia'] = 'Ancona', 
d['regione'] = 'Marche',
d['abitanti'] = 100696

Gli elementi di un dict non hanno un ordine specifico.\
I metodi più utili per operare sui dict sono riportati di seguito:

In [None]:
d.items()             # restituisce una lista di tuple (key, value) per tutti gli elementi del dict
d.keys()              # restituisce la lista di tutte le keys del dict
d.values()            # restituisce la lista di tutti i values del dict
d.clear()             # cancella tutti gli elementi del dict

come per le liste e le tuple, gli operatori `in` e `not in` possono essere usati per verificare la presenza di una specifica chiave o valore:

In [None]:
'città' in d          # True (ricerca nelle chiavi)
'città' in d.keys()   # True, analogo al comando precedente
'nazione' not in d    # True (ricerca nelle chiavi)
100696 in d.values()  # True

####OPERATORI E FUNZIONI DI BASE

Gli **operatori aritmetici** di base in Python sono gli stessi che si possono trovare nella maggior parte dei linguaggi:

In [None]:
a = b = 100     # assegnazione dello stesso valore a due variabili diverse
a + b           # somma
a - b           # sottrazione
a * b           # moltiplicazione
a ** b          # elevamento a potenza
a / b           # divisione
a // b          # divisione intera
a % b           # modulo (resto della divisione intera)

Assegnazione e forme compatte

In [None]:
a = b           # assegnazione
a += b          # forma compatta per a = a + b
a -= b          # forma compatta per a = a - b
a *= b          # forma compatta per a = a * b
a **= b         # forma compatta per a = a ** b
a //= b         # forma compatta per a = a // b 

Comparazione\
Ritornano un risultato di tipo *boolean*

In [None]:
a == b          # uguale
a != b          # diverso
a < b           # minore
a > b           # maggiore
a <= b          # minore o uguale
a >= b          # maggiore o uguale
a is b          # a e b sono la stessa variabile
a is not b      # a e b sono variabili diverse

Operatori logici\
applicabile a variabili di tipo *boolean*\
(nelle espressioni logiche Python accetta anche valori numerici, considerando lo 0 come *False* e tutti i numeri diversi da 0 come *True*)

In [None]:
a and b         # and
a or b          # or
not a           # not

Operatori logici bitwise\
applicabile a variabili numeriche, operano bit a bit

In [None]:
a = 5           # 0101
b = 9           # 1001
a & b           # and
a | b           # or
a ^ b           # xor
~ b             # not
a << b          # left shift and zero fill
a >> b          # right shift and zero fill

BUILT-IN FUNCTIONS\
sono funzioni comprese nella libreria standard Python, utilizzabili senza importare librerie esterne

In [None]:
abs()           # valore assoluto
max()           # valore massimo
min()           # valore minimo
round(x, n)     # arrotonda il valore di x a n cifre decimali
sum()           # somma gli elementi di una lista/tupla
all()           # restituisce True se tutti gli elementi di una lista/tupla sono True, altrimenti restituisce False
any()           # restituisce True se almeno un elemento di una lista/tupla è True, altrimenti restituisce False
type()          # scrive il tipo di una variabile

ZIP\
La funzione `zip()` aggrega due oggetti iterabili (liste/tuple) accoppiando gli elementi con lo stesso indice:


In [None]:
numbers_l = [1, 2, 3]
numbers_t = ('ONE', 'TWO', 'THREE')
result = zip(numbers_l, numbers_t)      # Restituisce un iterator (vedi sezione successiva)
print(list(result))                     # [(1, 'ONE'), (2, 'TWO'), (3, 'THREE')]

PRINT\
La funzione `print()` stampa a terminale qualsiasi tipo di informazione che viene passata come argomento.\
Può stampare valori numerici, stringhe, interi array. 
Se il dato ha una struttura complessa la funzione `print()` stampa il nome dell'oggetto o della classe.

In [None]:
a, b, c, d = 1, 2, 3.1412, 4500     # assegnazione multipla
print(a)                            # stampa il valore di a
print(a, b, c)                      # stampa i valori di più variabili

L'integrazione di più tipi di dati nella stessa `print()` ed in particolare stringhe e valori numerici può essere fatta in vari modi. Di seguito viene mostrata la formattazione *f-string* introdotta in Python 3:

In [None]:
print(f'Il valore della variabile a è {a} ed il valore di b è {b}')
print(f'Il valore della variabile c è {c:.3f}')                       # arrotonda la parte decimale a tre cifre
print(f'Il valore della variabile d è {d:,}')                         # inserisce la virgola come separatore delle migliaia 
print(f'Il valore della somma è {a + b}')                             # funzione integrata
print(f'Testo', end = '')                                             # non esegue il ritorno a capo dopo il print

####STRUTTURE CONDIZIONALI E ITERATORI

Di seguito sono riportate le sintassi delle strutture condizionali più comuni, in formato pseudo-codice:

IF

In [None]:
if condizione:          # condizione singola
  istruzione            # tutte le istruzioni all'interno dell'if devono avere la stessa indentazione
  istruzione
  ...

if condizione1 and condizione2 or not condizione3:    # condizione multipla
  istruzione
  istruzione
  ...

IF - ELSE

In [None]:
if condizione1:
  istruzione1
elif condizione2:       # istruzione2 viene eseguita se condizione2 è vera
  istruzione2

if condizione1:
  istruzione1
else:                   # istruzione2 viene eseguita se tutte le precedenti non sono vere
  istruzione2

IN-LINE IF

In [None]:
if condizione1: istruzione1                     # permette una sola linea di istruzioni

istruzione1 if condizione1 else istruzione2     # è obbligatorio specificare istruzione2 dopo else...

istruzione1 if condizione1 else None            # ...ma istruzione2 può essere un'operazione nulla

WHILE LOOP

In [None]:
while condizione:
  istruzione
  istruzione
  ...

while condizione1:
  ...
  if condizione2:
    break                 # esce dal ciclo while
  ...

while condizione1:
  ...
  if condizione2:
    continue              # salta le istruzioni successive e ricomincia un nuovo ciclo while

FOR LOOP

In [None]:
for var in iter:          # var è la variabile contatore, iter può essere una lista, una tupla...
  istruzione
  istruzione
  ...

ITERABILI ED ITERATORI\
In Python qualsiasi oggetto che contiene una sequenza ordinata di dati è definito **iterabile** (**iterable**).\
Liste e tuple sono gli iterabili più comuni.\
Sequenze iterabili, da utilizzare ad esempio nei cicli for, possono essere creati con la funzione `range()`

In [None]:
range(10):              # sequenza di numeri interi da 0 a 10 escluso
range(1,10,2):          # sequenza di numeri interi da 1 a 10 escluso e passo 2
range(10,0,-1)          # sequenza di numeri interi da 10 a 0 escluso e passo -1

In [None]:
for x in range(10):
  print(x)              # stampa la sequenza da 0 a 9

Per associare un numero progressivo agli elementi iterati si utilizza la funzione `enumerate()` che crea una tupla (indice, valore):

In [None]:
for num, var in enumerate(iter):
  print(f'Elemento {var} in posizione {num}')

un **iterabile** viene trasformato in un **iteratore** con la funzione `iter()`.\
L'**iteratore** è un oggetto che possiede vari metodi per la manipolazione e l'accesso ai suoi elementi; la funzione `next()` consente di accedere sequenzialmente agli elementi dell'iteratore ricordando la posizione dell'indice ad ogni chiamata:

In [None]:
mylist = [1,'a',2,'b',3,'c']
myiter = iter(mylist)
print(next(myiter))           # stampa 1
print(next(myiter))           # stampa a
print(next(myiter))           # stampa 2

####GESTIONE DELLE ECCEZIONI

Un programma Python si interrompe quando viene riscontrato un errore di sintassi del codice (ad es. errata indentazione) oppure si verifica un'eccezione (*exception*).\
Un *exception error* può essere anche generato intenzionalmente, ad esempio per scopi di debug:

In [None]:
raise Exception('Operazione non consentita!')

Per controllare la possibile comparsa di un errore che fermerebbe l'esecuzione del programma, si racchiude la parte di codice da controllare in una struttura *try/except*.\
In questo modo l'esecuzione del codice continua dalla riga successiva al blocco *except*

In [None]:
try:
    a = 5 / 0
except:
    print('errore!')
    
try:
    a = 5 / 0
except Exception as e:                      # cattura l'exception error e ne memorizza il tipo
    print(e)

Ogni *exception error* è caratterizzato da un nome che può essere utilizzato per rendere la gestione ancora più mirata, alcuni esempi sono:

In [None]:
import modulo_non_esistente                 # ModuleNotFoundError

a = variabile_non_definita                  # NameError

f = open('file_non_esistente.txt'):         # FileNotFoundError

a = [0, 1, 2]
a.remove(3)                                 # ValueError

a = 5 + "10"                                # TypeError

a = [0, 1, 2]
value = a[5]                                # IndexError

my_dict = {"name": "Max", "city": "Boston"}
age = my_dict["age"]                        # KeyError

####FUNZIONI

Una funzione Python viene dichiarata con la sintassi:  `def nomefunzione(arg1, arg2, arg3 = 100, arg4 = 0):`
- `arg1` e `arg2` sono argomenti di input **obbligatori** (*positional arguments*)
- `arg3` e `arg4` sono argomenti di input **facoltativi** (*keyword arguments*) e vanno posti dopo quelli obbligatori. Se non vengono specificati in fase di chiamata della funzione, assumono i valori di default: `arg3 = 100`, `arg4 = 0`
- `return` termina l'esecuzione della funzione e restituisce uno o più valori, separati da virgola. `return` è facoltativo, può essere assente o può essere presente in più parti della funzione.

Il corpo della funzione ed il return devono avere la stessa indentazione.


In [None]:
def nomefunzione(arg1, arg2, arg3 = 100, arg4 = 0):
  istruzione
  istruzione
  ...
  return val1, val2

In [None]:
def fattoriale(n):              # Esempio di funzione ricorsiva (nested function)
  if n==0:
    return 1                    # sono possibili return multipli legati ad una struttura condizionale
  else:
    return n *fattoriale(n-1)   # valore di return calcolato in-place

Con la seguente sintassi si definisce una funzione che accetta un numero arbitrario di parametri di input:

In [None]:
def nomefunzione(*args):        # la funzione accetta un numero arbitrario di argomenti di tipo positional e li inserisce in una tupla
  pass                          # blocchi condizionali e funzioni devono contenere almeno una riga di istruzioni, "pass" rappresenta un'istruzione nulla

def nomefunzione(**kwargs):     # la funzione accetta un numero arbitrario di argomenti di tipo keyword e li inserisce in una tupla
  pass

La chiamata della funzione deve essere fatta dopo la sua definizione. I valori di ritorno possono essere gestiti in diversi modi.\
Gli argomenti obbligatori vanno passati rispettando la posizione, mentre gli argomenti facoltativi possono essere passati anche senza rispettare l'ordine

In [None]:
r = nomefunzione(111, 222, arg4=50, arg3=2)                   # assegnazione dei valori di ritorno ad una sola variabile (tupla): r = (val1, val2)

somma, differenza = nomefunzione(111, 222, arg4=50, arg3=2)   # assegnazione dei valori di ritorno a due variabili differenti (value unpack, spacchettamento della tupla)
somma, _ = nomefunzione(111, 222, arg4=50, arg3=2)            # segnaposto (placeholder) _ per le variabili di ritorno che non verranno utilizzate 

LAMBDA FUNCTIONS\
Le funzioni lambda sono funzioni rapide espresse in una singola linea

In [None]:
f = lambda a : a + 10                   # una sola variabile di input
f(100)                                  # chiamata della funzione, stampa 110

d = lambda a, b, c : b**2-4*a*c         # variabili multiple di input
d(4, 3, 5)                              # chiamata della funzione

MAP\
L'operatore `map(funzione, iter)` chiama la *funzione* passando in sequenza tutti gli elementi di un *iteratore* (lista, tupla, ...)\
La funzione può avere una struttura classica o può essere una lambda function

In [None]:
a = (1,2,3,4,5)                 
map(lambda x: x**2, a)

print(tuple(map(lambda x: x**2, a)))    # i singoli output dell'operatore MAP vanno inseriti in una struttura tupla, lista o set
                                        # restituisce (1,4,9,16,25)

####CLASSI

Python è un linguaggio Object Oriented, in cui le classi rappresentano gli oggetti principali.\
Una classe viene definita con il comando:

In [None]:
class nomeclasse:
  variabili           # attributi della classe
  funzioni            # metodi della classe

mentre per creare l'istanza di una classe ed accedere ai suoi metodi e alle sue variabili:

In [None]:
x = nomeclasse()      # creazione di una nuova istanza della classe
x.variabile           # accesso agli attributi della classe         
x.funzione            # accesso alle funzioni della classe

In generale ogni classe contiene il metodo costruttore `__init__()` che viene eseguito alla sua creazione e può contenere parametri di input:

In [None]:
class myclass:
  def __init__(self, arg1, arg2):     # il parametro self permette di accedere a tutte le proprietà dall'interno della classe
    self.arg1 = arg1
    self.arg2 = arg2
  def func1(self):
    print(self.arg1 + self.arg2)
  def func2(self):
    print(self.arg1 - self.arg2)

x = myclass(10, 20)                   # istanza, prende in ingresso i parametri richiesti dal costruttore
x.func1()                             # stampa 30

SUBCLASS\
Una sottoclasse è una classe che viene definita ereditando metodi e proprietà di una classe parent (ereditarietà).\
In questo caso `mysubclass` eredita da `myclass` la sola funzione `func2`, poichè `func1` viene ridefinita, assieme ad un nuovo costruttore e due nuove funzioni (`func3` e `func4`)

In [None]:
class mysubclass(myclass):
  def __init__(self, arg1, arg2, arg3):
    self.arg1 = arg1
    self.arg2 = arg2
    self.__arg3 = arg3            # un attributo con due trattini bassi prima del nome è privato e non può essere usato all'esterno della classe
  def func1(self):                # un metodo di una sottoclasse con lo stesso nome di un metodo della classe parent sostituisce quest'ultimo (OVERRIDE)
    print(self.arg1 * self.arg2)
  def func3(self):                
    print(self.arg1 / self.arg2)
  def func4(self):
    return self.__arg3            # l'unico modo per ottenere un attributo privato è con una funzione apposita (getter)

y = mysubclass(10,20, 100)
y.func1()                         
y.func2()
y.func3()
y.func4()

il metodo `super()` specifica che il costruttore della subclass è identico a quello della classe parent, eventualmente con un diverso ordine degli input. In generale con `super()` si accede dalla subclass ai metodi e attributi della classe parent.

In [None]:
class mysubclass(myclass):
  def __init__(self, arg1, arg2):
    super().__init__(arg2, arg1)            # mysubclass ha lo stesso costruttore di myclass, ma passa i due argomenti in ordine inverso

z = mysubclass(1,2)

####MODULI E LIBRERIE

Un modulo Python è un file con estensione .py che contiene classi e funzioni aggiuntive rispetto a quelle di built-in.\
La *Python standard library* è una collezione di moduli base che viene installata assieme all'interprete Python; per conoscere la lista di funzioni standard consultare la [documentazione ufficiale](https://docs.python.org/3/library/)\
Un **package** (libreria) è un insieme di moduli organizzati gerarchicamente (module/submodule/...)\
Per utilizzare le funzionalità di un modulo o di un package installato, occorre importarlo:

In [None]:
import math                     # importa tutte le funzioni del package che possono essere chiamate con package.funzione()
print(math.log(100))

from math import log            # importa una specifica funzione che può essere chiamata con il solo nome
print(log(100))

from math import *              # importa tutte le funzioni del modulo che possono essere chiamata con il solo nome, (bad practice, può causare ambiguità tra funzioni con lo stesso nome)
print(log(100))

import numpy
from torch.nn import Linear     # importa una funzione/classe specifica da una libreria divisa in moduli e submoduli 
import os, sys, glob            # sono possibili import multipli sulla stessa linea

print(np.__version__)           # molte librerie restituiscono il numero di versione correntemente installata

`import as` permette di rinominare il package importato, per comodità nei successivi utilizzi:

In [None]:
import numpy as np
np.__version__                  # stampa il numero di versione installata

`dir` stampa la lista delle funzioni contenute nel package:

In [None]:
import math
dir(math)

Google Colab mette a disposizione una grande quantità di packages, oltre a quelli della Python Standard Library, assieme al gestore di pacchetti **pip** che possiamo utilizzare per installare i moduli non presenti, dal Python Package Index (PyPi)

In [None]:
!pip list                                     # elenca la lista dei pacchetti installati

!pip install somepackage                      # Installa somepackage
!pip install -q somepackage                   # -q (quiet) riduce gli output del terminale
!pip install somepackage==numeroversione      # Installa una specifica versione del pacchetto, se non specificato installa la più recente stabile
                                              # può essere utile se una funzione presenta un bug o per compatibilità con progetti datati

#### SYSTEM INTERACTIONS

Per sviluppare progetti di Machine Learning è necessario poter interagire con il filesystem della macchina che esegue il codice, principalmente per:
- caricare dataset personalizzati
- salvare dati di grandi dimensioni, come ad es. dataset pre-processati che richiedono notevoli tempi di calcolo
- salvare i progressi intermedi dell'addestramento della rete neurale, (*checkpoint*)
- salvare i progressi finali dell'addestramento e delle fasi di *validation* e *test*

La scrittura e la lettura di files viene eseguita con le funzioni della libreria standard.\
Inizialmente, che esista o meno, un file deve essere aperto con `f = open(nomefile, mode)`.\
*f* è il nome dell'istanza associato allo specifico file, che verrà usata per tutte le operazioni.   

In [None]:
f = open('abc.txt', 'w')      # nel filesystem colab il file viene memorizzato in /content (current working directory)
                    
# Modalità di apertura:
f = open('abc.txt', 'r')      # apre un file esistente in sola lettura
f = open('abc.txt', 'w')      # crea un nuovo file in sola scrittura, se esiste lo sovrascrive 
f = open('abc.txt', 'x')      # crea un nuovo file
f = open('abc.txt', 'a')      # crea un nuovo file in sola scrittura, se esiste appende il contenuto alla fine
f = open('abc.txt', 'w+')     # crea un nuovo file in lettura e scrittura, se esiste lo sovrascrive

Scrittura: (il file deve essere aperto in una modalità che consente la scrittura)\
Nei file possono essere scritti solamente dati di tipo *string*. Per integrare dati numerici si può utilizzare il casting o la formattazione di tipo *f-string* illustrata in precedenza:

In [None]:
cnt = 36
f.write('ciao\n')                        # scrive una stringa in una riga del file di testo e passa a capo riga            
f.write(f'Il valore di cnt è {cnt}')     # scrive la seconda riga di testo con la variabile numerica formattata in stringa

Lettura: (il file deve essere aperto in una modalità che consente la lettura)


In [None]:
r = f.read()                  # legge l'intero contenuto del file e lo mette in una variabile di tipo string
r = f.readline()              # legge una sola riga del file, per leggere la riga successiva ri-eseguire la funzione readline
r = f.readlines()             # legge l'intero contenuto del file e lo memorizza in una lista di variabili stringa

al termine delle operazioni su file (lettura o scrittura) è opportuno chiudere l'istanza con  il comando:

In [None]:
f.close()

è comodo utilizzare lo statement `with-as` per racchiudere tutte le operazioni su un file e chiuderlo automaticamente al termine:

In [None]:
with open('abc.txt', 'w') as f:
    f.write('ciao\n')
    ...                                   # chiusura automatica del file al termine del blocco delle operazioni

Le precedenti istruzioni eseguite in Colab salvano il file nel disco della VM; per accedere allo spazio disco del proprio Google Drive occorre prima montare il punto di accesso: (probabilmente verrà mostrata una procedura con la quale si chiede di autorizzare Colab ad accedere al proprio Drive):


In [None]:
from google.colab import drive
drive.mount('/content/drive')

f = open('/drive/abc.txt', 'w')   # il file viene creato nella root directory del proprio drive

OS\
Il modulo OS mette a disposizione numerose funzioni di interazione con il filesystem, sia Windows, Linux o MAC. Di seguito sono riportate alcune delle funzioni più utili:

In [None]:
import os

os.getcwd()                           # get current working directory: stampa il nome della directory di lavoro corrente
os.chdir('/new_work')                 # cambia la directory di lavoro corrente
os.mkdir('new_folder')                # crea una nuova directory
os.rmdir('old_folder')                # rimuove una directory
os.listdir('/content/sample_data')    # elenca il contenuto di una directory: files e altre directory
os.remove('abc.txt')                  # rimuove un file
os.rename('abc.txt', 'def.txt')       # rinomina un file o una directory

In [None]:
import os.path as osp

osp.exists('path/filename.ext')         # verifica se un file esiste, restituisce True o False
osp.isdir('path')                       # verifica se una directory esiste, restituisce True o False
osp.split('/dir1/dir2/.../file.ext')    # separa il nome file dal percorso e restituisce una tupla (percorso,nomefile)
osp.join('dir', 'file.ext')             # unisce le due stringhe in un unico path con il separatore di sistema (slash o backslash a seconda del s.o.)

####NUMPY
Numpy è una delle librerie Python per il calcolo scientifico più utilizzate. La struttura dati principale fornita da Numpy prende il nome di *n-dimensional array* (*ndarray*) e può contenere solo valori numerici, tutti dello stesso tipo.

Le dimensioni di un *ndarray* vengono chiamate *assi*  e sono rappresentate da una tupla di valori interi.

In [None]:
import numpy as np

a = np.array([1,2,3,4])             # crea un array ad 1 dimensione, con 4 elementi
print(a.shape)                      # Stampa una tupla di n valori che rappresentano il numero di elementi per ogni asse, in questo caso (4,)

a = np.array([[1,2,3,4]])           # crea un array a 2 dimensioni, con gli stessi 4 elementi del precedente
print(a.shape)                      # stampa (1,4)

anche se i due array precedenti contengono gli stessi elementi, essi hanno dimensioni differenti ed ammettono operazioni differenti.

In [None]:
a = np.array([[1],[2],[3],[4]])     # crea un array a 2 dimensioni, con gli stessi 4 elementi del precedente disposti lungo  il secondo asse
print(a.shape)                      # stampa (4,1)

a = np.array([1],[2],[3],[4])       # errore di sintassi

i valori di un array numpy sono accessibili con le stesse regole di slicing delle liste e delle tuple, e sono **modificabili**

In [None]:
a = np.array([1,2,3,4,5,6,7,8,9])             # cambia un elemento di un array monodimensionale
a[0] = 999
print(a)

In [None]:
a = np.array([[1,2,3,4,5,6,7,8,9]])           # cambia un elemento di un array 2-dimensioni
a[0,1] = 999                                  # devo specificare la posizione dell'elemento da cambiare, con tutti gli indici di asse in ordine
print(a)

anche se l'array ha 2 dimensioni, specificarne una sola non genera errore. Questa operazione è detta *broadcasting* ed in generale permette di ripetere lo stesso comando per tutti gli elementi lungo la dimensione non specificata:

In [None]:
a = np.array([[1,2,3,4,5,6,7,8,9]])           # cambia tutti gli elementi nell'asse 0
a[0] = 999                                    # broadcasting
print(a)

In [None]:
a = np.array([[1,2,3,4,5,6,7,8,9]])           # cambia tutti gli elementi nell'asse 0
a[0,:] = 999                                  # stesso risultato del precedente blocco. l'indice ":" significa "tutti gli elementi"
print(a)

In [None]:
a = np.array([[1,2,3,4,5,6,7,8,9]])           # cambia gli elementi dell'asse 0, nella posizione da 1 a 4 (escluso)
a[0,1:4] = 999                                
print(a)

Gli attributi più importanti per un *ndarray* sono:

In [None]:
a.ndim                          # restituisce il numero di dimensioni o assi dell'array
a.shape                         # restituisce una tupla con il numero di elementi per ogni asse
a.size                          # restituisce la dimensione globale (equivale al prodotto di tutte le dimensioni fornie da shape)
a.dtype                         # restituisce il tipo degli elementi contenuti nell'array

Alcune funzioni consentono di creare velocemente array di particolare utilità:

In [None]:
a = np.zeros((2,2))               # crea un array di dimensione (2,2) con tutti 0
b = np.ones((1,2,3))              # crea un array di dimensione (1,2,3) con tutti 1
c = np.full((2,2), 7)             # crea un array di dimensione (2,2) con tutti valori costanti (7)
d = np.eye(2)                     # crea una matrice identità 2x2
e = np.random.random((2,2))       # crea un array di dimensione (2,2) con valori random
f = np.arange(10)                 # crea un array 1d con una sequenza di 10 valori (partendo da 0)
g = np.arange(2, 20, 2)           # crea un array 1d con una sequenza di valori da 2 a 20 (escluso) e passo 2
h = np.linspace(0, 10, 5)         # crea un array 1d con 5 valori equispaziati da 0 a 10 (incluso)

Sebbene gli array bidimensionali rappresentino delle matrici, numpy definisce il particolare tipo di dato `matrix`, che raccomanda di utilizzare per le operazioni tra matrici.

In [None]:
a = np.array([[1,2],[3,4]])       # array
m = np.matrix('1 2 ; 3 4')        # matrice
a_m = np.matrix(a)                # matrice definita da un array


Alcuni degli operatori applicabili ad array 1D, 2D o dati di tipo `matrix` sono riportati di seguito (non operano in-place ma restituiscono un nuovo array come risultato):

In [None]:
np.add(a,b)                       # somma due scalari, due vettori o due matrici element-wise
np.subtract(a,b)                  # sottrae due scalari, due vettori o due matrici element-wise
np.multiply(a,b)                  # moltiplica due scalari, due vettori o due matrici element-wise
np.divide(a,b)                    # divide due scalari, due vettori o due matrici element-wise
np.power(a,2)                     # eleva a potenza uno scalari, un vettore o una matrice element-wise
np.mod(a,b)                       # fornisce il resto della divisione tra due scalari, due vettori o due matrici element-wise

np.inner(a,b)                     # prodotto scalare tra due vettori
np.dot(a,b)                       # moltiplicazione tra matrici (con dimensioni opportune)
np.transpose(a)                   # trasposizione
np.trace(a)                       # traccia della matrice 2D
np.linalg.matrix_rank(a)          # rango
np.linalg.det(a)                  # determinante
np.linalg.inv(a)                  # matrice inversa (solo se determinante != 0)
np.linalg.pinv(a)                 # matrice pseudoinversa (se determinante = 0)
np.linalg.eig(a)                  # autovalori e autovettori della matrice 
linalg.solve(a, b)                # risoluzione del sistema lineare ax = b
np.linalg.svd(a)                  # singular value decomposition, restituisce la tupla (U,Sigma,V)

Un *ndarray* viene trattato come **iterable** lungo il suo primo asse (asse 0), o attraverso tutti gli elementi, utilizzando l'attributo `flat`:

In [None]:
a = np.array([[1,2,3],[4,5,6],[7,8,9]])

for r in a:
  print(r)                # stampa [1 2 3] [4 5 6] [7 8 9]

for r in a.flat:          # stampa 1 2 3 4 5 6 7 8 9
  print(r)

Un array Numpy può essere copiato con tre procedure, che producono tre differenti "livelli" di copia.\
Semplice assegnazione: `b` e `a` sono due nomi per lo stesso array. Qualsiasi modifica su uno dei due si rispecchia nell'altro.

In [None]:
b = a

View: `a` e `b` condividono i valori ma non la dimensione. Cambiando i valori di uno dei due, viene modificato anche l'altro, ma ridimensionando uno dei due l'altro resta invariato.

In [None]:
b = a.view()

Copy: `a` e `b` sono due array inizialmente identici ma completamente scollegati, qualsiasi modifica su uno non si rispecchia nell'altro.

In [None]:
b = a.copy()

Il ridimensionamento di un array numpy consiste nel variare il numero di assi e/o elementi per asse, mantenendo inalterata la quantità di elementi totali.
- la funzione `reshape()` restituisce un nuovo array con la dimensione voluta, lasciando inalterata quella dell'array di origine.
- la funzione `resize()` opera in-place modificando la dimensione dell'array di origine.
- le funzioni `squeeze()` ed `expand_dims()` rispettivamente eliminano ed aggiungono un nuovo asse di dimensione 1

In [None]:
a = np.random.random((2,3,4))         # array iniziale di dimensioni (2,3,4) con 24 elementi
b = a.reshape(6,2,2)                  # 6x2x2 = 24 elementi, a rimane invariato
c = a.reshape(4,6)                    # 4x6 = 24 elementi, a rimane invariato
d = a.reshape(2,2,2,3)                # 2x2x2x3 = 24 elementi, a rimane invariato
e = a.reshape(24)                     # 24 elementi, a rimane invariato

a.resize((4,3,2))                     # nuova dimensione per a

In [None]:
x = np.array([[[0], [1], [2]]])       # array di dimensioni (1,3,1)
x = np.squeeze(x)                     # toglie il primo asse: ora x ha dimensioni (3,1)
x = np.expand_dims(x, axis=2)         # aggiunge un nuovo asse in posizione 2, ora x ha dimensioni (3,1,1)

####MATPLOTLIB

Matplotlib è una libreria grafica multipiattaforma che consente di visualizzare il contenuto di numerosi tipi di variabili Python; principalmente gli array Numpy, ma anche liste, tuple, tensori Tensorflow e Pytorch.\
Le modalità di utilizzo delle funzioni Matplotlib sono due: un'interfaccia stile Matlab, più semplice, a cui si farà riferimento nel seguito; e un'interfaccia object oriented più ricca di funzioni.

Di seguito vengono mostrate le funzioni base per la creazione e visualizzazione di grafici, scatter plot, istogrammi a barre e immagini.

L'import del pakage avviene solitamente rinominando il riferimento in `plt`\
Per incorporare gli elementi grafici nell'output delle celle di un notebook è conveniente usare la direttiva `inline`, negli script questa direttiva non è necessaria ma deve essere sostituita dalla chiamata alla funzione `show()`

In [None]:
import matplotlib.pyplot as plt
%matplotlib inline

In [None]:
import numpy as np
x = np.linspace(0, 10, 100)
y1 = np.sin(x)
y2 = np.cos(x)
y3 = np.sin(2*x)
y4 = list(np.exp(x))

chiamando semplicemente la funzione plot i dati vengono visualizzati sulla stessa figura, con colori e stili differenti che si possono personalizzare.\
Come in MATLAB l'array della variabile indipendente x può essere omesso:

In [None]:
plt.plot(x, y1);                # il ; al termine del comando sopprime eventuali output di testo specifici di matplotlib
plt.plot(x, y2, '--');          # cambia lo stile del tratteggio
plt.plot(x, y3, 'r');           # cambia il colore della linea

per creare più figure distinte, separare ogni `plot` con la chiamata `plt.figure()`:

In [None]:
plt.plot(x, y1);
plt.figure();
plt.plot(x, y2, '--');
plt.figure();
plt.plot(x, y3, 'r');

Gli attributi (colori, tratteggi, markers..) possono essere definiti singolarmente in sostituzione di quelli di default:

In [None]:
plt.plot(x, y4, color='green', marker='o', linestyle='dashed',linewidth=2, markersize=6);

In alternativa si possono applicare pacchetti di stili con i seguenti comandi:

In [None]:
plt.style.use('classic')
plt.style.use('fivethirtyeight')
plt.style.use('ggplot')
plt.style.use('bmh')
plt.style.use('dark_background')
plt.style.use('grayscale')

per salvare l'immagine occorre creare la figura e mantenere l'oggetto ritornato:

In [None]:
my_fig = plt.figure()
# plot
my_fig.savefig('my_figure.png')             # salva nel path specificato o nella current working directory

Il meccanismo dei subplot è analogo a quello di Matlab:\
Con la funzione `subplot(righe, colonne, numero)` si specifica l'area di plot corrente (*numero*), in una griglia di (*righe* x *colonne*) figure.\
Ad esempio, due grafici sovrapposti verticalmente:

In [None]:
plt.figure()
plt.subplot(2, 1, 1)
plt.plot(y1)
plt.subplot(2, 1, 2)
plt.plot(y2);

o due grafici affiancati:

In [None]:
plt.figure(figsize=(15,4))            # con figsize specifico la dimensione dell'immagine, in pollici
plt.subplot(1, 2, 1)
plt.plot(y1)
plt.subplot(1, 2, 2)
plt.plot(y2);

Funzioni per gestire la visualizzazione degli assi:

In [None]:
plt.xlim(-1, 11)                      # limiti asse orizzontale
plt.ylim(-1.5, 1.5)                   # limiti asse verticale
plt.axis([-1, 11, -1.5, 1.5])         # limiti su tutti gli assi (funzione alternativa alle due precedenti)
plt.axis('tight')                     # adatta gli assi ai limiti della curva
plt.axis('equal')                     # applica la stessa scala ad entrambi gli assi 

Inserimento delle etichette degli assi e del titolo:

In [None]:
plt.title('My Plot')
plt.xlabel('time (s)')
plt.ylabel('amplitude')

per inserire una legenda in un'immagine con uno o più curve occorre specificare per ognuna la propria etichetta:

In [None]:
plt.plot(y1, label='sin(x)')
plt.plot(y4, label='exp(x)')
plt.legend(loc='upper left');               # posso specificare anche la posizione, in modo che non si sovrapponga al disegno

Scatter Plot\
Gli scatter plot sono rappresentazioni bidimensionali di coppie di valori (in questo caso i valori rappresentano le coordinate del punto in un piano cartesiano) o triplette di valori (in questo caso il terzo valore può essere rappresentato con una caratteristica grafica come una scala di colori o un marker di dimensioni proporzionali):

In [None]:
# creazione di 100 campioni (x,y,v) interi random
x = np.random.randint(-10,10,100)
y = np.random.randint(-10,10,100)
v = np.random.randint(0,100,100)

plt.scatter(x, y, c=v, s=10*v, alpha=0.5)           # associo sia il colore (c) che la dimensione del punto (s) al valore di v
plt.colorbar();                                     # mostra la barra di colori

Istogrammi\
Gli istogrammi consentono di rappresentare la distribuzione di un insieme di dati numerici suddivisi in classi.\
Il comando base per creare un istogramma è il seguente:

In [None]:
# creazione di 1000 campioni random che seguono una statistica gaussiana standard (media nulla e varianza unitaria)
data = np.random.randn(1000)            
plt.hist(data);

tuttavia è spesso necessario controllare alcuni parametri, come il numero di classi visualizzate (bins), oppure il tipo di rappresentazione: densità di probabilità o funzione cumulativa:

In [None]:
plt.figure(figsize=(15,4))
plt.subplot(1,3,1)
plt.hist(data, bins=40)                        # frequenza assoluta
plt.title('histogram')                       
plt.subplot(1,3,2)
plt.hist(data, bins=40, density=True)          # frequenza relativa
plt.title('discrete PDF')
plt.subplot(1,3,3)
plt.hist(data, bins=40, cumulative=True)       # frequenza cumulata
plt.title('discrete CDF');

è possibile rappresentare due o più serie di dati su un unico piano, a condizione che rappresentino lo stesso tipo di frequenza:

In [None]:
# creazione di 1000 campioni random che seguono una statistica gaussiana a media e varianza definite
x1 = np.random.normal(0, 0.5, 1000) 
x2 = np.random.normal(-2, 1, 1000)
x3 = np.random.normal(3, 3, 1000)

plt.hist(x1, alpha=0.6, density=True, bins=40)          # alpha imposta la trasparenza del colore, utile in caso di regioni sovrapposte
plt.hist(x2, alpha=0.6, density=True, bins=40)
plt.hist(x3, alpha=0.6, density=True, bins=40);

Infine, per visualizzare un array bi-dimensionale, come ad esempio una funzione a 2 variabili, o un'immagine:

In [None]:
x = y = np.arange(-3.0, 3.0, 0.1)                   # definisco i due vettori delle variabili indipendenti x e y
X, Y = np.meshgrid(x, y)                            # creo una griglia bidimensionale
Z = np.sin(X)*np.cos(Y)                             # variabile dipendente

import matplotlib.image as mpimg            
img = mpimg.imread('python.jpg')                    # carico l'immagine da disco

In [None]:
plt.imshow(Z, origin='lower');                      # se non diversamente specificato il plot posiziona l'origine degli assi in alto a sinistra

In [None]:
plt.figure(figsize=(15,8))
plt.subplot(2,3,1)
plt.imshow(img)                                 # se l'immagine ha 3 canali viene applicata la mappatura colori RGB
plt.subplot(2,3,2)
plt.imshow(img[:,:,0])                          # visualizzando un solo canale viene applicata la mappa colori standard
plt.subplot(2,3,3)
plt.imshow(img[:,:,0], cmap='Greys_r')          # un canale visualizzato in scala di grigi
plt.subplot(2,3,4)
plt.imshow(img[:,:,0], cmap='Reds_r')           # primo canale visualizzato in scala di rossi
plt.subplot(2,3,5)
plt.imshow(img[:,:,1], cmap='Greens_r');        # secondo canale visualizzato in scala di verdi
plt.subplot(2,3,6)
plt.imshow(img[:,:,2], cmap='Blues_r');         # terzo canale visualizzato in scala di blu



---
06/04/2022
Aironi Carlo


c.aironi@pm.univpm.it
