# Introduzione a Python

Python è un linguaggo interpretato, generalista, orientato agli oggetti che viene molto utilizzato al giorno d'oggi per l'analisi dei dati ed le applicazioni di Machine Learning.

In questa breve introduzione si farà riferimento principalmente alle seguenti fonti:

- Il testo di Kenneth A. Lambert [Programmazione in Python](http://www.apogeoeducation.com/programmazione-in-python.html) disponibile su tutti gli store di libri
- Il sito [RealPython](https://realpython.com/) che contiene molti tutorial di livello base e avanzato
- Il portale della [documentazione ufficiale di Python 3](https://docs.python.org/3/)

Ecco un esempio di primo programma Python, `hello.py`:

```python
#!/usr/bin/env python

# import modules used here -- sys is a very standard one
import sys

# Gather our code in a main() function
def main():
    print ('Hello there', sys.argv[1])
    # Command line args are in sys.argv[1], sys.argv[2] ...
    # sys.argv[0] is the script name itself and can be ignored

# Standard boilerplate to call the main() function to begin
# the program.
if __name__ == '__main__':
    main()
```
Eseguiamolo:

In [1]:
%cd "Python programming"
%run hello.py Peppino

/Users/pirrone/src/github repositories/Big-Data/Python programming
Hello Peppino


Un programma Python standalone va eseguito con l'indicazione dell'interprete da usare e cioè `#!/usr/bin/env python` che invoca l'interprete predefinito nell'ambiente dell'utente.

I commenti si inseriscono con:
```python
# questo è un commento
'''
Questo è un commento
su più linee
'''
```

`import` è la direttiva di importazione di moduli realizzati dall'utente ovvero di moduli di libreria. I moduli più comuni di libreria sono:
- `sys`: utility di sistema, gestione dello standard input/output, `exit()`, lista degli argomenti di input `argv` etc.
- `os`: accesso al sistema operativo, esecuzione di comandi di shell, variabili di ambiente etc.
- `re`: espressioni regolari
- `math`: libreria matematica


```python
import <modulo>  # importa l'intero modulo <modulo> che farà da riferimento ai suoi metodi e classi interne     
import <package>.<modulo> [as <nome>] # importa solamente <package>.<modulo> e, se usa il nome <nome>, ne fa il binding nell'ambiente                
from <modulo> import <proprietà> [as <nome>] # importa solamente <proprietà>, eventualmente con il nome <nome>, e ne fa sempre il binding nell'ambiente
```

Python utilizza `def` come istruzione per creare funzioni definite dall'utente:
```python
def <nomefunzione>(<argomenti>):
    istruzione
    istruzione
    ...
```
L'indentazione con il tasto `TAB` è ***fondamentale*** in Python perché non ci sono parentesi ad individuare gli _scope_ o ambiti di visibilità. Si entra in uno scope con il simbolo `:` e le istruzioni del blocco sono tutte ad un livello di indentazione più rientrato rispetto alla istruzione che controllas il blocco (dichiarazione di funzione o istruzione di controllo del flusso). Non si usa il ";" a fine istruzione. Appena si toglie l'indentazione si esce dal blocco.

La funzione `main()` costituisce il programma principale, ma la sua esecuzione è legata al codice:
```python
if __name__ == '__main__':
    main()
```

`__name__` è una delle _variabli speciali_ di Python che è legata alla costruzione dei moduli. In particolare essa contiene il nome del modulo. Tale nome viene impostato automaticamente a `__main__` quando il modulo viene eseguito interattivamente e quindi è connesso allo standard input e output. Di conseguenza usiamo questa istruzione come punto di accesso al nostro programma principale che eseguirà tutte le altre funzioni definite all'interno del nostro codice.

Il nostro programma principale:

```python
def main():
    print ('Hello there', sys.argv[1])
```
richiama la funzione built-in `print()`per l'output eventualmente formattato di una sequenza di oggetti, nel nostro caso una stringa e il _secondo_ elemento della lista `sys.argv` che contiene gli argomenti passati dalla linea di comando, il primo essendo il nome del comando stesso. Le liste in Python si accedono con la notazione array ed indice che parte da 0, ma ***non sono*** array numerici bensì sequenze di oggetti i quali possono essere anche numeri.

## Informazioni e documentazione on line
Da console interattiva la funzione `help()` fornisce la descrizione del modulo/classe/oggetto/metodo richiesto come argomento, mentre `dir()` fornisce l'elenco dei _simboli_ o _attributi_ in questo definiti. Un modo semplice di ottenere la lista degli attributi di un oggetto è anche quello di usare il tasto `TAB` dopo aver digitato il punto.

In [None]:
import sys

help('pippo'.capitalize)

help(sys)

dir(sys)

## Tipi di dati e variabili

Qualunque dato è un oggetto in Python.

In [3]:
print(type(5))

a=3.56

print(a.__class__)
isinstance('pippo',str)

<class 'int'>
<class 'float'>


True

I tipi di dati principali sono:
- Interi
    - tipicamente implementati in 32 bit, ma con rappresentazione interna dipendente dall'architettura, si possono convertire da altre rappresentazioni con la funzione built-in `int()` ed accettano anche la forma esadecimale e ottale: ```21, 0x15, 0o25``` rispettivamente ottenibili tramite `hex()` e `oct()` rispettivamente.
- Reali
    - si possono ottenere con la funzione built-in `float()` con range tipico $[-10^{308},\ 10^{308}]$; letterali tipici sono, per esempio ```-3.456``` oppure in notazione scientifica ```-3.456e-7```
- Numeri complessi
    - si possono ottenere con la funzione built-in `complex()` e il letterale ha la forma del tipo `1.2±3.4j`
- Booleani
    - sono legati alle espressioni logiche ed agli operatori relazionali ed hanno i soli valori `True` e `False`
- Caratteri
    - si ottengono con `chr()`applicato alla codifica ASCII o Unicode e di converso `ord()` restituisce il codice del carattere; il letterale è racchiuso da apici singoli `'f'`
- Stringhe
    - si ottengono con `str()` e possono essere racchiuse da apici singoli o doppi; si possono accedere tramite notazione array ed usano la funzione built-in `len()` per ottenere la lunghezza.


In [4]:
print(str(len('Pippo'))+'\n'+"mamma"[2]+'\n'+'pluto'[-1]+'\n'+'paperino'[1:5])

5
m
o
aper


In Python sono in uso i caratteri di _escape_ `\n, \t, \b, \\, \', \"` e l'operatore `+` è sovraccaricato del significato di concatenazione tra _sole_ stringhe.
 
Le stringhe, ma anche le liste e le tuple, che vedremo in seguito, possono essere accedute usando la notazione slice `[start:stop:step]` che è l'equivalente di creare un oggetto con `slice(start:stop:step)`. La posizione `stop` è esclusa dallo slicing per cui si arriva a `stop - 1`. Sussiste una seconda indicizzazione a partire da `-1` per valori negativi che riferisce la stringa (tupla o lista) dall'ultima posizione fino alla prima.

![Indicizzazione in Python](https://developers.google.com/edu/python/images/hello.png)

_Fonte: [Google Python Class](https://developers.google.com/edu/python/strings)_

In [1]:
print("paperino"[-2])
print("paperino"[::2])
print("paperino"[1::2])
print("pluto"[::-1])

n
pprn
aeio
otulp


Per completezza si riporta la lista delle [funzioni built-in](https://docs.python.org/3/library/functions.html).


### Convenzioni sui nomi

- moduli e metodi: minuscole eventualmente con underscore `nome_mio_modulo`
- classi e variabili che contengono tipi: iniziali maiuscole `MiaClasse`
- funzioni e variabili: stile "mixedCase" `miaFunzione`
- costanti: tutte maiuscole con eventuale underscore `MIA_COSTANTE`

### Uso del carattere underscore
 - Underscore singolo iniziale (`_mio_modulo`) si utilizza per moduli/metodi/classi _private_ nel senso che non vengono importati utilizzando `import *`, ma non sono privati nel senso tipico della OOP
 - Underscore singolo finale (`mia_funzione_`) è solo una convenzione per evitare confusione con parole riservate del linguaggio.
 - Doppio underscore iniziale (`__mio_metodo`) è una sintassi per il cosiddetto _mangling_ dei metodi; all'interno di `Classe` il nome del metodo viene modificato dall'interprete in `_Classe__mio_metodo` per cui è di fatto privato, ma si tratta di un meccanismo di oscuramento di nomi di metodi per evitare confusione con metodi con lo stesso nome di possibili sottoclassi.
 - Doppio underscore iniziale e finale (`__magic__`) è riservato a una serie di nomi di metodi e variabili che hanno funzioni predefinite e rilevanti in Python e non dev'essere usato dagli utenti. Ad esempio:
    - `__init__` è il metodo di inizializzazione di una classe, di fatto il costruttore
    - `__eq__` è invocato internamente da Python su due oggetti quando si richiama l'operatore `==`
    - `__len__` analogamente quando si utilizza `len()`
    - `__file__` contiene il nome del file che stiamo utilizzando.


## Operatori
    
![Tabella di precedenza ed associatività degli operatori Python](https://www.miltonmarketing.com/wp-content/uploads/2018/04/Python-Operators-Precedence.jpg)

_Fonte: [MiltonMarketing.com](https://www.miltonmarketing.com/coding/python/python-basic-operators/8/)_