# Installazione e configurazione dell'ambiente Python

Il linguaggio Python è un linguaggio orientato agli oggetti molto versatile ed orientato alle applicazioni di _Data Science_ e _Machine Learning_. Storicamente si è evoluto in due versioni, Python 2 e Python 3, le quali hanno leggere differenze di sintassi, ma sono entrqmbe ancora supportate per motivi di compatibilità con i pacchetti software costruiti su tale linguaggio. Nel nostro corso adotteremo Python 3 per cui le istruzioni seguenti valgono per questo linguaggio.

## Installazione

Python si installa in maniera differente per i diversi sistemi operativi, ma la distribuzione segue fondamentalmente i canoni di un pacchetto Linux.

- **Windows**: 
    - Scaricare la versione di Python 3 più recente dal [sito di Python](https://www.python.org/downloads/windows/)
    - Estrarre il pacchetto ed eseguire l'installer, facendo attenzione ad attivare le caselle di spunta che chiedono di aggiungere la cartella che contiene l'eseguibile al `PATH` di sistema e di installare Python per tutti gli utenti
    - La distribuzione si troverà di default in `C:\Users\[username]\AppData\Local\Programs\Python\Python37` e già al suo interno si troverà il gestore di pacchetti `pip`

- **Linux**:
    - Utlizzare `apt` come utente amministratore e digitare:
    ```
    sudo apt update
    sudo apt install python3 python3-pip
    ```
    ovviamente verranno installate diverse dipendenze che dovranno essere accettate
- **MacOS**:
    - Installare il gestore di pacchetti `brew` dal suo repository `Git`, ove non sia già installato:
    ```
    /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
   ```
    - Installare `python` con `pip` e `setuptools` digitando:
```
brew install python
```
Il pacchetto `python` si riferisce direttamente a Python 3; per l'installazione di Python 2 usare `brew install python2`.

### Breve nota su `brew` per MacOS  

`brew` è un potente gestore di pacchetti Linux, in generale non direttamente disponibili per MacOS, il quale gestisce una propria struttura di cartelle, ma installa dei link simbolici alle applicazioni e/o librerie in `/usr/local`, cioè all'interno del `PATH` di sistema: ciò è comodo per le applicazioni che utilizzano tali pacchetti. 

    Alcuni comandi di base:
    - `brew install <nome_pacchetto>` installa il pacchetto
    - `brew search <nome_pacchetto>` ricerca informazioni sul pacchetto

    Per approfondimenti si consulti il [sito di brew](https://brew.sh/)

## Utilizzo dell'ambiente Python

L'ambiente Python così installato consente di eseguire script Python in forma interattiva da terminale digitando:
```
$ python <nome_script>.py [argomenti]
```
In alternativa si può accedere alla console interattiva digitando semplicemente il comando `python` alprompt e ricevendo una risposta del tipo:
```
Python 3.7.3 | packaged by conda-forge | (default, Jul  1 2019, 14:38:56) 
[Clang 4.0.1 (tags/RELEASE_401/final)] :: Anaconda, Inc. on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>> 
```
Nella console interattiva è possibile scrivere ed eseguire singoli comandi o interi script
```
>>> 3+2
5
>>> a=3
>>> a+5
8
>>> w=a**3
>>> print(w)
27
>>> x=[1,2,3]
>>> print(x)
>>> [1,2,3]
>>> def raiseToPower(x,y):
...     res = []
...     for i in x:
...             res.append(i**y)
...     return res
... 
>>> raiseToPower([3,4,5],2)
[9, 16, 25]
>>> 
```
L'ambiente è completato dal gestore di pacchetti `pip` che utilizza il repository [Python Package Index (PyPI)](https://pypi.org/). Di seguito alcuni comandi di base per l'utilizzo di `pip`:

- `pip install <nomepacchetto>[version_expr]` installa il pacchetto richiesto alla versione che risulta dalla valutazione di `version_expr`; se quest'ultima non è presente, viene installata l'ultima versione, altrimenti alcune possibilità sono
    - `==X.Y.Z` installa la versione X.Y.Z
    - `>=X.Y.Z` installa una versione superiore o uguale a X.Y.Z
    - `>=X.Y.Z,<T`installa una versione superiore o uguale a X.Y.Z, ma comunque inferiore a T
    - `~==X.Y.Z` installa una verisone X.Y.* e superiore o uguale a X.Y.Z
- `pip install --upgrade <nomepacchetto>` aggiorna il pacchetto
- `pip uninstall <nomepacchetto>` disinstalla il pacchetto
- `pip list [opzioni]` elenca i pacchetti installati; tra le opzioni possibili ci sono: `--outdated --uptodate` 
- `pip show [-f|--files] <nomepacchetto> ...` mostra le informazioni su un pacchetto installato ed eventualmente i file che lo compongono
- `pip search <query>` ricerca nel repository tutti i pacchetti che contengono `<query>` nel nome.

L'altra caratteristica importante dell'ambiente Python è l'uso dei _virtual environment_ e cioè ambienti di esecuzione separati per ogni progetto software, con interprete Python e pacchetti installati differenti. Il sistema dei virtual environment gestisce l'insieme dei pacchetti installati per l'intero sistema creando una struttura di cartelle e di alias differenziati per ogni ambiente. Ad ogni modo è possibile installare nuovi pacchetti diversi per un virtual environment che non si ritroveranno negli altri.
 
L'installazione si esguirà con `pip`:
 ```bash
$ pip install virtualenv
```

Un virtual environment si crea con:
```bash
$ virtualenv ENV
```

ciò crea tutta la struttura di cartelle al di sotto della cartella `ENV`:
- `bin`
- `lib`
- `include`
- `lib/pythonX.Y/site-packages`

installa `python`, `pip` e `setuptools`. Il virtual environment si attiva con:
```bash
$ source /percorso/di/ENV/bin/activate
```
In questo modo il percorso verso la cartella `bin` dell'ambiente viene aggiunto in cima al `PATH` di sistema. Il virtual environment si disattiva semplicemente con:
```bash
$ deactivate
```

### Conda
In genere i progetti Python richiedono l'installazione di moltissimi pacchetti per gestirne le funzionalità. Ciò è oarticolarmente vero per i progetti legati al Machine Learning ed alla Data Science. L'uso di `virtualenv` comporta che l'utente debba installare ex novo tutti i pacchetti che gli servono ogni volta che crea un nuovo ambiente. `conda` risolve questo tipo di problemi perché integra un ambiente virtuale con un gestore di pacchetti. `conda` può essere ottenuto tramite due distribuzioni: Anaconda e Miniconda. Nek seguito faremo riferimento ad Anaconda perché offre già l'installazione di un virtual environment completo di tutti i pacchetti necessari per i nostri scopi.

Anaconda va installato appositamente dal sito di riferimento per [Widows](https://www.anaconda.com/distribution/#windows), [Linux](https://www.anaconda.com/distribution/#linux) e [MacOS](https://www.anaconda.com/distribution/#macos) ed è possibile scegliere la versione per Python 3 o Python 2. Utilizzeremo la versione per Python 3. Una volta installato, viene creato subito un ambiente virtuale denominato `base` in cui si trovano `python`, `pip`, `numpy`, `scipy` e tutte gli altri principali pacchetti necessari. Anche in questo caso il percorso per raggiungere gli eseguibili, che è del tipo `/percorso/verso/anaconda3/bin:/percorso/verso/anaconda3/condabin`, viene inserito in testa al `PATH` di sistema e all'interno della cartella `anaconda3` si crea una struttura di cartelle analoga a quella di `virtualenv`. In particolare `/percorso/verso/anaconda3/condabin` contiene esplicitamente il comando `conda`. La struttura dei comandi di `conda` è del tipo: `conda <comando> <opzioni specifiche del comando>``

Di seguito alcuni comandi di base:
- `conda create --name <env> [pacchetto_richiesto ...]` crea l'ambiente `<env>` con la sua struttura di cartelle a partire da `/percorso/verso/anaconda3/envs/<env>` e, se sono stati specificati dei pacchetti, calcola le dipendenze e installa tutto ciò che è necessario per quel pacchetto; tipicamente in questi casi si imposta l'unterprete Python voluto per l'ambiente virtuale.
- `conda activate <env>` attiva l'ambiente, rimuove il percorso vergo gli eseguibili dell'ambiente `base` e inserisce in testa al `PATH` di sistema la cartella `/percorso/verso/anaconda3/envs/<env>/bin` con gli eseguibili di `<env>`.
- `conda deactivate` disattiva l'ambiente corrente.
- `conda info --envs` oppure `conda list envs` riporta l'elenco degli ambienti installati e segna con un '*' quello attivo.
- `conda list` fornisce l'elenco dei pacchetti installati nell'ambiente attivo


`conda` consente di gestire diversi ***canali*** di installazione dei pacchetti e cioè differenti repository. In automatico è presente il canale `defaults` già corrispondente al repository di Anaconda per il sistema operativo utilizzato, ma molti pacchetti di nostro interesse si trovano su un altro canale generalista denominato `conda-forge`. Per cui  di seguito si riportano le istruzioni per installare un altro canale, renderlo il primo utilizzabile e installare i pacchetti dal canale prescelto:

- `conda config add <nome_canale>` aggiunge un nuovo canale in testa alla lista dei canali e lo rende automaticamente quello a più elevata priorità di consultazione per installare i pacchetti.
- `conda install [-n | --name <env>] [-c | --channel <nome_canale>] pacchetto [pacchetto ...]` installa uno o più pacchetti nell'ambiente attivo ed usando la lista di canali predisposta, ma può forzare l'installazione in un ambiente diverso e/o a partire da un canale voluto dall'utente.
- `conda search [-c <nome_canale>] pacchetto[<version_expr>] [--info]` ricerca un pacchetto su tutti i canali disponibili, ovvero solo su quello richiesto ed eventualmente gestendo le versioni richieste; `--info` fornisce informazioni dettagliate sul pacchetto.
- `conda update <pacchetto>` aggiorna all'ultima versione disponibile; anche in questo caso si possono usare le _version expression_.

Per i pacchetti non presenti nei canali di Conda si può utilizzare `pip` installandolo prima nell'ambiente ove non lo sia già. Le chiamate a `conda list` elencheranno nell'ambiente anche i pacchetti installati via `pip`.


### Jupyter

Jupyter è l'ambiente interattivo via web che consente di eseguire interattivamente i cosiddetti _notebook_ ovvero dei documenti interattivi organizzati in blocchi detti "celle" i quali possono contenere codice che può essere eseguito immediatamente ovvero testo semplice oppure testo formattato in un mix di HTML, LaTeX (per le formule matematiche) e soprattutto ***Markdown*** che è un linguaggio molto semplificato per generare HTML con stile in maniera velocissima.

Le celle che contengono codice, creano un ambiente unico e, se eseguite in successione, la valutazione delle celle precedenti è visibile alle celle successive. L'esecuzione può avvenire secondo diversi _kernel_: Python, R, C++ etc. Un esempio on line è reperibile il sito [juyter.org](https://jupyter.org/try).

Jupyter viene utilizzato nella sua forma di _Notebook_ o di _Lab_. Il primo è un semplice esecutore di singoli notebook con un'intefaccia web di tipo a cartelle, mentre il secondo è un vero e proprio IDE.

L'installazione di Anaconda comporta già l'installazione del pacchetto `jupyter`, ma si può installare alternativamente con `pip`. Jupyter Lab si installa da conda-forge digitando:
```bash
$ conda install -c conda-forge jupyterlab
```

L'invocazione di `jupyter [lab|notebook] [--no-browser]` attiva il server che interagisce via web su localhost alla porta 8088. L'opzione `--no-browser` è usata per invocare il server dall'interno di un IDE. La documetazione si trova sui portali di [Jupyter Lab](https://jupyterlab.readthedocs.io/en/stable/) e [Jupyter](https://jupyter.readthedocs.io/en/latest/index.html).


pirrone
