# Statistica per i Big Data Economico-Aziendali - Esercitazioni in Python

Il materiale per il seguente modulo sarà reso disponibile di volta in volta in questa repository di GitHub: www.github.com/sergiopicascia/Stat4BigData.

**GitHub** è una piattaforma utilizzata per lo sviluppo collaborativo di software basata sul controllo di versione.
- [Guida a GitHub](https://docs.github.com/en/get-started/quickstart/hello-world)
- [Guida a Git](https://github.com/git-guides)

## Introduzione a Python

**Python** è un linguaggio di programmazione ad alto livello, utilizzato nelle applicazioni web, nello sviluppo di software, nella data science e nel machine learning. Può essere eseguito su tutti i principali sistemi operativi informatici ed è estremamente semplice da comprendere grazie ad una sintassi simile a quella della lingua inglese. Data la sua vasta diffusione e adozione tra gli sviluppatori, è possibile reperire con facilità tutorial e documentazione, oltre a migliaia di pacchetti sviluppati per numerose attività.
- [Documentazione](https://docs.python.org/3/)

Esistono diverse opzioni per scrivere codice in Python. Gli *script* sono file di testo con estensione *.py*. Possono essere creati e modificati con semplici editor di testo, oppure tramite ambienti di sviluppo integrato (IDE); questi ultimi sono software che assistono lo sviluppatore nella scrittura del codice tramite l'utilizzo di diversi strumenti, come il debugger o l'evidenziatore di sintassi. Gli script vengono eseguiti linearmente, dall'alto verso il basso, riga per riga, fino al raggiungimento della fine del file; nel caso in cui bisognasse modificare anche solo una linea di codice, sarà necessario rieseguire lo script per attuare le modifiche.
- Text Editors: [Sublime](https://www.sublimetext.com), [Notepad++](https://notepad-plus-plus.org)
- IDEs: [Visual Studio Code](https://code.visualstudio.com), [PyCharm](https://www.jetbrains.com/pycharm/)

I *notebook* sono composti da celle: in ogni cella è possibile scrivere sia del codice in Python, sia del semplice testo. È dunque possibile affiancare a delle sezioni di codice, delle altre contenenti spiegazioni, link o immagini. I notebook vengono eseguiti in maniera non lineare, ovvero è possibile eseguire le celle in qualsiasi ordine; ciò rende possibile modificare parte del codice presente in una cella, senza dover necessariamente rieseguire l'intero notebook.
- [Jupyter Notebook](https://jupyter.org), [Google Colab](https://colab.research.google.com/notebooks/)

In [None]:
# Il primo programma in Python


## Commenti

Un commento è introdotto da un asterisco (`#`) e termina alla fine di una linea di codice. I commenti vengono ignorati in fase di esecuzione del codice.

In [None]:
# Questo è un commento
# Anche questo è un commento

## Tipi di Dato

Un **tipo di dato** restringe l'insieme di possibili valori che un'espressione può avere e ne definisce l'insieme di operazioni consentite su di essa. Python supporta tipi di dato basilari, come *interi* e *booleani*, e sequenziali, come *stringhe* e *liste*.

#### `type(object)`
La funzione `type()` restituisce il tipo di un oggetto. 

## Tipi Numerici

Esistono tre tipi numerici: gli interi (*int*), i decimali (*float*), e i numeri complessi (*complex*).

- `int`: gli interi sono lo zero, numeri positivi e negativi interi, dunque senza la componente decimale
- `float`: chiamati *floating point numbers*, i decimali sono numeri reali positivi e negativi con una componente decimale indicata dal simbolo `.`or dalla notazione scienrifica `E` o `e`
- `complex`: un numero complesso è un numero avente una componente reale ed una immaginaria; la componente immaginaria è indicata dalla lettera `J` o `j`

In [None]:
# Interi



In [None]:
# Decimali



In [None]:
# Complessi


### Operatori Aritmetici

In Python, gli **operatori** sono speciali simboli che indicano che una certa computazione deve essere compiuta. I valori che vengono coinvolti nella computazione da un operatore, vengono detti *operandi*.

Gli **operatori aritmetici** vengono utilizzati per eseguire operazioni matematiche, come l'addizione, la sottrazione, la moltiplicazione e la divisione.

L'operatore *addizione* è indicato dal simbolo `+` ed è utilizzato per sommare due valori.

In [None]:
# Addizione


L'operatore *sottrazione* è indicato dal simbolo `-` ed è utilizzato per sottrarre il secondo valore dal primo.

In [None]:
# Sottrazione


L'operatore *moltiplicazione* è indicato dal simbolo `*` ed è utilizzato per calcolare il prodotto di due valori.

In [None]:
# Moltiplicazione


L'operatore *divisione* è indicato dal simbolo `/` ed è utilizzato per calcolare il quoziente quando il primo valore è diviso per il secondo.

In [None]:
# Divisione (float)


L'operatore *divisione floor* è indicato dal simbolo `//` ed è utilizzato per calcolare la parte intera del quoziente quando il primo valore è diviso per il secondo.

In [None]:
# Divisione (int)


L'operatore *modulo* è indicato dal simbolo `%` ed è utilizzato per calcolare il resto quando il primo valore è diviso per il secondo.

In [None]:
# Modulo


L'operatore *esponenziale* è indicato dal simbolo `**` ed è utilizzato per elevare il primo valore alla potenza del secondo.

In [None]:
# Esponenziale


## Tipo Stringa

In Python, i dati testuali sono gestiti con gli oggetti `str`, o *stringhe*. Una stringa può essere definita in tre diversi modi:
- singole virgolette (`'...'`): possono contenere doppie virgolette
- doppie virgolette (`"..."`): possono contenere singole virgolette
- triple virgolette (`'''...'''`, `"""..."""`): possono essere definite su più linee

In [None]:
# Singole Virgolette


In [None]:
# Doppie Virgolette


In [None]:
# Triple Virgolette



### Concatenazione
È possibile concatenare due stringhe diverse oppure ripetere la stessa stringa più volte utilizzando rispettivamente gli operatori aritmetici `+` e `*`.

In [None]:
# Concatenazione di due stringhe


In [None]:
# Ripetizione della stessa stringa


### Carattere Escape
Nelle stringhe, la barra rovesciata (*backslash*) `\` è un carattere speciale, chiamato **escape**. È utilizzato per definire alcune sequenze di caratteri come `\t` e `\n`.

Utilizzare `\` prima di un carattere speciale trasforma quest'ultimo in un carattere ordinario. 

### Slicing e Indexing
È possibile selezionare un sottoinsiemi di caratteri da una stringa utilizzando l'operazione di *slicing*: all'interno di parentesi quadre, si specifica l'indice di inizio e l'indice di fine, separati da `:`.

In Python, i tipi sequenziali sono indicizzati a zero, ovvero le posizioni (indici) degli *n* elementi all'interno di un oggetto va da *0* a *n-1*. Indicando soltanto un numero all'interno delle parentesi quadre si seleziona soltanto l'elemento presente a quell'indice.

### Metodi

Esistono una serie di *metodi integrati (built-in)* che possono essere utilizzati sulle stringhe.

`str.capitalize()` restituisce una copia della stringa con la prima lettera in maiuscolo e il resto in minuscolo.

`str.lower()` restituisce una copia della stringa con tutte le lettere minuscole.

`str.upper()` restituisce una copia della stringa con tutte le lettere maiuscole.

`str.strip()` restituisce una copia della stringa eliminando eventuali spazi all'inizio e alla fine di essa.

`str.find(sub)` restituisce il primo indice della stringa in cui viene trovata la sottostringa `sub`.

`str.replace(old, new)` restituisce una copia della stringa con tutte le occorrenze di `old` sostituite da `new`.

`str.format()` esegue un'operazione di formattazione sulla stringa.

## Conversione di Tipo

Il processo di convertire un valore da un tipo di dati ad un altro è chiamato **conversione**. In Python esistono due tipologie di conversione:
- *implicita*: Python converte automaticamente un tipo di dato in un altro senza che venga specificato dall'utente
- *esplicita*: l'utente converte l'oggetto da un tipo di dato all'altro utilizzando delle funzioni integrate, ad es. `int()`, `float()`, `str()`.

In [None]:
# Conversione implicita




In [None]:
# Conversione esplicita



## Variabili
Una variabile è un contenitore utilizzato per memorizzare informazione che viene poi recuperata e modificata da un programma. È anche un modo per descrivere in maniera più significativa i nostri dati, in modo da rendere più leggibile e comprensibile il nostro codice.

Per creare una variabile è necessario *dichiararla*. In Python ciò avviene definendo il nome della variabile, seguita dall'operatore *assegnazione* `=` e dal valore che le vogliamo assegnare.

In [None]:
# Dichiarazione di una variabile



In [None]:
# Aggiorna una variabile



### Altri Operatori di Assegnazione

`+=` (*somma e assegna*): aggiungi l'operando a destra con quello a sinistra e assegna il risultato all'operando a sinistra.

`-=` (*sottrai e assegna*): sottrai l'operando a destra da quello a sinistra e assegna il risultato all'operando a sinistra.

`*=` (moltiplica e assegna): moltiplica l'operando a destra con quello a sinistra e assegna il risultato all'operando a sinistra.

## Riferimento agli Oggetti

Una variabile in Python è un nome simbolico che fa da riferimento per un oggetto. Una volta che un oggetto viene assegnato ad una variabile, è possibile riferirsi a tale oggetto utilizzando il nome della variabile; il dato è comunque contenuto all'interno dell'oggetto e non della variabile. 

Ad ogni oggetto creato viene assegnato un numero che lo identifica. È garantito che due oggetti non possano avere lo stesso identificatore. La funzione integrata `id(object)` restituisce l'identificatore di un oggetto.

## Convenzioni

I nomi delle variabili dovrebbero essere formati da soli caratteri minuscoli, con parole separate da trattini bassi `_` per migliorarne la leggibilità.

In Python, un ridotto insieme di parole chiave sono riservate per particolari funzionalità del linguaggio. Alle variabili non possono essere assegnati nomi uguali a parole chiavi. È possibile controllare la lista di parole chiave in ogni momento utilizzando il comando `help('keywords')`.

## Esercizi

- Scrivi un programma che sostituisce tutte le occorrenze del primo carattere di una stringa con `?`, eccetto per il primo carattere. Ad esempio `ananas` -> `an?n?s`.

- Scrivi un programma che dato il raggio del cerchio calcola l'area e stampa `L'area del cerchio con raggio _ è uguale a _.`, sostituendo i trattini bassi con i reali valori.