# Introduzione a Python

## Dove scrivere il codice

Ci sono diverse opzioni per scrivere codice in Python. In generale, possiamo dire che ci sono due modi principali:

* Gli *script* ossia semplici file di testo, che possono essere creati anche semplicemente con TextEdit (su Mac) o Notepad (su Windows). Ovviamente non usiamo TextEdit per scrivere testo, perché sarebbe un inferno: esistono infinti programmi apoositi, ricchi di funzioni che ci aiutano a scrivere in modo più efficiente: ma alla fine si tratta di file leggerissimi che potrebbero essere scritti senza bisogno di applicazioni complicate. In fondo, gli script sono *plain text files*, ma che terminano in `.py` se sono script di Python (ma anche gli script di R sono la stessa cosa: solo che terminano in `.r`).
* I *notebook*, che sono un formato interattivo affermatosi a metà degli anni 2000 ed è usato soprattutto per illustrare concetti (quindi in ambito accademico/formativo) o nelle prime fasi della data science. I notebook sono versatili perché permettono di alternare *blocchi* o *celle* di testo (in cui si scrive in [Markdown](https://www.markdownguide.org/) come sto facendo qui) e celle di codice.

Esistono molte soluzioni online per scrivere notebook di Python: Colab è quella che vediamo a lezione, ma esistono anche [Kaggle](https://www.kaggle.com/) e [DeepNote](https://deepnote.com/). Queste soluzioni online sono molto versatili perché non richiedono di installare Python e altre librerie *localmente* (cioè sul vostro computer), ma funzionano *in remoto*: sfruttano cioè dei server di Google o di altri fornitori per eseguire il codice.

Lavoreremo prevalentemente su Colab, perché per configurare e usare al meglio Python in locale serve un po' di dimestichezza con il terminale (o linea di comando): qualcosa di relativamente semplice da imparare, ma che non abbiamo tempo di seguire direttamente in un corso di economia. Agli interessati, contattatemi pure - ad esempio anche su Ariel: se siamo abbastanza, potrei fare una lezione su questa cosa, oppure mandarvi individualmente qualche tutorial.

Per completezza di informazioni: in locale, esistono ottimi ambienti di sviluppo integrati (IDE, in inglese) per scrivere sia script che notebooks. Si tratta di programmi equivalenti a RStudio, spesso specifici per Python. Il migliore è indubbiamente PyCharm, sviluppato da JetBrains - un editor molto apprezzato e ricco di funzioni, che potete scaricare sia in versione gratuita (*Community Edition*) che full-feature (*Professional*) senza costi, in quanto studenti. La versione Community non supporta i notebook, quella premium sì.

L'altro IDE molto usato è Visual Studio Code (di Microsoft) che è gratuito e supporta anche altri linguaggi di programmazione. Si può usare sia con script che Notebook, ma a differenza di PyCharm farà surriscaldare un po' di più il vostro computer perché non è così ottimizzato. Alternativamente, potete scaricare un altro editor specifico anche per i Notebook - Jupyter Lab.

## Fondamentali di Python

In [None]:
# assegnare una variabile
a = 10

Le variabili si assegnano con `=`. Ogni variabile è un *oggetto* di un certo `tipo`, che possiamo verificare con la funzione `type()`:

In [None]:
type(a)

int

## Interi e Decimali

`a` è di tipo `int`, cioè è un intero. Gli altri tipi che vedremo oggi sono i `float`, cioè i numeri con decimali, e le stringhe (o `str`).

Curiosità: potete scrivere un numero qualsiasi mettendo `_` (o underscore) per separare le cifre, in modo da renderlo più leggibile (questa cosa non si può fare con R).

In [None]:
big_number = 1_000_000
print(big_number)

1000000


Con `print()` possiamo `stampare a schermo`, cioè visualizzare, l'espressione scritta tra parentesi. Più precisamente, il codice viene **eseguito** e ci viene mostrato il suo risultato.

Nel caso sopra, vediamo che avere scritto `big_number` con due `_` serve solo per renderlo più facile da leggere per noi: Python lo printerà senza trattini.

In [None]:
print(2 + 3)

5


## Stringhe

Le stringhe possono essere sia lettere che parole o frasi. Devono essere racchiuse tra `'` o `"` (sia singoli che tripli, cioè così `"""`). Questo perché certe stringhe potrebbero già avere al loro interno degli apostrofi o virgolette che vogliamo preservare:

In [None]:
articolo = "un po'"

Se la stringa contiene `'`, racchiudiamola tra `"` e viceversa. Per semplicità, o per scrivere strighe lunghe più di una riga, possiamo usare tre `"`:

In [None]:
the_rock = "Dwayne 'The Rock' Thomson"
the_rock_2 = 'Dwayne "The Rock" Thomson'
lorem_ipsum = """
Lorem ipsum dolor sit amet, "consectetur" adipiscing elit, sed do eiusmod
tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam,
quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu 
fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident,
sunt in culpa qui officia deserunt mollit anim id est laborum.
"""

print(the_rock)
print(the_rock_2)
print(lorem_ipsum)

Dwayne 'The Rock' Thomson
Dwayne "The Rock" Thomson

Lorem ipsum dolor sit amet, "consectetur" adipiscing elit, sed do eiusmod
tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam,
quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu 
fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident,
sunt in culpa qui officia deserunt mollit anim id est laborum.



## Dare nomi alle variabili

È molto importante che il codice che scriviamo sia comprensibile: per gli altri, ma anche se ci capiterà di rileggere il codice che abbiamo scritto tra qualche mese.

La convenzione (in Python, ma che è bene usare anche in R) è di scrivere **tutte le variabili e nomi di funzioni in minuscolo**. In caso di variabili lunghe più di una parola, **si separano con un trattino basso `_`**.

Sono nomi buoni:

```python
odd_number = 7
very_big_number = 123456789
very_small_number = 0.123456789
```

Sono nomi _tremendi_:

```python
df # un'abbreviazione di `dataframe`, cioè di dataset o insieme di dati
```

E tutte le variazioni un po' pigre tipo `df1`, `df_copy`... che vengono usate per salvare il nuovo dataset dopo che avete fatto delle trasformazioni (anche solo droppare alcune colonne).

Il `CamelCase` viene usato in Python ma per designare altri tipi di oggetti, dette `Classi`, di cui non ci occuperemo.

## Concatenare stringhe

Possiamo concatenare diverse stringhe - il modo più diretto (ma che non è il più efficiente) è usando un `+`.

In [None]:
greeting = "Hello "
name = "Luca"

print(greeting + name)

Hello Luca


Questo diventa problematico se però concateniamo una stringa e qualcosa che non è una stringa:

In [None]:
print(greeting + 9)

TypeError: ignored

Fare ciò risulterà in un errore - più precisamente un `TypeError`, cioè un errore legato ai tipi delle variabili. Questo perché si possono concatenare variabili che sono solo stringhe tra di loro.

Se non riuscite a risovlere immediatamente un errore (o *bug*), copiate il messaggio di errore - in questo caso `TypeError: can only concatenate str (not "int") to str` e cercatelo su StackOverflow - che è la piattaforma di Q&A più usata per risolvere moltissimi problemi (principalmente di programmazione, ma anche di statistica e altro).

Una nota: quando l'esecuzione di una cella si interrompe per un errore, Colab vi offre un bottone per cercare automaticamente il messaggio su StackOverflow.

Per concatenare una stringa e un numero possiamo prima convertire il numero in stringa:

In [None]:
print(greeting + str(9))

Hello 9


Se infatti guardiamo il tipo di `str(9)` con `type()`:

In [None]:
print(type(str(9)))

<class 'str'>


Vediamo che è una `classe` di tipo stringa (vedremo meglio domani che cosa significa).

La soluzione più elegante è usare le cosiddette `stringhe di formattazione`:

In [None]:
winning_number = 9
print(f"Il numero vincente è: {winning_number}")

Il numero vincente è: 9


Notiamo che stiamo stampando a schermo ("printando") una stringa che però precediamo con una `f` (che signfica "formatted"). Per dire a Python dove convertire automaticamente una variabile che abbiamo definito in una stringa, ci basta racchiuderla tra parentesi graffe `{}`.

Senza `f` e `{}`, la sostituzione del valore della variabile non avviene:

In [None]:
print("Il numero vincente è: {winning_number}")
print(f"Il numero vincente è: winning_number")

Il numero vincente è: {winning_number}
Il numero vincente è: winning_number


## Altre conversioni

Possiamo convertire interi in decimali ma anche decimali in interi: in questo modo, li arrotonderemo.

In [None]:
integer = 12 # int
pi = 3.1415 # float
number = "12" # str

print(f"This integer was converted into a float: {integer} -> {float(integer)}")
print(f"If you make `pi` into an integer, it will be rounded: {pi} -> {int(pi)}")

This integer was converted into a float: 12 -> 12.0
If you make `pi` into an integer, it will be rounded: 3.1415 3
