<a href="https://colab.research.google.com/github/nickprock/corso_data_science/blob/devs/intro_librerie_python/00_intro_colab.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Introduzione ai Notebook

## Anaconda Python

<p><img alt="Anaconda logo" height="120px" src="https://upload.wikimedia.org/wikipedia/en/thumb/c/cd/Anaconda_Logo.png/200px-Anaconda_Logo.png" align="center" hspace="10px" vspace="0px"></p>
<br>

[Anaconda](https://www.anaconda.com/) è una distribuzione **open source** dei linguaggi Python e R. Il suo obiettivo è semplificare la vita a chi si occupa di data science e calcolo scientifico occupandosi della gestione dei pacchetti. Anaconda è **cross platform** e contiene, tra le altre, le librerie che vedremo in questo corso:



*   numpy
*   pandas
*   matplotlib
*   scikit-learn

## Jupyter Notebook

<p><img alt="Jupyter logo" height="120px" src="https://upload.wikimedia.org/wikipedia/commons/thumb/3/38/Jupyter_logo.svg/250px-Jupyter_logo.svg.png" align="center" hspace="10px" vspace="0px"></p>
<br>

Anaconda fornisce anche [Jupyter Notebook](https://jupyter.org/), strumento molto diffuso per l'insegnamento, la prototipazione e la diffusione dei risultati nei progetti di data science.
Questo strumento interattivo permette di creare e condividere script, testo e immagini formattato in [Markdown](https://it.wikipedia.org/wiki/Markdown).

## Google Colab

<p><img alt="Colaboratory logo" height="120px" src="/img/colab_favicon.ico" align="center" hspace="10px" vspace="0px"></p>
<br>

[Google Colab](https://colab.research.google.com/notebooks/intro.ipynb) è una piattaforma che ci permette di **eseguire codice direttamente sul Cloud** (ogni volta che apriamo un notebook viene creata una nuova macchina da Google). Per sfruttare le funzionalità di tale piattaforma, tutto ciò di cui abbiamo bisogno è un account Google.
Colab è basato su Jupyter Notebook ma ha qualche differenza che vedremo in seguto.

# Caricare una libreria

## Caricare una libreria e assegnare un alias
Carichiamo numpy e utilizziamo una funzione che restituisce 10 numeri casuali tra zero e uno.

In [0]:
import numpy as np
np.random.rand(10)

## Caricare un modulo da una libreria e assegnare un alias

In [0]:
import matplotlib.pyplot as plt
x = np.random.rand(10)
y = np.random.rand(10)
plt.plot(x,y, "d")
plt.title("Grafico di test")

## Caricare una funzione
In questo caso useremo MinMaxScaler che nella sua configurazione di default fa scaling dei vettori assegnati in un range [0,1].

In [0]:
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaler.fit_transform(x.reshape(10,1))

# Installare una libreria non presente in Colab

Le librerie che utilizzeremo sono già presenti sull'istanza di default ma se avessimo bisogno di altro?

Come in un'installazione classica di Python useremo il package manager **pip** ma con l'aggiunta di un carattere speciale **!**




In [0]:
!pip install -U -q PyDrive

**Bisogna tenere a mente che ogni volta che apriamo il notebook viene creata la macchina virtuale sul cloud Google, quindi bisognerà ri-eseguire l'installazione.**

In questo caso abbiamo installato *PyDrive*, una libreria che ci consente di caricare i nostri file da Google Drive.

# Caricare un file da Google Drive

Il codice che vedremo in questa sezione è uno standard, potete riutilizzarlo così com'è.

In [0]:
from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
from google.colab import auth
from oauth2client.client import GoogleCredentials

# Authenticate and create the PyDrive client.
auth.authenticate_user()
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)

In [0]:
link = 'INSERT LINK HERE'
fluff, id = link.split('=')

print (id)

In [0]:
downloaded = drive.CreateFile({'id':id}) 
downloaded.GetContentFile('INSERT FILENAME HERE')

A questo punto bisogna caricare il file a seconda del tipo (qui suppongo di avere un csv).

```
import pandas as pd
file = pd.read_csv("filename.csv")
```



# Tips & Tricks

### Grafici inline

In Jupyter per vedere il grafico dopo aver caricato la libreria o il modulo bisogna dare il comando *%matplotlib inline*

```
import matplotlib.pyplot as plt
%matplotlib inline
```
### Leggere la documentazione

Per leggere la documentazione delle funzioni, ad esempio *MinMaxScaler()*, bisogna piazzarsi all'interno delle parentesi e poi **shift+tab** per aprile la documentazione online.

**Leggere la documentazione fa risparmiare molto tempo in fase di scrittura del codice.**

### Creare un pdf da jupyter notebook

Per creare un pdf dal jupyter notebook bisogna avere **LaTeX** installato sul pc.
* Aprire un terminale (Anaconda prompt su Windows) 
* Posizionarsi nella cartella di destinazione del PDF
* Digitare il comando
```
jupyter nbconvert --to pdf mynotebook.ipynb
```
* Troveremo nella cartella il file *mynotebook.pdf*

### Abilitare GPU o TPU

Per scegliere la GPU bisogna andare su:

*   ***Edit*** -> ***Notebook Settings***
*   oppure ***Runtime*** -> ***Change Runtime Type***

**La GPU è stata settata?**

In [0]:
import tensorflow as tf
tf.test.gpu_device_name()

1.    **'/device:GPU:0'** indica che lavoriamo su una GPU
2.    **'  '** indica che lavoriamo in CPU.

### Restart Colab

In [0]:
!kill -9 -1