# Travailler avec les Notebooks
**Accomplissements techniques :**

- Poser les bases de l'apprentissage sur la plateforme Databricks.
- Démontrer comment développer et exécuter du code dans un notebook.
- Introduire le système de fichiers Databricks (DBFS).
- Introduire l'outil `dbutils`.
- Passer en revue les différentes "Magic Commands".
- Explorer diverses commandes intégrées facilitant le travail avec les notebooks.

Le [Databricks Unified Support Portal](https://help.databricks.com/s/****) est un excellent endroit pour rechercher des forums et de la documentation sur Databricks et Spark.


##![Spark Logo Tiny](https://files.training.databricks.com/images/wiki-book/general/logo_spark_tiny.png) Scala, Python, R, SQL


In [0]:
print("J'exécute du Python !")

J'exécute du Python !


##![Spark Logo Tiny](https://files.training.databricks.com/images/wiki-book/general/logo_spark_tiny.png) Magic Commands

- Les Magic Commands sont spécifiques aux notebooks Databricks.
- Ils sont très similaires aux Magic Commands présents dans des produits de notebooks comparables.
- Ce sont des commandes intégrées qui ne s'appliquent pas au langage par défaut du notebook.
- Un symbole pourcentage (%) au début d'une cellule identifie une Magic Command.

### Magic Command: &percnt;sh
Par exemple, %sh nous permet d'exécuter des commandes shell sur le driver.

In [0]:
%sh 
ps | grep 'java'

    319 ?        00:00:46 java
    477 ?        00:01:42 java


### Magic Command : Autres Langages
Des Magic Commands supplémentaires permettent d'exécuter du code dans des langages différents de celui par défaut du notebook :

- %python
- %scala
- %sql
- %r

In [0]:
%scala

println("Hello Scala!")

In [0]:
%python

print("Hello Python!")

Hello Python!


In [0]:
%r

print("Hello R!", quote=FALSE)

[1] Hello R!

In [0]:
%sql

select "Hello SQL!"

Hello SQL!
Hello SQL!


### Magic Command: &percnt;md

Notre Magic Command préféré, **%md**, nous permet de rendre du Markdown dans une cellule.

### Magic Command: &percnt;run

- Vous pouvez exécuter un notebook depuis un autre notebook en utilisant la Magic Command %run.
- Toutes les variables et fonctions définies dans l'autre notebook seront disponibles dans votre notebook actuel.

In [0]:
%run "./1-LectureDataCSV"

##![Spark Logo Tiny](https://files.training.databricks.com/images/wiki-book/general/logo_spark_tiny.png) Databricks File System - DBFS

- DBFS est une couche au-dessus d'un stockage d'objets basé sur le cloud.
- Les fichiers dans DBFS sont persistés dans le stockage d'objets.
- La durée de vie des fichiers dans DBFS n'est PAS liée à la durée de vie de notre cluster.


Documentation : <a href="https://learn.microsoft.com/en-us/azure/databricks/dbfs/" target="_blank">What is DBFS</a>.

### Utilitaires Databricks - dbutils
- Vous pouvez accéder à DBFS via la classe Databricks Utilities (et d'autres routines d'entrée/sortie de fichiers).
- Une instance de DBUtils est déjà déclarée pour nous sous le nom de dbutils.
- Pour obtenir la documentation des DBUtils directement dans le notebook, vous pouvez exécuter la commande dbutils.help().


See also <a href="https://learn.microsoft.com/en-us/azure/databricks/dev-tools/databricks-utils" target="_blank">Databricks Utilities - dbutils</a>

In [0]:
dbutils.help()

Une aide supplémentaire est disponible pour chaque sous-utilitaire:
* `dbutils.fs.help()`
* `dbutils.meta.help()`
* `dbutils.notebook.help()`
* `dbutils.widgets.help()`


In [0]:
dbutils.fs.help()

### dbutils.fs.mounts()

Cette méthode renvoie une collection d'objets MountInfo, un pour chaque montage.

In [0]:
mounts = dbutils.fs.mounts()

for mount in mounts:
  print(mount.mountPoint + " >> " + mount.source)
  print("-"*80)



/databricks-datasets >> databricks-datasets
--------------------------------------------------------------------------------
/Volumes >> UnityCatalogVolumes
--------------------------------------------------------------------------------
/databricks/mlflow-tracking >> databricks/mlflow-tracking
--------------------------------------------------------------------------------
/databricks-results >> databricks-results
--------------------------------------------------------------------------------
/databricks/mlflow-registry >> databricks/mlflow-registry
--------------------------------------------------------------------------------
/Volume >> DbfsReserved
--------------------------------------------------------------------------------
/volumes >> DbfsReserved
--------------------------------------------------------------------------------
/ >> DatabricksRoot
--------------------------------------------------------------------------------
/volume >> DbfsReserved
-------------------------

In [0]:
%fs ls "/databricks-datasets/"

path,name,size,modificationTime
dbfs:/databricks-datasets/COVID/,COVID/,0,1732132616363
dbfs:/databricks-datasets/README.md,README.md,976,1532502332000
dbfs:/databricks-datasets/Rdatasets/,Rdatasets/,0,1732132616363
dbfs:/databricks-datasets/SPARK_README.md,SPARK_README.md,3359,1455505270000
dbfs:/databricks-datasets/adult/,adult/,0,1732132616363
dbfs:/databricks-datasets/airlines/,airlines/,0,1732132616363
dbfs:/databricks-datasets/amazon/,amazon/,0,1732132616363
dbfs:/databricks-datasets/asa/,asa/,0,1732132616363
dbfs:/databricks-datasets/atlas_higgs/,atlas_higgs/,0,1732132616363
dbfs:/databricks-datasets/bikeSharing/,bikeSharing/,0,1732132616363


In [0]:
%fs ls /databricks-datasets/nyctaxi-with-zipcodes/subsampled

path,name,size,modificationTime
dbfs:/databricks-datasets/nyctaxi-with-zipcodes/subsampled/_delta_log/,_delta_log/,0,1732132708739
dbfs:/databricks-datasets/nyctaxi-with-zipcodes/subsampled/nyc-zips-dataset-readme.txt,nyc-zips-dataset-readme.txt,1648,1624321838000
dbfs:/databricks-datasets/nyctaxi-with-zipcodes/subsampled/part-00000-80b68cae-ce6a-41cf-87cd-2573d91b4c07-c000.snappy.parquet,part-00000-80b68cae-ce6a-41cf-87cd-2573d91b4c07-c000.snappy.parquet,90261,1624321838000
dbfs:/databricks-datasets/nyctaxi-with-zipcodes/subsampled/part-00001-c883942d-366f-478a-be3b-f13fd4bee0ab-c000.snappy.parquet,part-00001-c883942d-366f-478a-be3b-f13fd4bee0ab-c000.snappy.parquet,90986,1624321838000
dbfs:/databricks-datasets/nyctaxi-with-zipcodes/subsampled/part-00002-bbf9fd81-4b3a-46f3-943e-841b48ae743e-c000.snappy.parquet,part-00002-bbf9fd81-4b3a-46f3-943e-841b48ae743e-c000.snappy.parquet,90740,1624321838000
dbfs:/databricks-datasets/nyctaxi-with-zipcodes/subsampled/part-00003-3d80435e-15f8-4154-92c7-515307e41c1b-c000.snappy.parquet,part-00003-3d80435e-15f8-4154-92c7-515307e41c1b-c000.snappy.parquet,90840,1624321838000
dbfs:/databricks-datasets/nyctaxi-with-zipcodes/subsampled/part-00004-0b996b45-a3ff-4339-afeb-8fc691770056-c000.snappy.parquet,part-00004-0b996b45-a3ff-4339-afeb-8fc691770056-c000.snappy.parquet,90818,1624321839000
dbfs:/databricks-datasets/nyctaxi-with-zipcodes/subsampled/part-00005-ec9ab51b-23a3-4333-8d42-1730df56bfb6-c000.snappy.parquet,part-00005-ec9ab51b-23a3-4333-8d42-1730df56bfb6-c000.snappy.parquet,90707,1624321839000
