# Configuración del entorno

En este notebook, se configurará rápidamente el entorno de Databricks para su uso con Azure Data Lake Storage Gen2 (ADLS Gen2).

## Objetivos

1. Inicializar el sistema de archivos de ADLS Gen2 usando la opción de configuración `fs.azure.createRemoteFileSystemDuringInitialization` para permitir que el sistema de archivos sea creado cuando se hace referencia por primera vez.
2. Montar el almacenamiento de Azure Data Lake Gen2 (ADLS Gen2) usando el acceso OAuth.

### Creación del punto de montaje

Para la creación del punto de montaje es necesario declarar las siguientes variables:
* ` adlsGen2AccountName`:  Nombre de la cuenta de almacenamiento.
* ` fileSystemName`: Nombre del sistema de archivos (o contenedor)
* ` scopeName`: Nombre del secret scope creado en databricks
* ` keyName`: Nombre del secreto creado en el Azure Key Vault

> *Nota 1*: Como buena práctica se usa un Azure Key Vault para llamar los secretos usando la función ` dbutils.secrets.get`.

Luego de la definición de las variables de conexión se hace el punto de montado a Databricks usando la función `dbutils.fs.mount`.

> *Nota 2*: La configuración `fs.azure.createRemoteFileSystemDuringInitialization` no interfiere en la creación del punto de montado si el sistema de archivos ya existe.

In [0]:
# Declaraciones variables.
adlsGen2AccountName = "analiticastorage"
fileSystemName      = "donaciones"
scopeName           = ""
keyName             = ""
accountKey          = "RB0bRK08z1Dcpy7adopANQyTJ7bXZ6XPSi2IxE6DDEkuKFysTCuPFsCUI1HxLv1xGUTvclCi85IeFAggb73XoQ=="

# Declaración de conexión
uri     = f"fs.azure.account.key.{adlsGen2AccountName}.blob.core.windows.net"
wasbUri = f"wasbs://{fileSystemName}@{adlsGen2AccountName}.blob.core.windows.net"

# Unión de los ajustes de configuración necesarios para el acceso OAuth a la cuenta ADLS Gen2.
configs  = {uri:accountKey}

# Antes de poder acceder al contenedor en su cuenta ADLS Gen2, debe inicializar un sistema de archivos. Para ello, se utilizara la opción de configuración `fs.azure.createRemoteFileSystemDuringInitialization` para permitir que el sistema de archivos se cree durante la operación de montaje. Se fijará este valor en `true` inmediatamente antes de acceder al sistema de archivos ADLS Gen2, y luego se volvera a `false` siguiendo el comando.

spark.conf.set("fs.azure.createRemoteFileSystemDuringInitialization", "true")

# Creación del punto de montaje del sistema de archivos en ADLS Gen2.
dbutils.fs.mount(
  source = wasbUri,
  mount_point = f"/mnt/{fileSystemName}",
  extra_configs = configs)

# Deshabilitar la creación del sistema de archivos durante la inicialización.
spark.conf.set("fs.azure.createRemoteFileSystemDuringInitialization", "false")

In [0]:
#dbutils.fs.unmount(mount_point = f"/mnt/{fileSystemName}")

### Prueba del punto de montaje

Para verificar rápidamente el acceso a el sistema de archivos ADLS Gen2, se ejecuta la celda de abajo.
%md

En la salida del comando `dbutils.fs.mounts()`, deberá ver el punto de montaje en la lista. Se verá algo así como: `mountPoint='/mnt/<Nombre del sistema de archivos>', source='abfss://<Nombre del sistema de archivos>@<Nombre de cuenta adls-gen2>.dfs.core.windows.net/'`.

In [0]:
display(
  dbutils.fs.ls(f"/mnt/{fileSystemName}/")
)