<div style="text-align: center; line-height: 0; padding-top: 9px;">
  <img src="https://databricks.com/wp-content/uploads/2018/03/db-academy-rgb-1200px.png" alt="Databricks Learning" style="width: 600px">
</div>

### **Introducción a la plataforma Databricks**

Este notebook proporciona una revisión práctica de algunas de las funcionalidades básicas de Databricks Data Science and Engineering Workspace.

#### **Objetivos de aprendizaje**
Al final de este laboratorio, usted debe ser capaz de:
- Cambiar el nombre de un notebook y cambiar el lenguaje por defecto
- Adjuntar un clúster
- Utilizar el comando mágico **`%run`**.
- Ejecutar celdas Python y SQL
- Crear una celda Markdown

### **Cambiar el nombre de un notebook**

Cambiar el nombre de un notebook es fácil. Haga clic en el nombre en la parte superior de esta página y, a continuación, modifíquelo. Para que le resulte más fácil volver a este notebook en caso de que lo necesite, añada una breve cadena **-test** al final del nombre existente.

### **Adjuntar un clúster**

La ejecución de celdas en un notebook requiere recursos de computación, que son proporcionados por los clusters. La primera vez que ejecute una celda en un notebook, se le pedirá que se conecte a un clúster si aún no lo está.

Para ello, haga clic en el menú desplegable situado en la esquina superior derecha de esta página. Seleccione el clúster que creó anteriormente. Esto borrará el estado de ejecución del notebook y conectará el notebook al cluster seleccionado.

Tenga en cuenta que el menú desplegable ofrece la opción de iniciar o reiniciar el clúster según sea necesario. También puede desconectarse y volver a conectarse a un clúster en una sola operación. Esto resulta útil para borrar el estado de ejecución cuando sea necesario.

### **Uso de %run**

Los proyectos complejos de cualquier tipo pueden beneficiarse de la capacidad de dividirlos en componentes más simples y reutilizables.

En el contexto de los notebooks de Databricks, esta facilidad se proporciona a través del comando mágico **`%run`**.

Cuando se utiliza de esta forma, las variables, funciones y bloques de código pasan a formar parte del contexto de programación actual.

Considera este ejemplo:

**`Notebook_A`** tiene cuatro comandos:
  1. **`name = "John"`**
  2. **`print(f"Hello {name}")`**
  3. **`%run ./Notebook_B`**
  4. **`print(f"Welcome back {full_name})`**

**`Notebook_B`** tiene un solo comando:
  1. **`full_name = f"{name} Doe"`**

Si ejecutamos **`Notebook_B`** fallará la ejecución porque la variable **`name`** no está definida en **`Notebook_B`**

Del mismo modo, uno podría pensar que **`Notebook_A`** fallaría porque utiliza la variable **`full_name`** que tampoco está definida en **`Notebook_A`**, ¡pero no es así!

Lo que ocurre en realidad es que los dos notebooks se fusionan como vemos a continuación y **luego** se ejecutan:
1. **`name = "John"`**
2. **`print(f"Hello {name}")`**
3. **`full_name = f"{name} Doe"`**
4. **`print(f"Welcome back {full_name}")`**

Y así proporcionar el comportamiento esperado:
* **`Hello John`**
* **`Welcome back John Doe`**

La carpeta que contiene este notebook contiene una subcarpeta llamada **`ExampleSetupFolder`**, que a su vez contiene un notebook llamado **`example-setup`**. 

Este simple notebook declara la variable **`my_name`**, la establece en **`None`**, y luego crea un DataFrame llamado **`example_df`**. 

Abre el notebook **`example-setup`** y modifícalo para que **`my_name`** no sea **`None`** sino tu nombre (o el de cualquiera) entre comillas, y para que las dos celdas siguientes se ejecuten sin lanzar un **`AssertionError`**.

<img src="https://files.training.databricks.com/images/icon_note_24.png"> Verás referencias adicionales **`_utility-methods`** y **`DBAcademyHelper`** que se utilizan para configurar este curso y deben ser ignoradas para este ejercicio.

In [None]:
%run ./ExampleSetupFolder/example-setup

In [None]:
assert my_name is not None, "Name is still None"
print(my_name)

### **Ejecutar una celda Python**

Ejecuta la siguiente celda para verificar que el notebook **`example-setup`** fue ejecutado mostrando el DataFrame **`example_df`**. Esta tabla consta de 16 filas de valores crecientes.

In [None]:
display(example_df)

### **Cambiar el Lenguaje**

Observa que el lenguaje por defecto para este notebook es Python. Cámbialo haciendo clic en el botón **Python** situado a la derecha del nombre del notebook. Cambia el lenguaje por defecto a SQL.

Observa que a las celdas de Python se les añade automáticamente el prefijo <strong><code>&#37;python</code></strong> para mantener la validez de esas celdas. Tenga en cuenta que esta operación también borra el estado de ejecución.

### **Crear una celda Markdown**

Añade una nueva celda debajo de esta. Rellénala con algo de Markdown que incluya al menos los siguientes elementos:
* Un encabezado
* Viñetas
* Un enlace (utilizando las convenciones HTML o Markdown que prefieras)

##### Encabezado
- Punto 1
- Punto 2
- [Link hacia el sitio de Databricks](https://www.databricks.com)

#### **Ejecutar una celda SQL**

Ejecute la siguiente celda para consultar una tabla Delta mediante SQL. Esto ejecuta una consulta simple contra una tabla respaldada por un conjunto de datos de ejemplo proporcionado por Databricks e incluido en todas las instalaciones de DBFS.

In [None]:
files = dbutils.fs.ls(f"{DA.paths.datasets}/nyctaxi-with-zipcodes/data")
display(files)

In [None]:
%sql
SELECT * FROM delta.`${DA.paths.datasets}/nyctaxi-with-zipcodes/data`

Ejecute la siguiente celda para ver los archivos subyacentes que respaldan esta tabla.

In [None]:
files = dbutils.fs.ls(f"{DA.paths.datasets}/nyctaxi-with-zipcodes/data")
display(files)

### **Borrar el estado del notebook**

A veces es útil borrar todas las variables definidas en el notebook y empezar desde el principio.  Esto puede ser útil cuando quieres probar celdas de forma aislada, o simplemente quieres restablecer el estado de ejecución.

Visite el menú **Run** y seleccione la opción **Clear state and outputs**.

Ahora intenta ejecutar la celda de abajo y observa que las variables definidas anteriormente ya no están definidas, hasta que vuelvas a ejecutar las celdas anteriores de arriba.

In [None]:
print(my_name)

### **Revisar cambios**

Asumiendo que has importado este material a tu workspace usando un Repo de Databricks, abre el diálogo Repo haciendo clic en el botón de la rama **`published`** en la esquina superior izquierda de esta página. Deberías ver tres cambios:
1. **Removed** con el antiguo nombre del notebook
1. **Added** con el nuevo nombre del notebook
1. **Modified** por crear una celda markdown arriba

Utilice el cuadro de diálogo para revertir los cambios y restaurar este notebook a su estado original.

<center><img src="https://i.postimg.cc/J48zWXfM/db331.png"></center>
<center><img src="https://i.postimg.cc/6pjWRmyp/db332.png"></center>
<center><img src="https://i.postimg.cc/pLXVmHVS/db333.png"></center>

Tenemos la opción de revertir los cambios

<center><img src="https://i.postimg.cc/0Nz8C0wd/db334.png"></center>

### **Conclusión**

Al completar este laboratorio, ahora debería sentirse cómodo manipulando notebooks, creando nuevas celdas y ejecutando notebooks dentro de notebooks.

-sandbox
&copy; 2022 Databricks, Inc. All rights reserved.<br/>
Apache, Apache Spark, Spark and the Spark logo are trademarks of the <a href="https://www.apache.org/">Apache Software Foundation</a>.<br/>
<br/>
<a href="https://databricks.com/privacy-policy">Privacy Policy</a> | <a href="https://databricks.com/terms-of-use">Terms of Use</a> | <a href="https://help.databricks.com/">Support</a>