# Notebooks

Presentamos una demostración de cómo funciona un Notebook como IDE de interacción con lenguajes de programación científicos. Un Notebook es una interfaz web de programación que permite escribir porciones de código dentro de celdas y estas se pueden ejecutar independientemente. Además a través de 'magics', que son directivas que van precedidas del caracter '%' permiten ejecutar código de distintos lenguajes en un mismo Notebook. En general un Notebook permite:

<b>
- Programar en cualquier lenguaje de programación (R, Python, bash, Java, Nodejs, Latex, Markdown, etc.)
- Disponer de un solo entorno, web y colaborativo para implementar Data Pipelines incluidos los modelos de Analítica de Datos.
- Escribir código y visualizar los resultados de manera sencilla.

### ¿Deseas crear programas en Python?

In [0]:
# Fibonacci

def fibonacci_loop(num):
    if num == 0:
        return 0
    elif num == 1 or num == 2:
        return 1
    elif num > 2:
        a = 1 # variable for (n - 1)
        b = 1 # variable for (n - 2)
        for _ in range(3, num + 1):
            c = a + b
            a, b = b, c

        return c

In [0]:
%time fibonacci_loop(40)

### ¿Deseas crear programas en R?
En el mismo notebook :O

In [0]:
%r
set.seed(0.234234)
# both x and y contains now 100000 random numbers
x=runif(100000)
y=runif(100000)
z=sqrt(x^2+y^2)
# The following returns the indices vector when z is less than 1
which(z<1)
print(length(which(z<=1))*4/length(z))

### ¿Deseas explicar una fórmula con Latex?

$$\int_a^b f(x) = F(b) - F(a)$$
$$(c = $$pm$$sqrt{a^2 + b^2} $$)
$$(A{_i}{_j}=B{_i}{_j}$$):

### ¿Deseas graficar?

In [0]:
#Instalar librería vía comando
!pip install matplotlib

In [0]:
from matplotlib import pyplot as plt
x = range(1000)
y = [i ** 2 for i in x]
fig, plt = plt.subplots()
plt.plot(x,y)
display(fig)

### Databricks tiene su propio motor de visualizaciones rápidas

In [0]:
# Databricks tiene un set de ejemplos en su dbfs, usaremos el ejemplo de bike sharing:
df = spark.read.format("csv").option("inferSchema", "true").option("header", "true").load("dbfs:/databricks-datasets/bikeSharing/data-001/day.csv")
# Databricks permite crear tablas temporales en el contexto SQL
df.registerTempTable("bikeshare")
# Se puede utilizar Spark SQL para consultar las tablas temporales y/o vistas
display(spark.sql("SELECT season, MAX(temp) as temperature, MAX(hum) as humidity, MAX(windspeed) as windspeed FROM bikeshare GROUP BY season ORDER BY SEASON"))

### Dashboards!

<img src="https://databricks.com/wp-content/uploads/2020/04/Home-slide-sclaing-demand.png" style="width:50%">

### Databricks File System

* **/FileStore:** Imported data files, generated plots, and uploaded libraries. See FileStore.
* **/databricks-datasets:** Sample public datasets.
* **/databricks-results:** Files generated by downloading the full results of a query.
* **/databricks/init:** Global and cluster-named (deprecated) init scripts.
* **/user/hive/warehouse:** Data and metadata for non-external Hive tables.

Más info: https://docs.databricks.com/data/databricks-file-system.html

In [0]:
display(dbutils.fs.ls("dbfs:/"))