# 📒 Conceptos Básicos de Jupyter Notebooks

## 🌟 Objetivos de Aprendizaje

Al finalizar este módulo, serás capaz de:

1. 💡 **Entender** qué es y para qué sirve Jupyter Notebook.
2. 📘 **Comprender** conceptos y funcionalidades básicas de Jupyter Notebook.
3. 🛠️ **Familiarizarte** con la herramienta y su uso en proyectos de análisis de datos.

<a id='Indice'></a>
## Índice
[Inicio ▲](#Indice)

1. [¿Qué es Jupyter Notebook?](#Que-Es-Jupyter-Notebooks)
1. [Jupyter Notebook App](#Jupyter-Notebook-App)
    1. [Kernel](#Kernel)
    1. [Dashboard](#Dashboard)
1. [Instalación](#Instalacion)
1. [Ejecución](#Ejecucion)
1. [¿Cómo construír un Notebook?](#Como-construir-notebook)
    1. [Celdas](#Celdas)
        1. [¿Qué es una celda?](#Que-es-una-celda)
        1. [¿Cómo se ejecuta?](#Como-se-ejecuta)
        1. [¿Cómo se edita?](#Como-se-edita)
    1. [Ejemplos](#Ejemplos)
        1. [Markdown](#Markdown)
        1. [Code](#Code)
1. [Shortcuts](#Shortcuts)
1. [Mejores Prácticas](#Mejores-Practicas)
1. [Bibliografia](#Bibliografia)

<a id='Que-Es-Jupyter-Notebooks'></a>
## ¿Qué es Jupyter Notebooks?
[Inicio ▲](#Indice)

Jupyter Notebook (o más comunmente un "notebook" a secas), es un documento producido por la aplicación [Jupyter Notebook App](https://jupyter-notebook-beginner-guide.readthedocs.io/en/latest/what_is_jupyter.html#notebook-app), que contiene tanto código de computadora (por ejemplo, Python o R) como elementos de texto enriquecido (párrafos, ecuaciones, figuras, enlaces, etc.). Es tanto un documento legible por un ser humano, pudiendo contener la descripción de un análisis de datos y sus resultados (figuras, tablas, etc.), como ejecutable por una computadora, pudiendo contener snippets de código que ejecutan por ejemplo un análisis de datos.

Debido a esta capacidad de mezclar, código y elementos de texto, este tipo de documentos son ideales para colocar el trabajo de un data scientist (científico de datos), reuniendo el análisis y los resultados en un mismo lugar, a la vez que permite ser ejecutado en tiempo real.

Fuente: http://ipython.org/notebook.html#notebook-documents

## 🖥️ Importancia de Jupyter Notebooks en Data Analytics

Jupyter Notebooks se ha convertido en una herramienta esencial para los profesionales de Data Analytics y Data Science. Su importancia radica en varias razones clave:

### 🌟 Interactividad y Visualización

- Una de las características más destacadas de Jupyter Notebooks es su capacidad para combinar código ejecutable, visualizaciones y texto descriptivo en un solo documento. Esto permite a los analistas de datos explorar, analizar y visualizar datos de manera interactiva y dinámica. La capacidad de ver los resultados de los análisis en tiempo real facilita la comprensión y comunicación de los hallazgos.

### 📊 Documentación y Reproducibilidad

- Jupyter Notebooks permite a los analistas de datos documentar cada paso de su análisis de datos con texto enriquecido, explicaciones y resultados intermedios. Esta documentación detallada es crucial para la reproducibilidad del análisis. Otros pueden seguir el mismo notebook y obtener los mismos resultados, lo que es fundamental para la colaboración y la validación de los hallazgos.

### 🛠️ Flexibilidad y Compatibilidad

- Jupyter Notebooks es compatible con una amplia variedad de lenguajes de programación a través de su arquitectura de kernels. Aunque Python es el lenguaje más comúnmente utilizado, también se pueden ejecutar notebooks en R, Julia y otros lenguajes. Esta flexibilidad permite a los analistas de datos utilizar la mejor herramienta para cada tarea específica.

### 🚀 Facilidad de Uso y Accesibilidad

- La interfaz de Jupyter Notebooks es intuitiva y fácil de usar, lo que la convierte en una excelente herramienta tanto para principiantes como para expertos. La instalación y configuración son sencillas, especialmente con distribuciones como Anaconda. Además, la posibilidad de ejecutar Jupyter Notebooks en entornos en la nube, como Google Colaboratory, elimina la necesidad de configuraciones locales complejas y hace que los notebooks sean accesibles desde cualquier lugar.

### 🤝 Colaboración

- Jupyter Notebooks facilita la colaboración entre equipos multidisciplinarios. Los notebooks pueden ser compartidos fácilmente, permitiendo que diferentes miembros del equipo contribuyan al análisis, revisen el trabajo y aporten comentarios. La capacidad de integrar texto, código y visualizaciones en un solo documento mejora significativamente la comunicación de ideas y resultados.

### 🌍 Comunidad y Recursos

- La popularidad de Jupyter Notebooks ha dado lugar a una amplia y activa comunidad de usuarios y desarrolladores. Esto significa que hay una abundancia de recursos disponibles, incluyendo tutoriales, documentación, ejemplos de notebooks y soluciones a problemas comunes. Esta comunidad también contribuye al desarrollo continuo de la herramienta, asegurando que Jupyter Notebooks se mantenga actualizado con las últimas tecnologías y prácticas en Data Science.



<a id='#Jupyter-Notebook-App'></a>
## Jupyter Notebook App
[Inicio ▲](#Indice)

Jupyter Notebook App, es una aplicación cliente-servidor que permite editar y ejecutar notebooks a través de un navegador web. La aplicación se puede instalar y ejecutar de forma local en una PC y no requiere acceso a Internet. A su vez se puede instalar en un servidor web remoto para luego accederla a través de Internet.

Sus dos componentes principales son: (i) kernels y (ii) dashboard.

<a id='Kernel'></a>
### Kernel
Un kernel es un "motor" computacional, que ejecuta el código contenido dentro del notebook. Cuando se abre un notebook, el kernel asociado se ejecuta de forma automática. Luego cuando se ejecuta un notebook (ya sea celda-por-celda o desde el menú *Cell -> Run All*), el kernel ejecuta los cálculos computacionales y produce los resultados.

Por defecto la aplicación trae un kernel para el lenguaje Python, pero pueden agregarse kernels para otros lenguajes de programación como R.

<a id='Dashboard'></a>
### Dashboard
El Dashboard de la aplicación, es la componente gráfica la cual se visualiza cuando uno ejecuta Jupyter Notebook App. Permite gestionar notebooks (agregar, crear, editar, etc), configurar y gestionar los Kernels disponibles (seleccionar, apagar, reiniciar, etc), entre otras opciones.

<a id='Instalacion'></a>
## Instalación
[Inicio ▲](#Indice)

Ya que utilizamos Anaconda para la gestión y despliegue del ambiente, no es necesario instalar Jupyter Notebooks (viene dentro de la distribución). Por cualquier duda, ver el *Instructivo de Instalacion de Herramientas* [3] en la sección de *Bibliografía* y referencias.

Igualmente si deseas utilizar google colaboratory, el notebook está listo para su uso.


# Ejecución
[Inicio ▲](#Indice)

Ahora que conocemos un poco más sobre la herramienta con la que se trabajará en este taller, es tiempo de aprender cómo utilizarla.

Para ejecutar la aplicación de Jupyter Notebook en Python, sigue estos pasos:

1. Abre una terminal.
2. Activa el ambiente virtual del taller utilizando el comando `conda activate taller_cdatos`.
3. Ejecuta el comando `jupyter notebook`.

```bash
$ conda activate taller_cdatos
$ jupyter notebook
```

El comando `jupyter notebook` abrirá la aplicación y automáticamente abrirá tu navegador web predeterminado en la dirección `http://localhost:8888`.

![figura1](https://github.com/efviodo/idatha-data-science-course/raw/master/notebooks/figures/content_jupyternotebook1.gif "segment")

<center>Imagen extraída de <a href="https://www.datacamp.com/community/tutorials/tutorial-jupyter-notebook">DataCamp</a></center>

En la pestaña "Files" encontrarás todos los documentos referentes a tus "notebooks", mientras que en la pestaña "Running" podrás ver información sobre todos los procesos en ejecución. Desde la pestaña "Clusters", puedes controlar clusters de kernels para paralelismo en notebooks (aunque no se abordará en este curso).

¡Intentemos crear un nuevo Notebook para empezar a trabajar!

Para crear un nuevo Notebook, simplemente haz clic en el botón "New" en la pestaña "Files". Se desplegará un menú donde podrás seleccionar el tipo de archivo a crear, como Tex File, Folder, Terminal, Python 2, Python 3, R, etc. En este caso, seleccionaremos **Python** para empezar.

<div class="alert alert-info">
    <b>NOTA:</b>
    Las opciones disponibles al crear un Notebook dependen de los kernels instalados en tu ambiente. Si tienes Python 3 instalado, verás esa opción disponible. Cuando creas un ambiente virtual con conda create, Anaconda se asegura de instalar todas las bibliotecas necesarias para Python 3 y configura un kernel correspondiente para Jupyter Notebook.
</div>

Una vez creado tu primer "notebook", se abrirá un archivo en blanco con herramientas similares a las de un editor de texto estándar.

En la siguiente sección, exploraremos las principales herramientas de Jupyter Notebook y aprenderemos cómo construir tu primer notebook desde cero. Antes de pasar a la siguiente sección, familiarízate navegando por los diferentes menús y opciones disponibles en la herramienta.


<a id='Como-construir-notebook'></a>
## ¿Cómo construír un Notebook?
[Inicio ▲](#Indice)

### Celdas

<a id='Que-es-una-celda'></a>
#### ¿Qué es una celda?
Un notebook se compone por un conjunto de celdas o "cells" en inglés. Cada celda es una unidad independiente, que puede ser editada y ejecutada.

Existen diferentes tipos de celdas:

* *Code* : Contienen código que puede ser ejecutado, utilizando el Kernel seleccionado (ej. Python, R).
* *Markdown*: Contienen información descriptiva como textos enriquecidos (descripciones, tablas, figuras).
* *Raw NBConvert*: Tipo de celda utilizado cuando se quiere que Jupyter no interprete el contenido de la misma y lo muestre tal cual tu lo escribiste.
* *Heading*: Antiguamente se utilizaba para crear títulos, actualmente se utiliza una celda Markdown para lo mismo.

Cuando agregamos una nueva celda, por defecto se creará de tipo *Code*. Sin embargo puedes cambiar en cualquier momento el tipo de la misma simplemente seleccionando la celda y luego cambiando el tipo desde el menú que aparece en la parte superior del editor y eigiendo cualquier otro tipo.

![figure2](https://github.com/efviodo/idatha-data-science-course/raw/master/notebooks/figures/change_cell_type.png)


Repasando lo que hemos visto hasta ahora, simplemente con estos cuatro tipos de celdas podemos mostrar:

- `Código`
- Gráficas generadas a partir de código
- Texto **enriquecido**
- Expresiones matemáticas: $e^x=\sum_{i=0}^\infty \frac{1}{i!}x^i$
- Dibujos y *rich media* (HTML, LaTeX, PNG, SVG, etc.)

<a id='Como-se-ejecuta'></a>
#### ¿Cómo se ejecuta?
Cuando se abre por primera vez un Notebook, Juypyter carga la información de cada una de las celdas pero **NO** las ejecuta en su totalidad. Solamente ejecuta las celdas de tipo *Markdown*. Para ejecutar todas las celdas (incluyendo las de tipo *Code*), debemos ejecutarlas utilizando alguna de las varias formas que Jupyter pone a nuestra disposición:

* *Cell -> Run Cells*
* *Cell -> Run All*
* Seleccionar la celda y *Ctrl+Enter* (shortcut)

<a id='Como-se-edita'></a>
#### ¿Cómo se edita?
Para editar el contenido de una celda, basta con seleccionar la celda y cambiar al [Modo edición](#Modo-Edicion). Para esto basta con hacer doble click en la selda que queremos editar.


### Ejemplos

#### Markdown
Esta es una celda de tipo *Markdown*; la misma permite escribir texto con cierto formato, por ejemplo títulos, listas, tablas. Probemos de insertar diferentes objetos, para investigar que tipo de cosas podemos hacer con ella:

&rarr; Diferentes tipos de fuentes: **Negrita**, *Italica*, ~~Tacchado~~

&rarr; Diferentes tamaños de letra:

# Título 1
## Título 2
### Título 3
#### Título 4

&rarr; Lista de elementos
    
* Item 1
* Item 2
  * Item 2.1
    * Item 2.2
    * Item 2.3


&rarr; Lista ordenada

    1. Elemento 1
    2. Elemento 2
    3. Elemento 3

&rarr; Tablas

| Clase | Día | Fecha |
| ----- | --- | ----- |
| 1 | Lunes | 22/0/2018 |
| 2 | Martes | 23/0/2018 |
| 3 | Miércoles | 24/0/2018 |
| 4 | Viernes | 26/0/2018 |

&rarr; Imagenes

<img src="https://github.com/efviodo/idatha-data-science-course/raw/master/notebooks/figures/jupyter-logo.png" width="200px" style="center; margin-top:50px"/>

&rarr; HTML


<form>
  First name:<br>
  <input type="text" name="firstname"><br>
  Last name:<br>
  <input type="text" name="lastname">
</form>

Por más información sobre lenguaje Markdown ver https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet

#### Código

In [2]:
# Esto es una celda de código de python. Como puedes ver, es posible editar el contenido de la misma y ejecutarla para ver su resultado
# El resultado se muestra debajo de la celda una vez que la misma fue ejecutada. 
# Prueba de editar el contenido de la celda para ver como cambia el resultado!

print("¡Hola mundo!")

¡Hola mundo!



# Obtener Ayuda en Jupyter Notebook para Análisis de Datos

Durante el análisis de datos en Jupyter Notebook, puedes aprovechar varias funciones y comandos integrados para obtener ayuda y resolver problemas. Aquí se detallan algunas formas útiles de utilizar Jupyter Notebook para este propósito.



## Uso del Comando `?`

El comando `?` te permite obtener información sobre objetos específicos en Python, como funciones, métodos o incluso módulos completos. 

Por ejemplo, para obtener ayuda sobre la función `pandas.DataFrame`, puedes ejecutar:


In [None]:
sum?

Esto abrirá una ventana con la documentación de la función sum, mostrando su firma, parámetros, y una breve descripción de su uso.



Función help()
La función help() en Python te proporciona documentación interactiva desde la consola de Python. En Jupyter Notebook, puedes usar help() para obtener ayuda detallada sobre cualquier objeto de Python.

Por ejemplo, para obtener ayuda sobre la función read_csv() de pandas, puedes ejecutar:


In [None]:
help(sum)

<a id='#Shortcuts'></a>
## Shortcuts
[Inicio ▲](#Indice)

## Atajos de Teclado en Jupyter Notebook

### Modo Comando vs. Modo Edición

Jupyter Notebook tiene dos modos de entrada diferentes que puedes distinguir por el color del borde de la celda:

**1. Modo comando**: Se indica con un borde azul. En este modo, puedes usar atajos de teclado para realizar acciones a nivel del notebook.

**2. Modo edición**: Se indica con un borde verde. Aquí es donde puedes editar el contenido de la celda seleccionada.

### Atajos de Teclado en Modo Comando

- `Shift + Enter`: Ejecuta la celda actual y selecciona la siguiente.
- `Ctrl + Enter`: Ejecuta la celda actual.
- `Option + Enter`: Ejecuta la celda actual e inserta una nueva debajo.
- `A`: Inserta una celda arriba de la celda actual.
- `B`: Inserta una celda debajo de la celda actual.
- `C`: Copia la celda o celdas seleccionadas.
- `V`: Pega la celda desde el portapapeles.
- `D`, `D` (presionar D dos veces seguidas): Borra la celda o celdas seleccionadas.
- `Shift + M`: Fusiona el contenido de las celdas seleccionadas, o la celda actual con la de abajo si solo una está seleccionada.
- `I`, `I` (presionar I dos veces seguidas): Detiene el kernel.
- `0`, `0` (presionar 0 dos veces seguidas): Reinicia el kernel.
- `Y`: Cambia el tipo de celda a *Code*.
- `M`: Cambia el tipo de celda a *Markdown*.

### Atajos de Teclado en Modo Edición

- `Cmd + /` (en Mac) o `Ctrl + /` (en Windows/Linux): Alterna las líneas seleccionadas entre comentarios y código.
- `Ctrl + Shift + -`: Divide la celda en el cursor.

Estos atajos de teclado te permiten realizar diversas acciones de manera rápida y eficiente en Jupyter Notebook, mejorando tu flujo de trabajo tanto en la creación de código como en la redacción de documentos con Markdown.



<a id='#Mejores-Practicas'></a>
## Mejores Prácticas
[Inicio ▲](#Indice)

A continuación se presentan una serie de buenas prácticas que te ayudarán a crear notebooks más organizados y eficientes en Python y Jupyter Notebook.

### Importación de Dependencias en la Primera Celda
* Realiza todas las importaciones necesarias al inicio del notebook en la primera celda. Esto mejora la legibilidad del código, asegura que todas las dependencias estén claras desde el principio y facilita la recarga de todas las dependencias al reiniciar el notebook.

### Mantén Tus Celdas Simples
* Procura que tus celdas sean claras y concisas. Evita tener una única celda con demasiado código o comentarios extensos. Asegúrate de mantener un equilibrio adecuado entre la cantidad de celdas y la complejidad del contenido en cada una.

### Define Métodos y Funciones
* Para análisis de datos complejos, aprovecha la programación modular definiendo métodos y funciones que encapsulen comportamientos repetitivos o complejos. Coloca secciones dedicadas a métodos útiles al inicio del notebook para facilitar la reutilización.

### Utiliza un Sistema de Control de Versiones
* Para mantener un registro claro y organizado de tus notebooks, utiliza un sistema de control de versiones como [Git](https://git-scm.com/), [Github](https://github.com/), o [GitLab](https://about.gitlab.com/). Esto te permite gestionar cambios, colaborar y mantener un historial de versiones de manera efectiva.

### Convención de Nombres de Archivos
* Adopta una convención clara para nombrar tus notebooks que refleje el contenido y propósito de cada uno. Por ejemplo:
   - `001-Analisis-Compras-Estatales.ipynb`
   - `002-Evaluacion-Calidad-Compras-Estatales.ipynb`

Evita nombres genéricos como `Notebook 2` o `Calentamiento` que no describen adecuadamente el contenido.

### Divide el Notebook en Secciones
* Organiza tu notebook utilizando Markdown para dividirlo en secciones. Incluye una sección de **Objetivos** y un **Índice** al inicio para orientar al lector sobre la estructura y propósito del notebook.

### Aprende Observando Otros Notebooks
* Una excelente manera de mejorar tus habilidades en la creación de notebooks es estudiar ejemplos y buenas prácticas observando otros notebooks. Puedes encontrar muchos ejemplos en sitios como [nbviewer](https://nbviewer.jupyter.org/) o repositorios en [Github](https://github.com/jakevdp/PythonDataScienceHandbook/tree/master/notebooks).

Estas prácticas te ayudarán a mantener tus notebooks organizados, legibles y eficientes, facilitando el trabajo colaborativo y la gestión de proyectos en Python con Jupyter Notebook.


<a id='Bibliografia'></a>
## Bilbiografía
[Inicio ▲](#Indice)

<ol>
    <li><a href="https://www.datacamp.com/community/tutorials/tutorial-jupyter-notebook">Tutorial Jupyter Notebooks</a></li>
    <li><a href="http://maxmelnick.com/2016/04/19/python-beginner-tips-and-tricks.html">Shortcuts Jupyter</a></li>
</ol>