<img src="../static/logo.png" alt="datio" style="width: 200px "align="right"/>

# Guía de lenguajes de programación (Python)

Contenidos:
* **Repositorios Python**: repositorios Github ofrecidos tanto para realizar el curso de introducción al lenguaje Python como para complementar la formación. 
* **Herramienta de trabajo**: breve descripción de la tecnología utilizada como entorno para realizar el curso.
* **Docker**: descripción del contenedor Docker utilizado para disponibilizar el entorno de trabajo.
* **Pasos a seguir**: facilita el procedimiento a llevar a cabo para tener disponible el entorno de trabajo y el material del curso.

## Repositorios Python

<img src="../static/github.png">

En el [repositorio de Github](https://github.com/DatioBD/academy/blob/master/languages/python.md) se encuentra la documentación necesaria para complementar la introducción desde cero al lenguaje de programación Python. Aquí se ofrecen cursos online recomendados para profundizar en el lenguaje y bibliografía básica.

Así mismo, el contenido de la formación de Python, se encuentra en este otro repositorio: [datiopython](https://github.com/DatioBD/academy/tree/master/courses/python)

## Herramienta de Trabajo

<img src="../static/jupyter.png">

La herramienta elegida para llevar a cabo la formación ha sido el notebook de [Jupyter](http://jupyter.org).
A continuación se explicarán de forma breve y concisa una serie de conceptos relacionados con el entorno de trabajo:
* **Jupyter**: Jupyter es un entorno interactivo de computación que permite la edición de *notebooks*. 
* **Notebook**: entorno interactivo web de ejecución de código. El notebook de Jupyter combina tres componentes:
  * *Aplicación web*: aplicación que permite escribir y ejecutar código de forma interactiva sobre un entorno web.
  * *Kernel*: antes de abrir un notebook, la aplicación web inicia el kernel sobre el que corre el código de ese notebook. Un kernel es capaz de soportar un único lenguaje de programación, sin embargo Jupyter ofrece múltiples kernels para los siguientes lenguajes:
    * [Python](https://github.com/ipython/ipython)
    * [Julia](https://github.com/JuliaLang/IJulia.jl)
    * [R](https://github.com/takluyver/IRkernel)
    * [Ruby](https://github.com/minrk/iruby)
    * [Haskell](https://github.com/gibiansky/IHaskell)
    * [Scala](https://github.com/Bridgewater/scala-notebook)
    * [node.js](https://gist.github.com/Carreau/4279371)
    * [Go](https://github.com/takluyver/igo) 
  * *Documento*: documento "auto-contenido" que agrupa todos los tipos de contenido visibles de la aplicación web (entradas y salidas de código, texto, imágenes, etc.). Cada documento tiene su propio kernel e internamente está estructurado como documento JSON que contiene tantos documentos como celdas.
* **Celda**: Entrada de texto del notebook que puede contener:
    * Código
    * Widgets interactivos
    * Plots
    * Texto 
    * Imágenes 
* **IPython**: kernel de python para jupyter / shell de python

## Docker

<img src="../static/docker.png">

#### Introducción a Docker
La instalación del entorno de trabajo (se explicará a continuación), se llevará a cabo por medio de un **contenedor Docker**.<br/>
**Docker** es una tecnología de código abierto que permite crear, ejecutar, probar e implementar aplicaciones (con todas sus dependencias) dentro de contenedores de software.<br/>
Los **contenedores** no son más que paquetes de elementos que permiten ejecutar una aplicación desde cualquier sistema operativo (linux, mac o windows). 
Estos contenedores resuelven:
* La necesidad de tener disponibles todas las dependencias (librerías, sistemas de archivos, etc.) necesarias para ejecutar una aplicación de forma correcta
* El aislamiento y asignación de recursos de un proceso (memoria, disco, cpu) durante el tiempo de vida del proceso.<br/> 
La estructura de un contenedor se define en un fichero llamado **Dockerfile**. Este fichero no deja de ser una *receta* que define los pasos necesarios para construir la imagen de dicho contenedor. </br>
Otra ventaja que ofrece Docker es la posibilidad de hacer uso de un registro (público o privado), llamado [Docker Registry](https://hub.docker.com) donde subir y bajar las imágenes docker, de forma que para construir una imagen no sea necesario tener ficheros en local, sino simplemente una conexión web. <br/>


#### Docker Jupyter Notebook

Para llevar a cabo la instalación del entorno, se hará uso del proyecto [Docker-Stacks](https://github.com/jupyter/docker-stacks) que agrupa una serie de contenedores docker capaces de lanzar aplicaciones Jupyter de diversas tecnologías:
* Python
* Scala
* R
* Spark
* Mesos stack<br/>

La imagen de este proyecto se encuentra accesible de forma pública desde el [Docker Registry del proyecto](https://hub.docker.com/r/jupyter/all-spark-notebook/)

Ya que esta imagen contiene un notebook que permite ejecutar los kernels de distintas tecnologías. Este entorno de trabajo será el utilizado para toda la formación orientada a lenguajes de programación (**Python**, **Scala** y **R**) así como para la centrada en el procesamiento mediante **Apache Spark**.

## Pasos a Seguir

<img src="../static/checklist.png" style="max-width:20%; width: 20%;">

#### Opción A: Configuración de la máquina virtual proporcionada para la formación de Datio

Para llevar a cabo la configuración del entorno de trabajo recomendado para la formación de lenguajes de programación, se ha elaborado la siguiente guía donde se explica paso a paso cómo importar una máquina virtual con el software necesario:<br/>
[Instrucciones de configuración de máquina virtual](https://github.com/DatioBD/academy/blob/master/courses/python/notebooks_completos/1_VirtualBoxDocker.ipynb)

#### Opción B: Configuración libre sin hacer uso de software de virtualización

#### 1. Descarga del material del curso

En primer lugar, se recomienda acceder al repositorio web de datio academy desde el navegador, para a continuación descargar una copia en local.

<img src="../static/download.gif">

A continuación, el arhivo zip se descomprime en una carpeta local *$CURSO_DATIO*

#### 2. Construcción y ejecución del notebook

##### a. Instalación Docker Engine
En el caso de no tener instalado el motor de docker, es necesario realizar ese paso:
[Install docker engine](https://docs.docker.com/engine/installation/)<br/>
Una vez completado el proceso de instalación, desde el terminal de sistema debe aparecer un mensaje similar al que se muestra a continuación, cuando se ejecuta el mandato "docker":<br/>

<img src="../static/dockerprompt.png">

##### b. Creación contenedor del entorno de trabajo

Una vez instalado docker, para crear el contenedor con los notebooks necesarios para la formación, basta con ejecutar la siguiente instrucción desde un terminal que tenga el docker engine instalado: <br/>

docker run -d -p 8888:8888 -v $CURSO_DATIO:/home/jovyan/work jupyter/all-spark-notebook start-notebook.sh --NotebookApp.token='' 

Esta instrucción realiza lo siguiente:<br/>
1.- Descarga el contenedor con los notebooks necesarios, en caso de que no estén descargados (jupyter/all-spark-notebook)<br/>
2.- Monta en el directorio home del notebook (/home/jovyan/work), el material para la formación que se ha descargado en la ruta $CURSO_DATIO.<br/>
3.- Mapea el puerto 8888 local para poder acceder desde el navegador al notebook (-p 8888:8888).<br/>

Un ejemplo de ello, sería si la descarga del repositorio es en /home/rbravo/datiobd/curso:


docker run -d -p 8888:8888 -v /home/rbravo/datiobd/curso:/home/jovyan/work jupyter/all-spark-notebook start-notebook.sh --NotebookApp.token=''

#### 3. Acceso al notebook

Una vez descargado el contenedor, se ejecuta por medio del mandato "docker run" y si todo va bien, estará disponible desde el navegador desde la siguiente url:

http://localhost:8888

Nota: En el caso que el sistema operativo utilizado no sea Linux, habrá que cambiar la dirección ip por la dirección ip del docker engine.

<img src="../static/notebooklocal.png">

Una vez aparezca el notebook desde el navegador, para seguir el curso, bastará con acceder a cada uno de los contenidos existentes.