# Plantillas de proyectos para ciencia de datos

## ¿Qué son y por qué utilizar plantillas de proyectos?

### ¿Qué son las plantillas de proyectos?
Las plantillas de proyectos son un medio que posibilita portar o construir un diseño predefinido. Estas te permiten definir carpetas, notebooks, scripts, archivos de configuración, etc.

### ¿Por qué usar plantillas de proyectos?
Algunas razones para usar plantillas en proyectos se debe a que:
* Agiliza tu trabajo y reduce la fatiga por decisión.
* Es más fácil de personalizar un proyecto hecho con plantillas que hecho desde cero.
* La reproducibilidad de un proyecto es más viable.
* Es más fácil encontrar algo entre los componentes del proyecto.

## Instalar Cookiecutter

### ¿Qué es Cookiecutter?
Es un manejador de plantillas multiplataforma (Windows, Mac OS, Linux) que te permite hacer plantillas en lenguaje de programación o formato de marcado. Puede ser usado como herramienta de línea de comandos o como librería de Python.

Cookiecutter funciona con Jinja, un motor de plantillas extensible con el cual puedes crear plantillas como si estuvieras escribiendo código en Python.

### ¿Cómo funciona?
Hay 3 pasos para entender la manera en que funciona:
* Detectará una sintaxis especial en los documentos y carpetas de tu proyecto.
* Buscará variables y valores a reemplazar.
* Finalmente, entregará un proyecto con la estructura definida en la plantilla.

### Sintaxis de Jinja
Existen 3 tipos diferentes de bloques:
* Bloques de expresión: se usan para incluir variables en la plantilla:
```
{{ cookiecutter.saluda }}
```
* Bloques de declaración: se usan para el uso de condicionales, ciclos, etc.:
```
{% if coockiecutter.eres_asombroso %}
. . .
{% endif %}
```
* Bloques de comentario: se usan para dejar comentarios o recomendaciones a los propios desarrolladores:
```
{# Esto es un comentario #}
```

### Instalación de Cookiecutter
Importante: Todos los pasos son vía consola y con Anaconda instalado.
1. Crea una carpeta un entrar en ella:
```
mkdir <nombre_carpeta>
cd <nombre_carpeta>
```
2. Agrega el canal Conda-Forge a tu configuración global:
```
conda config --add channels conda-forge
```
3. Crea un ambiente virtual que contenga a Coockiecutter:
```
conda create --name <nombre_ambiente> coockiecutter=1.7.3
```
4. Activa el ambiente virtual:
```
conda activate <nombre_ambiente>
```
5. Definir en dónde estará tu ambiente:
```
conda env export --from-history --file environment.yml
```
6. Para desactivar el ambiente virtual:
```
conda deactivate
```

## Crear plantillas de proyecto personalizadas

### Estructura inicial de la plantilla
Dentro de la carpeta principal crea la carpeta que contendrá todo lo que necesitarás en tu proyecto con el nombre:
```
{{ coockiecutter.project.slug }}
```
En la carpeta recién creada agrega los siguientes archivos:
```
README.md
environment.yml
coockiecutter.json
```
También crea las carpetas que necesitará tu proyecto:
```
/data
/notebooks
```
Afuera de la carpeta, pero dentro de la carpeta principal, crea el siguiente archivo:
```
environment.yml
```
Hay dos archivos environment.yml, el de configuración de entorno (dentro de la carpeta que creaste) y el que configura las dependencias y paquetes (en la carpeta principal).

### Información de README.md
Adentro del archivo README.md agrega las siguientes líneas que lo harán un archivo dinámico:
```
# {{ coockiecutter.project_title }}
By: {{ coockiecutter.project_author_name }}
{{ coockiecutter.project_description }}
```
Estas líneas, hechas en Jinja, permitirán a tu archivo acceder a las variables que contienen la información del título, autor y descripción del proyecto.

### Información de environment.yml (entorno)
```
# conda env create --file environment.yml
name: cookiecutter-personal-platzi
channels:
  - anaconda
  - conda-forge
  - defaults
dependencies:
  - cookiecutter
```

### Información de environment.yml (configuración)
```
# conda env create --file environment.yml
name: {{ cookiecutter.project_slug }}
channels:
  - anaconda
  - conda-forge
  - defaults
dependencies:
  {% if cookiecutter.project_packages == "All" -%}
  - fs
  - jupyter
  - jupyterlab
  - pathlib
  {% endif -%}
  - pip
  {% if cookiecutter.project_packages == "All" -%}
  - pyprojroot
  {% endif -%}
  - python={{ cookiecutter.python_version }}
  - pip:
    {% if cookiecutter.project_packages == "All" -%}
    - pyhere
    {% endif -%}
```

### Agregando información a coockiecutter.json
Dentro de este archivo configurarás todos los valores de las variables que utilizas en los demás archivos:
```json
{
    "project_title": "Cookiecutter Personal",
    "project_slug": "{{ coockiecutter.project_title.lower().replace(" ", "_").replace("-", "_") }}",
    "project_description": "Tu primer proyecto con Cookiecutter.",
    "project_author_name": "Tu nombre",
    "project_packages": ["All, Minimal"],
    "python_version": "3.7"
}
```

### Ejecuta el proyecto
* Inicializas el Coockiecutter con conda.
* Configuras la instalación, como en la clase anterior.

## Implementar hooks

### Introducción a Hooks
Los Hooks son sentencias que se van a ejecutar antes o después de generar la plantilla de datos. Por ejemplo, puedes usarlos para verificar el nombre de una carpeta, actualizar git, etc.

### Implementación de Hooks
* Se crea la carpeta `hooks`, adentro de la carpeta principal de tu proyecto.
* Dentro de la carpeta se agregan los archivos `pre_gen_project.py` (lo que se ejecuta antes de generar la plantilla) y `pos_gen_project.py` (lo que se ejecuta después de generar la plantilla).

Por ejemplo, en `pre_gen_project.py` se puede inicializar git o validar nombres y archivos para evitar errores.

En el archivo `pos_gen_project.py` se puede hacer el primer commit en git o mostrar la finalización de la instalación de dependencias.

## Distribuir plantilla de proyecto

Almacenar tu plantilla te permite poder compartirla con los demás y poder acceder a ella cuando necesites crear un nuevo proyecto.

### Distribución de tu plantilla (GitHub)
* Crea un nuevo repositorio vacío en GitHub. Puedes no agregar ninguna información sobre tu repositorio por el momento.
* Dentro de la carpeta que contiene tu proyecto inicializa git y haz tu primer commit:
``` bash
git init .
git add .
git commit -m "Initial commit"
```
* Ahora, para subir a GitHub tu proyecto, ejecuta lo siguiente:
``` bash
git remote add origin https://github.com/<usuario>/<repositorio>.git
git branch -M main
git push -u origin main
```
* No olvides eliminar cualquier carpeta innecesaria (por ejemplo, la carpeta que se genera cuando ejecutas Coockiecutter).
* Para evitar que git ignore las carpetas vacías, agrega un archivo “.gitkeep” dentro de cada carpeta vacía.

Cuando usas “cookiecutter” como parte del nombre de tu proyecto, este puede ser encontrado por otras personas en GitHub. De esta forma podrás ayudar a otros científicos de datos, facilitándoles el trabajo.