### <a name="index"></a>Index

[¿Qué son las plantillas de proyectos?](#mark_01)

[¿Por qué usar plantillas de proyectos?](#mark_02)

[¿Qué es Cookiecutter?](#mark_03)

[¿Cómo funciona?](#mark_04)

[Estructura inicial de la plantilla](#mark_05)

[Implementar hooks](#mark_06)

[Compartir plantilla de proyecto](#mark_07)

[Manejo de rutas problemáticas](#mark_08)

[Cómo Crear y Manejar Rutas "OS"](#mark_09)

[Cómo Crear y Manejar Rutas "pathlib"](#mark_10)

[Cómo Crear y Manejar Rutas "PyFilesystem2"](#mark_11)

[Cómo Evitar Romper Un Proyecto Cuando Cambiamos De Lugar Un Archivo](#mark_12)

[Descarga de plantilla y configuración de ambiente virtual](#mark_13)

[Declaración para actualizaciones automáticas](#mark_14)

[Agregar Código Propio Como Librería](#mark_15)

[](#mark_)

### <a name="mark_01"></a>¿Qué son las plantillas de proyectos?
[Index](#index)

Las plantillas de proyectos son un medio que posibilita portar o construir un diseño predefinido. Estas te permiten definir carpetas, notebooks, scripts, archivos de configuración, etc.

### <a name="mark_02"></a>¿Por qué usar plantillas de proyectos?
[Index](#index)

Algunas razones para usar plantillas en proyectos se debe a que:

- Agiliza tu trabajo y reduce la fatiga por decisión.
- Es más fácil de personalizar un proyecto hecho con plantillas que hecho desde cero.
- La reproducibilidad de un proyecto es más viable.
- Es más fácil encontrar algo entre los componentes del proyecto.

### <a name="mark_03"></a>¿Qué es Cookiecutter?
[Index](#index)

Es un manejador de plantillas multiplataforma (Windows, Mac OS, Linux) que te permite hacer plantillas en lenguaje de programación o formato de marcado. 

Puede ser usado como herramienta de línea de comandos o como librería de Python.

Cookiecutter funciona con Jinja, un motor de plantillas extensible con el cual puedes crear plantillas como si estuvieras escribiendo código en Python.

### <a name="mark_04"></a>¿Cómo funciona?
[Index](#index)

Hay 3 pasos para entender la manera en que funciona:

Detectará una sintaxis especial en los documentos y carpetas de tu proyecto.
Buscará variables y valores a reemplazar.

Finalmente, entregará un proyecto con la estructura definida en la plantilla.

* Sintaxis de Jinja

Existen 3 tipos diferentes de bloques:

- Bloques de expresión: se usan para incluir variables en la plantilla:

```{{ cookiecutter.saluda }}```

- Bloques de declaración: se usan para el uso de condicionales, ciclos, etc.:

```
{% if coockiecutter.eres_asombroso %}
. . .
{% endif %}
```

- Bloques de comentario: se usan para dejar comentarios o recomendaciones a los propios desarrolladores:

```{# Esto es un comentario #}```

* Instalación de Cookiecutter

- Importante: Todos los pasos son vía consola y con Anaconda instalado.

* Crea una carpeta y entrar en ella:

```mkdir <nombre_carpeta>```
```cd <nombre_carpeta>```

* Agrega el canal Conda-Forge a tu configuración global:

```conda config --add channels conda-forge```

* Crea un ambiente virtual que contenga a Coockiecutter:

```conda create --name <nombre_ambiente> coockiecutter=1.7.3```

* Activa el ambiente virtual:

```conda activate <nombre_ambiente>```

* Definir en dónde estará tu ambiente:

```conda env export --from-history --file environment.yml```

El comando `conda env export --from-history --file environment.yml` se utiliza para exportar el entorno de Anaconda a un archivo YAML, pero solo incluyendo los paquetes que se instalaron explícitamente en el historial del entorno. Esto difiere del comportamiento predeterminado de `conda env export`, que exporta todos los paquetes en el entorno, independientemente de cómo se instalaron.

**Explicación de los parámetros:**

* `--from-history`: Esta opción le indica a conda que solo incluya los paquetes que se instalaron explícitamente en el historial del entorno. Esto excluye los paquetes que se instalaron como dependencias implícitas de otros paquetes.
* `--file environment.yml`: Esta opción especifica el nombre del archivo YAML al que se exportará el entorno.

**Beneficios de usar `--from-history`:**

* **Reproducibilidad:** Al limitar la exportación a los paquetes explícitamente instalados, garantiza que la definición del entorno sea reproducible, independientemente de las dependencias indirectas que puedan variar entre sistemas.
* **Portabilidad:** Los archivos YAML generados con `--from-history` tienden a ser más pequeños y menos propensos a problemas de plataforma cruzada debido a la ausencia de dependencias implícitas.

**Limitaciones a tener en cuenta:**

* Los paquetes instalados con actualizaciones automáticas o utilizando flags como `--update-deps` no se incluirán en el archivo YAML ya que no forman parte del historial explícito de instalación.
* Si el entorno depende de paquetes no estándar o paquetes de canales no predeterminados, es posible que la creación del entorno a partir del archivo YAML requiera pasos adicionales para instalar estos paquetes manualmente.

**En resumen:**

`conda env export --from-history --file environment.yml` es una herramienta útil para crear archivos YAML reproducibles y portátiles de definiciones de entornos Anaconda. Sin embargo, es importante tener en cuenta las limitaciones y asegurarse de que el archivo YAML sea compatible con el sistema de destino.

* Para desactivar el ambiente virtual:

```conda deactivate```


### <a name="mark_05"></a>Estructura inicial de la plantilla
[Index](#index)

![](img_00.png)

Dentro de la carpeta principal crea la carpeta que contendrá todo lo que necesitarás en tu 

proyecto con el nombre:

```{{ coockiecutter.project_slug }}```

En la carpeta recién creada agrega los siguientes archivos:

- README.md
- environment.yml
- coockiecutter.json

También crea las carpetas que necesitará tu proyecto:

- /data
- /notebooks

Afuera de la carpeta, pero dentro de la carpeta principal, crea el siguiente archivo:

- environment.yml

Hay dos archivos environment.yml, el de configuración de entorno (dentro de la carpeta que creaste) y el que configura las dependencias y paquetes (en la carpeta principal).

Información de README.md

Adentro del archivo README.md agrega las siguientes líneas que lo harán un archivo dinámico:

```
# {{ coockiecutter.project_title }}
By: {{ coockiecutter.project_author_name }}
{{ coockiecutter.project_description }}
```
Estas líneas, hechas en Jinja, permitirán a tu archivo acceder a las variables que contienen la información del título, autor y descripción del proyecto.

Información de environment.yml (entorno)
```yml
# conda env create --file environment.yml
name: cookiecutter-personal-platzi
channels:
  - anaconda
  - conda-forge
  - defaults
dependencies:
  - cookiecutter
```

Información de environment.yml (configuración)
```yml
# conda env create --file environment.yml
name: {{ cookiecutter.project_slug }}
channels:
  - anaconda
  - conda-forge
  - defaults
dependencies:
  {% if cookiecutter.project_packages == "All" -%}
  - fs
  - jupyter
  - jupyterlab
  - pathlib
  {% endif -%}
  - pip
  {% if cookiecutter.project_packages == "All" -%}
  - pyprojroot
  {% endif -%}
  - python={{ cookiecutter.python_version }}
  - pip:
    {% if cookiecutter.project_packages == "All" -%}
    - pyhere
    {% endif -%}
```

Agregando información a coockiecutter.json

Dentro de este archivo configurarás todos los valores de las variables que utilizas en los demás archivos:
```json
{
    "project_title": "Cookiecutter Personal",
    "project_slug": "{{ coockiecutter.project_title.lower().replace(" ", "_").replace("-", "_") }}",
    "project_description": "Tu primer proyecto con Cookiecutter.",
    "project_author_name": "Tu nombre",
    "project_packages": ["All, Minimal"],
    "python_version": "3.7"
}
```

Ejecuta el proyecto

- Inicializas el Coockiecutter con conda.
- Configuras la instalación, como en la clase anterior.

### <a name="mark_06"></a>Introducción a Hooks
[Index](#index)

Los Hooks son sentencias que se van a ejecutar antes o después de generar la plantilla de datos. Por ejemplo, puedes usarlos para verificar el nombre de una carpeta, actualizar git, etc.

Implementación de Hooks:

Se crea la carpeta “hooks”, adentro de la carpeta principal de tu proyecto.

Dentro de la carpeta se agregan los archivos “pre_gen_project.py” (lo que se ejecuta antes de generar la plantilla) y “pos_gen_project.py” (lo que se ejecuta después de generar la plantilla).
Por ejemplo, en “pre_gen_project.py” se puede inicializar git o validar nombres y archivos para evitar errores.

```python
import os
import subprocess

MESSAGE_COLOR = "\x1b[34m"
RESET_ALL = "\x1b[0m"

print(f"{MESSAGE_COLOR}Almost done!")
print(f"Initializing a git repository...{RESET_ALL}")

subprocess.call(['git', 'init'])
subprocess.call(['git', 'add', '*'])
subprocess.call(['git', 'commit', '-m', 'Initial commit'])

print(f"{MESSAGE_COLOR}The beginning of your destiny is defined now! Create and have fun!{RESET_ALL}")
```
En el archivo “pos_gen_project.py” se puede hacer el primer commit en git o mostrar la finalización de la instalación de dependencias.

```python
import os
import sys

project_slug = "{{ cookiecutter.project_slug }}"

ERROR_COLOR = "\x1b[31m"
MESSAGE_COLOR = "\x1b[34m"
RESET_ALL = "\x1b[0m"

if project_slug.startswith("x"):
   print(f"{ERROR_COLOR}ERROR: {project_slug=} is not a valid name for this template.{RESET_ALL}")

   sys.exit(1)

print(f"{MESSAGE_COLOR}Let's do it! You're are going to create something awesome!")
print(f"Creating project at { os.getcwd() }{RESET_ALL}")
```

### <a name="mark_07"></a>Compartir plantilla de proyecto
[Index](#index)

Almacenar tu plantilla te permite poder compartirla con los demás y poder acceder a ella cuando necesites crear un nuevo proyecto.

Distribución de tu plantilla (GitHub)

Crea un nuevo repositorio vacío en GitHub. Puedes no agregar ninguna información sobre tu repositorio por el momento.

Dentro de la carpeta que contiene tu proyecto inicializa git y haz tu primer commit:

_ git init .
_ git add .
_ git commit -m "Initial commit"

Ahora, para subir a GitHub tu proyecto, ejecuta lo siguiente:

_ git remote add origin https://github.com/<usuario>/<repositorio>.git
_ git branch -M main
_ git push -u origin main


    No olvides eliminar cualquier carpeta innecesaria (por ejemplo, la carpeta que se genera cuando ejecutas Coockiecutter).

    Para evitar que git ignore las carpetas vacías, agrega un archivo “.gitkeep” dentro de cada carpeta vacía.

    Cuando usas “cookiecutter” como parte del nombre de tu proyecto, este puede ser encontrado por otras personas en GitHub. De esta forma podrás ayudar a otros científicos de datos, facilitándoles el trabajo.

### <a name="mark_08"></a>Manejo de rutas problemáticas:
[Index](#index)

Un problema común en el manejo de rutas es la incompatibilidad entre los sistemas de archivos de los sistemas operativos, ya sea Windows, Mac, Linux o WSL. 

* Por ejemplo:

Windows utiliza el “backslash” en sus rutas de archivos, mientras que el resto usa el “foward slash”.

* Solución al manejo de rutas:

Esto hace que, cuando inicies un nuevo proyecto, tengas que hacerte varias preguntas, por ejemplo:

_ ¿Habrá más personas involucradas?

_ ¿Habrá más de un ordenador involucrado?

_ ¿Cuál será la ubicación del proyecto, dentro del sistema de archivos de cada ordenador?

_ ¿Cómo se vería afectado un proyecto si reestructuras su contenido, en una fase intermedia de desarrollo?

Deberías poder trabajar en tu proyecto y no tener que preocuparte por nada más que eso.

### <a name="mark_09"></a>Cómo Crear y Manejar Rutas "OS":
[Index](#index)

Crear la ruta “./data/raw/” independiente del sistema operativo. 

En este caso usaremos os, un módulo de Python que sirve para manejar rutas.

IMPORTANTE: cerciórate de que estás trabajando en el entorno correcto.

[documentación](https://docs.python.org/3/library/os.html)

Implementación:

```python
import os
current_dir = os.getcwd() # Ruta actual de trabajo

#suponiendo que en un directorio padre tenemos un directorio "data" y dentro otro llamado "raw"
data_dir=os.path.join(current_dir, os.pardir,"data","raw") # Ruta objetivo (os.pardir: ruta padre)

os.path.exists(data_dir)  # Revisa si el path existe
os.path.isdir(data_dir)  # Revisa si es un directorio

os.listdir(data_dir)  # Itera por los archivos dentro del directorio

#iterando dentro del directorio concatenando el path con cada directorio.
[os.path.join(data_dir, item) for item in os.listdir(data_dir)]

#Crear directorios
os.mkdir(os.path.join(data_dir), "directory_name")
```

In [4]:
import os
os.path.join(os.getcwd(),os.pardir,"data","raw")
#equivalente a /home/compu_dell_ubuntu_01/platzi/pip_y_entornos_virtuales/py-project/data/raw'
#los ".." vuelven un directorio para atrás.

'/home/compu_dell_ubuntu_01/platzi/pip_y_entornos_virtuales/py-project/13_data_science_environment/../data/raw'

In [21]:
#ejemplo de iteración
[os.path.join(os.getcwd(), item) for item in os.listdir(os.getcwd())]

['/home/compu_dell_ubuntu_01/platzi/pip_y_entornos_virtuales/py-project/data_science_environment/environment.yml',
 '/home/compu_dell_ubuntu_01/platzi/pip_y_entornos_virtuales/py-project/data_science_environment/{{ cookiecutter.project_slug}}',
 '/home/compu_dell_ubuntu_01/platzi/pip_y_entornos_virtuales/py-project/data_science_environment/data_science_environment_notes.ipynb',
 '/home/compu_dell_ubuntu_01/platzi/pip_y_entornos_virtuales/py-project/data_science_environment/.ipynb_checkpoints',
 '/home/compu_dell_ubuntu_01/platzi/pip_y_entornos_virtuales/py-project/data_science_environment/.git',
 '/home/compu_dell_ubuntu_01/platzi/pip_y_entornos_virtuales/py-project/data_science_environment/plprojects',
 '/home/compu_dell_ubuntu_01/platzi/pip_y_entornos_virtuales/py-project/data_science_environment/hooks']

### <a name="mark_10"></a>Cómo Crear y Manejar Rutas "pathlib":
[Index](#index)

implementación:

```python
import pathlib

pathlib.Path()  # Genera un objeto Unix Path o 

CURRENT_DIR = pathlib.Path().resolve()  # Path de mi actual directorio.
DATA_DIR = CURRENT_DIR.parent.joinpath("data", "raw")  # Directorio objetivo

DATA_DIR.exists()  # Revisa si el directorio existe
DATA_DIR.is_dir()  # Revisa si es un directorio

DATA_DIR.joinpath("new_directory").mkdir() #crea un nuevo directorio "new_directory"

list(DATA_DIR.glob(".git*")) # Lista todos los archivos que comienzan con .git
```

`pathlib.Path()` es una clase en el módulo `pathlib` de Python que proporciona una interfaz orientada a objetos para manipular rutas de archivos y directorios de manera más sencilla y legible.

Al utilizar `pathlib.Path()`, puedes crear objetos de ruta que representan ubicaciones en el sistema de archivos. Estos objetos se pueden utilizar para realizar operaciones comunes en rutas, como unir rutas, obtener nombres de archivo o directorio, verificar si una ruta existe y mucho más.

Aquí hay algunos ejemplos de cómo utilizar `pathlib.Path()`:

1. Crear un objeto de ruta:
   ```python
   from pathlib import Path

   # Crear un objeto de ruta para una ubicación específica
   path = Path('/ruta/a/mi/archivo.txt')
   ```

2. Obtener partes de la ruta:
   ```python
   # Obtener el nombre del archivo
   file_name = path.name

   # Obtener el directorio padre
   parent_directory = path.parent

   # Obtener la extensión del archivo
   extension = path.suffix
   ```

3. Unir rutas:
   ```python
   # Unir una ruta con un nombre de archivo
   new_path = path / 'nuevo_archivo.txt'

   # Unir varias partes de ruta
   new_path = path / 'subdirectorio' / 'nuevo_archivo.txt'
   ```

4. Verificar la existencia de una ruta:
   ```python
   # Verificar si la ruta existe
   exists = path.exists()

   # Verificar si es un archivo
   is_file = path.is_file()

   # Verificar si es un directorio
   is_directory = path.is_dir()
   ```

En resumen, `pathlib.Path()` proporciona una forma conveniente y orientada a objetos de trabajar con rutas de archivos y directorios en Python. Facilita la manipulación de rutas, la obtención de información sobre las rutas y la realización de operaciones comunes en el sistema de archivos de manera más legible y expresiva.

### <a name="mark_11"></a>Cómo Crear y Manejar Rutas "PyFilesystem2":
[Index](#index)

Implementación:
```python
import fs

fs.open_fs(".")  #1° Abre una conexión con el path actual (OSFS)

CURRENT_DIR = fs.open_fs(".")

CURRENT_DIR.exists(".")  # Revisa si el directorio existe
DATA_DIR.listdir(".")  # Muestra el contenido dentro de la ruta.

for path in DATA_DIR.walk.files():
    print(path) #imprime los path de los archivos en esa localización
    
DATA_DIR.makedir("new_directory_name", recreate=True)
```
* PyFilesystem2 genera un objeto OSFS (Operating System Filesystem).

* El inconveniente con este módulo es que el objeto OSFS solo detecta los objetos que existen en la ruta actual, por lo que si intentas acceder a un archivo ubicado en el directorio padre “…” te saltará un IndexError.

* Si necesitas que el objeto OSFS también detecte el directorio padre, además de las carpetas “data” y “raw”, vuelve a generar el objeto de la siguiente forma:

```python
fs.open_fs("../data/raw/")  # quiero ir un directoria atrás a "data" y luego a "raw"
```

### <a name="mark_12"></a>Cómo Evitar Romper Un Proyecto Cuando Cambiamos De Lugar Un Archivo:
[Index](#index)

Necesitamos encontrar una forma de evitar que nuestro proyecto se rompa cuando movamos de lugar un archivo dentro del proyecto, para esto usaremos Referencias Relativas.

Implementación

* Usando PyProjRoot:

```python
import pyprojroot

pyprojroot.here()  # Esto es un Posix Path (pathlib)
pyprojroot.here().joinpath("data", "raw") 
```

- El path en pyprojroot se construye desde la raíz, no desde el path del archivo que lo ejecuta.
- Puedes mover el archivo a cualquier parte de la carpeta del proyecto, pero los paths no se romperán.

## Entendiendo el código con `pyprojroot`:

**1. Importando `pyprojroot`:**

- La primera línea `import pyprojroot` importa la librería `pyprojroot` a tu programa.
- Esta librería te ayuda a trabajar con rutas de archivos de manera relativa a la raíz de tu proyecto, sin importar dónde ejecutes el script.

**2. Obteniendo la raíz del proyecto:**

- `pyprojroot.here()` es una función de la librería que te da la **ruta completa** a la raíz de tu proyecto como un objeto `Posix Path` (similar a los objetos `Path` de la librería `pathlib`).
- Piensa en la raíz del proyecto como la carpeta principal que contiene todos los archivos y subcarpetas de tu proyecto.

**3. Construyendo una ruta relativa:**

- `.joinpath("data", "raw")` es un método del objeto `Posix Path` que te permite construir una ruta relativa a partir de la ruta actual.
- En este caso, se agregan los directorios "data" y "raw" a la ruta de la raíz del proyecto obtenida anteriormente.

**Ejemplo:**

Imagina que la raíz de tu proyecto está en `/home/usuario/mi_proyecto`. Entonces:

- `pyprojroot.here()` devolvería algo como `/home/usuario/mi_proyecto`.
- `.joinpath("data", "raw")` añadiría los directorios, dando como resultado la ruta completa `/home/usuario/mi_proyecto/data/raw`.

**Beneficios:**

- Usar `pyprojroot` te permite:
    - Evitar escribir rutas largas y específicas a la ubicación del proyecto.
    - Hacer tu código más portable, ya que la ruta se define relativa a la raíz del proyecto.

**Resumen:**

El código te ayuda a construir una ruta completa a un archivo o directorio dentro de tu proyecto, teniendo en cuenta la ubicación de la raíz del proyecto, sin necesidad de especificar la ruta completa manualmente. Esto simplifica la gestión de rutas y mejora la portabilidad de tu código.


* Usando PyHere:
```python
import pyhere

pyhere.here()  # También regresa un Posix Path
```

- El directorio que regresa es el directorio padre del directorio actual.

* Comparación

Estas dos líneas de código regresan el mismo resultado:
```
pyprojroot.here("data").joinpath("raw")
pyhere.here().resolve() / "data" / "raw"
```
Estas dos librerías sirven para crear shortcuts. 

Para esto, se puede usar la siguiente función:

```python
def make_dir_function(dir_name):
    def dir_function(*args):
        return pyprojroot.here()joinpath(dir_name, *args)
    return dir_function


data_dir = make_dir_function("data")
data_dir("raw", "pathlib")  # Devuelve el path personalizado raw->pathlib
```

Puedes crear la cantidad de shortcuts que tu proyecto necesite.

### <a name="mark_13"></a>Descarga de plantilla y configuración de ambiente virtual:
[Index](#index)


Descarga e Instalación:

Para instalar y ejecutar la plantilla a usar, en el caso práctico, en una terminal escribir:
```sh
conda activate <nombre_entorno_cookiecutter>
cookiecutter https://github.com/jvelezmagic/cookiecutter-conda-data-science
```

Durante la instalación de la plantilla y para que puedas reproducir el proyecto del profesor, elige las siguientes opciones:

- Select project packages: Minimal
- Python version: 3.9

Activación

Para activar el proyecto, ejecutar lo siguiente en consola:
```sh
cd <nombre_carpeta_proyecto>
conda env create --file environment.yml
conda list python
code .
```

### <a name="mark_14"></a>Declaración para actualizaciones automáticas:
[Index](#index)

```
%load_ext autoreload
%autoreload 2
```
Nota: Seguir investigando.

### <a name="mark_15"></a>Agregar Código Propio Como Librería:
[Index](#index)

```
pip install --editable .
```
Nota: el "." Es para agregar el codigo como librería "en la carpeta donde me encuentro"

## Explicación de `pip install --editable .`:

El comando `pip install --editable .` se utiliza para instalar un paquete de Python en modo editable. Esto significa que cualquier cambio que se realice en el código del paquete se reflejará automáticamente en la instalación.

**¿Cómo funciona?**

1. **Ubicación:** El comando debe ejecutarse desde el directorio que contiene el archivo `setup.py` del paquete.
2. **Instalación:** `pip` crea un enlace simbólico al paquete en el directorio de paquetes de Python del usuario.
3. **Edición:** Al editar el código del paquete, los cambios se reflejan en el enlace simbólico.
4. **Ejecución:** Al importar el paquete en un script de Python, se utiliza la versión editable con los cambios realizados.

**Ventajas:**

* **Desarrollo rápido:** Permite probar y depurar el paquete sin necesidad de reinstalarlo constantemente.
* **Iteración:** Facilita el ciclo de desarrollo al permitir realizar cambios y ver los resultados de forma inmediata.
* **Colaboración:** Útil para trabajar en equipo, ya que los cambios realizados por un miembro del equipo son visibles para los demás.

**Desventajas:**

* **Entorno de desarrollo:** No es recomendable para entornos de producción, ya que los cambios realizados pueden afectar la estabilidad del sistema.
* **Dependencias:** Si el paquete tiene dependencias, estas también deben estar instaladas en modo editable.

**Alternativas:**

* `pip install -e .`: Similar a `--editable`, pero crea un enlace simbólico en el directorio actual en lugar del directorio de paquetes de Python.
* `pip install .[dev]`: Instala el paquete en modo normal, pero también instala las dependencias de desarrollo.

**En resumen:**

`pip install --editable .` es una herramienta útil para el desarrollo de paquetes de Python, ya que permite realizar cambios y probarlos sin necesidad de reinstalar el paquete. Sin embargo, no es recomendable para entornos de producción.