<a href="https://colab.research.google.com/github/krixik-ai/krixik-docs/blob/main/docs/system/pipeline_creation/saving_and_loading_pipelines.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import os
import sys
import json
from pathlib import Path

# preparaci√≥n de demo - incuye instanciaci√≥n de secretos, instalaci√≥n de requerimientos, y definici√≥n de rutas
if os.getenv("COLAB_RELEASE_TAG"):
    # si est√°s usando este notebook en Google Colab, ingresa tus secretos ac√°
    MY_API_KEY = "TU_API_KEY_VA_AQUI"
    MY_API_URL = "TU_API_URL_VA_AQUI"

    # si est√°s usando este notebook en Google Colab, instala requerimientos y descarga los subdirectorios requeridos
    # instala el cliente Python de Krixik
    !pip install krixik

    # instala github-clone, que permite clonaci√≥n f√°cil de los subdirectorios del repositorio de documentaci√≥n https://github.com/krixik-ai/krixik-docs
    !pip install github-clone

    # clona los conjuntos de datos
    if not Path("data").is_dir():
        !ghclone https://github.com/krixik-ai/krixik-docs/tree/es-main/data
    else:
        print("ya se clonaron los conjuntos de datos de documentaci√≥n!")

    # define la variable 'data_dir' para tus rutas
    data_dir = "./data/"

    # crea directorio de salidas
    from pathlib import Path

    Path(data_dir + "/salidas").mkdir(parents=True, exist_ok=True)

else:
    # si est√°s usando una descarga local de la documentaci√≥n, define las rutas relativas a la estructura local de la documentaci√≥n
    # importa utilidades
    sys.path.append("../../../")

    # define la variable 'data_dir' para tus rutas
    data_dir = "../../../data/"

    # si est√°s usando este notebook localmente desde el repositorio de documentaci√≥n Krixik, carga tus secretos de un archivo .env ubicado en la base del repositorio de documentaci√≥n
    from dotenv import load_dotenv

    load_dotenv("../../../.env")

    MY_API_KEY = os.getenv("MY_API_KEY")
    MY_API_URL = os.getenv("MY_API_URL")


# importa Krixik e inicializa sesi√≥n con tus secretos personales
from krixik import krixik

krixik.init(api_key=MY_API_KEY, api_url=MY_API_URL)

SUCCESS: You are now authenticated.


## Guardar y Cargar *Pipelines*
[üá∫üá∏ English version of this document](https://krixik-docs.readthedocs.io/latest/system/pipeline_creation/saving_and_loading_pipelines/)

Esta introducci√≥n a guardar y cargar *pipelines* se divide en las siguientes secciones:

- [El M√©todo `save_pipeline`](#el-metodo-save_pipeline)
- [El M√©todo `load_pipeline`](#el-metodo-load_pipeline)
- [La Funci√≥n `reset_pipeline`](#la-funcion-reset_pipeline)

### El Metodo `save_pipeline`

En Krixik, guardar tu *pipeline* quiere decir *guardar su [configuraci√≥n](configuracion_de_pipelines.md)* en disco.

Puedes guardar la [configuraci√≥n](configuracion_de_pipelines.md) de un *pipeline* con el m√©todo `save_pipeline`. Este m√©todo toma un argumento (requerido):

- `config_path`: Una ruta de archivo local v√°lida. El archivo no tiene que existir, pero la ruta en directorios s√≠ debe ser posible.

`config_path` debe terminar con una extensi√≥n `.yml` o `.yaml`. Este es actualmente el √∫nico formato de archivo con el que Krixik guarda *pipelines*.

Para ver c√≥mo funciona, primero tendr√°s que crear un *pipeline* con el m√©todo [`create_pipeline`](creacion_de_pipelines.md):

In [2]:
# primero crea un pipeline
pipeline = krixik.create_pipeline(name="guardar_y_cargar_pipelines_1", module_chain=["summarize", "summarize", "keyword-db"])

Ahora que tienes un *pipeline* puedes usar el m√©todo `save_pipeline` para guardar ese *pipeline* en disco:

In [3]:
# guardar la configuraci√≥n de un pipeline en disco (con ejemplo de ruta; la ruta debe obedecer lo que dicte tu sistema operativo)
pipeline.save_pipeline(config_path=data_dir + "configs-de-pipeline/guarda-demo-pipeline.yaml")

Para facilitar las cosas, si un archivo con ese nombre de archivo no existe en la ubicaci√≥n indicada, Krixik crear√° el archivo localmente y luego guardar√° tu *pipeline* en √©l.

### El Metodo `load_pipeline`

Dado que la [configuraci√≥n](configuracion_de_pipelines.md) de un *pipeline* es su descripci√≥n fundamental, cualquier archivo v√°lido de configuraci√≥n puede cargarse a Krixik, as√≠ recreando el *pipeline* asociado.

El m√©todo `load_pipeline` toma un argumento (requerido):

- `config_path`: Una ruta de archivo local v√°lida.

Para que el m√©todo `load_pipeline` funcione, el archivo indicado por `config_path` debe (a) existir, (b) tener extensi√≥n `.yaml` o `.yml` y (c) contener una [configuraci√≥n](configuracion_de_pipelines.md) de *pipeline* Krixik con formato adecuado. Si uno de estos no es el caso, el m√©todo fallar√°. Si antes [guardaste](#el-metodo-save_pipeline) un *pipeline* Krixik en esa ubicaci√≥n con ese nombre de archivo, el m√©todo funcionar√° bien.

El m√©todo `load_pipeline` se usa de la siguiente manera:

In [5]:
# carga un pipeline a memoria por medio de un archivo v√°lido de configuraci√≥n
mi_pipeline_2 = krixik.load_pipeline(config_path=data_dir + "configs-de-pipeline/guarda-demo-pipeline.yaml")

Ver√°s que no tienes que haber previamente guardado el *pipeline* t√∫. Por ejemplo, puede que un colega te haya compartido una [configuraci√≥n](configuracion_de_pipelines.md) de *pipeline*, o que hayas escrito el archivo desde cero. Siempre y cuando el archivo config tenga formato correcto, el m√©todo `load_pipeline` funcionar√° como debe.

### La Funcion `reset_pipeline`

El m√©todo `load_pipeline` arriba descrito vuelve a instanciar un *pipeline* previo con el mismo `name` y `module_chain`. Dado que los archivos procesados por un *pipeline* est√°n asociados al `name` de ese *pipeline*, esos archivos est√°n ahora asociados a este nuevo *pipeline*.

Si buscas recrear un *pipeline* pero quieres hacerlo con hoja en blanco, la manera m√°s f√°cil es con el m√©todo `reset_pipeline`, que borra todos datos de proceso asociados a ese *pipeline* (es decir, cualquier cosa relacionada con todo archivo previamente procesado a trav√©s de *pipeline(s)* con ese `name`).

El m√©todo `reset_pipeline` toma un argumento (requerido):

- `pipeline`: La variable en el que objeto *pipeline* est√° guardado.

Ten en cuenta que esta variable _no_ es el `name` del *pipeline*. Por ejemplo, si quisieras reiniciar el primer *pipeline* creado en este documento, el argumento `pipeline` para el m√©todo `reset_pipeline` tendr√≠a el valor `mi_pipeline_2` (y no el valor `guardar_y_cargar_pipelines_1`), de la siguiente manera:

In [6]:
# elimina todos los datos procesados pertenecientes a este pipeline
krixik.reset_pipeline(mi_pipeline_2)

Dicho de otra manera, el argumento `pipeline` del m√©todo `reset_pipeline` es una variable al que se ha asignado un objeto *pipeline*, y `reset_pipeline` eliminar√° todo dato asociado al `name` de ese objeto *pipeline* en el sistema Krixik.

In [7]:
# elimina todos los datos procesados pertenecientes a este pipeline
krixik.reset_pipeline(pipeline)