### **4.3 - The new way of creating DAGs**

Crear DAGs una y otra vez puede llevar mucho tiempo y en algún momento ser realmente aburrido y como ingeniero no te gusta repetirte y hacer el mismo código una y otra vez. Por eso se ha introducido la "Taskflow API" desde Airflow 2.0. Con la Taskflow API puedes crear data pipelines de una manera mucho más fácil y rápida. Veamos en qué consiste exactamente. En primer lugar, se puede dividir la Taskflow API en dos partes diferentes, donde la primera parte son los "decorators" y la segunda parte son los “XCom args". ¿Cuál es el objetivo de los decorators? Bueno, el objetivo de los decorators es ayudarle a crear DAGs de una manera más fácil y rápida que la forma clásica de crear sus DAGs. Por ejemplo, digamos que quieres crear una tarea con el operador Python, en lugar de instanciar el operador Python, y luego llamar a tu función Python, puedes usar el decorator @task.python. Y mediante el uso de ese decorador en la parte superior de su función de Python, que desea ejecutar, automáticamente Airflow creará el Python operator por usted y vamos a llamar a esa función. Así que usted tiene @task.virtualenv, con el fin de ejecutar su función de Python dentro de un entorno virtual. Y por último, pero no menos importante, tienes @task_group, que te permite agrupar múltiples tareas como vas a ver más adelante en el curso. Así que tienes esos decoradores y obviamente vendrán nuevos decoradores, pero con esos decoradores ya eres capaz de crear hermosos DAGs de una manera mucho más rápida.

<center><img src="https://i.postimg.cc/J0qCY0T0/a1183.png"></center>

El otro componente de la Taskflow API es el XCom args. Básicamente, cada vez que una tarea comparte datos con otra tarea, esas dos tareas tienen una dependencia, porque, por ejemplo, tienes la tarea A, B y C, y C necesita datos procedentes de la tarea A. Tienes la dependencia entre esas dos tareas, pero, la cosa es que estas dependencias están implícitas en la interfaz de usuario, no serás capaz de ver que la tarea C necesita los datos procedentes de la tarea A, sólo verás las dependencias tarea A, luego tarea B, luego tarea C. Así que con la Taskflow API, automáticamente Airflow hará esta dependencia entre la tarea C y la tarea A explícita. Creará la dependencia por ti. Estos son los dos componentes de la Taskflow API. El primero son los "decoradores" que te permiten crear DAGs de una manera mucho más rápida y el segundo son los "XCom args" que te permiten compartir datos entre tus tareas sin tener que llamar a "XCom push" y "XCom pull" y también te ayuda a explicitar las dependencias implícitas creadas por los XComs. Empecemos con los "decoradores", en tu data pipeline, tienes dos tareas "extract" y "process". Ambas utilizan el operador Python, así que vamos a ver cómo se puede aprovechar la Taskflow API, para no tener que instanciar el operador Python, con el fin de ejecutar una función de Python. Así que, primero haz la importación de los decoradores, así que necesitas escribir "from airflow. decorators import task" y luego el segundo paso es simplemente añadir el decorador correspondiente, así que añade @task.python ya que quieres usar el operador Python para llamar a esa función "_extract": 

<center><img src="https://i.postimg.cc/h4bntZSn/a1184.png"></center>

Entonces puedes quitar el "_" de la función "_extract". Así, esta función Python que ahora se llama "extract" se convierte en el nombre de tu tarea "extract". 

<center><img src="https://i.postimg.cc/BQS0L56K/a1185.png"></center>

Por último, pero no menos importante, sólo tienes que eliminar esta parte, ya que no la necesitas, el Python operator se crea automáticamente para ti entre bastidores: 

<center><img src="https://i.postimg.cc/02Vqp6MH/a1186.png"></center>

Y poner dos paréntesis, como si llamaras a una función "extract" y ya está.

<center><img src="https://i.postimg.cc/jSCYvsyq/a1187.png"></center>

Al hacer esto, está utilizando el Python operator para llamar a la función "extract" y todo se hace automáticamente por usted, ya que utiliza la Taskflow API. Entonces, puedes hacer exactamente lo mismo con la función "_process": 

<center><img src="https://i.postimg.cc/nLDbb0d6/a1188.png"></center>

Y como puedes ver, es mucho más limpio que antes. Y hay dos cosas más que necesitas saber sobre los "decoradores", la primera es que hay "Dag decorator", así que aquí puedes importarlo escribiendo "dag" 

<center><img src="https://i.postimg.cc/L87KbrVt/a1189.png"></center>

y luego crear tu DAG con @dag, quitar el DAG ID "my_dag", así también "as dag". 

<center><img src="https://i.postimg.cc/k4PrnKzD/a1190.png"></center>

Luego define una función como si fuera un decorador. Este decorador debe estar encima de la función, "def my_dag" y pones tus tareas así como tus dependencias dentro de esa función y "my_dag", aquí, es el DAG ID de tu DAG. Finalmente, llama a la función "my_dag" y eso es todo. 

<center><img src="https://i.postimg.cc/nrn6mZHJ/a1191.png"></center>

Si guardas el archivo y echas un vistazo a la interfaz de usuario de Airflow, verás que funciona. No estoy seguro de que realmente necesites usar el decorador @dag, pero ahora sabes que existe. Además, la última cosa que me gustaría hablar es, que usted es capaz de llamar sólo el decorador @task para utilizar el Python operator detrás de la escena. Ahora bien, como mejor práctica, te recomiendo encarecidamente que uses siempre "@task", luego "dot" y "el decorador" que quieras, en ese caso python o virtualenv: 

<center><img src="https://i.postimg.cc/tT3K77Gk/a1192.png"></center>

Ok, ahora es el momento de hablar de XCom args, el segundo componente de la Taskflow API, y esto es realmente hermoso, porque, digamos, ahora usted no tiene esas dependencias más:

<center><img src="https://i.postimg.cc/ZnjXFgRy/a1193.png"></center>

sino que tienes esta función "extract" que devuelve un valor: 

<center><img src="https://i.postimg.cc/xjRr2kRT/a1194.png"></center>

Así que, digamos, en lugar de este valor JSON, sólo quieres devolver "partner_name":

<center><img src="https://i.postimg.cc/kXX0Xn1N/a1195.png"></center>

Ahora, ¿cómo puedes recuperarlo desde "process"? ¿Cómo puedes sacar ese XCom desde "process"? ¿Vas a usar xcom_pull? No, no lo vas a hacer, ya no. Lo único que tienes que hacer es especificar el nombre de tu XCom, así que, por ejemplo, aquí puedes escribir "partner_name", pero puedes llamarlo como quieras, y entonces vamos a imprimir "partner_name"

<center><img src="https://i.postimg.cc/L6CrJrwc/a1196.png"></center>

Y ahora te preguntarás, bueno, esto es genial, tengo "partner_name" pero ¿cómo puedo extraer (pull) ese XCom? Pues bien, sólo tienes que llamar a "process" y como argumento de "process", le pasas "extract( )". 

<center><img src="https://i.postimg.cc/VkJ2nKcd/a1197.png"></center>

Y al hacer esto, no sólo se puede extraer (pull) el XCom automáticamente, que es empujado (pushed) por "extract", sino que también las dependencias entre esas dos tareas, se generan automáticamente para usted. Y eso es lo que puede ver en la interfaz de usuario de Airflow. En DAGs, haga clic en "my_dag" y vaya a la Graph View. Puedes ver que la dependencia entre las dos tareas, "extract" y "process", está bien creada y ésta se crea automáticamente por ti.

<center><img src="https://i.postimg.cc/vZCkz5QX/a1198.png"></center>

Recuerda que en tu código no has definido ninguna dependencia aquí. 

<center><img src="https://i.postimg.cc/KYLVs4jb/a1199.png"></center>

Así que esa es la belleza de la Taskflow API, que te permite crear data pipelines mucho más limpios, además de hacer explícitas las dependencias implícitas creadas por XCom. Muy bien, ya sabe cómo utilizar los "decoradores" y los " XCom args" para compartir datos entre sus tareas con la Taskflow API. Es hora de responder a la pregunta, ¿qué pasa si tienes varios valores que quieres compartir, pero quieres tener un XCom con un solo valor? ¿Cómo puedes hacerlo sin usar "xcom_push" dos veces? Bueno, eso es lo que vas a descubrir con la Taskflow API de nuevo, en el siguiente vídeo.