### Настройка окружения

Для начала вам необходимо выполнить ряд команд чтобы настроить окружение для дальнейшей работы, это позволит первое время не заниматься долгим деплоем, а сразу начать писать код и работать с airflow.

In [1]:
# Установка Airflow
# Установка Airflow
!pip install apache-airflow==2.1.4
!pip install apache-airflow-providers-http
!pip install apache-airflow-providers-telegram

!airflow db init

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting apache-airflow==2.1.4
  Downloading apache_airflow-2.1.4-py3-none-any.whl (5.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m5.3/5.3 MB[0m [31m20.7 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting inflection>=0.3.1
  Downloading inflection-0.5.1-py2.py3-none-any.whl (9.5 kB)
Collecting openapi-spec-validator>=0.2.4
  Downloading openapi_spec_validator-0.5.5-py3-none-any.whl (32 kB)
Collecting setproctitle<2,>=1.1.8
  Downloading setproctitle-1.3.2-cp38-cp38-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_17_x86_64.manylinux2014_x86_64.whl (31 kB)
Collecting apache-airflow-providers-http
  Downloading apache_airflow_providers_http-4.2.0-py3-none-any.whl (22 kB)
Collecting python-slugify<5.0,>=3.0.0
  Downloading python-slugify-4.0.1.tar.gz (11 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting flask-appbuilder<4.0.0,>=3.3.2
  Downloading

In [2]:
# Создадим папку dags
# В этой папке лежат скрипты для создания дагов
# Это стандартное имя для  данной папки
!mkdir /root/airflow/dags
!mkdir /root/airflow/plugins
!mkdir /root/airflow/plugins/custom_plugin
!mkdir /root/airflow/plugins/custom_plugin/operators
!mkdir /root/airflow/plugins/custom_plugin/hooks
!mkdir /root/airflow/plugins/custom_plugin/sensors
!touch /root/airflow/dags/dag.py
!touch /root/airflow/dags/telegram.py
!touch /root/airflow/plugins/custom_plugin/__init__.py
!touch /root/airflow/plugins/custom_plugin/operators/__init__.py
!touch /root/airflow/plugins/custom_plugin/operators/custom_operator.py
!touch /root/airflow/plugins/custom_plugin/hooks/__init__.py
!touch /root/airflow/plugins/custom_plugin/sensors/__init__.py

In [3]:
!airflow users create \
          --username admin \
          --firstname admin \
          --lastname admin \
          --role Admin \
          --email admin@example.org \
          -p 12345

[[34m2023-02-27 18:25:02,498[0m] {[34mmanager.py:[0m243} INFO[0m - Inserted Role: Admin[0m
[[34m2023-02-27 18:25:02,509[0m] {[34mmanager.py:[0m243} INFO[0m - Inserted Role: Public[0m
[[34m2023-02-27 18:25:02,585[0m] {[34mmanager.py:[0m504} INFO[0m - Created Permission View: can edit on Passwords[0m
[[34m2023-02-27 18:25:02,604[0m] {[34mmanager.py:[0m562} INFO[0m - Added Permission can edit on Passwords to role Admin[0m
[[34m2023-02-27 18:25:02,630[0m] {[34mmanager.py:[0m504} INFO[0m - Created Permission View: can read on Passwords[0m
[[34m2023-02-27 18:25:02,650[0m] {[34mmanager.py:[0m562} INFO[0m - Added Permission can read on Passwords to role Admin[0m
[[34m2023-02-27 18:25:02,691[0m] {[34mmanager.py:[0m504} INFO[0m - Created Permission View: can edit on My Password[0m
[[34m2023-02-27 18:25:02,703[0m] {[34mmanager.py:[0m562} INFO[0m - Added Permission can edit on My Password to role Admin[0m
[[34m2023-02-27 18:25:02,718[0m] {[34mmana

### Практика

#### Первый плагин

Поместите в /root/airflow/plugins/custom_plugin/operators/custom_operator.py следующий код

```python
from airflow.models.baseoperator import BaseOperator

class HelloOperator(BaseOperator):

    def __init__(
            self,
            name: str,
            **kwargs) -> None:
        super().__init__(**kwargs)
        self.name = name

    def execute(self, context):
        message = "Hello {}".format(self.name)
        print(message)
        return message
```



Поместите в dag.py следующий код

**Задание #1**

Сообщение в логе будет ответом к задаче.

```python
from custom_plugin.operators.custom_operator import HelloOperator
from airflow import DAG
from datetime import timedelta, datetime
from airflow.utils.dates import days_ago
 
# Создадим объект класса DAG
dag = DAG(
    'dag',
    start_date=datetime(2015, 12, 1),
    schedule_interval='@daily')
hello_task = HelloOperator(task_id='sample-task', name='foo_bar', dag=dag)
```

#### Нотификация

Вставьте данный код в dag.py

**Задание #2**

Сообщение в телеграм будет ответом.

```python
from airflow import DAG
from datetime import timedelta, datetime
from airflow.utils.dates import days_ago
from custom_plugin.operators.custom_operator import HelloOperator
from airflow.providers.telegram.operators.telegram import TelegramOperator

 
def on_success_callback(context):
    send_message = TelegramOperator(
        task_id='send_message_telegram',
        telegram_conn_id='telegram_id',
        chat_id='-1001525736146',
        text='Hello from Airflow!',
        dag=dag)
    return send_message.execute(context=context)

# Создадим объект класса DAG
dag = DAG(
    'dag',
    start_date=datetime(2015, 12, 1),
    on_success_callback=on_success_callback,
    schedule_interval='@daily')
hello_task = HelloOperator(task_id='sample-task', name='foo_bar', dag=dag)
```

Создайте чат и бота в телеграмме, добавьте бота в чат выдам админские права, создайте **connection** (с именем telegram_id) со следующими параметрами


- Password: API Token который можно получить через https://telegram.me/BotFather
- Host: ID вашего чата, можно получить добавив в чат @raw_data_bot и написать /my_id
- Connection Type: HTTP


In [4]:
# Перезапустим шедулер
# Это должно ускорить поиск нашего дага
# Нужно подождать пару минут пока даг появится
!airflow scheduler -D

  ____________       _____________
 ____    |__( )_________  __/__  /________      __
____  /| |_  /__  ___/_  /_ __  /_  __ \_ | /| / /
___  ___ |  / _  /   _  __/ _  / / /_/ /_ |/ |/ /
 _/_/  |_/_/  /_/    /_/    /_/  \____/____/|__/


In [5]:
# Запуск веб сервера
!airflow webserver -p 18273 -D

  ____________       _____________
 ____    |__( )_________  __/__  /________      __
____  /| |_  /__  ___/_  /_ __  /_  __ \_ | /| / /
___  ___ |  / _  /   _  __/ _  / / /_/ /_ |/ |/ /
 _/_/  |_/_/  /_/    /_/    /_/  \____/____/|__/
Running the Gunicorn Server with:
Workers: 4 sync
Host: 0.0.0.0:18273
Timeout: 120
Logfiles: - -
Access Logformat: 
[[34m2023-02-27 18:26:56,409[0m] {[34mdagbag.py:[0m538} INFO[0m - Filling up the DagBag from [01m/dev/null[22m[0m


In [6]:
# Последующие команды не имеют отношения к Airflow
# Они нужни только для корректной работы веб морды
# в среде Google Colab

!pip install pyngrok
!ngrok authtoken 2MBRgJ066swk4ThgvdLuWtytQAI_3WLNSDpTtkwHYi33C27nr # найти его можно https://dashboard.ngrok.com/get-started/setup 

# Эта команда просто отображет веб морду на другой адрес
# Его вы можете найти https://dashboard.ngrok.com/cloud-edge/status
# При каждом отключении ссылка будет меняться
!nohup ngrok http -log=stdout 18273 > /dev/null &

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting pyngrok
  Downloading pyngrok-5.2.1.tar.gz (761 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m761.3/761.3 KB[0m [31m14.9 MB/s[0m eta [36m0:00:00[0m
[?25h  Preparing metadata (setup.py) ... [?25l[?25hdone
Building wheels for collected packages: pyngrok
  Building wheel for pyngrok (setup.py) ... [?25l[?25hdone
  Created wheel for pyngrok: filename=pyngrok-5.2.1-py3-none-any.whl size=19792 sha256=473172b970b828f934fcdd8128a69d755b14334b1dc26e0650497d3467fd1e27
  Stored in directory: /root/.cache/pip/wheels/5d/f2/70/526da675d32f17577ec47ac4c663084efe39d47c826b6c3bb1
Successfully built pyngrok
Installing collected packages: pyngrok
Successfully installed pyngrok-5.2.1
Authtoken saved to configuration file: /root/.ngrok2/ngrok.yml
nohup: redirecting stderr to stdout
