<a href="https://colab.research.google.com/github/CodeHunterOfficial/ABC_DataMining/blob/main/Python/%D0%9F%D0%BB%D0%B0%D0%BD%D0%B8%D1%80%D0%BE%D0%B2%D1%89%D0%B8%D0%BA%D0%B8_%D0%B7%D0%B0%D0%B4%D0%B0%D1%87_(Schedulers)_%D0%B2_Python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


#Планировщики задач (Schedulers) в Python

## Введение

Планировщик задач (Scheduler) — это инструмент, который позволяет автоматизировать выполнение определенных задач в заранее заданное время или по расписанию. В контексте программирования на Python планировщики позволяют выполнять функции и скрипты в соответствии с установленными правилами, будь то разовое выполнение через определенное время или периодическое выполнение.

В этой лекции мы рассмотрим основные концепции работы с планировщиками в Python, популярные библиотеки для этого, а также покажем практические примеры их использования.



## 1. Основные понятия

### 1.1 Что такое Scheduler?

Scheduler — это механизм, который управляет временем выполнения задач. Он может быть как простым (например, выполнение задачи через N секунд) так и сложным (например, выполнение задачи каждый понедельник в 9:00).

Основные типы задач, которые можно планировать:
- **Одноразовые задачи**: выполняются один раз после задержки.
- **Периодические задачи**: выполняются регулярно с определенным интервалом.
- **Задачи с расписанием**: выполняются в конкретное время или дату.

### 1.2 Почему использовать Scheduler?

1. **Автоматизация**: Вы можете назначить выполнение рутинных задач без вашего участия.
2. **Эффективность**: Уменьшает количество ручной работы, особенно при работе с большими проектами.
3. **Управление временем**: Позволяет запускать задачи в удобное для вас время, например, ночью, когда нагрузка на систему минимальна.
4. **Масштабируемость**: Можно легко добавлять новые задачи или изменять существующие.


## 2. Стандартная библиотека Python: `threading.Timer`

Python предоставляет базовый инструмент для создания одноразовых задач через модуль `threading`. Класс `Timer` позволяет запустить функцию через определенное время.

### 2.1 Пример использования `threading.Timer`

```python
import threading
import time

def my_task():
    print("Задача выполнена!")

# Создаем таймер, который вызовет функцию через 5 секунд
timer = threading.Timer(5.0, my_task)
timer.start()

print("Ожидание выполнения задачи...")
time.sleep(6)  # Ждем завершения таймера
print("Программа завершена.")
```

### 2.2 Преимущества и недостатки

**Преимущества:**
- Простота использования.
- Нет необходимости устанавливать дополнительные библиотеки.

**Недостатки:**
- Поддерживает только одноразовые задачи.
- Отсутствует поддержка сложных расписаний.



## 3. Модуль `schedule`

Модуль `schedule` — это легковесная библиотека для управления периодическими задачами. Она позволяет создавать расписания с минимальными усилиями.

### 3.1 Установка

```bash
pip install schedule
```

### 3.2 Пример использования `schedule`

```python
import schedule
import time

def job():
    print("Выполняется задача!")

# Запускаем задачу каждую минуту
schedule.every().minute.do(job)

# Запускаем задачу каждые 10 секунд
schedule.every(10).seconds.do(job)

# Запускаем задачу каждый день в 10:30
schedule.every().day.at("10:30").do(job)

while True:
    schedule.run_pending()
    time.sleep(1)
```

### 3.3 Особенности

- **Простота**: Легко настраивать периодические задачи.
- **Гибкость**: Поддерживает различные единицы времени (секунды, минуты, часы, дни).
- **Ограничения**: Не подходит для сложных расписаний или высоконагруженных систем.



## 4. Модуль `apscheduler`

`APScheduler` (Advanced Python Scheduler) — это мощная библиотека для управления задачами с расписанием. Она поддерживает несколько типов планировщиков и является более гибкой, чем `schedule`.

### 4.1 Установка

```bash
pip install apscheduler
```

### 4.2 Типы планировщиков в APScheduler

1. **BlockingScheduler**: Блокирует выполнение программы до тех пор, пока все задачи не будут завершены.
2. **BackgroundScheduler**: Запускает планировщик в фоновом режиме, позволяя продолжать выполнение основного потока программы.
3. **AsyncIOScheduler**: Используется для асинхронных задач в сочетании с `asyncio`.

### 4.3 Пример использования `apscheduler`

#### Пример 1: Запуск задачи каждую минуту

```python
from apscheduler.schedulers.blocking import BlockingScheduler

def job():
    print("Выполняется задача!")

scheduler = BlockingScheduler()
scheduler.add_job(job, 'interval', minutes=1)

print("Запуск планировщика...")
scheduler.start()
```

#### Пример 2: Запуск задачи в конкретное время

```python
from apscheduler.schedulers.background import BackgroundScheduler
from datetime import datetime

def job():
    print(f"Задача выполнена в {datetime.now()}")

scheduler = BackgroundScheduler()
scheduler.add_job(job, 'cron', hour=10, minute=30)  # Запуск каждый день в 10:30

scheduler.start()
print("Планировщик запущен в фоновом режиме.")

# Основной цикл программы
try:
    while True:
        time.sleep(1)
except KeyboardInterrupt:
    scheduler.shutdown()
```

### 4.4 Особенности

- **Гибкость**: Поддерживает различные типы триггеров (`interval`, `cron`, `date`).
- **Масштабируемость**: Может работать с несколькими процессами и потоками.
- **Расширяемость**: Позволяет использовать хранилища задач (например, базы данных) для сохранения состояния планировщика.



## 5. Работа с cron-расписанием

Cron — это система планирования задач, используемая в Unix-подобных операционных системах. Python также поддерживает использование формата cron через библиотеки, такие как `apscheduler`.

### 5.1 Формат cron

Формат cron состоит из пяти полей:
1. Минута (0-59)
2. Час (0-23)
3. День месяца (1-31)
4. Месяц (1-12)
5. День недели (0-7, где 0 и 7 — это воскресенье)

Примеры:
- `* * * * *` — каждую минуту.
- `0 0 * * *` — каждый день в полночь.
- `30 8-17 * * 1-5` — каждый рабочий день с 8:30 до 17:30.

### 5.2 Пример использования cron в `apscheduler`

```python
from apscheduler.schedulers.blocking import BlockingScheduler

def job():
    print("Выполняется задача!")

scheduler = BlockingScheduler()
scheduler.add_job(job, 'cron', minute='*/5')  # Запуск каждые 5 минут

scheduler.start()
```



## 6. Асинхронный планировщик с `asyncio`

Для работы с асинхронными задачами можно использовать `AsyncIOScheduler` из `apscheduler`.

### 6.1 Пример асинхронного планировщика

```python
import asyncio
from apscheduler.schedulers.asyncio import AsyncIOScheduler

async def async_job():
    print("Выполняется асинхронная задача!")

scheduler = AsyncIOScheduler()
scheduler.add_job(async_job, 'interval', seconds=5)

scheduler.start()
print("Планировщик запущен.")

try:
    asyncio.get_event_loop().run_forever()
except KeyboardInterrupt:
    pass
```


## 7. Сохранение состояния планировщика

В некоторых случаях может потребоваться сохранять состояние планировщика между перезапусками программы. Для этого можно использовать базы данных или файлы.

### 7.1 Пример с использованием SQLite

```python
from apscheduler.schedulers.background import BackgroundScheduler
from apscheduler.jobstores.sqlalchemy import SQLAlchemyJobStore

jobstores = {
    'default': SQLAlchemyJobStore(url='sqlite:///jobs.sqlite')
}

scheduler = BackgroundScheduler(jobstores=jobstores)
scheduler.start()

# Добавляем задачу
scheduler.add_job(my_task, 'interval', minutes=1)

print("Планировщик запущен с сохранением состояния.")
```



## 8. Практические советы

1. **Используйте фоновые планировщики**: Если ваша программа должна продолжать работу, используйте `BackgroundScheduler` вместо `BlockingScheduler`.
2. **Тестируйте задачи**: Перед запуском в production протестируйте все задачи на корректность.
3. **Логирование**: Используйте логирование для отслеживания выполнения задач.
4. **Обработка ошибок**: Обрабатывайте исключения внутри задач, чтобы одна ошибка не останавлила весь планировщик.


 Таким образом:
Планировщики задач играют важную роль в автоматизации процессов и оптимизации работы программ. Python предлагает множество инструментов для управления задачами, начиная от простых решений, таких как `threading.Timer`, и заканчивая мощными библиотеками, такими как `apscheduler`. Выбор инструмента зависит от ваших требований и сложности проекта.

Если вы работаете с простыми задачами, достаточно использовать `schedule` или `threading.Timer`. Для более сложных случаев рекомендуется использовать `apscheduler`, который предоставляет широкие возможности для управления задачами.



# Использование Scheduler в Django

В Django планировщики задач (Schedulers) могут быть использованы для выполнения фоновых задач, таких как отправка ежедневных email-рассылок, обработка очередей задач, очистка базы данных и многое другое. В этой лекции мы рассмотрим различные способы интеграции планировщиков в Django проект.



## 1. Введение

Django — это мощный фреймворк, но он не предоставляет встроенных средств для управления задачами с расписанием. Однако, благодаря большому количеству сторонних библиотек, можно легко добавить эту функциональность в ваш проект.

Основные способы использования планировщиков в Django:
1. **Использование cron-like систем**: Запуск задач через операционную систему.
2. **Использование сторонних библиотек**: Например, `django-apscheduler`, `django-celery-beat` или `django-background-tasks`.



## 2. Метод 1: Использование Cron

Cron — это система планирования задач, используемая в Unix-подобных операционных системах. Вы можете создать скрипты Django и запускать их через cron.

### 2.1 Создание Django management команды

Создайте пользовательскую management команду, которую вы будете вызывать из cron.

#### Шаг 1: Создайте management команду

```bash
python manage.py startapp myapp
```

В папке `myapp/management/commands` создайте файл `my_command.py`:

```python
from django.core.management.base import BaseCommand
from datetime import datetime

class Command(BaseCommand):
    help = 'Выполняет периодическую задачу'

    def handle(self, *args, **kwargs):
        self.stdout.write(f"Задача выполнена в {datetime.now()}")
```

#### Шаг 2: Настройте cron

Добавьте следующую строку в файл crontab (команда `crontab -e`):

```bash
0 * * * * /path/to/your/virtualenv/bin/python /path/to/your/project/manage.py my_command >> /path/to/logfile.log 2>&1
```

Это запустит команду каждые часы.



## 3. Метод 2: Использование `django-apscheduler`

`django-apscheduler` — это удобная библиотека, которая позволяет использовать `APScheduler` внутри Django проекта.

### 3.1 Установка

```bash
pip install django-apscheduler
```

### 3.2 Настройка

#### Добавьте приложение в `INSTALLED_APPS`

```python
INSTALLED_APPS = [
    ...
    'django_apscheduler',
]
```

#### Создайте модель для хранения задач

`django-apscheduler` автоматически создает таблицу для хранения информации о задачах. Выполните миграции:

```bash
python manage.py migrate
```

#### Создайте планировщик

Создайте файл `scheduler.py` в одном из ваших приложений:

```python
from apscheduler.schedulers.background import BackgroundScheduler
from apscheduler.triggers.cron import CronTrigger
from django_apscheduler.jobstores import DjangoJobStore
from django.core.management.base import BaseCommand
from datetime import datetime

def my_scheduled_job():
    print(f"Задача выполнена в {datetime.now()}")

class Command(BaseCommand):
    help = "Запускает планировщик"

    def handle(self, *args, **options):
        scheduler = BackgroundScheduler()
        scheduler.add_jobstore(DjangoJobStore(), "default")

        # Добавляем задачу
        scheduler.add_job(
            my_scheduled_job,
            trigger=CronTrigger(second="*/10"),  # Каждые 10 секунд
            id="my_scheduled_job",
            max_instances=1,
            replace_existing=True,
        )
        scheduler.start()

        print("Планировщик запущен!")
        try:
            while True:
                time.sleep(1)
        except KeyboardInterrupt:
            scheduler.shutdown()
            print("Планировщик остановлен.")
```

#### Запустите планировщик

Запустите команду:

```bash
python manage.py runapscheduler
```



## 4. Метод 3: Использование `django-celery-beat`

`django-celery-beat` — это расширение для Celery, которое позволяет управлять периодическими задачами через админ-панель Django.

### 4.1 Установка

```bash
pip install celery[redis] django-celery-beat
```

### 4.2 Настройка

#### Добавьте приложение в `INSTALLED_APPS`

```python
INSTALLED_APPS = [
    ...
    'django_celery_beat',
]
```

#### Настройте Celery

Создайте файл `celery.py` в корне вашего проекта:

```python
import os
from celery import Celery

os.environ.setdefault('DJANGO_SETTINGS_MODULE', 'your_project.settings')

app = Celery('your_project')
app.config_from_object('django.conf:settings', namespace='CELERY')
app.autodiscover_tasks()
```

Обновите `__init__.py` вашего проекта:

```python
from .celery import app as celery_app

__all__ = ('celery_app',)
```

#### Настройте Redis как брокер сообщений

В `settings.py`:

```python
CELERY_BROKER_URL = 'redis://localhost:6379/0'
CELERY_RESULT_BACKEND = 'redis://localhost:6379/0'
```

#### Создайте периодическую задачу

Создайте файл `tasks.py` в одном из ваших приложений:

```python
from celery import shared_task
from datetime import datetime

@shared_task
def my_periodic_task():
    print(f"Периодическая задача выполнена в {datetime.now()}")
```

#### Настройте периодическую задачу через админку

Запустите миграции:

```bash
python manage.py migrate
```

Запустите Celery worker и beat:

```bash
celery -A your_project worker --loglevel=info
celery -A your_project beat --loglevel=info
```

Теперь вы можете настроить задачу через админ-панель Django.



## 5. Метод 4: Использование `django-background-tasks`

`django-background-tasks` — это простая библиотека для выполнения фоновых задач.

### 5.1 Установка

```bash
pip install django-background-tasks
```

### 5.2 Настройка

#### Добавьте приложение в `INSTALLED_APPS`

```python
INSTALLED_APPS = [
    ...
    'background_task',
]
```

#### Создайте фоновую задачу

Создайте файл `tasks.py`:

```python
from background_task import background
from datetime import datetime

@background(schedule=10)  # Задержка в 10 секунд
def my_background_task():
    print(f"Фоновая задача выполнена в {datetime.now()}")
```

#### Вызовите задачу

```python
from .tasks import my_background_task

my_background_task()
```

#### Запустите worker

```bash
python manage.py process_tasks
```



## 6. Сравнение методов

| Метод                  | Преимущества                                                                 | Недостатки                                      |
|------------------------|-----------------------------------------------------------------------------|------------------------------------------------|
| Cron                   | Простота использования, не требует дополнительных библиотек                 | Не подходит для сложных расписаний             |
| `django-apscheduler`   | Гибкость, поддержка различных триггеров                                    | Требует ручной настройки                       |
| `django-celery-beat`   | Интеграция с Celery, управление через админку                               | Требует установки Redis или другого брокера     |
| `django-background-tasks` | Простота использования, не требует дополнительных компонентов              | Ограниченная гибкость                           |



## 7. Практические советы

1. **Используйте логирование**: Всегда записывайте результаты выполнения задач в логи.
2. **Мониторинг**: Используйте инструменты мониторинга (например, Flower для Celery) для отслеживания состояния задач.
3. **Тестирование**: Перед запуском в production протестируйте все задачи.
4. **Безопасность**: Защитите sensitive данные, используемые в задачах.

---

## Заключение

Выбор метода зависит от ваших потребностей:
- Для простых задач можно использовать cron или `django-background-tasks`.
- Для более сложных случаев рекомендуется использовать `django-celery-beat` или `django-apscheduler`.

Все эти инструменты помогут вам эффективно управлять фоновыми задачами в Django проекте.