# Вивчаємо Python: модуль argparse

[переклад ukr](https://habr.com/ru/company/ruvds/blog/440654/)

Якщо ви займаєтеся обробкою та аналізом даних з використанням Python, то вам рано чи пізно доведеться вийти за межі Jupyter Notebook, перетворивши свій код на скрипти, які можна запускати засобами командного рядка. Тут вам і знадобиться модуль argparse. Для новачків, які звикли до Jupyter Notebook, такий крок означає необхідність залишити зону комфорту та перейти у нове середовище. Матеріал, переклад якого ми публікуємо сьогодні, написано для того, щоб полегшити подібний перехід.


# Модуль argparse

Модуль argparse можна порівняти з силами природи, які спорудили гірські піки, що височіють над хмарами. Завдяки цьому модулю в скриптах стає можливим робота з тим, що без його використання було б приховано від коду цих скриптів.

Слід зазначити, що [argparse](https://docs.python.org/3/howto/argparse.html#id1) є рекомендованим до використання модулем стандартної бібліотеки Python, призначеним до роботи з аргументами командного рядка. Мені вдалося знайти хороший посібник з `argparse` для початківців, тому я і вирішив перекласти таке [керівництво](https://habr.com/ru/company/ruvds/blog/440654/).

# Життя за межами Jupyter Notebook

Коли я вперше зіткнувся з argparse у Python-скрипті, який був потрібен мені для проекту, яким я займався у вільний час, я подумав: «А це що ще за таємнича конструкція?». Після цього я швидко переніс код Jupyter Notebook, але такий хід виявився нераціональним.

Мені потрібно було, щоб я мав можливість просто запустити скрипт, а не працювати з ним засобами Jupyter Notebook. Автономним скриптом, в якому використовувався модуль argparse, було б набагато легше користуватися, працювати над ним було б простіше, ніж покладаючись на Jupyter Notebook. Але тоді я поспішав, і, коли глянув на документацію по argparse, не зміг відразу схопити її суть, тому й не користувався вихідною версією скрипта.

З тих пір я розібрався з argparse та цей модуль мені дуже сподобався. Тепер я вважаю його просто життєво необхідним. При цьому освоїти його не так вже й складно.

# Навіщо потрібний модуль argparse?

Модуль argparse дозволяє розбирати аргументи, що передаються скрипту під час його запуску з командного рядка, і дає можливість користуватися цими аргументами у скрипті. Тобто йдеться про те, що цей модуль дозволяє надавати скрипту деякі дані в момент його запуску, а цими даними скрипт зможе скористатися під час виконання його коду. Модуль argparse — це засіб, за допомогою якого можна налагодити спілкування між автором програми та тим, хто нею користується, наприклад — між вами, коли ви сьогодні пишете скрипт, і вами ж, коли ви його завтра запускаєте, щось йому передаючи.

Використання argparse означає, що при необхідності змінити поведінку скрипта або при необхідності передачі йому деяких даних, якщо це передбачено автором скрипту, користувачеві не потрібно редагувати програмний код. В результаті скрипти знаходять певний рівень гнучкості.

# приклад

Припустимо, ви хочете написати скрипт для перетворення відеофайлів на звичайні зображення з використанням бібліотеки [OpenCV](https://opencv.org/). Для того, щоб скрипт міг би вирішити це завдання, йому потрібно знати місце, де зберігаються відеофайли, та місце, в яке потрібно помістити готові зображення. Тобто йому потрібні відомості про дві папки, шляхи до яких, що не дуже зручно, можна жорстко задати в коді скрипта, або, що вже куди краще, можна дозволити задавати користувачеві скрипта, вводячи їх як аргументи командного рядка при запуску скрипта. Для того, щоб оснастити скрипт такою можливістю, нам і знадобиться модуль `argparse`. Ось як може виглядати розділ скрипта (назвемо цей скрипт `videos.py`), в якому здійснюється розбір аргументів командного рядка:

```Python
# videos.py
import argparse
parser = argparse.ArgumentParser(description='Videos to images')
parser.add_argument('indir', type=str, help='Input dir for videos')
parser.add_argument('outdir', type=str, help='Output dir for image')
args = parser.parse_args()
```

Тут, на початку файлу, імпортується модуль `argparse`. Потім, з використанням конструкції `argparse.ArgumentParser()`, створюється об'єкт `parser` із зазначенням його опису. Далі, за допомогою методу `parser.add_argument()` описується змінна `indir`, в яку планується записати шлях до папки з відеофайлами. При цьому вказується те, що вона має рядковий (`str`) тип, а також задається довідкова інформація про неї. Після цього, так само, створюється змінна `outdir`, в яку потрапить шлях до папки, в яку скрипт повинен буде розмістити зображення, створені на основі відеофайлів. На наступному етапі роботи в змінну `args` потрапляє результат аналізу аргументів командного рядка. Те, що передано скрипту при запуску, тепер буде доступним у вигляді властивостей `indir` та `outdir` об'єкта `args`. Тепер із цими значеннями можна працювати. В даному випадку ми просто виводимо у консоль те, що передано скрипту в аргументі `indir`.

Ось як запустити цей скрипт із командного рядка:

```Bash
python videos.py /videos /images
```
Зверніть увагу на те, що рядки `/videos` та `/images` не потрібно укладати в лапки. Скрипт, запущений таким чином, виведе в термінал рядок `/videos`, що підтвердить можливість використання переданих йому аргументів у своєму коді. Це є магія `argparse` у дії.

# Подробиці про argparse

Щойно ми розглянули простий приклад роботи з `argparse`. Тепер давайте обговоримо деякі подробиці, що стосуються `argparse`.

>**Позиційні аргументи**
Конструкція виду `parser.add_argument('indir', type=str, help='Input dir for videos')` із скрипта `videos.py` призначена для створення позиційного аргументу (`positional argument`). При виклику скрипта важливим є порядок зазначення таких аргументів. Так, перший аргумент, переданий скрипту, стає першим позиційним аргументом, другий аргумент другим позиційним аргументом.
Що станеться в тому випадку, якщо скрипт взагалі запустити без аргументів, виконавши в терміналі команду `python videos.py`?
У такому разі буде виведено повідомлення про помилку такого вигляду:
`videos.py: error: the following arguments are required: indir, outdir`
В результаті виявляється, що для того, щоб запустити скрипт, в якому передбачено використання позиційних аргументів, такі аргументи завжди потрібно вказувати під час його запуску.

>**Необов'язкові аргументи**
Що станеться під час запуску нашого скрипта командою `python videos.py --help`?
У відповідь буде виведено довідкову інформацію про нього. Це саме ті відомості про позиційні аргументи, які ми вказували при описі відповідних змінних:
> 
```
usage: videos.py [-h] indir outdir

Videos to images

positional arguments:
  indir       Input dir for videos
  outdir      Output dir for image

optional arguments:
  -h, --help  show this help message and exit 
```
Скрипт повідомив нам багато цікавого про те, чого він чекає від користувача, а `help` – це приклад необов'язкового аргументу (optional argument). `--help` (або `-h`) - це єдиний стандартний необов'язковий аргумент, яким ми можемо користуватися при роботі з `argparse`, але якщо вам потрібні й інші необов'язкові аргументи, їх можна створювати і самостійно.

Необов'язкові аргументи створюють так само, як і позиційні. Основна різниця між командами їх створення полягає в тому, що при вказівці імен таких аргументів ці імена починаються з послідовності символів `-` або для коротких форм аргументів, з символу `-`. Наприклад, необов'язковий аргумент можна створити так:

`parser.add_argument('-m', '--my_optional')`

Нижче приклад того, як створювати та використовувати необов'язкові аргументи. Зверніть увагу, що ми, описуючи тут необов'язковий аргумент, вказали його тип як `int`. Тобто він є цілим числом. У такій ситуації можна використовувати інші типи `Python`.

```Python
# my_example.py
import argparse
parser = argparse.ArgumentParser(description='My example explanation')
parser.add_argument(
    '--my_optional',
    type=int,
    default=2,
    help='provide an integer (default: 2)'
)
my_namespace = parser.parse_args()
print(my_namespace.my_optional)
```

Аргумент, описаний як `--my_optional`, доступний у програмі як властивості об'єкта `my_namespace` з ім'ям `my_optional`.

Необов'язковими аргументами можна призначати значення, які вони будуть мати за умовчанням. У нашому випадку, якщо при викликі скрипта аргументу `my_example` не буде встановлено жодного значення, в нього буде записано число 2, яке і буде виведено в консоль. Для того, щоб задати значення цього аргументу під час запуску скрипту можна скористатися такою конструкцією:

`python my_example.py  --my_optional=3`

# Навіщо ще можна використовувати argparse?

Модуль argparse можна використовувати для розробки `Python`-додатків, які планується упаковувати в контейнери `Docker`. Так, наприклад, якщо при запуску програми, упакованої в контейнер, йому потрібно передати аргументи командного рядка, то описати це на етапі складання контейнера можна в `Dockerfile` за допомогою інструкції `RUN`. Для запуску скриптів під час виконання контейнера можна використовувати інструкції `CMD` або `ENTRYPOINT`. Подробиці про файли `Dockerfile` можна знайти [тут](https://habr.com/ru/company/ruvds/blog/439980/).

# Підсумки

Автор розглянув базові способи роботи з модулем `argparse`, використовуючи які ви можете оснастити свої скрипти можливістю приймати і обробляти аргументи командного рядка. При цьому слід зазначити, що можливості `argparse` на цьому не закінчуються. Наприклад, використання при описі аргументів параметра `nargs` дозволяє працювати зі списками аргументів, а параметр `choices` дозволяє встановити набори значень, які можуть приймати аргументи. Насправді тепер, освоївши основні можливості `argparse`, ви, без особливих складнощів, зможете вивчити цей модуль глибше, використовуючи документацію до нього.

Якщо ви звикли працювати з `Jupyter Notebook` і хочете відійти від цієї практики, то [ось](https://medium.com/chingu/an-introduction-to-environment-variables-and-how-to-use-them-f602f66d15fa) і [ось](https://www.datacamp.com/community/blog/environment-variable-data-science) матеріали по роботі зі змінними оточеннями. Ось матеріал, присвячений засобу, [`repo2docker`](https://repo2docker.readthedocs.io/en/latest/), що дозволяє перетворювати репозиторії `Jupyter Notebook` на образи `Docker`.