# **Лекция №4**
##**Курс "Прикладное программирование систем безопасности"**  
*Специальность "Информационная безопасность автоматизированных систем", 2(3) курс, 1 семестр*  

Содержание:
1.   Модуль os.
2.   Работа с файлами.
3.   Демонстрация процесса работы.
4.   Аргументы командной строки.

##1. Модуль os

В [документации](https://docs.python.org/3/library/os.html) данный модуль озаглавлен как __"miscellaneous operating system interfaces"__. Он содержит различный функционал для взаимодействия с операционной системой.  

Поведение функций данного модуля (по идее) не должно зависеть от ОС и тем самым обеспечивать переносимость  программ. Однако на самом деле не все функции модуля поддерживаются всеми ОС.

Рассмотрим некоторые из возможностей этого модуля.

In [None]:
#импортируем модуль
import os

###os.name, os.uname()

__os.name__ - возвращает имя операционной системы,  
__os.uname()__ - возвращает объект с атрибутами, описывающими текущую ОС.

In [None]:
# как мы уже в курсе, в колабе мы работаем на unixовой виртуалке
os.name

'posix'

In [None]:
# как можно выяснить из результатов выполнения этой функции, мы обитаем на smp-машине
# что в целом тоже довольно очевидно, так как это простой и дешевый способ масштабирования
# подробнее про SMP-архитектуру можно узнать в интернете, например, тут - https://kpfu.ru/portal/docs/F1799539540/SMP.pdf
os.uname()

posix.uname_result(sysname='Linux', nodename='68bb4e4a088b', release='5.15.120+', version='#1 SMP Wed Aug 30 11:19:59 UTC 2023', machine='x86_64')

###os.environ, os.getenv()

__os.environ__ - изменяемый словарь переменных окружения,  
__os.getenv()__ - метод для доступа к отдельным его значениям.

In [None]:
# посмотрим на набор переменных окружения в колабе
os.environ

environ{'SHELL': '/bin/bash',
        'NV_LIBCUBLAS_VERSION': '11.11.3.6-1',
        'NVIDIA_VISIBLE_DEVICES': 'all',
        'COLAB_JUPYTER_TRANSPORT': 'ipc',
        'NV_NVML_DEV_VERSION': '11.8.86-1',
        'NV_CUDNN_PACKAGE_NAME': 'libcudnn8',
        'CGROUP_MEMORY_EVENTS': '/sys/fs/cgroup/memory.events /var/colab/cgroup/jupyter-children/memory.events',
        'NV_LIBNCCL_DEV_PACKAGE': 'libnccl-dev=2.15.5-1+cuda11.8',
        'NV_LIBNCCL_DEV_PACKAGE_VERSION': '2.15.5-1',
        'VM_GCE_METADATA_HOST': '169.254.169.253',
        'HOSTNAME': '68bb4e4a088b',
        'LANGUAGE': 'en_US',
        'TBE_RUNTIME_ADDR': '172.28.0.1:8011',
        'GCE_METADATA_TIMEOUT': '3',
        'NVIDIA_REQUIRE_CUDA': 'cuda>=11.8 brand=tesla,driver>=450,driver<451 brand=tesla,driver>=470,driver<471 brand=unknown,driver>=470,driver<471 brand=nvidia,driver>=470,driver<471 brand=nvidiartx,driver>=470,driver<471 brand=geforce,driver>=470,driver<471 brand=geforcertx,driver>=470,driver<471 brand=quadro,d

In [None]:
# по ключам можно получить доступ к отдельным значениям обычными словарными методами
print(os.environ['CUDA_VERSION']) # как видно, в колабе есть возможность использовать графические ускорители для расчетов
print(os.environ['CUDNN_VERSION']) # и даже обучать при их помощи нейросети

11.8.0


KeyError: ignored

In [None]:
# либо можно воспользоваться отдельным методом для получения значения
print(os.getenv('CUDA_VERSION'))
print(os.getenv('CUDNN_VERSION'))


11.1.1
None


In [None]:
# словарь изменяемый, так что добавлять в него значения и изменять их можно
os.environ['my_env']='i like cats'
print(os.getenv('my_env'))
os.environ['my_env']='i like dogs'
print(os.getenv('my_env'))

i like cats
i like dogs


In [None]:
# как и удалять
del os.environ['my_env']
print(os.getenv('my_env'))
# тут видно преимущество использования отдельного метода для получения значения
try:
  print(os.environ['my_env'])
except Exception as e:
  print(f'{type(e)} : {e}')


None
<class 'KeyError'> : 'my_env'


###os.chdir(), os.getcwd()

__os.chdir()__ - возвращает текущую рабочую директорию,  
__os.getcwd()__ - позволяет изменить текущую рабочую директорию.

In [None]:
# посмотрим, в какой директории работаем в данный момент
os.getcwd()

'/content'

In [None]:
# изменим рабочую директорию
os.chdir("/content/sample_data")
print(os.getcwd())

/content/sample_data


###os.mkdir(), os.makedirs()

__os.mkdir()__ - создает новую директорию по указанному пути,  
__os.makedirs()__ - создает новую директорию по указанному пути с возможностью создания промежуточных директорий, если их не было.

In [None]:
# создадим новую директорию
os.mkdir("new folder") # в текущей рабочей директории, раз полный путь мы не указали

In [None]:
# создадим новую директорию внутри новой директории внутри новой директории
try:
  os.mkdir("new0/new1/new2") # этот метод на такое не способен
except Exception as e:
  print(f'{type(e)} : {e}')

os.makedirs("new0/new1/new2") # зато может этот

<class 'FileNotFoundError'> : [Errno 2] No such file or directory: 'new0/new1/new2'


###os.remove(), os.rmdir()

__os.remove()__ - удаляет указанный файл,  
__os.rmdir()__ - удаляет указанную директорию.

In [None]:
# давайте удалим какой-нибудь файл, благо в колабе есть демо-файлы
os.remove("mnist_test.csv")

In [None]:
# теперь удалим всю папку
os.rmdir("new folder")

In [None]:
# успешно удалить можно только пустую директорию
try:
  os.rmdir("new0")
except Exception as e:
  print(f'{type(e)} : {e}')

<class 'OSError'> : [Errno 39] Directory not empty: 'new0'


###os.rename()

__os.rename()__ - переименовыввает файл или папку.

In [None]:
# преименуем файл
os.rename("mnist_train_small.csv","mnist.csv")

In [None]:
# переименуем папку
os.rename("new0","old0")

###os.startfile()

__os.startfile()__ - позволяет запустить файл в привязанном к его расширению приложении, работает только в Windows.

In [None]:
# откроем что-нибудь
try:
  os.startfile("README.md") # как видно, мы тут не в Windows работаем
except Exception as e:
  print(f'{type(e)} : {e}')

<class 'AttributeError'> : module 'os' has no attribute 'startfile'


In [None]:
# в колабе можно воспользоваться cell magic
%pycat README.md

###os.walk()

__os.walk()__ - производит генерацию имён файлов в дереве каталогов; для каждого каталога возвращает кортеж (путь к каталогу, список каталогов, список файлов в них).

In [None]:
# это позволяет производить итерацию по каталогам, продкаталогам или файлам
os.chdir("/content")
# выведем все каталоги, имеющиеся в рабочей директории
for root, dirs, files in os.walk(os.getcwd()):
    print(root, dirs, files)

/content ['.config', 'sample_data'] []
/content/.config ['configurations', 'logs'] ['.last_survey_prompt.yaml', '.last_opt_in_prompt.yaml', 'config_sentinel', 'active_config', '.last_update_check.json', 'gce']
/content/.config/configurations [] ['config_default']
/content/.config/logs ['2022.09.26'] []
/content/.config/logs/2022.09.26 [] ['13.44.43.065608.log', '13.43.53.411838.log', '13.44.51.979721.log', '13.44.20.618810.log', '13.45.16.034312.log', '13.45.15.211900.log']
/content/sample_data [] ['README.md', 'anscombe.json', 'mnist_test.csv', 'california_housing_train.csv', 'california_housing_test.csv', 'mnist_train_small.csv']


###os.system()

__os.system()__ - исполняет строку как системную команду и возвращает код ее завершения.

In [None]:
# как можно догадаться, имя для метода os, создающего директорию, вдохновлено bash-командой
os.system("mkdir new_dir") # 0 == успех

0

In [None]:
# аналог os.makedirs можно реализовать при помощи флага -p
# при нем создаются недостающие директории
os.system("mkdir -p new_dir0/new_dir1/new_dir2")

0

In [None]:
# как можно догадаться, имя для метода os, удаляющего директорию, вдохновлено bash-командой
os.system("rmdir new_dir")

0

In [None]:
# в колабе можно при помощи ! исполнять команды операционной системы и без вызова os.system()
!mkdir new_dir

In [None]:
# кстати, в колабе при удалении директории через меню файлов осуществляется аналогичный вызов
# потому что удалить непустую папку он не даст
!rmdir new_dir

In [None]:
# код завершения вовзращен не будет, но если что-то пойдет не так, то будет выведено полное сообщение об ошибке
!rmdir non_existing_folder

rmdir: failed to remove 'non_existing_folder': No such file or directory


###os.urandom()

__os.urandom()__ -  возвращает указанное число случайных байт.

In [None]:
# такое может понадобиться для реализации криптографических систем
# как, например, в 3й лабораторной по основам информационной безопасности
os.urandom(10)

b'\xad\x91\xc4l\xd4\xf5\xa5\xc1\r\xac'

###os.stat()

__os.stat()__ - возвращает набор метаданных файла.

In [None]:
os.stat('/content/sample_data/README.md')

os.stat_result(st_mode=33261, st_ino=2621455, st_dev=44, st_nlink=1, st_uid=0, st_gid=0, st_size=930, st_atime=946713600, st_mtime=946713600, st_ctime=1664932206)

Выведенные в этом примере метаданные:
*  st_mode: режим доступа к файлу,
*  st_ino: идентификатор файла,
*  st_dev: идентификатор устройства, на котором лежит файла,
*  st_nlink: счетчик ссылок на файла,
*  st_uid: идентификатор владельца файла,
*  st_gid: идентификатор группы владельца файла,
*  st_size: размер файла,
*  st_atime: время последнего доступа к файлу от начала эпохи в секундах,
*  st_mtime: время последнего изменения файла от начала эпохи в секундах,
*  st_ctime: время последнего изменения метаданных от начала эпохи в секундах.





###os.path

Модуль os.path содержит набор функций для манипуляции путями к файлам и директориям.
Рассмотрим подробнее, что он умеет.

####os.path.join()

__os.path.join()__ - конкатериует части пути к файлу или директории, добавляя обратные слеши, если в этом есть необходимость.

In [None]:
# как видно, необходимый / был добавлен
os.path.join(r'/content/sample_data','README.md')

'/content/sample_data/README.md'

In [None]:
os.path.join('/content', 'sample_data', 'README.md')

'/content/sample_data/README.md'

In [None]:
# наличие / в начале второго аргумента сигнализирует о том, что используется абсолютный путь
# так что с ним нужно быть аккуратным
os.path.join('/content/sample_data','/README.md')

'/README.md'

####os.path.expanduser()

__os.path.expanduser()__ - возвращает аргумент с начальным компонентом пути $\sim$, замененным домашним каталогом этого пользователя. Если расширение пути завершается неудачно или путь не начинается с тильды $\sim$, то путь возвращается без изменений.

In [None]:
# найдем домашний каталог своего пользователя в колабе
os.path.expanduser('~') # мы тут рут

'/root'

In [None]:
# подадим в качестве аргумента что-то другое
os.path.expanduser('something/else/than/tilde') # ничего не изменилось

'something/else/than/tilde'

In [None]:
# этот метод может понадобиться для получения абсолютного пути к чему-либо в пользовательском каталоге
os.path.expanduser('~/file/in/my/home/folder.txt')

'/root/file/in/my/home/folder.txt'

####os.path.split()

__os.path.split()__ - делит полные пути к файлам и директориям на их имя и путь к ним.

In [None]:
# разделим путь к файлу
os.path.split('/content/sample_data/README.md')

('/content/sample_data', 'README.md')

In [None]:
# разделим путь к директории
os.path.split('/content/sample_data/old0/new1/new2')

('/content/sample_data/old0/new1', 'new2')

In [None]:
# по сути это довольно примитивная регулярка для поиска последнего обратного слеша в строке
os.path.split('С:\\content\\sample_data\\old0\\new1\\new2')
# потому что с путями в виндовом виде она не работает

('', 'С:\\content\\sample_data\\old0\\new1\\new2')

####os.path.splitext()

__os.path.splitext()__ - отделяет от пути к файлу его расширение.



In [None]:
os.path.splitext('/content/sample_data/README.md')

('/content/sample_data/README', '.md')

In [None]:
# у директории второй элемент кортежа будет пустой строкой
os.path.splitext('/content/sample_data/old0/new1/new2')

('/content/sample_data/old0/new1/new2', '')

In [None]:
# по сути это регулярка для поиска последней точки в строке
os.path.splitext('D:\\content\\sample_dat.a\\REA.DME.md')

('D:\\content\\sample_dat.a\\REA.DME', '.md')

####os.path.getsize()

__os.path.getsize()__ - возвращает размер файла или директории в байтах.

In [None]:
os.path.getsize('/content/sample_data/README.md')

930

In [None]:
os.path.getsize('/content/sample_data/')

4096

####os.path.realpath()

__os.path.realpath()__ - формирует абсолютный путь к файлу или директории.

In [None]:
os.path.realpath('sample_data/README.md')

'/content/sample_data/README.md'

In [None]:
# по сути просто подставляет к пути текущую рабочую директорию
os.path.realpath('README.md')

'/content/README.md'

####os.path.expandvars()

__os.path.expandvars()__ - вставляет значение переменной окружения в путь.

In [None]:
print(os.getenv('PAGER'))
print(os.path.expandvars('/home/users/$PAGER.py')) #имя переменной пишется с префиксом $

cat
/home/users/cat.py


In [None]:
os.path.exists(r"/content/sample_data")

True

##2. Работа с файлами

###Открытие и закрытие файлов

Для открытия файла используется метод __open()__, для закрытия - __close()__.

In [None]:
f = open('sample_data/README.md', mode='r', encoding='utf-8')
f.close()

Режимы работы с файлом:
*   __r__ - чтение; указатель на начале файла; вызывается по умолчанию,
*   __r+__ - одновременные чтение и запись; указатель на начале файла,
*   __rb__ - чтение в бинарном формате; указатель на начале файла,
*   __rb+__ - одновременные чтение и запись в бинарном формате; указатель на начале файла,
*   __w__ - запись; перезаписывает файл, если он есть; создает новый файл, если его нет,
*   __wb__ - запись в бинарном формате; перезаписывает файл, если он есть; создает новый файл, если его нет,
*   __w+__ - одновременные чтение и запись; перезаписывает файл, если он есть; создает новый файл, если его нет,
*   __a__ - добавление; указатель на конце файла, если файл есть; создает новый файл, если его нет,
*   __ab__ - добавление в бинарном формате; указатель на конце файла, если файл есть; создает новый файл, если его нет,
*   __a+__ - одновременные чтение и добавление; указатель на конце файла, если файл есть, создает новый файл, если его нет,
*   __ab+__ - одновременные чтение и добавление в бинарном формате; указатель на конце файла, если файл есть; создает новый файл, если его нет.

In [None]:
# чтобы работать с файлом безопасно, можно воспользоваться методами обработки исключений, которые были на прошлой лекции
try:
  f = open('sample_data/README1.md', mode='r', encoding='utf-8')
  # тут вытворяем с файлом всякое
  print(1)
finally:
  f.close()

FileNotFoundError: ignored

In [None]:
# можно воспользоваться следующей конструкцией, чтобы не закрывать файл в явном виде
with open('sample_data/README.md', encoding = 'utf-8') as f: #если открываем файл на чтение, можно mode не уазывать
  # тут вытворяем с файлом всякое и не переживаем, что забыли его закрыть
  print(1)
  pass

1


###Запись и чтение

При помощи __write()__ можно записать в файл строковую переменную.

In [None]:
with open('test0.txt',mode = 'w', encoding = 'utf-8') as f: # не забываем про кодировку, если хотим увидеть родную речь
  f.write('запишем строку в файл')
  f.write('запишем еще одну')
  f.write('чтобы записать данные с новой строки\n')
  f.write('не забываем про символ перевода строки')
  try:
    f.write(69.42)
  except Exception as e:
    print(f'{type(e)} : {e}') # убеждаемся, что при помощи этого метода можем писать только строковые переменные
  f.write(str(69.42)) # приводим типы

<class 'TypeError'> : write() argument must be str, not float


In [None]:
%pycat test0.txt

При помощи __writelines()__ можно записать в файл список строковых переменных.

In [None]:
lines = [
         '\nзапишем строку в файл\n',
         'запишем еще одну\n',
         'никто за нас символ переноса строки\n',
         'ставить не будет\n'
        ]
with open('test0.txt',mode = 'a', encoding = 'utf-8') as f:
  f.writelines(lines)


In [None]:
%pycat test0.txt

При помощи __writable()__ можно проверить, есть ли возможность записать что-то в открытый файл, при помощи __readable()__ - есть ли возможность прочесть.

In [None]:
def check_mode_capabilities(f):
  print(f'mode=\'{f.mode}\' : writable={f.writable()}, readable={f.readable()}')

f0 = open('sample_data/README.md', mode='r', encoding='utf-8')
check_mode_capabilities(f0)
f0.close()
f1 = open('sample_data/README.md', mode='r+', encoding='utf-8')
check_mode_capabilities(f1)
f1.close()
f2 = open('sample_data/README.md', mode='w', encoding='utf-8')
#заметим, что тут файл открыт для перезаписи, а значит все, что в нем было раньше, мы потеряли
check_mode_capabilities(f2)
f2.close()

mode='r' : writable=False, readable=True
mode='r+' : writable=True, readable=True
mode='w' : writable=True, readable=False


При помощи __read()__ можно считать определенное количество символов файла, или весь файл целиком, если в качестве аргумента указать отрицательное значение (или ничего).

In [None]:
with open('test0.txt',mode = 'r', encoding = 'utf-8') as f:
  first_10_chars = f.read(10) # это именно число символов, а не байт, т.к. utf-8 использует от 1 до 4 байт на хранение символа
  next_10_chars = f.read(10)
with open('test0.txt',mode = 'r', encoding = 'utf-8') as f:
  everything = f.read()

print(f'{first_10_chars} - {len(first_10_chars)} символов, {len(first_10_chars.encode("utf-8"))} байт\n')
print(f'{next_10_chars} - {len(next_10_chars)} символов, {len(next_10_chars.encode("utf-8"))} байт\n')
print(everything)

запишем ст - 10 символов, 19 байт

року в фай - 10 символов, 18 байт

запишем строку в файлзапишем еще однучтобы записать данные с новой строки
не забываем про символ перевода строки69.42


__readline()__ считывает одну строку целиком, либо ее часть вплоть до указанного числа символов.

In [None]:
with open('test0.txt',mode = 'r', encoding = 'utf-8') as f:
  line_with_a_limit= f.readline(50)
with open('test0.txt',mode = 'r', encoding = 'utf-8') as f:
  line_with_no_limit= f.readline()
with open('test0.txt',mode = 'r', encoding = 'utf-8') as f:
  line_less_than_limit= f.readline(100)

print(f'{line_with_a_limit} - {len(line_with_a_limit)} символов, {len(line_with_a_limit.encode("utf-8"))} байт\n')
print(f'{line_with_no_limit} - {len(line_with_no_limit)} символов,{len(line_with_no_limit.encode("utf-8"))} байт\n')
print(f'{line_less_than_limit} - {len(line_less_than_limit)} символов,{len(line_less_than_limit.encode("utf-8"))} байт\n')

запишем строку в файлзапишем еще однучтобы записат - 50 символов, 94 байт

запишем строку в файлзапишем еще однучтобы записать данные с новой строки
 - 74 символов,137 байт

запишем строку в файлзапишем еще однучтобы записать данные с новой строки
 - 74 символов,137 байт



__readlines()__ либо считывает весь файл целиком как список строк, либо считывает строки до тех пор, пока не достигнет лимита.

In [None]:
with open('test0.txt',mode = 'r', encoding = 'utf-8') as f:
  lines_no_limit= f.readlines()
with open('test0.txt',mode = 'r', encoding = 'utf-8') as f:
  lines_with_limit= f.readlines(75)

print(f'{lines_no_limit}\n')
length=0
for st in lines_with_limit:
  length += len(st)
print(f'{lines_with_limit} - {length} символов\n') # если лимит превышен на какой-то из строк, она все равно считается до конца

['запишем строку в файлзапишем еще однучтобы записать данные с новой строки\n', 'не забываем про символ перевода строки69.42']

['запишем строку в файлзапишем еще однучтобы записать данные с новой строки\n', 'не забываем про символ перевода строки69.42'] - 117 символов



__tell()__ возвращает текущее смещение указателя.

In [None]:
with open('test0.txt',mode = 'r', encoding = 'utf-8') as f:
  print(f'прочитано {f.tell()} байт')
  f.read(50)
  print(f'прочитано {f.tell()} байт')

прочитано 0 байт
прочитано 94 байт


Также можно считать все строки в список просто итерируя по строкам файла:

In [None]:
with open('test0.txt',mode = 'r', encoding = 'utf-8') as f:
  l = [line.strip() for line in f] # при помощи strip() можно избавиться от символов, которые в строке нам не нужны
                                   # в этом случае - символ конца строки
print(l)

['запишем строку в файлзапишем еще однучтобы записать данные с новой строки', 'не забываем про символ перевода строки69.42', 'запишем строку в файл', 'запишем еще одну', 'никто за нас символ переноса строки', 'ставить не будет']


##3. Демонстрация процесса работы

###tqdm

__tqdm__ -  библиотека, позволяющая демонстрировать прогресс бар в консольных python приложениях.

In [None]:
# устанавливаем пакет
!pip install tqdm



###Демонстрация прогресс бара

In [None]:
# выведем прогресс бар работы в цикле
import tqdm
from time import sleep

for i in tqdm.tqdm(range(9)):
    sleep(0.5) # в цикле ничего делать не будем

100%|██████████| 9/9 [00:04<00:00,  1.99it/s]


In [None]:
# итерировать можно и по спискам
from tqdm import tqdm
list_of_chars = ['a','b','c','d','e','f']
for i in tqdm(list_of_chars):
   sleep(1)

100%|██████████| 6/6 [00:06<00:00,  1.00s/it]


In [None]:
# в библиотеке есть свой аналог range для вывода прогресс бара
from tqdm import trange

for i in trange(10):
  sleep(i/10)

100%|██████████| 10/10 [00:04<00:00,  2.21it/s]


In [None]:
# можно использовать конструкуцию with
with tqdm(range(100)) as pbar:
  for i in range(5):
    sleep(0.5)
    pbar.update(20)

200it [00:02, 79.68it/s]


In [None]:
with tqdm(range(100)) as pbar:
  for i in range(10):
    for j in range(10):
      sleep(0.5)
      pbar.update(1)

100%|██████████| 100/100 [00:50<00:00,  1.99it/s]


###Кастомизация прогресс бара

In [None]:
# прогресс бар можно кастомизировать
for i in tqdm(range(12), desc="Что-то делаем"):
  sleep(0.4)

Что-то делаем: 100%|██████████| 12/12 [00:04<00:00,  2.49it/s]


In [None]:
# описание можно изменять динамически
pbar = tqdm(list_of_chars)
for char in pbar:
    sleep(0.7)
    pbar.set_description(f'Обрабатываем букву {char}')

Обрабатываем букву f: 100%|██████████| 6/6 [00:04<00:00,  1.42it/s]


In [None]:
# при помощи ncols можно изменять длину прогресс бара  от оооооооооочень длинного до вывода только процентов
for i in tqdm(range(10000000), ncols=150):
    pass
for i in tqdm(range(10000000), ncols=4):
    pass

100%|████████████████████████████████████████████████████████████████████████████████████████████████| 10000000/10000000 [00:02<00:00, 4131294.33it/s]
100%


In [None]:
# можно менять цвет полоски
for i in tqdm(range(100), colour='green'):
    sleep(0.05)

100%|[32m██████████[0m| 100/100 [00:05<00:00, 19.71it/s]


In [None]:
# демонстрацию прогресса можно выводить и по нескольким циклам одновременно
for i in tqdm(range(3), colour='green',desc='Внешний          цикл'):
  for j in tqdm(range(3), colour='blue',desc='Первый вложенный цикл'):
    for k in tqdm(range(3), colour='yellow',desc='Второй вложенный цикл'):
      sleep(0.2)

Внешний          цикл:   0%|[32m          [0m| 0/3 [00:00<?, ?it/s]
Первый вложенный цикл:   0%|[34m          [0m| 0/3 [00:00<?, ?it/s][A

Второй вложенный цикл:   0%|[33m          [0m| 0/3 [00:00<?, ?it/s][A[A

Второй вложенный цикл:  33%|[33m███▎      [0m| 1/3 [00:00<00:00,  4.99it/s][A[A

Второй вложенный цикл:  67%|[33m██████▋   [0m| 2/3 [00:00<00:00,  4.96it/s][A[A

Второй вложенный цикл: 100%|[33m██████████[0m| 3/3 [00:00<00:00,  4.93it/s]

Первый вложенный цикл:  33%|[34m███▎      [0m| 1/3 [00:00<00:01,  1.63it/s][A

Второй вложенный цикл:   0%|[33m          [0m| 0/3 [00:00<?, ?it/s][A[A

Второй вложенный цикл:  33%|[33m███▎      [0m| 1/3 [00:00<00:00,  5.00it/s][A[A

Второй вложенный цикл:  67%|[33m██████▋   [0m| 2/3 [00:00<00:00,  4.95it/s][A[A

Второй вложенный цикл: 100%|[33m██████████[0m| 3/3 [00:00<00:00,  4.89it/s]

Первый вложенный цикл:  67%|[34m██████▋   [0m| 2/3 [00:01<00:00,  1.62it/s][A

Второй вложенный цикл:   0%|[33m       

###tqdm.notebook

__tqdm_notebook__ представляет из себя прогресс бар с автоматически меняющейся цветовой гаммой. Он красный если цикл прерван, синий, если цикл в процессе и зеленый, если цикл успешно завершился.

In [None]:
from tqdm.notebook import tqdm_notebook

pbar =  tqdm_notebook(list_of_chars, desc='Кастомизировать можно аналогично tqdm',ncols=1000)

for char in pbar:
    sleep(1)
    pbar.set_description(f'Обрабатываем букву {char}')

Кастомизировать можно аналогично tqdm:   0%|                                                                  …

In [None]:
# аналогично работает для вложенных циклов
for i in tqdm_notebook(range(5), desc='Цикл 1'): # при этом первы йцикл не будет выводиться кусками
  for j in tqdm_notebook(range(5), desc='Цикл 2'):
    sleep(0.5)


Цикл 1:   0%|          | 0/5 [00:00<?, ?it/s]

Цикл 2:   0%|          | 0/5 [00:00<?, ?it/s]

Цикл 2:   0%|          | 0/5 [00:00<?, ?it/s]

Цикл 2:   0%|          | 0/5 [00:00<?, ?it/s]

Цикл 2:   0%|          | 0/5 [00:00<?, ?it/s]

Цикл 2:   0%|          | 0/5 [00:00<?, ?it/s]

##4. Аргументы командной строки

###sys.argv

Для примитивного случая - когда параметры неименованные и идут в строгом порядке - можно воспользоваться парсером из пакета __sys__.

In [None]:
%%writefile samplesys.py
# импортируем
import sys

print(f'sys.argv[0]={sys.argv[0]}') # первым параметром всегда идет имя запускаемого файла
if len(sys.argv) == 1:
  print('нет параметров')
else:
  print(f'передано {len(sys.argv)-1} параметров: {sys.argv[1:]}') # дальше к параметрам можно обращаться по индексам

Writing samplesys.py


In [None]:
!python samplesys.py

sys.argv[0]=samplesys.py
нет параметров


In [None]:
!python samplesys.py parameter 420

sys.argv[0]=samplesys.py
передано 2 параметров: ['parameter', '420']


###argparse

Для более сложных случаев - например, для использования именованных параметров, которые могут быть как обязательными, так и нет, - существует пакет __argparse__.

In [None]:
!pip install argparse

Collecting argparse
  Downloading argparse-1.4.0-py2.py3-none-any.whl (23 kB)
Installing collected packages: argparse
Successfully installed argparse-1.4.0


In [None]:
%%writefile sampleargparse.py
import argparse
# опциональные аргументы
parser = argparse.ArgumentParser(description ='Пример использования argrapse для разбора аргументов командной строки')
parser.add_argument('-i','--integerarg',type=int, default=1, help='Это целочисленный аргумент, у которого имеется значение по умолчанию')
parser.add_argument('-s','--stringarg',type=str, choices=['говори','python','круто'], help='Это обязательный строковый аргумент,\
                    значение которого должно попадать в указанный список',required=True)
group = parser.add_mutually_exclusive_group(required = True)
group.add_argument('-t','--truearg',action='store_true', help='Это аргумент взаимоисключающей группы,\
                   его нельзя передавать вместе с -f, он хранит в себе булевое значение True')
group.add_argument('-f','--falsearg',action='store_false', help='Это аргумент взаимоисключающей группы,\
                   его нельзя передавать вместе с -t, он хранит в себе булевое значение False')
# позиционные аргументы
parser.add_argument('req0',type=str,help='Это обязательный строковый позиционный аргумент, в вызове всегда будет идти после опциональных')
parser.add_argument('req1',type=float,help='Это обязательный вещественный позиционный аргумент, в вызове всегда будет идти после опциональных')
# рекомендуется вместо позиционных аргументов использовать required=True опциональные аргументы
# причины очевидны - так удобнее работать пользователю

args = parser.parse_args()
print(args.req0)
print(args.req1)
print(args.integerarg)
print(args.stringarg)
if args.truearg is not None:
  print(args.truearg)
else:
  print(args.falsearg)


Writing sampleargparse.py


In [None]:
# позиционные аргументы указываются после опциональных в порядке их описания в коде
!python sampleargparse.py --stringarg=python --truearg 'обязательный аргумент' 4.20

обязательный аргумент
4.2
1
python
True


In [None]:
# иначе получим ошибку несоответствия типов
!python sampleargparse.py --stringarg=python --truearg  4.20 'обязательный аргумент'

usage: sampleargparse.py
       [-h]
       [-i INTEGERARG]
       -s
       {говори,python,круто}
       (-t | -f)
       req0
       req1
sampleargparse.py: error: argument req1: invalid float value: 'обязательный аргумент'


In [None]:
# можно указывать как полные имена опциональных аргументов
!python sampleargparse.py --stringarg=python --truearg 'обязательный аргумент' 4.20

обязательный аргумент
4.2
1
python
True


In [None]:
# так и сокращенные
!python sampleargparse.py -s=python -t 'обязательный аргумент' 4.20

обязательный аргумент
4.2
1
python
True


In [None]:
# прочесть описания аргументов можно вызвав приложение с параметром -h или --help
!python sampleargparse.py --help

usage: sampleargparse.py
       [-h]
       [-i INTEGERARG]
       -s
       {говори,python,круто}
       (-t | -f)
       req0
       req1

Пример испо
льзования
argrapse
для разбора
аргументов
командной
строки

positional arguments:
  req0
    Это обязате
    льный
    строковый
    позиционный
    аргумент, в
    вызове
    всегда
    будет идти
    после опцио
    нальных
  req1
    Это обязате
    льный вещес
    твенный
    позиционный
    аргумент, в
    вызове
    всегда
    будет идти
    после опцио
    нальных

options:
  -h, --help
    show this
    help
    message and
    exit
  -i INTEGERARG, --integerarg INTEGERARG
    Это целочис
    ленный
    аргумент, у
    которого
    имеется
    значение по
    умолчанию
  -s {говори,python,круто}, --stringarg {говори,python,круто}
    Это обязате
    льный
    строковый
    аргумент,
    значение
    которого
    должно
    попадать в
    указанный
    список
  -t, --truearg
    Это
    аргумент вз
    аимоисключа
    ющей
    г

In [None]:
# опциональные аргументы можно указывать в произвольном порядке
!python sampleargparse.py  -t -s=python -i=69 'обязательный аргумент' 4.20

обязательный аргумент
4.2
69
python
True


In [None]:
# если указать значение не из списка для -s, выведется ошибка
!python sampleargparse.py -t -s=жабаскрипт 'обязательный аргумент' 4.20

usage: sampleargparse.py [-h] [-i INTEGERARG] -s {говори,python,круто}
                         (-t | -f)
                         req0 req1
sampleargparse.py: error: argument -s/--stringarg: invalid choice: 'жабаскрипт' (choose from 'говори', 'python', 'круто')


In [None]:
# если не указать  опциональные аргументы, у которых есть required, выведется ошибка
!python sampleargparse.py 'обязательный аргумент' 4.20

usage: sampleargparse.py [-h] [-i INTEGERARG] -s {говори,python,круто}
                         (-t | -f)
                         req0 req1
sampleargparse.py: error: the following arguments are required: -s/--stringarg


In [None]:
# если указать взаимоисключающие аргументы, выведется ошибка
!python sampleargparse.py -s=python -t -f 'обязательный аргумент' 4.20

usage: sampleargparse.py [-h] [-i INTEGERARG] -s {говори,python,круто}
                         (-t | -f)
                         req0 req1
sampleargparse.py: error: argument -f/--falsearg: not allowed with argument -t/--truearg


In [None]:
%%writefile sampleargparse.py

import argparse

parser = argparse.ArgumentParser()
parser.add_argument('-f','--find',type=str, required=True)
parser.add_argument('-c','--count',type=int, required=True)
args = parser.parse_args()

def actions(count, find):
  for i in range(count):
    print(find)


actions(args.count, args.find)

Overwriting sampleargparse.py


In [None]:
!python sampleargparse.py -f caat -c 20

caat
caat
caat
caat
caat
caat
caat
caat
caat
caat
caat
caat
caat
caat
caat
caat
caat
caat
caat
caat


In [None]:
var = 10
for i in range(0,2,1):
  var+=i
print(var)

11
