# Прикладные задачи. Модули os, sys. Работа с архивами

Для многих прикладных задач потребуется подключать специальные библиотеки, которые значительно облегчают процесс разработки и автоматизируют львиную долю стандартных операций. Ниже представим некоторые из них.

## Обработка конфигурационных файлов

### json

JSON (JavaScript Object Notation) - простой формат обмена данными, основанный на подмножестве синтаксиса JavaScript. Модуль json позволяет кодировать и декодировать данные в удобном формате.

Некоторые возможности библиотеки **json**

**json.dump**`(obj, fp, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw)` - сериализует obj как форматированный JSON поток в fp.

**json.dumps**`(obj, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw)` - сериализует obj в строку JSON-формата.

**json.load**`(fp, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)` - десериализует JSON из fp.

**json.loads**`(s, encoding=None, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)` - десериализует s (экземпляр str, содержащий документ JSON) в объект Python.

In [2]:
import json

# Кодирование основных объектов Python
print(json.dumps(['foo', {'bar': ('baz', None, 1.0, 2)}]))
print(json.dumps({"c": 0, "b": 0, "a": 0}, sort_keys=True))

# Компактное кодирование
print(json.dumps([1,2,3,{'4': 5, '6': 7}], separators=(',', ':')))

# Красивый вывод
print(json.dumps({'4': 5, '6': 7}, sort_keys=True, indent=4))

# Декодирование (парсинг) JSON
print(type(json.loads('["foo", {"bar":["baz", null, 1.0, 2]}]')))
print(json.loads('"\\"foo\\bar"'))

["foo", {"bar": ["baz", null, 1.0, 2]}]
{"a": 0, "b": 0, "c": 0}
[1,2,3,{"4":5,"6":7}]
{
    "4": 5,
    "6": 7
}
<class 'list'>
"fooar


# Задание

Задачи, аналогичные этой, часто встречаются в реальной веб-разработке. Будем получать и отдавать JSONы. К вам поступают данные в виде json-строки, в которых содержится список людей. Для каждого человека описаны различные его параметры, но вам нужно посчитать просто средний возраст всех людей из списка. Напишите функцию mean_age(json_string), которая принимает json строку, считает средний возраст людей из входных данных и возвращает новую json-строку с посчитанным возрастом. Формат входных и выходных данных указан в контесте в задаче Парсинг JSON, проверить правильность выполнения задания вы можете там же.

In [32]:
# опишите решение здесь
# Задачи, аналогичные этой, часто встречаются в реальной веб-разработке. Будем получать и отдавать JSONы.
# К вам поступают данные в виде json-строки, в которых содержится список людей.
# Для каждого человека описаны различные его параметры,
# но вам нужно посчитать просто средний возраст всех людей из списка. Напишите функцию mean_age(json_string),
# которая принимает json строку,
# считает средний возраст людей из входных данных и возвращает новую json-строку в том формате, который указан ниже.
import json
def mean_age(json_string) -> dict:
    with open(json_string) as f:
        s = f.readlines()
        s = ''.join(s)
        s = s.split('\n')
        s = ''.join(s)
        s = s.split('    ')
        s = ''.join(s)
    s = json.loads(s)
    Sum = 0
    for el in s:
        Sum += el.get("age")
    meanAge = Sum/len(s)
    s = '{"mean_age": ' + str(meanAge) + '}'
    return s
print(mean_age("input.txt"))

{"mean_age": 23.5}


## Системные библиотеки

### Модуль **os**

Модуль os предоставляет множество функций для работы с операционной системой, причём их поведение, как правило, не зависит от ОС, поэтому программы остаются переносимыми. Здесь будут приведены наиболее часто используемые из них.

Будьте внимательны: некоторые функции из этого модуля поддерживаются не всеми ОС.

|Функция|Что делает|
|---|:---|
|`os.name`|имя операционной системы. Доступные варианты: 'posix', 'nt', 'mac', 'os2', 'ce', 'java'|
|`os.environ`|словарь переменных окружения. Изменяемый (можно добавлять и удалять переменные окружения)|
|`os.getlogin()`|имя пользователя, вошедшего в терминал (Unix)|
|`os.getpid()`|текущий id процесса|
|`os.uname()`|информация об ОС. возвращает объект с атрибутами: sysname - имя операционной системы, nodename - имя машины в сети (определяется реализацией), release - релиз, version - версия, machine - идентификатор машины|
|`os.access(path, mode, *, dir_fd=None, effective_ids=False, follow_symlinks=True)`|проверка доступа к объекту у текущего пользователя. Флаги: `os.F_OK` - объект существует, `os.R_OK` - доступен на чтение, `os.W_OK` - доступен на запись, `os.X_OK` - доступен на исполнение|
|`os.chdir(path)`|смена текущей директории|
|`os.chmod(path, mode, *, dir_fd=None, follow_symlinks=True)`|смена прав доступа к объекту (mode - восьмеричное число)|
|`os.chown(path, uid, gid, *, dir_fd=None, follow_symlinks=True)`|меняет id владельца и группы (Unix)|
|`os.getcwd()`|текущая рабочая директория|
|`os.link(src, dst, *, src_dir_fd=None, dst_dir_fd=None, follow_symlinks=True)`|создаёт жёсткую ссылку|
|`os.listdir(path=".")`|список файлов и директорий в папке|
|`os.mkdir(path, mode=0o777, *, dir_fd=None)`|создаёт директорию. OSError, если директория существует|
|`os.makedirs(path, mode=0o777, exist_ok=False)`|создаёт директорию, создавая при этом промежуточные директории|
|`os.remove(path, *, dir_fd=None)`|удаляет путь к файлу|
|`os.rename(src, dst, *, src_dir_fd=None, dst_dir_fd=None)`|переименовывает файл или директорию из src в dst|
|`os.renames(old, new)`|переименовывает old в new, создавая промежуточные директории|
|`os.replace(src, dst, *, src_dir_fd=None, dst_dir_fd=None)`|переименовывает из src в dst с принудительной заменой|
|`os.rmdir(path, *, dir_fd=None)`|удаляет пустую директорию|
|`os.removedirs(path)`|удаляет директорию, затем пытается удалить родительские директории, и удаляет их рекурсивно, пока они пусты|
|`os.symlink(source, link_name, target_is_directory=False, *, dir_fd=None)`|создаёт символическую ссылку на объект|
|`os.sync()`|записывает все данные на диск (Unix)|
|`os.truncate(path, length)`|обрезает файл до длины length|
|`os.utime(path, times=None, *, ns=None, dir_fd=None, follow_symlinks=True)`|модификация времени последнего доступа и изменения файла. Либо times - кортеж (время доступа в секундах, время изменения в секундах), либо ns - кортеж (время доступа в наносекундах, время изменения в наносекундах)|
|`os.walk(top, topdown=True, onerror=None, followlinks=False)`|генерация имён файлов в дереве каталогов, сверху вниз (если topdown равен True), либо снизу вверх (если False). Для каждого каталога функция walk возвращает кортеж (путь к каталогу, список каталогов, список файлов)|
|`os.system(command)`|исполняет системную команду, возвращает код её завершения (в случае успеха 0)|
|`os.urandom(n)`|n случайных байт. Возможно использование этой функции в криптографических целях|
|`os.path`|модуль, реализующий некоторые полезные функции на работы с путями|

#### Некоторые распространенные функции os

- **os.getcwd**

Текущая рабочая директория

- **os.path.join**

Метод join позволяет вам совместить несколько путей при помощи присвоенного разделителя. К примеру, в Windows, в роли разделителя выступает бэкслэш (косая черта, указывающая назад), однако в Linux функция разделителя присвоена косой черте, указывающей вперед (forward slash).

- **os.listdir**

Cписок файлов и директорий в папке

- **os.environ**

Значение os.environ известно как объект мэппинга (сопоставления), который работает со словарем переменных пользовательской среды. 

In [33]:
import os

# print(os.getcwd())
# print(os.path.join(os.getcwd(), 'text.txt'))
# print(os.listdir(path="02"))
print(os.environ)

environ({'ELECTRON_RUN_AS_NODE': '1', 'USER': 'meadowse', 'SECURITYSESSIONID': '18eae', 'COMMAND_MODE': 'unix2003', '__CFBundleIdentifier': 'com.microsoft.VSCode', 'PATH': '/usr/local/bin:/usr/local/bin:/opt/goinfre/meadowse/homebrew/opt/ruby/bin:/opt/goinfre/meadowse/homebrew/opt/ruby/bin:/Users/meadowse/.brew/bin:/usr/local/bin:/usr/bin:/bin:/usr/sbin:/sbin:/usr/local/go/bin:/usr/local/munki:/Library/Apple/usr/bin:$/opt/goinfre/meadowse/.rvm/bin:/Users/meadowse/.rvm/bin', 'HOME': '/Users/meadowse', 'SHELL': '/bin/zsh', 'LaunchInstanceID': '12568768-5C87-4BD1-9CE7-C7753BEF8AE7', '__CF_USER_TEXT_ENCODING': '0xF7906:0x7:0x31', 'XPC_SERVICE_NAME': 'application.com.microsoft.VSCode.1676020.1676223', 'SSH_AUTH_SOCK': '/private/tmp/com.apple.launchd.LmBWKuHMbm/Listeners', 'XPC_FLAGS': '0x0', 'LOGNAME': 'meadowse', 'TMPDIR': '/var/folders/zz/zyxvpxvq6csfxvn_n003vs0r00yy86/T/', 'ORIGINAL_XDG_CURRENT_DESKTOP': 'undefined', 'VSCODE_CWD': '/', 'VSCODE_NLS_CONFIG': '{"locale":"ru","availableLangu

### Модуль **sys**

Модуль sys обеспечивает доступ к некоторым переменным и функциям, взаимодействующим с интерпретатором python.

|Функция|Что делает|
|---|:---|
|`sys.argv`|список аргументов командной строки, передаваемых сценарию Python. `sys.argv[0]` является именем скрипта (пустой строкой в интерактивной оболочке)|
|`sys.byteorder`|порядок байтов. Будет иметь значение 'big' при порядке следования битов от старшего к младшему, и 'little', если наоборот (младший байт первый)|
|`sys.builtin_module_names`|кортеж строк, содержащий имена всех доступных модулей|
|`sys.call_tracing(функция, аргументы)`|вызывает функцию с аргументами и включенной трассировкой, в то время как трассировка включена|
|`sys.copyright`|строка, содержащая авторские права, относящиеся к интерпретатору Python|
|`sys._clear_type_cache()`|очищает внутренний кэш типа|
|`sys._current_frames()`|возвращает словарь-отображение идентификатора для каждого потока в верхнем кадре стека в настоящее время в этом потоке в момент вызова функции|
|`sys.dllhandle`|целое число, определяющее дескриптор DLL Python (Windows)|
|`sys.exc_info()`|возвращает кортеж из трех значений, которые дают информацию об исключениях, обрабатывающихся в данный момент|
|`sys.exec_prefix`|каталог установки Python|
|`sys.executable`|путь к интерпретатору Python|
|`sys.exit([arg])`|выход из Python. Возбуждает исключение SystemExit, которое может быть перехвачено|
|`sys.flags`|флаги командной строки. Атрибуты только для чтения|
|`sys.float_info`|информация о типе данных float|
|`sys.float_repr_style`|информация о применении встроенной функции repr() для типа float|
|`sys.getdefaultencoding()`|возвращает используемую кодировку|
|`sys.getdlopenflags()`|значения флагов для вызовов dlopen()|
|`sys.getfilesystemencoding()`|возвращает кодировку файловой системы|
|`sys.getrefcount(object)`|возвращает количество ссылок на объект. Аргумент функции getrefcount - еще одна ссылка на объект|
|`sys.getrecursionlimit()`|возвращает лимит рекурсии|
|`sys.getsizeof(object[, default])`|возвращает размер объекта (в байтах)|
|`sys.getswitchinterval()`|интервал переключения потоков|
|`sys.getwindowsversion()`|возвращает кортеж, описывающий версию Windows|
|`sys.hash_info`|информация о параметрах хэширования|
|`sys.hexversion`|версия python как шестнадцатеричное число (для 3.2.2 final это будет 30202f0)|
|`sys.implementation`|объект, содержащий информацию о запущенном интерпретаторе python|
|`sys.int_info`|информация о типе int|
|`sys.intern(строка)`|возвращает интернированную строку|
|`sys.last_type`, `sys.last_value`, `sys.last_traceback`|информация об обрабатываемых исключениях. По смыслу похоже на `sys.exc_info()`|
|`sys.maxsize`|максимальное значение числа типа Py_ssize_t (231 на 32-битных и 263 на 64-битных платформах)|
|`sys.maxunicode`|максимальное число бит для хранения символа Unicode|
|`sys.modules`|словарь имен загруженных модулей. Изменяем|
|`sys.path`|список путей поиска модулей|
|`sys.path_importer_cache`|словарь-кэш для поиска объектов|
|`sys.platform`|информация об операционной системе|
|`sys.prefix`|папка установки интерпретатора python|
|`sys.ps1`, `sys.ps2`|первичное и вторичное приглашение интерпретатора (определены только если интерпретатор находится в интерактивном режиме). По умолчанию `sys.ps1 == ">>> "`, а `sys.ps2 == "... "`|
|`sys.dont_write_bytecode`|если true, python не будет писать .pyc файлы|
|`sys.setdlopenflags(flags)`|установить значения флагов для вызовов dlopen()|
|`sys.setrecursionlimit(предел)`|установить максимальную глубину рекурсии|
|`sys.setswitchinterval(интервал)`|установить интервал переключения потоков|
|`sys.settrace(tracefunc)`|установить "след" функции|
|`sys.stdin`|стандартный ввод|
|`sys.stdout`|стандартный вывод|
|`sys.stderr`|стандартный поток ошибок|
|`sys.__stdin__`, `sys.__stdout__`, `sys.__stderr__`|исходные значения потоков ввода, вывода и ошибок|
|`sys.tracebacklimit`|максимальное число уровней отслеживания|
|`sys.version`|версия python|
|`sys.api_version`|версия C API|
|`sys.version_info`|Кортеж, содержащий пять компонентов номера версии|
|`sys.warnoptions`|реализация предупреждений|
|`sys.winver`|номер версии python, использующийся для формирования реестра Windows|

#### Некоторые распространенные константы sys

- **sys.path**

это список строк, которые указывают путь поиска для модулей. Как правило, данная функция указывает Python, в каких локациях смотреть, когда он пытается импортировать модуль. В соответствии с документацией Python, sys.path инициализируется из переменной окружения PYTHONPATH, плюс зависимое от установки значение, указанное по умолчанию.

- **sys.platform**

Значение sys.platform – идентификатор платформы. Вы можете использовать sys.platform чтобы добавлять модули к sys.path, импортировать разные модули, в зависимости от платформы, или запускать разные части кода. 

- **sys.stdin** / **stdout** / **stderr**

Stdin, stdout и stderr сопоставляются с файловыми объектами, которые соответствуют стандартным входам, выходам и потокам ошибок интерпретатора соответственно. Функция stdin используется для всех входов, используемых интерпретатором, за исключением скриптов, тогда как stdout используется для выходов операторов print и expression. Возможное применение - перенаправить stdout или stderr, или обе функции к файлу, такому как log, либо же какой-либо дисплей в пользовательском графическом интерфейсе, созданным вами.

In [34]:
import sys

# print(sys.path)
# print(sys.platform)
print(sys.stdin)
print(sys.stdout)
print(sys.stderr)

<_io.TextIOWrapper name='<stdin>' mode='r' encoding='utf-8'>
<ipykernel.iostream.OutStream object at 0x109ed9ae0>
<ipykernel.iostream.OutStream object at 0x109ed9ba0>
