# Глава 21. Модули: общая картина

Модули в языке Python обычно соответствуют файлам программ. Каждый файл - это отдельный модуль, и модули могут импортировать другие модули для доступа к именам, которые в них определены.

Обработка модулей выполняется двумя инструкциями и одной важной функцией:

* **`import`** - позволяет клиентам (импортерам) получать модуль целиком


* **`from`** - позволяет клиентам получать определенные имена из модуля


* **`imp.reload`** - обеспечивает возможность повторной загрузки модуля без остановки интерпретатора Python

## Зачем нужны модули?

> Модули обеспечивают простой способ организации компонентов в систему автономных пакетов переменных, известных как **пространства имен**.
>
> В процессе импортирования глобальная область видимости модуля образует пространство имент атрибутов объекта модуля.
>
> В конечном счете модули позволяют связывать отдельные файлы в крупные программные системы.

С точки зрения теории модули играют как минимум три роли:

* **Повторное использование программного кода**


* **Разделение системы пространств имен**. Модули являются самой высокоуровневой единицей организации программ. По существу, они - всего лишь пакеты имен. Модули позволяют изолировать имена в замкнутые пакеты, которые позволяют избежать конфликтов имен.

* **Реализация служб или данных для совместного использования**

## Архитектура программы на языке Python

### Как организована программа

Как правило, программа состоит из множества текстовых файлов, содержащих *инструкции*. Программа организована как один **главный файл**, к которому могут подключаться дополнительные файлы, известные как **модули**.

* Главный файл определяет, как будет двигаться основной поток выполнения программы - это тот файл, который необходимо запустить, чтобы начать работу приложения.

* Файлы модулей - это библиотеки инструментальных средств, где содержатся компоненты, используемые главным файлом (и, возможно, где-то еще). Главный файл использует инструменты, определенные в файлах модулей, а модули используют инструменты, определенные в других модулях.

Обычно файлы модулей ничего не делают, если попытаться запустить их отдельно - в них определяются инструментальные средства, используемые в других файлах.

### Импортирование и атрибуты

Инструкции `import` и `from` загружают и запускают другие файлы на этапе времени выполнения.

Импорт - широко используемое понятие в языке Python. Любой файл может импортировать функциональные возможности из любого другого файла.

### Модули стандартной библиотеки

Интерпретатор Python поставляется с обширной коллецией дополнительных модулей, которая известна как **стандартная библиотека**:

- интерфейсы операционных систем,
- организация хранилищ объектов,
- поиск по шаблону,
- сетевые взаимодействия,
- создание графического интерфейса и др.

## Как работает импорт

При импорте выполняются следующе действия:

* **Поиск** файла модуля


* **Компилирование** в байт-код (если это необходимо)


* **Запуск** программного кода модуля, чтобы создать объекты, которые он определяет

>**Все три действия выполняются, только когда модуль впервые импортируется** во время выполнения программы - все **последующие операции импорта** того же модуля пропускают эти действия и **просто выбирают уже находящийся в памяти объект модуля**

**1. Поиск**

Имен файлов в инструкции `import` указываются без расширения `.py` и без пути к каталогу, потому что для поиска файла, соответствующего имени, указанному в инструкции `import`, интерпретатор использует стандартный **путь поиска модулей**

**2. Компиляция (если необходимо)**

После того как в пути поиска модулей будет найден файл, интерпретатор компилирует его в бай-код, если это необходимо.

>Интерпретатор проверяет время создания файла и пропускает этап компиляции исходного программного кода, если файл с байт-кодом `.pyc` не старше, чем соответствующий ему файл `.py` с исходным текстом.

Если Python обнаружит в пути поиска только файл с байт-кодом и не найдет файл с исходным текстом, он просто загрузит байт-код.

**Компиляция выполняется в момент импортирования файла**.

По этой причине **файл `.pyc` для главного файла программы обычно не создается, если только он  не был импортирован еще куда-нибудь**. Байт-код главного файла программы создается в памяти компьютера.

**3. Запуск**

На последнем шаге операции импортирования производится запуск байт-кода модуля. Все инструкции в файле модуля выполняются по порядку, сверху вниз. Таким образом, этот этап выполнения создает все инструменты, которые определяются модулем.

Например, во время импортирования выполняются инструкции `def` в файле, которые создают функции и присваивают их атрибутам модуля. После этого функции могут вызываться из программы, выполнившей импорт.

На последнем шаге операции импортирования фактически запускается программный код модуля, поэтому если программный код верхнего уровня в файле модуля выполняет какие-нибудь действия, результаты этих действий можно будет наблюдать в время импорта.

## Путь поиска модулей

В общих чертах пути поиска модулей в языке Python выбираются из объединенных данных следующих основных источников. Некоторые из них предопределены, а некоторые можно настроить и тем самым сообщить интерпретатору, где выполнять поиск:

1. Домашний каталог программы - определяется автоматически


2. Содержимое переменной окружения `PYTHONPATH` (если таковая определена)


3. Каталоги стандартной библиотеки - определяются автоматически


4. Содержимое любых файлов с расширением `.pht` (если таковые имеются)

В конечном итоге объединение этих четырех компонентов составляет **`sys.path`** - список строк с именами каталогов.

`PYTHONPATH` и `.pht` можно использовать для расширения пути поиска, включая в него свои собственные каталоги с исходными текстами.

В зависимости от используемой платформы в путь поиска модулей автоматически могут добавляться дополнительные каталоги.

Например, в  путь поиска вслед за каталогами из переменной окружения `PYTHONPATH` и  перед каталогами стандартной библиотеки интерпретатор может добавлять текущий рабочий каталог  – каталог, откуда была запущена программа. Когда программа запускается из командной строки, текущий рабочий каталог может не совпадать с  домашним каталогом, где находится главный файл программы (то есть с каталогом, где находится программа).

Так как от запуска к запуску программы текущий рабочий каталог может изменяться, при обычных условиях рабочий каталог не должен иметь значения для операций импорта.

### Автоматическое изменение пути поиска

**1. Домашний каталог**

В зависимости от того, как была запущена программа, это может быть каталог, где находится главный файл программы. При работе в интерактивном сеансе этот элемент содержит путь к каталогу, откуда была запущена интерактивная оболочка (то есть текущий рабочий каталог).

>**Поиск в первую очередь всегда производится в этом каталоге**

**2. Каталоги в `PYTHONPATH`**

После этого производится поиск во всех каталогах, перечисленных в переменной окружения `PYTHONPATH`, слева направо (если эта переменная вообще установлена)

**3. Каталоги стандартной библиотеки**

Далее интерпретатор автоматически выполняет поиск в  каталогах, куда
были установлены модули стандартной библиотеки. Так как эти каталоги
всегда участвуют в поиске, их можно не добавлять в переменную окружения `PYTHONPATH`, или включать в файлы с расширением `.pth`

**4. Каталоги в файле `.pth`**

Можно добавлять нужные каталоги в путь поиска модулей, просто перечисляя их **по одному в строке** в текстовом файле с расширением `.pth`

Текстовый файл со списком каталогов помещается в соответствующий каталог и может играть примерно ту же роль, что и переменная окружения. Например, в UNIX-подобных системах этот файл можно поместить в каталог `/usr/local/lib/python3.0/site-packages` или `/usr/local/lib/site-python` (для системного питона, аналогично для анаконды).

Обнаружив этот файл, интерпретатор добавит в конец пути поиска модулей
каталоги, перечисленные во всех строках файла, от первой до последней.
Интерпретатор выберет все имена каталогов во всех файлах `.pth`, которые обнаружит, и  отфильтрует повторяющиеся имена и имена несуществующих каталогов.

### Список `sys.path`

Если вам потребуется узнать, как выглядит путь поиска на вашей машине, вы всегда сможете сделать это, просмотрев содержимое встроенного списка `sys.path`.

Этот список строк с именами каталогов **представляет собой фактический путь поиска, используемый интерпретатором**, – при выполнении операций импорта Python просматривает каждый каталог из списка, слева направо.

In [1]:
import sys
sys.path

['',
 '/home/shurik/anaconda3/lib/python36.zip',
 '/home/shurik/anaconda3/lib/python3.6',
 '/home/shurik/anaconda3/lib/python3.6/lib-dynload',
 '/home/shurik/anaconda3/lib/python3.6/site-packages',
 '/home/shurik/anaconda3/lib/python3.6/site-packages/GDAL-2.3.1-py3.6-linux-x86_64.egg',
 '/home/shurik/anaconda3/lib/python3.6/site-packages/trackml-3.dev0-py3.6.egg',
 '/home/shurik/anaconda3/lib/python3.6/site-packages/mask_rcnn-2.1-py3.6.egg',
 '/home/shurik/repos/facenet/src',
 '/home/shurik/anaconda3/lib/python3.6/site-packages/IPython/extensions',
 '/home/shurik/.ipython']

Действительно, `sys.path` – это путь поиска модулей. Интерпретатор создает его во время запуска программы, автоматически объединяя в  список: домашний каталог (или пустую строку, что соответствует текущему рабочему каталогу), все каталоги, перечисленные в  переменной окружения `PYTHONPATH` и в файлах `.pth`, и  каталоги стандартной библиотеки. В  результате получается список строк с  именами каталогов, которые просматриваются интерпретатором при импортировании новых файлов.

### Выбор файла модуля

Расширения имен файлов (например, `.py`) преднамеренно опущены в  инструкции `import`.

Интерпретатор выбирает первый найденный в пути поиска файл, который соответствует указанному имени. Например, инструкция `import b` могла бы загрузить:

* Файл с исходным текстом, имеющий имя b.py.
* Файл с байт-кодом, имеющий имя b.pyc.
* Содержимое каталога b при импортировании пакета
* Скомпилированный модуль расширения, написанный, как правило, на языке C или C++ и скомпонованный в виде динамической библиотеки (например, b.so в Linux и b.dll или b.pyd в Cygwin и в Windows).
* Скомпилированный встроенный модуль, написанный на языке C и статически скомпонованный с интерпретатором Python.
* Файл ZIP-архива с компонентом, который автоматически извлекается при импорте
* Образ памяти для фиксированных двоичных исполняемых файлов.
* Класс Java в версии Jython.
* Компонент .NET в версии IronPython.

Для импортера различия в типах загружаемых файлов совершенно незаметны как при импорте, так и при обращении к атрибутам модуля. Инструкция `import b` загружает некоторый модуль `b` в соответствии с настройками пути поиска модулей, а  инструкция `b.attr` извлекает элемент модуля, будь то переменная или функция, написанная на языке C

Если у вас в различных каталогах имеются файлы b.py и b.so, интерпретатор всегда будет загружать тот, что будет найден в  каталоге, который располагается раньше (левее) в пути поиска модулей, так как поиск в списке sys.path выполняется слева направо.

Но что произойдет, если оба файла, b.py и  b.so, находятся в одном и том же каталоге? В этом случае интерпретатор будет следовать стандартному порядку выбора файлов, впрочем, нет никаких гарантий,
что такой порядок будет оставаться неизменным с течением времени.

### Дополнительные возможности выбора модуля

Вполне возможно переопределить большую часть того, что делает операция импорта, используя то, что называется **программными ловушками импорта**.

Эти ловушки могут использоваться, чтобы придать операции импорта
дополнительные полезные возможности, такие как загрузка файлов из архивов, расшифровывание и так далее.

Фактически сам интерпретатор Python использует эти ловушки, чтобы обеспечить возможность извлечения импортируемых компонентов из ZIP-архивов, – заархивированные файлы автоматически извлекаются во время импорта, когда в пути поиска выбирается файл с расширением .zip

### Стороннее программное обеспечение: `distutils`

Настройка пути поиска модулей, описание которой приводится в  этой главе, в  первую очередь касается программного кода, который вы пишете самостоятельно. Сторонние расширения для Python обычно используют для автоматической установки самих себя такой инструмент, как `distutils`, входящий в состав стандартной библиотеки, поэтому для
использования такого программного кода не требуется выполнять настройку пути поиска модулей.

Системы, использующие `distutils`, обычно поставляются со сценарием `setup.py`, который запускается для установки таких систем, – этот сценарий импортирует и  использует модуль `distutils`, чтобы поместить систему в каталог, который уже является частью пути поиска модулей (обычно в подкаталог `lib\sitepackages` в каталоге, куда был установлен Python).

За дополнительной информацией о  распространении и  установке программ с  помощью `distutils` обращайтесь к  стандартному набору руководств по языку Python, потому что эта тема далеко выходит за рамки данной книги (например, этот инструмент дополнительно обеспечивает возможность компиляции расширений на языке C на машине, где производится установка). Кроме того, обратите внимание на развивающуюся систему `eggs`, распространяемую с открытыми исходными текстами, которая добавляет возможность проверки зависимостей для установленного программного кода на языке Python.