# Py Boxes: модули, пакеты, программы

До этого момента вы писали и запускали с помощью интерактивного интерпретатора Python фрагменты кода вроде следующего:

In [1]:
print("This interactive snippet works.")

This interactive snippet works.


Теперь создадим отдельную программу. Создайте файл под названием test1.py, содержащий следующую строку кода: 

In [2]:
print("This standalone program works!")

This standalone program works!


Обратите внимание на отсутствие символов >>>, перед вами лишь одна строка кода. Убедитесь, что перед print нет пробелов. Если вы работаете с Python с помощью текстовой консоли или окна терминала, введите имя вашей программы Python, а затем — имя файла:


In [None]:
python test1.py

Вы увитете текст: 

In [None]:
This standalone program works!

# Аргументы командной строки

Создайте файл test2.py, который содержит две следующие строки: 

In [2]:
import sys
print('Program argument: ', sys.argv)

Program argument:  ['C:\\Users\\user\\Anaconda3\\lib\\site-packages\\ipykernel_launcher.py', '-f', 'C:\\Users\\user\\AppData\\Roaming\\jupyter\\runtime\\kernel-f7a061bd-aa70-45b9-b8a1-aa5c0cdc4b83.json']


Теперь используйте свою версию Python, чтобы запустить эту программу. Вот так может выглядеть окно терминала в операционных системах Linux или Mac OS X, использующее стандартную программу оболочки: 

In [None]:
$ python test2.py 
Program arguments: ['test2.py'] 
$ python test2.py tra la la 
Program arguments: ['test2.py', 'tra', 'la', 'la']

# Модули и оператор import

Мы собираемся перейти на новый уровень — создание и использование кода более чем из одного файла. Модуль — это всего лишь файл, содержащий код Python. Текст этой книги организован в иерархию: слова, предложения, абзацы и главы. В противном случае он стал бы нечитаемым спустя пару страниц. У кода имеется подобная организация: типы данных похожи на слова, операторы и выражения — это предложения, функции — это абзацы, а модули — это главы. Продолжу аналогию: когда я говорю, что что-то будет более подробно рассмотрено в главе 8, в программировании это было бы похоже на отсылку к коду другого модуля. Мы ссылаемся на код других модулей с помощью оператора import. Оно позволяет получить доступ к коду и переменным этого модуля из вашей программы. 

# Импортируем модуль 

Простейший вариант использования оператора import выглядит как import модуль, где модуль — это имя другого файла Python без расширения .py. Симулируем работу метеостанции и выведем на экран отчет о погоде. Основная программа выведет на экран отчет, а отдельный модуль, содержащий одну функцию, вернет описание погоды, которое будет использовано в отчете. 

Основная программа выглядит так (назовем ее weatherman.py): 

In [None]:
import report 
description = report.get_description() 
print("Today's weather:", description) 

А ее модуль (report.py) — так: 

In [8]:
def get_description():
    """Return random weather, just like the pros"""
    from random import choice    
    possibilities = ['rain', 'snow', 'sleet', 'fog', 'sun', 'who knows']    
    return choice(possibilities) 
  

Если вы поместите оба этих файла в один каталог и укажете Python запустить файл weatherman.py в качестве основной программы, он обратится к модулю report и запустит его функцию get_description(). Мы написали эту версию функции get_description() так, чтобы она возвращала случайную строку из списка, которую выведет на экран основная программа: 

In [None]:
$ python weatherman.py 
Today's weather: who knows 
$ python weatherman.py 
Today's weather: sun 
$ python weatherman.py 
Today's weather: sleet 

Мы использовали оператор import в двух местах. 

В основной программе weatherman.py, импортируемой модулем report. 

В файле модуля report.py функция get_description() импортирует функцию choice из стандартного модуля Python random. Мы также использовали эти операторы двумя разными способами. 

Основная программа делала вызов import report и затем вызывала функцию report.get_description(). 

Функция get_description() из модуля report.py содержит вызовы from random import choice и choice(possibilities). 

В первом случае мы импортировали модуль report целиком, при этом нам нужно было добавить префикс report., чтобы вызвать функцию get_description(). 

После этого оператора import все содержимое файла report.py становится доступным основной программе, нужно лишь ставить перед именем вызываемой функции префикс report.. 

Путем уточнения содержимого модуля с помощью его имени мы избегаем возникновения неприятных конфликтов именования. 

В каком-то другом модуле также может быть функция get_descpirtion(), и мы не вызовем ее по ошибке. 

Во втором случае мы находимся внутри функции и знаем, что существует только одна функция с именем choice, поэтому импортируем функцию choice() непосредственно из модуля random. Мы могли бы написать функцию как следующий сниппет, который возвращает случайный результат: 

In [None]:
def get_description():    
    import random    
    possibilities = ['rain', 'snow', 'sleet', 'fog', 'sun', 'who knows']    
    return random.choice(possibilities) 

Как и для многих других аспектов программирования, выбирайте стиль, который кажется вам наиболее прозрачным. Имя функции, перед которым стоит имя модуля (random.choice), использовать безопаснее, однако из-за этого придется набирать немного больше текста. 

Эти примеры применения функции get_description() продемонстрировали варианты того, что можно импортировать, но не показали, где следует выполнять импортирование, — в них import вызывался изнутри функции. Мы могли бы импортировать random из другой функции: 

In [None]:
import random 
def get_description():     
    possibilities = ['rain', 'snow', 'sleet', 'fog', 'sun', 'who knows'] 
    return random.choice(possibilities) 

get_description() 

'who knows' 

get_description() 

'rain' 

Вам следует рассмотреть возможность импортировать код вне функции, если импортируемый код может быть использован более одного раза, и изнутри функции, если вы знаете, что использование кода будет ограничено. Некоторые люди предпочитают размещать все операторы import в верхней части файла, чтобы явно обозначить все зависимости их кода. Оба варианта работают. 

# Импортируем модуль  с другим именем 

В нашей основной программе weatherman.py мы делали вызов import report. Но что, если у вас есть другой модуль с таким же именем или вы хотите использовать более короткое или простое имя? В такой ситуации можете выполнить импорт с помощью псевдонима. Используем псевдоним wr: 

In [None]:
import report as wr 
description = wr.get_description() 
print("Today's weather:", description) 

# Импортируем только  самое необходимое 

С помощью Python вы можете импортировать одну или несколько частей модуля. Каждая часть может сохранить свое оригинальное имя, или же вы можете дать ей alias. Для начала импортируем функцию get_description() из модуля report с помощью его оригинального имени: 

In [None]:
from report import get_description 
description = get_description() 
print("Today's weather:", description)

Теперь импортируем ее как do_it: 

In [None]:
from report import get_description as do_it 
description = do_it() 
print("Today's weather:", description) 

# Каталоги поиска модулей

Где Python ищет файлы для импорта? Он использует список имен каталогов и ZIP-архив, хранящийся в стандартном модуле sys, как переменную path. Вы можете получить доступ к этому списку и изменить его. Вот так выглядит значение переменной sys.path в Python 3.3 в моей версии операционной системы Mac:

In [None]:
import sys 
for place in sys.path: 
    print(place) 

Пустое место в начале вывода содержит в себе строку '', которая символизирует текущий каталог. Если строка '' находится первой в sys.path, Python сначала выполнит поиск в текущем каталоге, когда вы попробуете что-то импортировать: import report выглядит как report.py. 

Будет использован первый найденный модуль. Это означает, что, если вы определите модуль с именем random и он будет найден раньше оригинального модуля, вы не получите доступ к стандартной библиотеке random.


# Пакеты

Мы перешли от отдельных строк кода к функциям, отдельным программам и модулям, располагающимся в одной папке. Чтобы сделать еще один шаг, вы можете организовать модули в иерархии файлов, которые называются пакетами.

Возможно, нам нужны разные типы прогнозов погоды: на следующий день и следующую неделю. В качестве одного из вариантов мы можем создать папку с именем sources, а внутри нее — два модуля: daily.py и weekly.py. Каждый из них содержит функцию forecast. Версия на каждый день возвращает строку, а версия на каждую неделю — список из семи строк. 

Рассмотрим основную программу и два модуля. (Функция enumerate() разбивает список на части и отправляет каждый элемент списка в цикл for, добавляя к каждому элементу число в качестве небольшого бонуса.)

Основная программа — boxes/weather.py: 

In [None]:
from sources import daily, weekly 
print("Daily forecast:", daily.forecast()) 
print("Weekly forecast:") 

for number, outlook in enumerate(weekly.forecast(), 1):    
    print(number, outlook) 
    
#Модуль 1: boxes/sources/daily.py. 
def forecast():    
    'fake daily forecast'    
    return 'like yesterday' 

#Модуль 2: boxes/sources/weekly.py. 
def forecast():    
"""Fake weekly forecast"""    
return ['snow', 'more snow', 'sleet', 'freezing rain', 'rain', 'fog', 'hail']

В папке sources вам понадобится иметь кое-что еще — файл с именем __init__.py. 

Он может быть пустым, но Python он нужен для того, чтобы считать папку, которая его содержит, пакетом. 

Запустите основную программу weather.py, чтобы увидеть, что произойдет: 

$ python weather.py 
Daily forecast: like yesterday 
Weekly forecast: 
1 snow 
2 more snow 
3 sleet 
4 freezing rain 
5 rain 
6 fog 
7 hail


# Стандартная библиотека Python 

Одно из основных преимуществ Python заключается в том, что у него есть собственный «запас мощности» — большая стандартная библиотека модулей, которые выполняют множество полезных задач и располагаются отдельно друг от друга, чтобы избежать разрастания ядра языка. 

Когда вы собираетесь писать код, зачастую сначала стоит проверить, существует ли стандартный модуль, который уже делает то, что вы хотите. 

# Обработка отсутствующих ключей с помощью функций setdefault()  и defaultdict() 

Вы уже видели, что попытка получить доступ к словарю с помощью несуществующего ключа генерирует исключение. Использование функции словаря get() для того, чтобы вернуть значение по умолчанию, помогает этого избежать. 

Функция setdefault() похожа на функцию get(), но она также присваивает элемент словарю, если заданный ключ отсутствует:


In [1]:
periodic_table = {'Hydrogen': 1, 'Helium': 2} 
print(periodic_table) 

#{'Helium': 2, 'Hydrogen': 1}

{'Hydrogen': 1, 'Helium': 2}


Если ключа еще нет в словаре, будет использовано новое значение:


In [2]:
carbon = periodic_table.setdefault('Carbon', 12)  
carbon 
#12

12

In [3]:
periodic_table 
#{'Helium': 2, 'Carbon': 12, 'Hydrogen': 1} 

{'Hydrogen': 1, 'Helium': 2, 'Carbon': 12}

Если мы пытаемся присвоить другое значение по умолчанию уже существующему ключу, будет возвращено оригинальное значение и ничто не изменится:


In [4]:
helium = periodic_table.setdefault('Helium', 947) 
helium 
#2

2

In [5]:
periodic_table 
#{'Helium': 2, 'Carbon': 12, 'Hydrogen': 1} 

{'Hydrogen': 1, 'Helium': 2, 'Carbon': 12}

Функция defaultdict() похожа на предыдущую, но она определяет значение по умолчанию для новых ключей заранее, при создании словаря. В этом примере мы передаем функцию int, которая будет вызываться как int(), и возвращаем значение 0:


In [6]:
from collections import defaultdict 
periodic_table = defaultdict(int)

Теперь любое отсутствующее значение будет заменяться целым числом (int) 0:


In [9]:
periodic_table['Hydrogen'] = 1 
periodic_table['Hydrogen']

1

In [7]:
periodic_table['Hydrogen'] = 1 
periodic_table['Lead'] 
#0 

0

In [10]:
periodic_table 
#defaultdict(<class	'int'>,	{'Lead':	0,	'Hydrogen':	1})

defaultdict(int, {'Hydrogen': 1, 'Lead': 0})

Аргументом defaultdict() является функция, возвращающая значение, которое будет присвоено отсутствующему ключу. В следующем примере функция no_idea() будет вызываться всякий раз, когда нужно вернуть значение:


In [11]:
 from collections import defaultdict 

In [12]:
def no_idea(): 
    return 'Huh?'

In [13]:
bestiary = defaultdict(no_idea) 
bestiary['A'] = 'Abominable Snowman' 
bestiary['B'] = 'Basilisk' 
bestiary['A'] 
#'Abominable Snowman' 

'Abominable Snowman'

In [14]:
bestiary['B'] 
#'Basilisk' 

'Basilisk'

In [15]:
bestiary['C'] 
#'Huh?

'Huh?'

In [16]:
int()

0

Вы можете использовать функции int(), list() или dict(), чтобы возвращать пустые значения по умолчанию: int() возвращает 0, list() возвращает пустой список ([]) и dict() возвращает пустой словарь ({}). 

Если вы опустите аргумент, исходное значение нового ключа будет равно None. 

Кстати, вы можете использовать lambda для того, чтобы определить функцию по умолчанию изнутри вызова:


In [17]:
bestiary = defaultdict(lambda: 'Huh?') 
bestiary['E'] 
#'Huh?' 

'Huh?'

Применение int — это один из способов создать ваш собственный прилавок:


In [18]:
from collections import defaultdict 
food_counter = defaultdict(int) 

for food in ['spam', 'spam', 'eggs', 'spam']: 
    food_counter[food] += 1 
    
for food, count in food_counter.items(): 
    print(food, count)
    
#eggs 1
#spam 3

spam 3
eggs 1


В предыдущем примере, если бы food_counter был обычным словарем, а не defaultdict, Python генерировал бы исключение всякий раз, когда бы мы пытались увеличить элемент словаря food_counter[food], поскольку он был бы не инициализирован. 

Нам понадобилось бы сделать дополнительную работу, как показано здесь:


In [None]:
dict_counter = {} 
for food in ['spam', 'spam', 'eggs', 'spam']: 
    if not food in dict_counter: 
        dict_counter[food] = 0 
    dict_counter[food] += 1 
    
for food, count in dict_counter.items(): 
    print(food, count)
    
#spam 3 
#eggs 1


# Подсчитываем элементы  с помощью функции Counter() 

Если говорить о счетчиках, то в стандартной библиотеке имеется счетчик, который решает задачу, показанную в предыдущем примере, и даже больше:


In [6]:
from collections import Counter 
breakfast = ['spam', 'spam', 'eggs', 'spam', 'eggs'] 
breakfast_counter = Counter(breakfast) 
breakfast_counter 
#Counter({'spam': 3, 'eggs': 1}) 

Counter({'spam': 3, 'eggs': 2})

Функция most_common() возвращает все элементы в убывающем порядке или лишь те элементы, ....:


возвращает n наиболее часто встречающихся элементов, в порядке убывания встречаемости. Если n не указано, возвращаются все элементы.

In [7]:
breakfast_counter.most_common()

[('spam', 3), ('eggs', 2)]

In [8]:
breakfast_counter.most_common(1)

[('spam', 3)]

Счетчики можно объединять. Для начала снова взглянем на содержимое breakfast_counter:


In [4]:
breakfast_counter

Counter({'spam': 3, 'eggs': 1})

Теперь мы создадим новый список, который называется lunch, и счетчик, который называется lunch_counter:

In [5]:
lunch = ['eggs', 'eggs', 'bacon']
lunch_counter = Counter(lunch)
lunch_counter

Counter({'eggs': 2, 'bacon': 1})

Счетчики можно объединить с помощью оператора +: 

In [9]:
breakfast_counter + lunch_counter

Counter({'spam': 3, 'eggs': 4, 'bacon': 1})

Как вы можете догадаться, счетчики можно вычитать друг из друга с помощью оператора -. Что мы будем есть на завтрак, но не на обед? 

In [11]:
breakfast_counter - lunch_counter 

Counter({'spam': 3})

О’кей, теперь узнаем, что мы можем съесть на обед, но не можем на завтрак: 

In [12]:
lunch_counter - breakfast_counter

Counter({'bacon': 1})

По аналогии с множествами, показанными в главе 4, вы можете получить общие элементы с помощью оператора пересечения &: 

In [14]:
breakfast_counter & lunch_counter

Counter({'eggs': 2})

В результате пересечения был получен общий элемент ('eggs') с низким значением счетчика. Это имеет смысл: на завтрак у нас было только два яйцо, поэтому указанное количество является общим. 

Наконец, вы можете получить все элементы с помощью оператора объединения |: 

In [15]:
breakfast_counter | lunch_counter

Counter({'spam': 3, 'eggs': 2, 'bacon': 1})

Элемент 'eggs' снова оказался общим для обоих счетчиков. В отличие от сложения объединение не складывает счетчики, а выбирает тот, который имеет наибольшее значение. 

# Упорядочиваем по ключу  с помощью OrderedDict() 

Многие примеры кода, показанные в первых главах этой книги, демонстрируют, что порядок ключей в словаре нельзя предсказать: вы можете добавить в определенном порядке ключи a, b и c, но функция keys() вернет результат "c, a, b". Рассмотрим модифицированный пример из главы 1: 

In [4]:
quotes = {'Moe': 'A wise guy, huh?',
          'Larry': 'Ow!',
          'Curly': 'Nyuk nyuk!'} 
for stooge in quotes: 
     print(stooge) 
    

Moe
Larry
Curly


Словарь OrderedDict() запоминает порядок, в котором добавлялись ключи, и возвращает их в том же порядке с помощью итератора. 

Попробуем создать OrderedDict из последовательности кортежей вида «ключ — значение»: 

In [5]:
from collections import OrderedDict 
quotes = OrderedDict([
    ('Moe', 'A wise guy, huh?'), 
    ('Larry', 'Ow!'), 
    ('Curly', 'Nyuk nyuk!')])
for stooge in quotes: 
     print(stooge) 

Moe
Larry
Curly


In [6]:
from collections import OrderedDict
d = OrderedDict()
d['a'] = 1
d

OrderedDict([('a', 1)])

In [7]:
OrderedDict([('a', 1)])
d['b'] = 2
d

OrderedDict([('a', 1), ('b', 2)])

# Стек + очередь == deque

deque (произносится как «дэк») — это двухсторонняя очередь, которая имеет возможности стека и очереди. Она полезна, когда вы хотите добавить и удалить элементы с любого конца последовательности. В следующем примере мы будем двигаться с обоих концов слова к его середине, чтобы увидеть, является ли оно палиндромом. Функция popleft() удаляет крайний слева элемент deque и возвращает его, функция pop() удаляет крайний справа элемент и возвращает его. Вместе они двигаются с концов слова к его середине. Работа будет продолжаться до тех пор, пока крайние символы совпадают и пока не будет достигнута середина: 

In [8]:
def palindrome(word):
    from collections import deque
    dq = deque(word)
    while len(dq) > 1:
        if dq.popleft() != dq.pop():
            return False
    return True 

In [9]:
palindrome('a') 

True

In [10]:
 palindrome('racecar') 

True

In [11]:
palindrome('') 

True

In [12]:
palindrome('radar') 

True

In [13]:
 palindrome('halibut') 

False

Я воспользовался этим примером, чтобы было проще проиллюстрировать работу deque. Если вы действительно хотите создать программу, которая определяет палиндромы, гораздо проще было бы сравнивать строку с ее копией, вывернутой наизнанку. В Python строковой функции reverse() не существует, но можно обратить строку с помощью разбиения, как показано здесь: 

In [15]:
def another_palindrome(word): 
    return word == word[::-1] 

In [16]:
another_palindrome('radar') 

True

In [17]:
another_palindrome('halibut') 

False