## Лекция 3 - Модули и пакеты Python

- подключение модулей
- интроспекция модулей
- собственные модули и пакеты
- примеры стандартных модулей:
    * math
    * random
    * datetime
    * re
    * itertools

In [1]:
# подключение стандартного модуля math
import math

# тут же можем посмотреть справку по модулю
help(math)

Help on built-in module math:

NAME
    math

DESCRIPTION
    This module is always available.  It provides access to the
    mathematical functions defined by the C standard.

FUNCTIONS
    acos(...)
        acos(x)
        
        Return the arc cosine (measured in radians) of x.
    
    acosh(...)
        acosh(x)
        
        Return the inverse hyperbolic cosine of x.
    
    asin(...)
        asin(x)
        
        Return the arc sine (measured in radians) of x.
    
    asinh(...)
        asinh(x)
        
        Return the inverse hyperbolic sine of x.
    
    atan(...)
        atan(x)
        
        Return the arc tangent (measured in radians) of x.
    
    atan2(...)
        atan2(y, x)
        
        Return the arc tangent (measured in radians) of y/x.
        Unlike atan(y/x), the signs of both x and y are considered.
    
    atanh(...)
        atanh(x)
        
        Return the inverse hyperbolic tangent of x.
    
    ceil(...)
        ceil(x)
        
 

In [2]:
# пример использования функций и констант подключенного модуля
print('PI = {}'.format(math.pi))
print('PI/2 = {} degrees'.format(math.degrees(math.pi/2)))
print('НОД(64, 112)'.format(math.gcd(64, 112)))

a = 2.4
b = 0.8 * 3
print('\nСравнение 2.4 и 0.8*3\n1) через ==\n2) с помощью math)\n')
print(a == b)
print(math.isclose(a, b))

PI = 3.141592653589793
PI/2 = 90.0 degrees
НОД(64, 112)

Сравнение 2.4 и 0.8*3
1) через ==
2) с помощью math)

False
True


In [3]:
# можно подключить выборочные константы/функции модуля:
from math import pi, e

print(pi)
print(e)

# или даже так (все имена загрузить в текущий модуль):
# from math import *

# но лучше так не делать по пресловутой причине коллизии имен

3.141592653589793
2.718281828459045


In [4]:
# если не нравится писать везде имя модуля, можно ввести свой алиас:
# import math as m
# print(m.pi)

# (хотя вряд ли есть причина алиасить годное имя math )))

# алиас для какой-либо функции модуля:
from math import isclose as cmp

print(cmp(a, b))

True


In [5]:
# help() выдает нам справку, удобную для чтения
# а dir() - полезнейшая функция для кодера 
# (выводит все символьные имена, определенные в модуле/типе)
dir(math)

['__doc__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'acos',
 'acosh',
 'asin',
 'asinh',
 'atan',
 'atan2',
 'atanh',
 'ceil',
 'copysign',
 'cos',
 'cosh',
 'degrees',
 'e',
 'erf',
 'erfc',
 'exp',
 'expm1',
 'fabs',
 'factorial',
 'floor',
 'fmod',
 'frexp',
 'fsum',
 'gamma',
 'gcd',
 'hypot',
 'inf',
 'isclose',
 'isfinite',
 'isinf',
 'isnan',
 'ldexp',
 'lgamma',
 'log',
 'log10',
 'log1p',
 'log2',
 'modf',
 'nan',
 'pi',
 'pow',
 'radians',
 'sin',
 'sinh',
 'sqrt',
 'tan',
 'tanh',
 'trunc']

In [6]:
# с помощью dir() можно на ходу интроспектировать модули и типы!
# например, у нас есть переменная, выведем все magic-методы ее типа
message = 'hello'
magic = [method for method in dir(message) if method.startswith('__') ]
print(magic)

['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__']


In [7]:
# посмотрим значения первых "особенных" членов модуля math:
# строка документации модуля (docstring)
print('__doc__:', math.__doc__)

# квалифицированное имя модуля
print('__name__:', math.__name__)

# пакет, которому принадлежит модуль
print('__package__:', math.__package__)

# служебный объект-загрузчик модуля (начиная с Python 3.3)
print('__loader__:', math.__loader__)

# служебная информация загрузчика модуля (начиная с Python 3.4)
# https://docs.python.org/3/reference/import.html#import-related-module-attributes
print('__spec__:', math.__spec__)

__doc__: This module is always available.  It provides access to the
mathematical functions defined by the C standard.
__name__: math
__package__: 
__loader__: <class '_frozen_importlib.BuiltinImporter'>
__spec__: ModuleSpec(name='math', loader=<class '_frozen_importlib.BuiltinImporter'>, origin='built-in')


In [8]:
# посмотрим значения первых особенных членов модуля math:
# строка документации модуля (docstring)
print('__doc__:', __doc__)
print('__name__:', __name__)
print('__package__:', __package__)
print('__loader__:', __loader__)
print('__spec__:', __spec__)

__doc__: Automatically created module for IPython interactive environment
__name__: __main__
__package__: None
__loader__: None
__spec__: None


In [9]:
if __name__ == '__main__':
    print('this script is executing right now')

this script is executing right now


In [10]:
# dir без параметров вернет все символьные имена в текущем модуле
dir()

['In',
 'Out',
 '_',
 '_5',
 '__',
 '___',
 '__builtin__',
 '__builtins__',
 '__doc__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '_dh',
 '_i',
 '_i1',
 '_i10',
 '_i2',
 '_i3',
 '_i4',
 '_i5',
 '_i6',
 '_i7',
 '_i8',
 '_i9',
 '_ih',
 '_ii',
 '_iii',
 '_oh',
 '_sh',
 'a',
 'b',
 'cmp',
 'e',
 'exit',
 'get_ipython',
 'magic',
 'math',
 'message',
 'pi',
 'quit']

In [11]:
# показать все доступные встроенные функции и типы
dir(__builtin__)

['ArithmeticError',
 'AssertionError',
 'AttributeError',
 'BaseException',
 'BlockingIOError',
 'BrokenPipeError',
 'BufferError',
 'ChildProcessError',
 'ConnectionAbortedError',
 'ConnectionError',
 'ConnectionRefusedError',
 'ConnectionResetError',
 'EOFError',
 'Ellipsis',
 'EnvironmentError',
 'Exception',
 'False',
 'FileExistsError',
 'FileNotFoundError',
 'FloatingPointError',
 'GeneratorExit',
 'IOError',
 'ImportError',
 'IndentationError',
 'IndexError',
 'InterruptedError',
 'IsADirectoryError',
 'KeyError',
 'KeyboardInterrupt',
 'LookupError',
 'MemoryError',
 'NameError',
 'None',
 'NotADirectoryError',
 'NotImplemented',
 'NotImplementedError',
 'OSError',
 'OverflowError',
 'PermissionError',
 'ProcessLookupError',
 'RecursionError',
 'ReferenceError',
 'RuntimeError',
 'StopAsyncIteration',
 'StopIteration',
 'SyntaxError',
 'SystemError',
 'SystemExit',
 'TabError',
 'TimeoutError',
 'True',
 'TypeError',
 'UnboundLocalError',
 'UnicodeDecodeError',
 'UnicodeEncodeE

In [12]:
'''
This module contains standard sorting algorithms.

Supported algorithms:
    - insertion sort
    - shell sort
    - selection sort
    - bubble sort
    - shaker sort
    - quick sort
    - merge sort
    - heap sort
'''

def insertion_sort(arr):
    ''' classical insertion sort '''
    pass

# ...

print(__doc__)
print('Function is documented:')
print(insertion_sort.__doc__)


This module contains standard sorting algorithms.

Supported algorithms:
    - insertion sort
    - shell sort
    - selection sort
    - bubble sort
    - shaker sort
    - quick sort
    - merge sort
    - heap sort

Function is documented:
 classical insertion sort 


#### Модули можно структурировать по пакетам. Подробно здесь:

https://docs.python.org/3/tutorial/modules.html#packages

Если кратко:
```
sound/                          пакет верхнего уровня
      __init__.py               инициализация пакета sound
      formats/                  суб-пакет для преобразований форматов файлов
              __init__.py
              wavread.py
              wavwrite.py
              aiffread.py
              aiffwrite.py
              ...
      effects/                  суб-пакет для звуковых эффектов
              __init__.py
              echo.py
              surround.py
              reverse.py
              ...
```
Файлы __init__.py files are required to make Python treat the directories as containing packages

```import sound.effects.echo```

#### Внутрипакетные ссылки

```
from . import echo
from .. import formats
from ..filters import equalizer
```

Рассмотрим несколько полезных модулей Python.

Начнем с работы с датой и временем
https://docs.python.org/3.5/library/datetime.html

In [13]:
import datetime

print(datetime.date.today())

2016-08-11


In [14]:
import time

print(time.localtime())

time.struct_time(tm_year=2016, tm_mon=8, tm_mday=11, tm_hour=0, tm_min=28, tm_sec=40, tm_wday=3, tm_yday=224, tm_isdst=0)


In [15]:
lt = time.localtime()
print('{}:{}:{}'.format(lt.tm_hour, lt.tm_min, lt.tm_sec))

0:28:40


In [16]:
# продемонстрируем возможности модуля работы со случайными числами
import random

# сгенерируем 10 случайных чисел
random_numbers = [random.randint(1, 100) for _ in range(10)]
print(random_numbers)

# перемешаем числа в случайном порядке
random.shuffle(random_numbers)
print(random_numbers)

# выберем случайно 3 числа из набора
selected = random.sample(random_numbers, 3)
print(selected)

[24, 31, 67, 34, 92, 5, 56, 98, 76, 34]
[5, 67, 76, 98, 34, 24, 31, 92, 56, 34]
[98, 34, 24]


In [17]:
# сгенерируем выборку 100 чисел с нормальным распределением
MU = 15
SIGMA = 5
normal = [round(random.gauss(MU, SIGMA), 1) for _ in range(100)]
print(normal)

# перепроверим среднее (должно быть близко к MU)
mean = sum(normal) / len(normal)
print('Mean:', mean)

# и стандартное отклонение (должно быть близко к SIGMA)
variance = sum([(i - mean)**2 for i in normal]) / len(normal)
print('Std. deviation:', variance**0.5)

[4.1, 16.9, 16.1, 15.5, 14.0, 17.8, 19.0, 12.4, 9.0, 23.4, 11.7, 16.9, 15.0, 16.0, 20.3, 19.8, 16.5, 15.1, 22.7, 14.2, 16.1, 22.6, 20.1, 22.3, 18.2, 16.6, 17.4, 17.4, 8.3, 7.4, 7.7, 24.3, 20.1, 16.4, 16.4, 15.0, 14.4, 7.7, 15.1, 15.5, 24.9, 22.9, 17.3, 14.8, 12.7, 16.7, 11.6, 16.0, 15.8, 17.9, 23.9, 20.7, 17.8, 16.2, 13.1, 20.7, 10.8, 11.6, 26.7, 19.7, 16.8, 6.1, 8.9, 14.9, 11.6, 14.9, 12.2, 19.9, 20.0, 19.8, 23.1, 15.2, 20.0, 21.5, 7.4, 18.4, 1.6, 10.0, 14.8, 19.9, 10.4, 13.4, 10.3, 13.9, 18.6, 19.5, 21.2, 12.6, 22.0, 18.1, 18.3, 17.4, 14.3, 3.8, 17.3, 13.8, 17.6, 16.7, 21.6, 11.6]
Mean: 15.966
Std. deviation: 4.864446936703082


In [18]:
# еще полезный модуль! 
# часть его возможностей рассмотрим в следующей лекции
# а в этой - демонстрация комбинаторики
import itertools

nums = [1, 2, 3, 4]

# выведем все ПЕРЕСТАНОВКИ чисел 1, 2, 3, 4
for perm in itertools.permutations(nums):
    print(perm)

(1, 2, 3, 4)
(1, 2, 4, 3)
(1, 3, 2, 4)
(1, 3, 4, 2)
(1, 4, 2, 3)
(1, 4, 3, 2)
(2, 1, 3, 4)
(2, 1, 4, 3)
(2, 3, 1, 4)
(2, 3, 4, 1)
(2, 4, 1, 3)
(2, 4, 3, 1)
(3, 1, 2, 4)
(3, 1, 4, 2)
(3, 2, 1, 4)
(3, 2, 4, 1)
(3, 4, 1, 2)
(3, 4, 2, 1)
(4, 1, 2, 3)
(4, 1, 3, 2)
(4, 2, 1, 3)
(4, 2, 3, 1)
(4, 3, 1, 2)
(4, 3, 2, 1)


In [19]:
# выведем все парные СОЧЕТАНИЯ чисел 1, 2, 3, 4
for comb in itertools.combinations(nums, 2):
    print(comb)

(1, 2)
(1, 3)
(1, 4)
(2, 3)
(2, 4)
(3, 4)


In [20]:
# и куда же без регулярок ))
import re

haystack = "Folder contains 01.mp3 and 12.wav"

# найти все подстроки по шаблону (способ 1 - все сразу)
results = re.findall(r'\d{1,2}\.(mp3|wav)', haystack)
print(results)

# найти все подстроки по шаблону (способ 2 - через итератор)
# (можно также использовать группы (groups))
for s in re.finditer(r'\d{1,2}\.(mp3|wav)', haystack):
    print(haystack[s.start():s.end()])

['mp3', 'wav']
01.mp3
12.wav


In [21]:
# еще пример
phone = "2004-959-559 # This is Phone Number"

# Замена 1: удаляем Python-style комментарии
num = re.sub(r'#.*$', '', phone)
print('Phone Num : {}'.format(num))

# Замена 2: удаляем всё, кроме цифр
num = re.sub(r'\D', '', phone)
print('Phone Num : {}'.format(num))

Phone Num : 2004-959-559 
Phone Num : 2004959559
