## Лекция 3 - Модули и пакеты Python

- подключение модулей
- интроспекция модулей
- собственные модули и пакеты
- примеры стандартных модулей:
    * math
    * random
    * datetime, time, calendar
    * re
    * itertools

In [1]:
# подключение стандартного модуля math
import math

# тут же можем посмотреть справку по модулю
help(math)

Help on built-in module math:

NAME
    math

DESCRIPTION
    This module is always available.  It provides access to the
    mathematical functions defined by the C standard.

FUNCTIONS
    acos(...)
        acos(x)
        
        Return the arc cosine (measured in radians) of x.
    
    acosh(...)
        acosh(x)
        
        Return the inverse hyperbolic cosine of x.
    
    asin(...)
        asin(x)
        
        Return the arc sine (measured in radians) of x.
    
    asinh(...)
        asinh(x)
        
        Return the inverse hyperbolic sine of x.
    
    atan(...)
        atan(x)
        
        Return the arc tangent (measured in radians) of x.
    
    atan2(...)
        atan2(y, x)
        
        Return the arc tangent (measured in radians) of y/x.
        Unlike atan(y/x), the signs of both x and y are considered.
    
    atanh(...)
        atanh(x)
        
        Return the inverse hyperbolic tangent of x.
    
    ceil(...)
        ceil(x)
        
 

In [2]:
# пример использования функций и констант подключенного модуля
print('PI = {}'.format(math.pi))
print('PI/2 = {} degrees'.format(math.degrees(math.pi/2)))
print('НОД(64, 112) = {}'.format(math.gcd(64, 112)))

a = 2.4
b = 0.8 * 3
print('\nСравнение 2.4 и 0.8*3\n1) через ==\n2) с помощью math\n')
print(a == b)
print(math.isclose(a, b))

PI = 3.141592653589793
PI/2 = 90.0 degrees
НОД(64, 112) = 16

Сравнение 2.4 и 0.8*3
1) через ==
2) с помощью math

False
True


In [3]:
# можно подключить выборочно константы/функции модуля:
from math import pi, e

print(pi)
print(e)

# или даже так (все имена загрузить в текущий модуль):
# from math import *

# но лучше так не делать по пресловутой причине коллизии имен

3.141592653589793
2.718281828459045


In [4]:
# если не нравится писать везде имя модуля, можно ввести свой алиас:
# import math as m
# print(m.pi)

# (хотя вряд ли есть причина алиасить годное имя math )))

# алиас для какой-либо функции модуля:
from math import isclose as cmp

print(cmp(a, b))

True


In [5]:
# help() выдает нам справку, удобную для чтения
# а dir() - полезнейшая функция для кодера 
# (выводит все символьные имена, определенные в модуле/типе)
dir(math)

['__doc__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'acos',
 'acosh',
 'asin',
 'asinh',
 'atan',
 'atan2',
 'atanh',
 'ceil',
 'copysign',
 'cos',
 'cosh',
 'degrees',
 'e',
 'erf',
 'erfc',
 'exp',
 'expm1',
 'fabs',
 'factorial',
 'floor',
 'fmod',
 'frexp',
 'fsum',
 'gamma',
 'gcd',
 'hypot',
 'inf',
 'isclose',
 'isfinite',
 'isinf',
 'isnan',
 'ldexp',
 'lgamma',
 'log',
 'log10',
 'log1p',
 'log2',
 'modf',
 'nan',
 'pi',
 'pow',
 'radians',
 'sin',
 'sinh',
 'sqrt',
 'tan',
 'tanh',
 'trunc']

In [6]:
# с помощью dir() можно на ходу интроспектировать модули и типы!
# например, у нас есть переменная, выведем все magic-методы ее типа
message = 'hello'
magic = [method for method in dir(message) if method.startswith('__') ]
print(magic)

['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__']


In [7]:
# посмотрим значения первых "особенных" членов модуля math:
# строка документации модуля (docstring)
print('__doc__:', math.__doc__)

# квалифицированное имя модуля
print('__name__:', math.__name__)

# пакет, которому принадлежит модуль
print('__package__:', math.__package__)

# служебный объект-загрузчик модуля (начиная с Python 3.3)
print('__loader__:', math.__loader__)

# служебная информация загрузчика модуля (начиная с Python 3.4)
# https://docs.python.org/3/reference/import.html#import-related-module-attributes
print('__spec__:', math.__spec__)

__doc__: This module is always available.  It provides access to the
mathematical functions defined by the C standard.
__name__: math
__package__: 
__loader__: <class '_frozen_importlib.BuiltinImporter'>
__spec__: ModuleSpec(name='math', loader=<class '_frozen_importlib.BuiltinImporter'>, origin='built-in')


In [8]:
# посмотрим значения первых особенных членов текущего модуля:
print('__doc__:', __doc__)
print('__name__:', __name__)
print('__package__:', __package__)
print('__loader__:', __loader__)
print('__spec__:', __spec__)

__doc__: Automatically created module for IPython interactive environment
__name__: __main__
__package__: None
__loader__: None
__spec__: None


In [9]:
if __name__ == '__main__':
    print('this script is executing right now')

this script is executing right now


In [10]:
# dir без параметров вернет все символьные имена в текущем модуле
dir()

['In',
 'Out',
 '_',
 '_5',
 '__',
 '___',
 '__builtin__',
 '__builtins__',
 '__doc__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '_dh',
 '_i',
 '_i1',
 '_i10',
 '_i2',
 '_i3',
 '_i4',
 '_i5',
 '_i6',
 '_i7',
 '_i8',
 '_i9',
 '_ih',
 '_ii',
 '_iii',
 '_oh',
 '_sh',
 'a',
 'b',
 'cmp',
 'e',
 'exit',
 'get_ipython',
 'magic',
 'math',
 'message',
 'pi',
 'quit']

In [11]:
# показать все доступные встроенные функции/типы/константы
dir(__builtin__)

['ArithmeticError',
 'AssertionError',
 'AttributeError',
 'BaseException',
 'BlockingIOError',
 'BrokenPipeError',
 'BufferError',
 'ChildProcessError',
 'ConnectionAbortedError',
 'ConnectionError',
 'ConnectionRefusedError',
 'ConnectionResetError',
 'EOFError',
 'Ellipsis',
 'EnvironmentError',
 'Exception',
 'False',
 'FileExistsError',
 'FileNotFoundError',
 'FloatingPointError',
 'GeneratorExit',
 'IOError',
 'ImportError',
 'IndentationError',
 'IndexError',
 'InterruptedError',
 'IsADirectoryError',
 'KeyError',
 'KeyboardInterrupt',
 'LookupError',
 'MemoryError',
 'NameError',
 'None',
 'NotADirectoryError',
 'NotImplemented',
 'NotImplementedError',
 'OSError',
 'OverflowError',
 'PermissionError',
 'ProcessLookupError',
 'RecursionError',
 'ReferenceError',
 'RuntimeError',
 'StopAsyncIteration',
 'StopIteration',
 'SyntaxError',
 'SystemError',
 'SystemExit',
 'TabError',
 'TimeoutError',
 'True',
 'TypeError',
 'UnboundLocalError',
 'UnicodeDecodeError',
 'UnicodeEncodeE

In [12]:
'''
This module contains standard sorting algorithms.

Supported algorithms:
    - insertion sort
    - shell sort
    - selection sort
    - bubble sort
    - shaker sort
    - quick sort
    - merge sort
    - heap sort
'''

def insertion_sort(arr):
    ''' classical insertion sort '''
    pass

# ...

print(__doc__)
print('Function is documented:')
print(insertion_sort.__doc__)


This module contains standard sorting algorithms.

Supported algorithms:
    - insertion sort
    - shell sort
    - selection sort
    - bubble sort
    - shaker sort
    - quick sort
    - merge sort
    - heap sort

Function is documented:
 classical insertion sort 


#### Модули можно структурировать по пакетам. Подробно здесь:

https://docs.python.org/3/tutorial/modules.html#packages

Если кратко:
```
sound/                          пакет верхнего уровня
      __init__.py               инициализация пакета sound
      formats/                  суб-пакет для преобразований форматов файлов
              __init__.py
              wavread.py
              wavwrite.py
              aiffread.py
              aiffwrite.py
              ...
      effects/                  суб-пакет для звуковых эффектов
              __init__.py
              echo.py
              surround.py
              reverse.py
              ...
```
Файлы __init__.py files are required to make Python treat the directories as containing packages

```import sound.effects.echo```

#### Внутрипакетные ссылки

```
from . import echo
from .. import formats
from ..filters import equalizer
```

In [13]:
import algo.search

dir(algo.search)

['__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '__test_speed',
 'binary_search',
 'exponential_search',
 'interpolation_search']

In [14]:
help(algo.search.binary_search)

Help on function binary_search in module algo.search:

binary_search(a, elem)
    Binary Search iterative implementation.
    
    Parameters
    ----------
    a : array of items
    elem : item to find
    Returns
    ---------- 
    position or -1



In [15]:
from algo.search import *

pos = binary_search([1,2,3,4,5], 4)
print(pos)

pos = exponential_search([1,2,3,4,5], 4)
print(pos)

# альтернативный вариант
#from algo import *
#
#pos = search.binary_search([1,2,3,4,5], 4)
#print(pos)
#
#pos = search.exponential_search([1,2,3,4,5], 4)
#print(pos)

3
3


Рассмотрим несколько полезных модулей Python.

Начнем с работы с датой и временем
https://docs.python.org/3.5/library/datetime.html

In [16]:
# модуль для работы с датой и временем
import datetime

# демо простой работы с датой
print(datetime.date.today())

armageddon = datetime.date(2012, 12, 21)
print(armageddon.strftime('%A %d %b %Y'))

2016-08-16
Friday 21 Dec 2012


In [17]:
# демо работы с датой-временем и временными интервалами
trial_period = datetime.timedelta(days=60)
print('Trial period: {} days'.format(trial_period.days))

install_date = datetime.datetime(2014, 10, 5, 15, 45, 22)
print('Software installed at {}'.format(install_date))

expiration_date = install_date + trial_period
print('Trial period expires at {}'.format(expiration_date))

Trial period: 60 days
Software installed at 2014-10-05 15:45:22
Trial period expires at 2014-12-04 15:45:22


In [18]:
# для работы со временем есть еще модуль time
import time

print(time.localtime())

time.struct_time(tm_year=2016, tm_mon=8, tm_mday=16, tm_hour=0, tm_min=29, tm_sec=37, tm_wday=1, tm_yday=229, tm_isdst=0)


In [19]:
lt = time.localtime()

print('{}:{}:{}'.format(lt.tm_hour, lt.tm_min, lt.tm_sec))

print(time.asctime())

0:29:37
Tue Aug 16 00:29:37 2016


In [20]:
# вопросы локализации частенько нетривиальны
import locale
print('Current locale: {}'.format(locale.getdefaultlocale()))

time_string = time.strftime('%A %d %b %Y', time.localtime())

# т.к. текущая кодировка - не UTF8, то перекодируем:
print(time_string.encode('latin1').decode('cp1251'))

# подробнее о кодировках - в лекции №8
# можно также сделать так (если ОС позволит )):
#locale.setlocale(locale.LC_TIME, 'ru_RU.utf8') 

Current locale: ('ru_RU', 'cp1251')
Tuesday 16 Aug 2016


In [21]:
# простой модуль с календарем
# вопросы локализации - на самостоятельную проработку
import calendar

may_2016 = calendar.month(2016, 5)
print(may_2016)

      May 2016
Mo Tu We Th Fr Sa Su
                   1
 2  3  4  5  6  7  8
 9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31



In [22]:
day = calendar.weekday(2015, calendar.February, 28)
print('28/02/2015 was {}'.format(calendar.day_name[day]))

28/02/2015 was Saturday


In [23]:
# продемонстрируем возможности модуля работы со случайными числами
import random

# сгенерируем 10 случайных чисел
random_numbers = [random.randint(1, 100) for _ in range(10)]
print(random_numbers)

# перемешаем числа в случайном порядке
random.shuffle(random_numbers)
print(random_numbers)

# выберем случайно 3 числа из набора
selected = random.sample(random_numbers, 3)
print(selected)

[29, 89, 2, 66, 47, 18, 86, 74, 61, 92]
[92, 66, 18, 2, 61, 89, 86, 47, 74, 29]
[47, 29, 61]


In [24]:
# сгенерируем выборку 100 чисел с нормальным распределением
MU = 15
SIGMA = 5
normal = [round(random.gauss(MU, SIGMA), 1) for _ in range(100)]
print(normal)

# перепроверим среднее (должно быть близко к MU)
mean = sum(normal) / len(normal)
print('Mean:', mean)

# и стандартное отклонение (должно быть близко к SIGMA)
variance = sum([(i - mean)**2 for i in normal]) / len(normal)
print('Std. deviation:', variance**0.5)

[14.3, 12.4, 12.7, 13.6, 11.9, 18.4, 15.1, 16.3, 18.5, 8.5, 10.5, 17.0, 5.2, 15.0, 20.2, 10.6, 12.8, 15.7, 17.4, 11.0, 7.7, 12.8, 26.9, 11.4, 15.3, 9.9, 22.1, 20.0, 12.1, 20.5, 14.7, 11.4, 14.9, 14.7, 14.4, 25.5, 12.4, 13.6, 13.7, 12.1, 13.6, 13.8, 9.0, 13.1, 11.8, 15.2, 22.5, 13.2, 14.4, 17.5, 14.5, 22.0, 12.6, 7.1, 7.9, 11.9, 12.2, 12.3, 26.5, 8.2, 8.3, 10.3, 11.7, 19.4, 17.8, 12.3, 18.8, 21.7, 15.8, 21.0, 11.6, 19.6, 23.6, 5.9, 19.0, 18.7, 12.4, 12.2, 22.6, 18.2, 13.9, 17.3, 17.3, 14.9, 29.8, 20.0, 28.1, 18.0, 13.4, 13.8, 19.6, 11.8, 5.4, 18.6, 5.3, 15.7, 13.5, 11.7, 11.8, 15.1]
Mean: 14.983999999999996
Std. deviation: 4.976519265510784


In [25]:
# еще полезный модуль! 
# часть его возможностей рассмотрим в следующей лекции
# а в этой - демонстрация комбинаторики
import itertools

nums = [1, 2, 3, 4]

# выведем все ПЕРЕСТАНОВКИ чисел 1, 2, 3, 4
for perm in itertools.permutations(nums):
    print(perm)

(1, 2, 3, 4)
(1, 2, 4, 3)
(1, 3, 2, 4)
(1, 3, 4, 2)
(1, 4, 2, 3)
(1, 4, 3, 2)
(2, 1, 3, 4)
(2, 1, 4, 3)
(2, 3, 1, 4)
(2, 3, 4, 1)
(2, 4, 1, 3)
(2, 4, 3, 1)
(3, 1, 2, 4)
(3, 1, 4, 2)
(3, 2, 1, 4)
(3, 2, 4, 1)
(3, 4, 1, 2)
(3, 4, 2, 1)
(4, 1, 2, 3)
(4, 1, 3, 2)
(4, 2, 1, 3)
(4, 2, 3, 1)
(4, 3, 1, 2)
(4, 3, 2, 1)


In [26]:
# выведем все парные СОЧЕТАНИЯ чисел 1, 2, 3, 4
for comb in itertools.combinations(nums, 2):
    print(comb)

(1, 2)
(1, 3)
(1, 4)
(2, 3)
(2, 4)
(3, 4)


In [27]:
# и куда же без регулярок ))
import re

haystack = "Folder contains 01.mp3 and 12.wav (as well as 23.mp3)"

# найти все подстроки по шаблону (способ 1 - все сразу)
needles = re.findall(r'\d{1,2}\.(?:mp3|wav)', haystack)
print(needles)

['01.mp3', '12.wav', '23.mp3']


In [28]:
# разница - в non-capturing groups (?:)
needles = re.findall(r'\d{1,2}\.(mp3|wav)', haystack)
print(needles)

['mp3', 'wav', 'mp3']


In [29]:
# найти все подстроки по шаблону (способ 2 - через итератор)
for s in re.finditer(r'\d{1,2}\.(mp3|wav)', haystack):
    print(haystack[s.start():s.end()])
    print('  [file {}]'.format(s.group(1)))

01.mp3
  [file mp3]
12.wav
  [file wav]
23.mp3
  [file mp3]


In [30]:
# еще пример (взято из
# http://www.tutorialspoint.com/python/python_reg_expressions.htm)
phone = "2004-959-559 # This is Phone Number"

# Замена 1: удаляем Python-style комментарии
num = re.sub(r'#.*$', '', phone)
print('Phone Num : {}'.format(num))

Phone Num : 2004-959-559 


In [31]:
# Замена 2: удаляем всё, кроме цифр
num = re.sub(r'\D', '', phone)
print('Phone Num : {}'.format(num))

Phone Num : 2004959559


In [32]:
# демонстрация метода search
# (ищет вхождение паттерна в любом месте строки)
text = '''Think harder!
Hey, think longer
THINK'''

text_parts = re.split(r'[!\n]', text)
text_parts = [w for w in text_parts if w != '']
print(text_parts)

for part in text_parts:
    result = re.search(r'Think', part, re.I)
    if result:
        print(part)
        print(result.group(), result.pos, result.endpos)
        print()

['Think harder', 'Hey, think longer', 'THINK']
Think harder
Think 0 12

Hey, think longer
think 0 17

THINK
THINK 0 5



In [33]:
# демонстрация метода match
# (ищет вхождение паттерна только в начале строки)
for part in text_parts:
    result = re.match(r'Think', part, re.I)
    if result:
        print(part)
        print(result.group(), result.pos, result.endpos)
        print()

Think harder
Think 0 12

THINK
THINK 0 5



In [34]:
# демонстрация метода fullmatch
# (ищет полное соотвествие паттерна всей строке)
for part in text_parts:
    result = re.fullmatch(r'(?i)Think', part)
    if result:
        print(part)
        print(result.group(), result.pos, result.endpos)

THINK
THINK 0 5
