# Лекция 3: базовые элементы языка Python - продолжение

В рамках этой части лекции продолжим рассматривать базовые элементы языка Python.

## Операторы

### Арифметические
* +, -, *, % - как обычно (в C/C++).  
* / - дробное деление, в результате float. [3.x]  
* // - целочисленное деление, в результате int. [3.x]  
* \** - возведение в степень

### Сравнение
* ==, <, <=, >, >= - как обычно
* a < b < c - составное сравнение.
* Составное сравнение вычисляется лениво и могут не все выражения вычислиться.
* Результат bool().
* Исключение TypeError в случае сравнения несравнимых (число и строка, и т.п.) [3.x]

### Логические
* and - логическое и
* or - логическое или
* not - унарное отрицание
* Результат and и or не обязательно bool() и на вход не обязательно bool() - подробности ниже.
* Все пустые значения приводятся к False ("", 0, None, 0.0, [], and {}), непустые - к True.
* Помнить и понимать, что and и or вычисляются лениво.

#### and
* Если любое из значений False (или приводится к False), то and вернёт первое такое значение.  
* Если все значения True (или приводятся к True), то and вернёт последнее такое значение.  

In [1]:
# and

#### or
* Если любое из значений True (или приводится к True), то or вернёт первое такое значение.
* Если все значения False (или приводятся к False), то or вернёт последнее такое значение.

In [2]:
# or

### Бинарные
* & - побитовое и
* | - побитовое или
* ^ - исключающее или
* << и >> - сдвиги

In [3]:
# binary
a = 1
print(type(a << 70), a << 70, bin(a << 70), len(bin(a << 70)))

<class 'int'> 1180591620717411303424 0b10000000000000000000000000000000000000000000000000000000000000000000000 73


### Условные
* if condition:
* elif condition: - не обязателен
* else: - не обязателен
* Составные многострочные условия можно заключать в скобки.
* Сложные условия лучше заносить в переменные и проверять их.

In [4]:
# conditions
a = 3
if a > 2:
    print("a > 2")

if a > 3:
    print("a > 3")
elif a < 1:
    print("a < 1")
else:
    print("1 <= a <= 3")

s = "abcdefgh"
is_looks_like_alphabet = s.startswith("abc") or s.endswith("xyz")
if is_looks_like_alphabet:
    print("Hmm, is it an alphabet?")

a > 2
1 <= a <= 3
Hmm, is it an alphabet?


### Циклы
* while condition: - обычный цикл while  
* for elem in iterable: - цикл for как итерирование  
* есть continue и break  
* range([start,] stop[, step]) - для задания iterable промежутка.   
* можно поставить else в конце - выполнится, если не бы break - но лучше не использовать, т.к. сложнее читать.

In [5]:
# loops

counter = 0
while counter < 10:
    counter += 2
    print(counter)

2
4
6
8
10


In [6]:
numbers = [1, 2, 100500]

for number in numbers:
    print(number)

1
2
100500


In [7]:
for elem in range(10):
    print(elem)

0
1
2
3
4
5
6
7
8
9


### Особые
* in - вхождение элемента в коллекцию.
* is - проверка идентичности двух объектов.
    + Переменные должны указывать на один и тот же объект, а не только иметь одинаковое значение.
    + is принято использовать для сравнения с None.
* del - удаление
    + переменной (больше имя не ссылается на значение)
    + элемента коллекции или части коллекции (срез)
* pass
    + ничего не делает (nop)
    + удобно для создания наброска набора функций или иерархии классов 

In [8]:
# other
#numbers = [1, 2, 100500]
numbers = set([1, 2, 100500])

if 2 in numbers:
    print("Found it!")

Found it!


## Функции

Определение:

* Являются объектами (понятие function is a first-class citizen).
* Задаются с помощью ключевого слова def.


Возвращаемое значение:

* Тип возвращаемого значения не задаётся.
* Возвращаемое значение с помощью return.
* Если нет return, то вернёт None.


Аргументы:

* Аргументы передаются по ссылке.
* Типы аргументов не задаются.
* Обязательные и опциональные аргументы - в месте определения, задано ли значение по-умолчанию.
* Позиционные и именованные аргументы - в месте вызова, в зависимости от способа передачи при вызове.
* Позиционные задаются и распределяются по порядку.
* Именованные аргументы задаются при вызове с явным указанием имени переменной.
* Значение аргумента по-умолчанию создаётся только один раз - потенциальные проблемы (сохранённое состояние, общий контейнер).
* В определении параметров функции идут сначала обязательные, потом опциональные аргументы.
* При вызове в передаче параметров функции аргументы следует задавать сначала позиционно, потом по имени.
* Собирающие аргументы \*args и \*\*kwargs.
* \*args - все неперечисленные явно, но переданные позиционные аргументы будут помещены в аргумент-кортеж с указанным именем.
* \*\*kwargs - все неперечисленные явно, но переданные именованные аргументы будут помещены в аргумент-словарь с указанным именем.
* Порядок определения: обязательные, опциональные, \*args, \*\*kwargs.
* Порядок передачи при вызове: позиционные, именованные. А далее они распределяются по описанным в определении, в т.ч. по \*args и \*\*kwargs.

Замечание про описание и передачу аргументов:

* Строго говоря, между обязательными и позиционными, а также между опциональными и именованными нет требования взаимно-однозначного соответствия: опциональные могут передаваться с помощью позиционных, обязательные - по имени.
* Однако лучше придерживаться такого соглашения: передавать обязательные позиционно и опциональные непозиционно. В противном случае могут быть ситуации неконсистентного использования, а то и ошибок, и придётся задумываться о лишним вещах:
  - В некоторых фреймворках принято переиспользовать или перекрывать некоторое поведение путём перехвата в оборачивающией функции kwargs аргументов и каких-нибудь действий над этим контейнером.
  - Некоторые функции с обязательными аргументами не будут нормально вызываться при передаче аргумента по имени (см. split(sep)). Это связано с особенностями внутренней реализации нативных методов. https://bugs.python.org/issue1176
  - При чтении кода, в котором придерживаются соглашения выше, проще понимать, что и куда идёт, а также как с ним работать и чего ожидать.

Локальные переменные:

* Определённые и используемые внутри каждой функции переменные считаются локальными и хранятся в отдельной таблице локальных символов.
* При обращении к переменной она сначала ищется в локальной области, а потом в глобальной.
* Чтобы писать в глобальные переменные из кода внутри функции надо сначала их явно пересчислить в выражении с ключевым словом global.


Документация:

* Документация с помощью docstring - <https://www.python.org/dev/peps/pep-0257/>
* Первым выражением может идти строковый литерал - docstring (documentation string).
* Можно получить из объекта функции из поля \_\_doc\_\_.
* Редакторы умеют показывать.
* Можно даже мини-тесты вставлять.  

In [9]:
# simple function
def print_hello():
    print("hello")

def return_hello():
    return "hello"

# recursive function
def dummy_factorial(value):
    if value == 0:
        return 1
    else:
        return value * dummy_factorial(value - 1)

print_hello()
print(return_hello())
print(dummy_factorial(3))

hello
hello
6


In [10]:
# keyword argument
def greet(name=None):
    if name is None:
        name = "stranger"

    print("Greetings, {name}".format(name=name))

greet()
greet("user")
greet(name="user") 

Greetings, stranger
Greetings, user
Greetings, user


In [11]:
def show_params(first_param, second_param, *args, **kwargs):
    print(type(args))
    print(first_param, second_param, args)
    print(type(kwargs))
    print(kwargs)

show_params("one", "two", "three", "four", first_named="named_one", second_named="named_two", third_named="named_three")

<class 'tuple'>
one two ('three', 'four')
<class 'dict'>
{'first_named': 'named_one', 'third_named': 'named_three', 'second_named': 'named_two'}


In [12]:
# unpacking arguments (no always a good style, but sometimes useful)
def show_params(first_param, second_param, third_param):
    print(first_param, second_param, third_param)

elems = (3, 1, 2)
show_params(*elems)
print(range(*elems))

3 1 2
range(3, 1, 2)


In [13]:
d = {'a': 1, 'b': 2, 'c': 3}
show_params(*d)

a c b


In [14]:
# unpacking kwargs
def show_named_params(first_param="one", second_param="two", third_param="three"):
    print(first_param, second_param, third_param)

d = {'first_param': 1, 'second_param': 2, 'third_param': 3}
show_named_params(**d)

1 2 3


In [15]:
# zip-star magic
elems_containers = ((1, 2, 3), (4, 5, 6), (7, 8, 9))
print(zip(*elems_containers), list(zip(*elems_containers)))

<zip object at 0x7f7fd498d9c8> [(1, 4, 7), (2, 5, 8), (3, 6, 9)]


In [16]:
# docstring
def do_something():
    """Short description of the function action

    More detailes description: may contain params, invariants,
    raised exceptions, return value and etc.
    """
    pass

print(do_something.__doc__)
help(do_something)

Short description of the function action

    More detailes description: may contain params, invariants,
    raised exceptions, return value and etc.
    
Help on function do_something in module __main__:

do_something()
    Short description of the function action
    
    More detailes description: may contain params, invariants,
    raised exceptions, return value and etc.



## List comprehensions

* Списковые включения (выражения) - pythonic способ построения списков с помощью выражений особого вида.  
* Осторожнее с читабельностью: иногда вместо сложного выражения лучше просто написать два обычных цикла

In [17]:
print([elem for elem in range(10)])
print([elem for elem in range(10) if elem % 2 == 0])
print([2 ** elem for elem in range(10) if elem % 2 == 0])

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 2, 4, 6, 8]
[1, 4, 16, 64, 256]


In [18]:
# may be too complex
print([(elem, inner_elem)
        for elem in range(4)
            for inner_elem in range(100, 104)
                if elem % 2 != 0])

[(1, 100), (1, 101), (1, 102), (1, 103), (3, 100), (3, 101), (3, 102), (3, 103)]


In [19]:
# may be more readable version without list comprehension in such case
elems = []
for elem in range(4):
    for inner_elem in range(100, 104):
        if elem % 2 != 0:
            elems.append((elem, inner_elem))

print(elems)

[(1, 100), (1, 101), (1, 102), (1, 103), (3, 100), (3, 101), (3, 102), (3, 103)]


In [20]:
# nested list comprehensions
print([[(row, col) for col in range(3)] for row in range(4)])

[[(0, 0), (0, 1), (0, 2)], [(1, 0), (1, 1), (1, 2)], [(2, 0), (2, 1), (2, 2)], [(3, 0), (3, 1), (3, 2)]]


In [21]:
print([[0] * 10 for i in range(10)])

[[0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]


In [22]:
# list comprehensions with dict aka dict comprehensions
counters = {"a": 1, "c": 2, "f": 100500, "z": 3}
print(counters)

print([(key, value) for key, value in counters.items()])

{'f': 100500, 'z': 3, 'a': 1, 'c': 2}
[('f', 100500), ('z', 3), ('a', 1), ('c', 2)]


In [23]:
{str(value) : 2 ** value for value in range(10)}

{'0': 1,
 '1': 2,
 '2': 4,
 '3': 8,
 '4': 16,
 '5': 32,
 '6': 64,
 '7': 128,
 '8': 256,
 '9': 512}

In [24]:
{value for value in range(10)}

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}

## Элементы функционального программирования

### Лябмда-функции

* Функции без имени - анонимные функции.  
* В Python ограничены одним выражением и предназначены для использования в простых сценариях.  
* Общее правило: если нужно что-то сложнее простого понятного выражения в лямбда-функции - сделать обычную именованную функцию.  
* Возвращаемое значение - результат единственного выражения в теле.  
* Ключевое слово return не нужно.  

In [25]:
print( (lambda: 3)() )
print( (lambda line, number: {line: number})("counter", 100500) )

3
{'counter': 100500}


### Замыкания

* Вложенные функции могут захватывать контекст внешних функций.
* Переменные из внешнего контекста read-only.
* Можно обойти в Python 2.x с помощью костыля - созданием контейнера.
* Но лучше избегать подобного использования.
* При попытке записи - проблема, т.к. не удаётся записать значение.

In [26]:
# closure example
def make_adder(initial):
    return lambda elem: initial + elem

adder100500 = make_adder(100500)
adder10 = make_adder(10)
print([adder100500(val) for val in range(10)])
print([adder10(val) for val in range(10)])

[100500, 100501, 100502, 100503, 100504, 100505, 100506, 100507, 100508, 100509]
[10, 11, 12, 13, 14, 15, 16, 17, 18, 19]


### Некоторые функции высшего порядка

* map() - преобразовать коллекцию 1 к 1 функцией (количество аргументов - количество переданных коллекций).
  - вернёт iterable [3.x]  
* reduce() - свёртка коллекции бинарной функцией.
  - брать в модуле functools [3.x]
* filter() - фильтрация коллекции с помощью унарной функции-предиката.
  - вернёт iterable [3.x]
* Сейчас в большинстве случаев вместо этих функций принято использовать list comprehensions.

In [27]:
# map
elems = list(range(1, 10))
print(elems)
print(map(lambda value: 2 ** value, elems))
print(list(map(lambda value: 2 ** value, elems)))

[1, 2, 3, 4, 5, 6, 7, 8, 9]
<map object at 0x7f7fd49a56d8>
[2, 4, 8, 16, 32, 64, 128, 256, 512]


In [28]:
print([2 ** value for value in elems])

[2, 4, 8, 16, 32, 64, 128, 256, 512]


In [29]:
# reduce
from functools import reduce

elems = list(range(1, 10))
print(elems)
print(reduce(lambda first, second: first + second, elems, -5))

[1, 2, 3, 4, 5, 6, 7, 8, 9]
40


In [30]:
elems = list(range(1, 10))

accum = -5
for elem in elems:
    accum = accum + elem
print(accum)

40


In [31]:
# filter
elems = list(range(1, 10))
print(elems)
print(filter(lambda value: value % 2 == 0, elems))
print(list(filter(lambda value: value % 2 == 0, elems)))

[1, 2, 3, 4, 5, 6, 7, 8, 9]
<filter object at 0x7f7fd49ab550>
[2, 4, 6, 8]


In [32]:
[i for i in elems if i % 2 == 0]

[2, 4, 6, 8]

## Полезные встроенные функции

Рассмотрим некоторые встроенные функции.

In [33]:
# all
print(all([False, True, True]))
print(all([False, False, False]))
print(all([True, True, True]))

False
False
True


In [34]:
# all((key in valid_keys) for key in existing_keys)

In [35]:
# any
print(any([True, False, False]))
print(any([True, True, True]))
print(any([False, False, False]))

True
True
False


In [36]:
# callable (back since 3.2)
print(callable(any))
print(callable(lambda elem: -elem))
print(callable(1))
print(callable(""))

True
True
False
False


In [37]:
# chr, ord
print(chr(48))
print(ord('0'))

0
48


In [38]:
# enumerate
for ind, letter in enumerate(['a', 'b', 'c']):
    print(ind, letter)

0 a
1 b
2 c


In [39]:
# bin, hex, oct
print(bin(20))
print(hex(20))
print(oct(20))

0b10100
0x14
0o24


In [40]:
int(hex(20), 16)

20

In [41]:
# id - for CPython this is the address in memory
a = lambda elem: -elem
print(id(a))

140187004528568


In [42]:
# isinstance
print(isinstance("abc", str))
print(isinstance("abc", int))

True
False


In [43]:
# locals
# print(locals())

In [44]:
# globals
# print(globals())

## Пример исполняемого скрипта

In [45]:
#!/usr/bin/env python3.5
# -*- coding: utf-8 -*-

import sys

def main():
    print("Hello, World!")
    print("This is {name}".format(name=sys.argv[1]))

if __name__ == "__main__":
    main()

Hello, World!
This is -f


* Первая строка - принятое в Unix-системах соглашение о том, как указывать командной оболочке интерпретатор, которым обрабатывать скрипт.
* Строка с coding задаёт кодировку для редактора и интерпретатора.
* Интерпретатор будет предполагать, что строки в литералах и текст в комментариях задан в этой кодировке.
* Последний if нужен для того, чтобы при import данного файла код бы не выполнялся - выполнится только при запуске в качестве скрипта.