Программа повышения квалификации (научно-педагогических) работников НИУ ВШЭ

# Python для исследователей

*Автор: Ян Пиле, Татьяна Рогович, НИУ ВШЭ*  

## Устройство функций в Python. Написание простейших функций. Lambda-функции. Функция map() и filter()

### Что такое функция в Python?

По своей сути функции в Python практически ничем не отличаются от функций из других языков программирования. Функцией называют именованный фрагмент программного кода, к которому можно обратиться из другого места вашей программы (но есть lambda-функции, у которых нет имени, о них будет рассказано в конце урока). Как правило, функции создаются для работы с данными, которые передаются ей в качестве аргументов, также функция может формировать некоторое возвращаемое значение. 

### Объявляя функцию, нужно следовать определенным правилам:

Объявление происходит с помощью ключевого слова **def**, за ним идёт имя функции и круглые скобки ().

**Аргументы**, передаваемые в функцию, должны находится в круглых скобках. Там же можно определить их значения по умолчанию, указав их после знака равно.

Перед основным содержимым желательно включить **строку документации** (docstring), которая обычно описывает назначение  и основные принципы работы функции.

**Тело функции** начинается после знака двоеточия. Важно не забыть об отступах.

Чтобы выйти из функции в Python, используют оператор **return [значение]**. Если оператор опущен, будет возвращено значение None.

Функцию можно объявить где угодно: внутри модуля, класса или другой функции. Если она объявляет внутри класса, то называется методом класса и вызывается так: *class_name.function()*.

In [2]:
def Имя(аргументы):
    "Документация"
    Тело (инструкции)
    return [значение]

На самом деле мы уже использовали огромное количество функций и методов (str(), float(), .add(), .count() и так далее). 

Попробуем самостоятельно реализовать функцию, складывающую два числа и выводящую результат на печать:

In [9]:
def sum_a_b(a, b):
    sum = a + b
    print(sum)

Теперь эту функцию в любом месте кода можно вызвать:

In [10]:
sum_a_b(1, 2)

3


In [11]:
x = sum_a_b(1, 2)
print(x) # функция выводит нам значение, но не возвращает его, переменная - пустая.

3
None


Чтобы иметь возможность работать с тем, что посчитала (или сделала) внутри себя функция, нужно вернуть ее значение

In [13]:
def sum_ab(a, b):
    sum_ab = a + b
    return sum_ab # вернёт сумму

c = sum_ab(4, 3) # переменная c будет равна возвращаемому значению
print(c)

7


Также мы можем задать значения по умолчения для аргументов. Помните, как мы говорили, что параметр sep=' ' функции print() равен по умолчанию пробелом.

При описании функции в *Python 3* можно задать аргументы с какими-либо начальными значениями, такие аргументы являются "необязательными". Вначале нужно описывать обязательные параметры, а после них – необязательные.
При вызове функции не обязательно указывать значения "необязательных" параметров (спасибо, кэп). Если мы хотим изменить значение аргумента, не меняя начальные значения других аргументов, можно обращаться к нему по ключу.

In [14]:
def example(first, second=3, third=5):
    print(first)
    print(second)
    print(third)
    
example('my string', third=4)

my string
3
4


А еще функция может быть пустой и ничего не делать. Выглядит это так:

In [1]:
def test():
    pass # Оператор-заглушка, равноценный отсутствию операции.

А что если параметров у функции несколько, но только мы не знаем, сколько. Например, мы хотим складывать числа, которые пользователь вводит с клавиатуры, но мы заранее не знаем, сколько чисел он собирается ввести. Уже несколько раз мы упоминали такое понятие, как "распаковка" списков, кортежей и словарей (когда записывается что-то в духе \*list_name или \*\*dictionary_name). 

## Напоминание:
Если мы хотим сожержимое двух списков положить в третий список или содержимое двух словарей положить в третий словарь, на помощь нам приходит так называемый "звездочный синтаксис":

In [16]:
list1 = [1,2,3]
list2 = [4,5,6]

list3 = [*list1,*list2] ##положили все элементы обоих списков в третий
list3

[1, 2, 3, 4, 5, 6]

In [18]:
dict1 = {'a':1,'b':2,'c':3}
dict2 = {'d':4,'e':5,'f':6}

dict3 = {**dict1,**dict2} ##положили все элементы обоих словарей в третий
dict3

{'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6}

Точно таким же образом можно что-то указать "в явном виде", а что-то распаковать из структуры (например, вы хотите дописать в новый список числа 3 и 4):

In [16]:
list1 = [0,1,2]
print([3,4,list1]) # тут элементом стал сам список
print([3,4,*list1]) # а тут мы элементы списка распаковали

[3, 4, [0, 1, 2]]
[3, 4, 0, 1, 2]


### В функции точно так же можно подавать несколько аргументов!
Даже если вы заранее не знаете, сколько их будет. Вспомните, например, функцию print(). Она умеет давать ответ и при одном аргументе, и при двух и при любом N.

In [17]:
def adder(x, y, z):
    print("sum:",x + y + z)

adder(10, 12, 13)

sum: 35


### \*args и \*\*kwargs спешат на помощь
В Python можно передать переменное количество аргументов двумя способами:

* \*args для неименованных аргументов;
* \*\*kwargs для именованных аргументов.
Мы используем \*args и \*\*kwargs в качестве аргумента, когда заранее не известно, сколько значений мы хотим передать функции.

### \*args
Как было сказано, \*args нужен, когда мы хотим передать неизвестное количество неименованных аргументов. Если поставить `*` перед именем, это имя будет принимать не один аргумент, а несколько. Аргументы передаются как кортеж и доступны внутри функции под тем же именем, что и имя параметра, только без *.

In [2]:
def adder(*nums):
    sum = 0
    
    for n in nums:
        sum += n

    print("Sum: ", sum)

adder(3, 5)
adder(4, 5, 6, 7)
adder(1, 2, 3, 5, 6)

Sum:  8
Sum:  22
Sum:  17


### \*\*kwargs
По аналогии с \*args мы используем \*\*kwargs для передачи переменного количества именованных аргументов. Схоже с \*args, если поставить ** перед именем, это имя будет принимать любое количество именованных аргументов. Кортеж/словарь из нескольких переданных аргументов будет доступен под этим именем. Например:

In [3]:
def intro(**data):
    print("\nData type of argument: ",type(data))

    for key, value in data.items():
        print("{} is {}".format(key, value))

intro(Firstname="Yoko", Lastname="Ono", Age=87, Phone=1234567890)
intro(Firstname="John", Lastname="Lennon", Email="johnlennon@nomail.com", Country="UK", Age=40, Phone=9876543210)


Data type of argument:  <class 'dict'>
Firstname is Yoko
Lastname is Ono
Age is 87
Phone is 1234567890

Data type of argument:  <class 'dict'>
Firstname is John
Lastname is Lennon
Email is johnlennon@nomail.com
Country is UK
Age is 40
Phone is 9876543210


В этом случае у нас есть функция **intro()** с параметром \*\*data. В функцию мы передали два словаря разной длины. Затем внутри функции мы прошлись в цикле по словарям, чтобы вывести их содержимое.

### Локальные и глобальные переменные aka области видимости

#### Локальные переменные
Для создания переменных, обладающих локальной областью видимости, необходимо всего лишь поместить их в отдельный блок кода, изолированный от остальной программы. Например, у нас таким свойством обладают все переменные, которые мы прежде использовали в функциях, например:

In [4]:
def f(x):
    output = x+1
    output2 = output + 1
    return output2

print(f(4))
print(output)

6


NameError: name 'output' is not defined

Функция у нас сработала, а вот переменную за пределами функции мы не видим. А что если мы попробуем изнутри функции использовать переменную, определенную вовне?

In [5]:
x = 11

def foo(z):
    print(x)
    return None

foo(10)

11


Сработало! Более того - все переменные, объявленные "в более широкой области видимости" всегда доступны "в более узкой области видимости". Попробуем завернуть несколько функций друг в друга и взглянуть на значения:

In [6]:
def f1():
    x = 100
    def f2():
        x = 200
    f2()
    return x
f1()

100

Выведено было значение с "самого высокого уровня".

Если нам все-таки нужно использовать значение переменной "изнутри" функции, можно сказать , что мы объявляем глобальную переменную. Для этого используется выражение **global**

In [2]:
def f():
    global s
    s = "Only in spring, but London is great as well!"


s = "I am looking for a course in Paris!" 
print(s)
f()
print(s)

I am looking for a course in Paris!
Only in spring, but London is great as well!


Здесь мы вызвали функцию и она перезаписала нам значение в переменную s

В Python 3 есть еще один тип переменных, который позволяет использовать значение внутри областей видимости, но не выносить их в глобальную область. Это так называемые **nonlocal** переменные.

In [8]:
def f():
    city = "Munich"
    def g():
        nonlocal city
        city = "Zurich"
    print("Before calling g: " + city)
    print("Calling g now:")
    g()
    print("After calling g: " + city)
    
city = "Stuttgart"
f()
print("'city' in main: " + city)

Before calling g: Munich
Calling g now:
After calling g: Zurich
'city' in main: Stuttgart


Видно, что в глобальную область видимости Цюрих не доехал, но в локальной он переехал со первого уровня вложенности в функцию f :)

### Lambda-функции
Это особый вид функций, которые объявляются с помощью ключевого слова **lambda** вместо **def**:
Лямбда-функции принимают любое количество аргументов, но не могут содержать несколько выражений и всегда возвращают только одно значение.
В программировании на **Python** можно обойтись без анонимных функций, которые по сути являются обычными, но без имени и с ограничением в одно выражение. Однако их использование в нужных местах упрощает написание и восприятие кода. Пишется так:

* lambda arguments: expression

arguments - аргументы, expression - выражение, возвращающее значение.

Пример (lambda функция, которая добавляет к переданному аргументу 1 и возвращает результат):

In [9]:
add_1 = lambda x: x + 1
add_1(8) 

9

А если мы вдруг решили сложить два числа, то это тоже можно сделать с помощью лямбда-функции:

In [10]:
add_2 = lambda x, y: x + y
add_2(3, 4)

7

Заработало! А если по-другому назвать аргументы?

In [11]:
add_2 = lambda f123, er45: f123 + er45
add_2(3, 4)

7

Во всех трех примерах мы все-таки присвоили имя каждой из функций. Давайте попробуем вызвать функцию по-настоящему анонимно. Аргументы передаются в скобках после скобок, содержащих определение lambda функции

In [12]:
(lambda x, y: x * y)(3, 5)

15

По сути, лямбда-функции умеют все, что и обычные функции, только они обязаны возвращать всего одно значение. 
* Они умеют работать с разными типами данных
* Можно вызывать функцию без параметров
* Параметрам функции можно задать значения по умолчанию

In [13]:
# Со строками
(lambda x, y: x * y)("Ха-",3)

'Ха-Ха-Ха-'

In [14]:
(lambda x, y: x + y)("Первая","Вторая")

'ПерваяВторая'

In [15]:
# А вот тут без аргументов
(lambda: [0,1,2,3])()

[0, 1, 2, 3]

In [16]:
# А тут есть значения по умолчанию
(lambda x=3, y = 5: x + y)(4)

9

In [17]:
# Здесь в качестве первого аргумента пришел список, а второй использовался по умолчанию
# На выходе должны получить первый элемент первого списка + 3
(lambda x,y=3: x[0] + y)([1,2,3])

4

In [18]:
print((lambda x, y, z: x + y + z)(1, 2, 3)) # Три аргумента

print((lambda x, y, z=3: x + y + z)(1, 2)) # Три аргумента и у одного default-значение

print((lambda x, y, z=3: x + y + z)(1, y=2)) # Три аргумента, у одного default-значение и один мы передали "по имени"

print((lambda *args: sum(args))(1,2,3)) # Передали кортеж аргументов и сложили

print((lambda **kwargs: sum(kwargs.values()))(one=1, two=2, three=3)) # Передали словарь аргументов и сложили

6
6
6
6
6


## map() и filter()

Лямбда-функции очень часто применяются для преобразования каких-то коллекций. Для этого lambda-функции можно подавать в функцию map. Мы с вами уже множество раз использовали map, например, для преобразования списков. Давайте возьмем список и возведем все его элементы в квадрат с помощью map и lambda-функции.

In [19]:
a = [1,3,4,6]
list(map(lambda x: x ** 3, a))

[1, 27, 64, 216]

Обнулим в списке все числа, не кратные 3

In [20]:
a = [1,3,4,6]

list(map(lambda x: x if x % 3 == 0 else 0, a))

[0, 3, 0, 6]

Заметим, что в if здесь используется тот же синтаксис, что был в списковых включениях и генераторах списков.

А еще есть прекрасная функция для фильтрации списков, которая работает аналогично map. Называется она filter. Пусть мы хотим отфильтровать все числа меньше 4 из списка. С помощью цикла это можно сделать вот так:

In [21]:
numbers = [1,2,3,4,5]
numbers_under_4 = []
for number in numbers:
    if number < 4:
        numbers_under_4.append(number)
numbers_under_4

[1, 2, 3]

А с помощью спискового включения вот так:

In [22]:
numbers = [1,2,3,4,5]
numbers_under_4 = [number for number in numbers if number < 4]
numbers_under_4

[1, 2, 3]

А чудо-функция filter сработает вот так:

In [23]:
numbers = [1,2,3,4,5]
numbers_under_4 = list(filter(lambda x: x < 4, numbers))
numbers_under_4

[1, 2, 3]

Видно, что синтаксис такой же, как и у map. первый аргумент - функция, которую надо применять, а второй - коллекция, на которую надо применять. Но как и для map, функция возвращает итератор, поэтому, чтобы получить список, его нужно обернуть функцией list.

### Задачка 1: Напишите функцию для вычисления факториала данного числа без рекурсии 
### (что бы это ни было :)    )

Ввод: 3

Вывод: 6

In [12]:
def factorial(n): # factorial - название функции, n - ее аргумент, параметр, от которого зависит результат
    fact = 1

    for i in range(1, n + 1):
        fact *= i
    return fact # когда результат получен, его надо вернуть с помощью ключевого слова return

%timeit factorial(10) # замерим время выполнения функции

1.26 µs ± 332 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [15]:
 factorial(2)

2

### Рекурсия

Рекурсия — это техника в Computer Science, когда функция вызывает сама себя. Самый известный пример — вычисление факториала n! = n * n — 1 * n -2 * … 2 *1. Зная, что 0! = 1, факториал можно записать следующим образом:

In [16]:
def factorial(n):
    if n != 1:
        return n * factorial(n-1)
    else:
        return 1

# В этой реализации есть некоторые проблемы, но мы поговорим об этом потом :)
%timeit factorial(10)  # замерим время выполнения функции - выполняется дольше

2.3 µs ± 351 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [11]:
 factorial(4)

24

Каждый раз, когда функция вызывает себя и сохраняет некоторую память. Таким образом, рекурсивная функция может содержать гораздо больше памяти, чем традиционная функция. Python останавливает вызовы функций после глубины в 1000 вызовов. Если вы запустите этот пример, получите ошибку.

In [19]:
print(factorial(3000))

RecursionError: maximum recursion depth exceeded in comparison

А еще таким же образом можно вычислять N-ое число Фибоначчи.
Заодно здесь мы видим, что выражений return может быть несколько (для различных условий)

In [22]:
# рекурсивная функция - вызывает внутри саму себя
def fibonacci(n):
    if n in (1, 2):
        return 1
    return fibonacci(n - 1) + fibonacci(n - 2)

%timeit fibonacci(10)

33.9 µs ± 1.72 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


In [29]:
for i in range(1,6):
    print(fibonacci(i), end=' ')

1 1 2 3 5 

In [21]:
# функция без рекурсии
def fibonacci(n):
    fib1 = fib2 = 1
    n = n - 2
    while n > 0:
        fib1, fib2 = fib2, fib1 + fib2
        n -= 1
    return fib2

%timeit fibonacci(10)

1.77 µs ± 330 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


### Рекурсивно посчитать сумму чисел от 1 до N

Вход: N

Выход: sum(1,2,3,...,N)


Вход: 3

Выход: 6

In [30]:
def add(n):
    if n == 0:
        return 0
    return n + add(n - 1)

In [31]:
add(10)

55

### Очень полезный пример про рекурсию

Примеры с факториалом и числом Фибоначи обычно являются хорошей иллюстрацией, чтобы объяснить рекурсию, но мы увидели, что в обоих этих примерах рекурсивная функция работает дольше обычной с увеличением аргумента. Но есть примеры, где рекурсия действительно оправдана.

### Быстрое возведение в степень

Одним из полезных применений рекурсии является алгоритм быстрого возведения в степень. Если вычислять степень числа a в степень N при помощи простого цикла, то понадобится n-1 умножение. Но можно решить все это быстрее, воспользовавшись рекуррентными соотношениями:

Для нечетных N: \begin{eqnarray} a^n = a^{n-1}a \end{eqnarray} 

Для четных N: \begin{eqnarray} a^n = (a^{n/2})^2 \end{eqnarray}

Это позволяет записать алгоритм, который будет выполнять не более чем за: \begin{eqnarray} 2*log_2(n) \end{eqnarray} умножений

In [34]:
def power(a, n):
    if n == 0:
        return 1
    elif n % 2 == 1:
        return power(a, n - 1) * a
    else:
        return power(a, n // 2) ** 2

In [35]:
# 5 операций вместо 19
power(2,20)

1048576

### Возврат нескольких значений

Нужно упомянуть еще один факт: по команде return функция может возвращать несколько значений. Например вот функция, которая умеет выводить сумму и разность двух аргументов функции:

In [36]:
def sum_diff(a,b):
    return a+b, a-b

sum, diff = sum_diff(4,1)
print(sum)
print(diff)

5
3
