# Функции и модули

В этой лекции мы расскажем о том, что такое функции в языках программирования и для чего они нужны. Также мы рассмотрим понятия модуля и пакета, познакомимся с некоторыми основными модулями Python и вкратце обсудим парадигму процедурного программирования.

## Содержание лекции

* [Функции](#Функции)
  * [Создание и вызов](#Создание-и-вызов)
  * [Аргументы и возвращаемое значение](#Аргументы-и-возвращаемое-значение)
  * [Лямбда-функции](#Лямбда-функции)
* [Модули](#Модули)
* [Процедурное программирование](#Процедурное-программирование)
* [Вопросы для самоконтроля](#Вопросы-для-самоконтроля)
* [Задание](#Задание)

## Функции

**Функция**, также иногда называемая *подпрограммой* или *процедурой* - это фрагмент исходного кода (как правило, именованный), к которому можно обратиться из других частей программы. Можно говорить о том, что функция представляет собой маленькую законченную программу внутри основной программы (поэтому ее иногда и называют подпрограммой). Большинство функций имеют имя для того, чтобы к ним было удобно обращаться из остальных частей программы. По сути, понятие функции тесно связано с понятием переменной, только первая связывает некоторое имя с блоком исходного кода, а вторая - со значением в памяти (числовым, строковым и т.д.).

### Создание и вызов

Функции в языке программирования Python создаются с помощью инструкции `def`:

<pre>
def <i>function_name</i>(<i>parameters_list<i>):
    <i>code_block</i>
</pre>

Имя функции *function_name* должно быть [допустимым идентификатором](04_Data_Types.ipynb#Допустимые-идентификаторы) в языке Python. Поскольку функция как правило выполняет некоторое действие, то в ее имени рекомендуется использовать глаголы. В качестве примера можно привести такие имена функций: `send_message`, `get_inverted_value`, `make_job` и т.д.

Функция может иметь **параметры**, описываемые в *parameters_list*, который представляет собой 0 или более переменных, разделенных запятыми. Эти переменные "видны" **только** внутри функции (в ее *code_block*) так, словно они были созданы в ней явно с помощью инструкций присваивания, и к ним нельзя обратится из других частей исходного кода.

Компонент *code_block* представляет собой последовательность произвольных инструкций языка программирования Python, в том числе других инструкций `def`. Обратите внимание, что все инструкции в *code_block* должны иметь отступ относительно инструкции `def`.

В любом месте внутри *code_block* функции можно использовать специальную инструкцию `return` вместе со значением произвольного типа, с помощью которой функция может вернуть результат своей работы.

Функции используются следующим образом:

1. В начале функция создается с помощью инструкции `def`. Не любую последовательность инструкций имеет смысл делать функцией - как правило она должна делать небольшую и четко определенную работу, необходимость в которой может возникать в разных частях исходного кода основной программы. Процесс создания функции, а также соответствующая инструкция `def` в исходном коде, часто называются **определением функции**.
2. После того, как функция определена, ее можно использовать в других частях программы для того, чтобы выполнить работу, реализованную в функции. Для этого в нужных местах исходного кода пишут имя функции и в скобках `()` указывают значения для ее параметров. Это называется **вызовом функции**. Переменные и литералы, указанные в скобках при вызове функции называются ее **аргументами**.
3. Когда интерпретатор встречает инструкцию вызова функции, он вначале инициализирует с помощью аргументов ее параметры, а затем выполняет *code_block* функции. Можно представлять себе, что при вызове функции интерпретатор как бы вставляет в исходный код инструкции из *code_block*, при этом заменив в них имена параметров на имена аргументов.
4. Если в *code_block* функции выполняется инструкция `return`, интерпретатор берет значение, указанное в ней, вставляет его в место вызова функции (говорят, что функция **возвращает** значение), а затем продолжает выполнять программу с этой точки. Можно представлять себе это так, словно значение из инструкции `return` заменило собой инструкцию вызова функции. В `return` можно и не указывать никакого значения - в этом случае возвращается специальное значение `None`.
5. Если инструкция `return` не встретилась, то интерпретатор обрабатывает *code_block* функции целиком, а затем выполняет действия, аналогичные тому, как если бы в конце *code_block* была инструкция `return` без значения.

In [1]:
# определение функции

def print_hello(name):    # name - это параметр функции, который "виден" только в ее code_block
    print('hello,', name) # это code_block функции, только в нем мы можем обращаться к параметру name

# основная программа

name1 = 'Alice'
name2 = 'Bob'

print_hello(name1) # вызов функции print_hello, name1 - это аргумент, который присваивается параметру name
print_hello(name2) # вызов функции print_hello с другим аргументом (name2)

hello, Alice
hello, Bob


Определение функции должно находится в исходном коде до ее вызовов. Это ограничение связано с тем, что интерпретатор выполняет исходный код последовательно сверху вниз, поэтому в момент вызова функции должен знать, какой блок кода связан с ней. В следующем пример интерпретатор генерирует исключение `NameError`, так как в момент вызова функции он еще не обрабатывал ее определение:

In [2]:
# основная программа

print_hello_world()

# определение функции print_hello_world
# обратите внимание, что функция может не иметь параметров, однако скобки ()
# все равно должны присутствовать как в ее определении, так и в ее вызове

def print_hello_world():  
    print('hello, world')

NameError: name 'print_hello_world' is not defined

Напомним, что все переменные в Python являются [ссылками](./04_Data_Types.ipynb#Ссылки). Это означает, что при инициализации параметров функции с помощью аргументов, первые начинают указывать на ту же область памяти, что и вторые. Если аргумент имеет неизменяемый тип данных, то модификация соответствующего параметра в *code_block* функции никак не повлияет на значение аргумента, иначе - изменение параматра внутри функции приведет к изменению значения аргумента (подробнее об этом [здесь](./04_Data_Types.ipynb#Изменяемость-типов-данных)). Поскольку пока из всех типов данных, что мы встречали, изменяемым был только тип `Context`, используем его, чтобы продемонстрировать разницу между изменяемыми и неизменяемыми аргументами:

In [3]:
import decimal

def add_one_to_variable(var):
    var += 1
    print('in function: var =', var)

def add_one_to_prec(ctx):
    ctx.prec += 1
    print('in function: ctx.prec =', ctx.prec)

var = 1
ctx = decimal.getcontext()

print('before function: var =', var)
add_one_to_variable(var)
print('after function: var =', var)

print('before function: ctx.prec =', ctx.prec)
add_one_to_prec(ctx)
print('after function: ctx.prec =', ctx.prec)

before function: var = 1
in function: var = 2
after function: var = 1
before function: ctx.prec = 28
in function: ctx.prec = 29
after function: ctx.prec = 29


Как видите, модификация неизменяемого типа внутри функции видна только в ее *code_block*, в то время как модификация изменямого остается в силе и после возврата из функции.

### Аргументы и возвращаемое значение

В примерах, которые были только что рассмотрены, выигрыш от использования функций небольшой - можно было бы просто вместо них везде писать их *code_block*. Рассмотрим более полезную функцию, вычисляющую площадь треугольника по длинам его сторон ([формула Герона](https://ru.wikipedia.org/wiki/%D0%A4%D0%BE%D1%80%D0%BC%D1%83%D0%BB%D0%B0_%D0%93%D0%B5%D1%80%D0%BE%D0%BD%D0%B0)):

In [4]:
def get_triangle_area(a, b, c):
    print('a =', a, ', b =', b, ', c =', c)
    p = (a + b + c) / 2
    return (p * (p - a) * (p - b) * (p - c)) ** 0.5

area = get_triangle_area(3, 4, 5)
print('area =', area)

a = 3 , b = 4 , c = 5
area = 6.0


В этой функции мы видим инструкцию `return`, возвращающую значение выражения для площади треугольника, которое затем присваивается переменной `area`.

Аргументы, с которыми вызывается функция `get_triangle_area` в примере выше называются **позиционными** - они присиваиваются параметрам в том порядке, в котором указаны в инструкции вызова функции, то есть параметр `a` становится равен трем, `b` четырем, а `c` - пяти.

При вызове функции также можно использовать **именованные аргументы**, которые явно указывают, какому параметру какое значение нужно присвоить. Именованные аргументы могут идти в любом порядке, и даже использоваться вместе с позиционными, правда обязательно **после** них. Какую бы комбинацию именованных и позиционных аргументов вы ни использовали, важно, чтобы в итоге все параметры были проинициализированы, или будет сгенерировано исключение.

In [5]:
# во всех примерах ниже параметры функции get_triangle_area: a = 5, b = 10, c = 7

# позиционные аргументы
print('area1 =', get_triangle_area(5, 10, 7))

# именованные аргументы
print('area2 =', get_triangle_area(c=7, a=5, b=10))

# позиционны и именованные аргументы
print('area3 =', get_triangle_area(5, c=7, b=10))

a = 5 , b = 10 , c = 7
area1 = 16.24807680927192
a = 5 , b = 10 , c = 7
area2 = 16.24807680927192
a = 5 , b = 10 , c = 7
area3 = 16.24807680927192


Приведем также примеры некорректных вызовов функции `get_triangle_area`:

In [6]:
get_triangle_area(a=1, 2, 3)          # позиционный аргумент идет после именованного
get_triangle_area(1, b=2)             # слишком мало аргументов
get_triangle_area(a=1, b=2, c=3, d=4) # неизвестный параметр d

SyntaxError: positional argument follows keyword argument (<ipython-input-6-e953892bf87c>, line 1)

В нашей текущей реализации функции `get_triangle_area` не учтен тот факт, что не всякие три числа могут быть использованы в качестве длин сторон треугольника, поэтому давайте добавим в нее соответствующую проверку. Если параметры корректны, то мы будем высчитывать и возвращать площадь треугольника, а в случае ошибки - возвращать специальное значение `None`, которое позволит обнаружить ее в том месте, где вызывается наша функция. Этот прием (использование `None` в качестве результата в случае ошибки) очень распространен и встречается во многих функциях в Python.

In [7]:
def get_triangle_area(a, b, c):
    # из школьного курса геометрии известно, что сумма любых двух
    # сторон треугольника должна быть строго больше третьей стороны
    if a + b <= c or a + c <= b or b + c <= a:
        return None # в принципе, можно было написать просто "return", но так понятнее
    
    p = (a + b + c) / 2
    return (p * (p - a) * (p - b) * (p - c)) ** 0.5

# длины сторон треугольника

a = 10
b = 11
c = 12

# вычисляем площадь (здесь a, b, c - позиционные аргументы, с помощью которых будут
# проинициализированны параметры функции)
area = get_triangle_area(a, b, c) 

# проверяем, что не произошло ошибки

if area is not None:
    print('area =', area)
else:
    print('bad triangle sides!')

area = 51.521233486786784


Обратите внимание, что для проверки того, равна ли переменная `area` специальному значению `None`, следует использовать операцию `is` или `is not`, а не `==`.

Убедимся, что наша программа работает правильно и при некорректных значениях длин сторон треугольника:

In [8]:
a = 1
b = 1
c = 5

area = get_triangle_area(a, b, c) 

if area is not None:
    print('area =', area)
else:
    print('bad triangle sides!')

bad triangle sides!


Заметим, что внутри функции может находиться определение другой функции. Такие функции иногда называют **локальными**, потому что их можно вызвать только в *code_block* функции, в которой они определены. В противовес этому, обычные функции, которые мы рассматривали выше, называют **глобальными**, потому что они могут использоваться в любой части исходного кода программы. Перепишем наш пример с использованием локальной функции:

In [9]:
def get_triangle_area(a, b, c): # глобальная функция 
    def get_half_perimeter():   # локальная функция
        return (a + b + c) / 2  # внутри локальной функции видны параметры глобальной!
    
    if a + b <= c or a + c <= b or b + c <= a:
        return None
    
    p = get_half_perimeter()    # вызываем локальную функцию
    return (p * (p - a) * (p - b) * (p - c)) ** 0.5

get_triangle_area(3, 7, 9)

8.78564169540279

При попытке вызвать локальную функцию вне глобальной, в которой она определена, мы получим уже хорошо знакомую нам ошибку `NameError`:

In [10]:
get_half_perimeter()

NameError: name 'get_half_perimeter' is not defined

При определении функции с помощью инструкции `def` для некоторых параметров можно указать *значение по умолчанию*. Такие параметры становятся *необязательными*, то есть при вызове функции можно не указывать аргументы для них, при этом параметры инициализируются своими значениями по умолчанию. Рассмотрим функцию, которая укорачивает произвольный текст до определенного количества символов, добавляя в конец индикатор того, что текст бы сокращен. В примере мы воспользуемся встроенной в Python функцией `len`, которая принимает в качестве параметра строку и возвращает количество символов в ней.

In [11]:
def get_short_string(text, length=15, indicator='...'):
    if len(text) <= length:
        return text
    
    indicator_len = len(indicator)
    result = text[:length-indicator_len] + indicator
    return result

У функции `get_short_string` есть два необязательных параметра `length` и `indicator`, для которых задано значение по умолчанию (указывается с помощью знака `=` в определении функции `def`), а значит при ее вызове их можно не указывать:

In [12]:
text = 'To be or not to be, that is the question'

print(get_short_string(text, 20, '***'))       # явно задаем значения для всех параметров
print(get_short_string(text, length=10))       # indicator будет иметь значение по умолчанию
print(get_short_string(text, indicator='***')) # length будет иметь значение по умолчанию
print(get_short_string(text))                  # length и indicator будут иметь значение по умолчанию

To be or not to b***
To be o...
To be or not***
To be or not...


Значения по умолчанию часто используются в определении функции, у которой есть параметры, как правило устанавливаемые в одно и то же значение при вызове. Это с одной стороны делает использование такой функции удобным, так как не нужно при ее вызове указывать множество несущественных аргументов, а с другой - гибким, поскольку в частном случае можно добиться нужного результата, явно указав значение для некоторого параметра.

Если вы хотите сделать несколько параметров своей функции необязательными (т.е. имеющими значение по умолчанию), все их нужно указывать **после** обязательных параметров в инструкции `def`, например такое определение является некорректным:

In [13]:
def my_function(param1, param2=0, param3):
    print('my function')

SyntaxError: non-default argument follows default argument (<ipython-input-13-29fa1a732243>, line 1)

Функции можно присваивать переменным, а затем вызывать их через эти переменные:

In [14]:
def decorate_text(text):
    return '---' + text + '---'

a = decorate_text
decorated_text = a('hello')
print(decorated_text)

---hello---


Этот прием позволяет создавать интересные конструкции, например, использовать функцию в качестве параметра другой функции. Рассмотрим такой пример:

In [15]:
def decorate_text1(text):
    return '---' + text + '---'

def decorate_text2(text):
    return '***' + text + '***'

def decorate_text3(text):
    return '+++' + text + '+++'

def print_hello(name, decorator=decorate_text1):
    hello_text = 'hello, ' + name
    hello_text = decorator(hello_text)
    print(hello_text)

print_hello('Alice')
print_hello('Bob', decorate_text2)

---hello, Alice---
***hello, Bob***


### Лямбда-функции

**Лямбда-функция** представляет собой анонимную функцию, создаваемую следующей инструкцией:

<pre>
lambda <i>parameters_list</i>: <i>expression</i>
</pre>

Как и для обычных функций, *parameters_list* представляет собой 0 или более переменных, разделенных запятыми. Для них можно указывать значение по умолчанию по тем же правилам, что и для обычных функций.

*Expression* представляет собой некоторое выражение языка программирования Python, например, арифметическое, логическое или условное.

Приведем простой пример лямбда-функции, которая возвращает модуль числа:

In [16]:
abs_value = lambda x: x if x >= 0 else -x # используем условное выражение в качестве лямбда-функции
print(abs_value(5))
print(abs_value(-5))

5
5


Рассмотрим последний пример из предыдущего раздела. Хорошая функция должна представлять собой законченную небольшую программу, которая может многократно использоваться в других участках кода (подробнее об этом читайте ниже в разделе [Процедурное программирование](#Процедурное-программирование)). Сказать это о функциях `decorate_text` мы не можем - они используются лишь как параметры для функции `print_hello`, и вряд ли понадобятся где-либо еще. Поэтому этот пример лучше переписать с использованием лямбда-функций:

In [17]:
# обратите внимание на то, как мы используем лямбда-функцию в качестве значения по умолчанию
def print_hello(name, decorator = lambda text: '---' + text + '---'):
    hello_text = 'hello, ' + name
    hello_text = decorator(hello_text)
    print(hello_text)

print_hello('Alice')

---hello, Alice---


Если нам потребуется любой другой способ декорирование текста, мы можем указать его прямо при вызове функции `print_hello`:

In [18]:
print_hello('Bob', lambda text: '***' + text + '***')
print_hello('Cooper', lambda text: '===' + text + '===')

***hello, Bob***
===hello, Cooper===


## Модули

## Процедурное программирование

## Вопросы для самоконтроля

1. Что такое функция? Чем она похожа на переменную?
2. Что такое определение функции? Что такое вызов функции?
3. Что такое параметр и аргумент функции? Какими двумя способами можно передать аргументы в вызов функции?
4. В чем особенности локальных функций? Лямбда-функций? Какой еще тип функций бывает?

## Задание

- - -
[Предыдущая: Инструкция ветвления и циклы](06_Branch_Instruction_And_Loops.ipynb) |
[Содержание](00_Overview.ipynb#Содержание) |
[Следующая: Классы и исключения](08_Classes_And_Exceptions.ipynb)