# **Функции**

*Функции* — главный и самый важный способ организации и повторного использования кода в Python. Кроме того, функции могут сделать код более понятным, поскольку дают имя группе взаимосвязанных предложений.

Объявление функции начинается ключевым словом `def`, а результат возвращается в предложении `return`:

In [None]:
def my_function(x,y,z=1.5): 
  if z > 1:
    return z*(x+y)
  else:
    return z/(x+y)

Ничто не мешает иметь в функции несколько предложений `return`. Если при выполнении достигнут конец функции, а предложение `return` не встретилось, то возвращается `None`.

У функции могут быть *позиционные* и *именнованные* аргументы. *Именованные* аргументы обычно используются для задания значений по умолчанию и необязательных аргументов. В примере выше `x` и `y` — позиционные аргументы, а `z` — именованный. Следующие вызовы функции эквивалентны:

In [None]:
my_function(5,6,z=0.7)

0.06363636363636363

In [None]:
my_function(5,6,0.7)

0.06363636363636363

In [None]:
my_function(5,6)

0.06363636363636363

In [None]:
my_function(y=6,x=5,z=0.7)

0.06363636363636363

# **Пространства имен, области видимости и локальные функции**

Функции могут обращаться к переменным, объявленным в двух областях видимости: *глобальной* и *локальной*. Область видимости переменной в Python называют также *пространством имен*. Любая переменная, которой присвоено значение внутри функции, по умолчанию попадает в *локальное пространство* имен. Локальное пространство имен создается при вызове функции, и в него сразу же заносятся аргументы функции. По завершении функции локальное пространство имен учичтожется. Рассмотрим функцию:

In [None]:
def func():
  a = [] #создаем пустой список
  for i in range(5): #включается счетчик от 0 до 4
    a.append(i) #в список включается каждое значение i

Допустим, что мы объявляем `a` следующим образом, тогда чтобы этой переменной можно было пользоваться вне функции, нужно объявить ее глобальной, используя метод `global`:

In [None]:
a = [] #пустая переменная
def func():
  global a #объявление переменной глобальной
  for i in range(5): #включается счетчик от 0 до 4
    a.append(i) #в список включается каждое значение i

# **Возврат нескольких значений**

В Python можно возвращать из функции несколько значений:

In [None]:
def f(a,b,c):
  a *= 2
  b *= 3
  c *= 3
  return a,b,c

In [None]:
sp = [[1,2,3],[4,5,6],[7,8,9]]
sp_new = []
for element in sp:
  sp_new.append(list(f(element[0],element[1],element[2])))
sp_new

[[2, 6, 9], [8, 15, 18], [14, 24, 27]]

In [None]:
def f(a,b):
  a **= 2
  b **= 2
  return a,b

In [None]:
mass = [[[1,2],[3,4]],[[5,6],[7,8]]]
mass_2 = []
for i in mass:
  for j in i:
    mass_2.append(list(f(j[0],j[1])))
mass_2

[[1, 4], [9, 16], [25, 36], [49, 64]]

# **Функции являются объектами**

Поскольку функции в Python — объекты, становятся возможны многие конструкции, которые в других языках выразить трудно. Например, необходимо произвести очистку данных и должны преобразовать следующий список строк:

In [None]:
states = [' Alabama ', 'Georgia!', 'Georgia', 'georgia', 'FlOrIda', 'south carolina##', 'West virginia?']

Для работы со строками (исправление, очистка) используется модуль `re`:

In [None]:
import re
def clean_strings(strings):
  result = []
  for value in strings:
    value = value.strip() #strip удаляет пробелы
    value = re.sub('[!#?]','', value) #очистка от мусорных символов: sub('символы, которые удаляются','чем заменяются', аргумент, над которым проводится манипуляция)
    value = value.title() #написание слов с большой буквы
    result.append(value)
  return result
clean_strings(states)

['Alabama',
 'Georgia',
 'Georgia',
 'Georgia',
 'Florida',
 'South Carolina',
 'West Virginia']

Другой подход, который может быть полезен, — составить список операций, который необходимо применить к набору строк:

In [None]:
states = [' Alabama ', 'Georgia!', 'Georgia', 'georgia', 'FlOrIda', 'south carolina##', 'West virginia?']
def remove_punctuation(value):
  return re.sub('[!#?]','', value) #возвращаем функцию, которая будет очищать все от знаков препинания

In [None]:
clean_ops = [str.strip, remove_punctuation, str.title] #список функций (да, так тоже можно)

In [None]:
def clean_strings_2(strings,ops): #задаем очищающую функцию с аргументами из списка данных и списка функций, применяемых к ним
  result = []
  for value in strings: #проходимся по данным в списке
    for function in ops: #проходимся по функциям в списке функций
      value = function(value) #применяем функцию из списка к элементу списка данных
    result.append(value) #добавляем к результату очищенные данные
  return result #выводим результат
clean_strings_2(states, clean_ops)

['Alabama',
 'Georgia',
 'Georgia',
 'Georgia',
 'Florida',
 'South Carolina',
 'West Virginia']

Подобный *функциональный* подход позволяет задать способ модификации строк на очень высоком уровне.
Функции можно передавать в качестве аргументов другим функциям, например, встроенной функции `map`, которая применяет переданную функцию к коллекции:

In [None]:
def clean_string_3(value):
  value = value.strip() #strip удаляет пробелы
  value = re.sub('[!#?]','', value) #очистка от мусорных символов: sub('символы, которые удаляются','чем заменяются', аргумент, над которым проводится манипуляция)
  value = value.title() #написание слов с большой буквы
  return value

In [None]:
for x in map(clean_string_3, states): #функция map создает пару функция-элемент списка и проводит манипуляции в цикле for
  print(x)

Alabama
Georgia
Georgia
Georgia
Florida
South Carolina
West Virginia


# **Анонимные (лямбда) функции**

Python поддерживает так называемые *анонимные* функции, или *лямбда*-функции. По существу, это простые однострочные функции, возвращающие значение. Определяются они с помощью ключевого слова `lambda`, которое означает лишь "мы определяем анонимную функцию" и ничего более.

In [None]:
def short_function(x): #вызываем функцию с аргументом x
  return x*2
equiv_anon = lambda x: x*2 #функцию выше можно записать в одну строку

20

In [None]:
def apply_to_list(some_list,f):
  return [f(x) for x in some_list]

In [None]:
ints = [4,0,5,6,10]

In [None]:
apply_to_list(ints, lambda x: x*2)

[8, 0, 10, 12, 20]

Отсортируем коллекцию строк по количеству различных букв в строке:

In [None]:
strings = ['foo','card','bar','aaaaa','abab']

Для этого передаем лямбда-функцию методу списка sort:

In [None]:
strings.sort(key= lambda x: len(set(list(x)))) #ключ сортировки — лямбда-функция, которая сортирует количество уникальных элементов списка по возрастанию
strings

['aaaaa', 'foo', 'abab', 'bar', 'card']

In [None]:
strings.sort(key = lambda x: len(x)) #ключ сортировки — длина строки
strings

['foo', 'bar', 'abab', 'card', 'aaaaa']

In [None]:
strings.sort(key = lambda x: (x[0],x[1])) #ключ сортировки — первые две буквы
strings

['aaaaa', 'abab', 'bar', 'card', 'foo']

# **Каррирование: фиксирование части аргументов**

*Каррированием* в информатике называется порождение новых функций из существующих путем *фиксирования некоторых аргументов*. Рассмотрим функцию, складывающую два числа:

In [None]:
def add_numbers(x,y):
  return x+y

На ее основе можно создать новую функцию одной переменной `add_five`, которая прибавляет к своему аргументу `5`:

In [None]:
add_five = lambda y: add_numbers(5,y) #фиксируем x, функция теперь имеет один аргумент (y)
add_five(10)

15

Говорят, что второй аргумент функции `add_numbers` *каррирован* (фиксирован). Стандартный модуль `functools` упрощает эту процедуру за счет функции `partial`:

In [None]:
from functools import partial
add_five = partial(add_numbers,5) #фиксируем функцией partial один из аргументов

# **Генераторы**

Наличие единого способа обхода последовательностей, например, объектов в списке или строк в файле, — важная особенность Python. Реализована она с помощью протокола *итератора*, общего механизма, наделяющего объекты свойством итерируемости. Например, при обходе (итерировании) словаря получаем хранящиеся в нем ключи:

In [None]:
some_dict = {'a':1,'b':2,'c':3}
for key in some_dict: #пытается создать итератор (счетчик) из some_dict
  print(key)

a
b
c


*Генератор* — простой способ конструирования итерируемого объекта. Если обычная функция выполняется и возвращает единственное значение, то генератор "лениво" возвращает последовательность значений, приостанавливаясь после возврата каждого в ожидании запроса следующего. Чтобы создать генератор, нужно вместо `return` использовать ключевое слово `yield`:

In [None]:
def squares(n=10): #задаем функцию
  print('Generating squares from 1 to {0}'.format(n ** 2)) #выдаем красивый текст
  for i in range(1,n+1):
    yield i**2

Только после запроса элементов генератор начинает выполнять свой код:

In [None]:
for x in squares(): #счетчик, который выводит последовательность чисел по функции-генератору
  print(x,end = ' ')

Generating squares from 1 to 100
1 4 9 16 25 36 49 64 81 100 

**Генераторные выражения**

Еще более лаконичный способ создать генератор — воспользоваться *генераторным выражением*. Такой генератор аналогичен списковому, словарному и множественному включениям. Чтобы его создать, нужно заключить выражение, которое выглядит как списковое включение, в круглые скобки вместо квадратных:

In [None]:
gen = (x**2 for x in range(21)) #создает функцию, вычисляющую квадраты в заданном промежутке
list(gen)

[0,
 1,
 4,
 9,
 16,
 25,
 36,
 49,
 64,
 81,
 100,
 121,
 144,
 169,
 196,
 225,
 256,
 289,
 324,
 361,
 400]

Генераторные выражения можно использовать внутри любой функции Python, принимающей генератор:

In [None]:
sum(x**2 for x in range(101)) #суммирует все квадраты от 0 до 100

338350

In [None]:
dict((i,i**2) for i in range(11)) #преобразует кортеж вида (число, квадрат числа от 0 до 10) в словарь

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81, 10: 100}

**Модуль itertools**

Стандартный библиотечный модуль `itertools` содержит набор генераторов для многих общеупотребительных алгоритмов. Так, генератор `groupby` принимает произвольную последовательность и функцию, он группирует соседние элементы последовательности по значению, возвращенному функцией:

In [None]:
import itertools
first_letter = lambda x: x[0] #заводим лямбда-функцию, которая находит первый символ каждого элемента списка
names = ['Alan', 'Adam', 'Wes', 'Will', 'Albert', 'Steven']
for letter,names in itertools.groupby(names, first_letter):
  print(letter,list(names),sep = ': ')

A: ['Alan', 'Adam']
W: ['Wes', 'Will']
A: ['Albert']
S: ['Steven']


Некоторые полезные функции `itertools`:

In [None]:
combinations(iterable, k) #генерирует последовательность всех возможных k-кортежей, составленных из элементов iterable, без учета порядка
permutations(iterable, k) #генерирует последовательность всех возможных k-кортежей, составленных из элементов iterable, с учетом порядка
groupby(iterable,keyfunc) #генерирует пары (ключ,субитератор) для каждого уникального ключа
product(*iterables, repeat=1) #генерирует декартово произведение входных итерируемых величин в виде кортежей, как если бы использовался вложенный цикл for

# **Обработка исключений**

*Обработка ошибок*, или *исключений*, в Python — важная часть создания надежных программ. В приложениях для анализа данных многие функции работают только для входных данных определенного вида. Например, функция float может привести строку к типу числа с плавающей точкой, но если формат строки заведомо некорректен, то завершится с ошибкой `ValueError`:

In [None]:
float('1.2345')

1.2345

In [None]:
float('aaa') #код с ошибкой

Требуется написать версию `float`, которая не завершится с ошибкой, а возвращает поданный на вход аргумент. Это можно сделать, обернув вызов `float` блоком `try/except`:

In [None]:
def attempt_float(x): #создаем функцию
  try:
    return float(x) #пробуем записать float формат данных
  except:
    return x #если не получилось, возвращаем значение

In [None]:
attempt_float('5.456')

5.456

In [None]:
attempt_float('meme')

'meme'

Например, мы хотим использовать возраст респондентов и целочисленно поделить его на 10, чтобы разделить на поколения. Если в данных есть ошибка, вернем `1000000` и, таким образом, чтобы отдельно рассмотреть значения с `1000000`:

In [None]:
def attempt_int(x): 
  try:
    return int(x)//10
  except:
    return 1000000

In [None]:
ages = ['20','30','35','Ivan','64','18.5']
new_ages = list(map(attempt_int,ages))
new_ages

[2, 3, 3, 1000000, 6, 1000000]

Для перехватывания исключений нескольких типов следует написать кортеж (скобки обязательны)

In [1]:
def attempt_float(x): #создаем функцию
  try:
    return float(x) #пробуем записать float формат данных
  except (TypeError, ValueError): #прописываем типы ошибок
    return x #если не получилось, возвращаем значение

In [2]:
attempt_float([1,2])

[1, 2]

Иногда исключение не нужно перехватывать, но какой-то код должен быть выполнен вне зависимости от того, возникло исключение в блоке `try` или нет. Для этого служит предложение `finally`:

In [None]:
f = open(path, 'w')
try:
  wrtite_to_file(f)
finally:
  f.close() #вне зависимости от результата кода файл закроется

Здесь описатель файла `f` закрывается в *любом случае*. Можно написать код, который исполняется, только если в блоке `try` не было исключения. Для этого используется ключевое слово `else`:

In [None]:
f = open(path, 'w')
try:
  wrtite_to_file(f) #пытаемся сделать операции над файлом
except:
  print('Ошибка') #если операция не получается, выводится "Ошибка"
else:
  print('Все хорошо') #если операция получается, выводится "Все хорошо"
finally:
  f.close() #вне зависимости от результата файл закрывается