# Функции, обработка ошибок. Ссылочная модель данных, изменяемые типы. Срезы и работа со строками
В этом уроке мы познакомимся с новым объектом в Python - функциями - и узнаем, как они упрощают жизнь программистам.
После изучения функций мы увидим, как вся последующая работа станет проще и структурированнее.

Затем мы заглянем немного глубже в структуры, которые изучали на прошлом уроке. Такие знания здорово выручают: на практике часто совершаются досадные ошибки из-за незнания тех или иных деталей конструкций. Более конкретно, мы узнаем, что такое срезы списка, ссылочная модель, изменяемые и не изменяемые типы данных. Наконец, применим эти знания для продвинутой работы со строками.

## Функции
### Зачем нужны функции
Функции в Python выполняют схожую функцию, что и указания в устной речи.
Когда мы говорим "Возьми на столе список покупок и сходи за ними в магазин", человек сразу понимает набор действий, который надо совершить:
1. Взять листик со стола и положить себе (листик был бы _аргументом_ функции).
2. Сходить в магазин.
3. Для каждого товара из листика - найти в магазине и положить в корзину.
4. Подойти к кассе и рассчитаться.
5. Вернуться домой.
6. Отдать покупки (покупки были бы _возвращаемым значением_ функции).

При этом человеку не надо каждый раз объяснять, как ходить в магазин - достаточно один раз (обычно это происходит в возрасте 6-7 лет) объяснить, как покупать в магазине.

Сохранение действий в одно имя может здорово помочь в разработке:
1. Оно уменьшает количество строк кода. Если один раз человеку объяснить, как ходить в магазин, то потом не нужно снова тратить на это слова.
2. Оно разбивает код на логические блоки, каждый из которых четко говорит, что он делает. Если мы видим в тексте, что идет описание "как ходить в магазин", то мы можем пропустить это описание, если уже знаем, как ходят в магазин, либо же читать только этот кусок, если хотим разобраться. Главное - нам не придется читать весь текст вместе с другими командами и пытаться понять целиком и сразу, что там делается.

Давайте рассмотрим игрушечный пример:

In [2]:
def say_hello(name):
    print(f'Hello, {name}')

user_name = input('Please enter your name:')  # в input() можно передать строку - ее Питон выведет, когда будет просить ввести строку
say_hello(user_name)

Please enter your name:Алексей
Hello, Алексей


В функции мы попросили выполнить ровно одно действие: напечатать `Hello, {name}` с подстановкой значения переменной `name` (для подстановки использовали f-strings, о которых говорили в первой лекции).

**Важный момент**: мы нигде до этого не объявляли переменную `name`, но тем не менее уже используем ее в коде функции. Почему так можно, разберемся немного позже, пока только подметим.

### Как работать с функциями
Жизнь функции состоит из двух этапов: объявления и вызова.
Объявление функции - это описание имени функции, всех входных значений, всех совершаемых функцией действий и возвращаемого результата (_в примере отсутствует_, будет ниже).
Функция объявляется через слово `def`. Его синтаксис такой:
```python
def function_name(argument_1, argument_2, ...):
    action_1
    action_2
    ...
    return value_to_return
```

In [3]:
# Учим Python определять, четное число или нет
def is_even(number):  # объявляем по синтаксису выше. Обратите внимание на двоеточие в конце - оно обязательно
    # Все команды внутри функции пишутся через табуляцию - как и в циклах.
    # Это не удивительно, поскольку команды, которые выполняет функция,
    # формируют блок - точно такой же блок, что мы видели в циклах и условиях if
    if number % 2 == 0:
        return True
    else:
        return False


print(is_even(2))  # вызываем функцию, передавая на вход один аргумент 2
print(is_even(9))

True
False


Почему же функция "видит" переменную под другим именем?

Дело в том, что при вызове функций в нее передаются _аргументы_, которые внутри функции будут видны как переменные.
В примере выше функция `is_even` принимает один _аргумент_ `number` (такое имя мы указали на этапе _объявления_ функции) и теперь внутри `is_even` (и только там!) можно писать код, считая переменную `number` заданной.
Когда мы далее _вызываем функцию_, ей будет передано число `2` как первый аргумент - и далее функция будет "видеть" число `2` как переменную с именем `number`.

Кстати, мы ранее вызывали функцию `print()` по схожим правилам :)

### Чем функции отличаются от циклов
На первый взгляд кажется, что для набора повторяющихся операций уже есть циклы. 
Но функции несколько про другое: вместо того, что повторять набор операций сразу, они "сохраняют" этот набор под некоторым именем, чтобы дальше можно было по этому имени выполнить набор целиком. В примере с магазином мы все 6 операций сохранили бы под именем "сходи в магазин" и затем периодически бы вызывали этот набор через фразу "сходи в магазин".

In [4]:
# Попробуем подсчитать прибыль по вкладу, как это делали в первом занятии, но через функции

def balance_after_a_year(init_sum, interest_rate):
    """
    Через тройные кавычки (одинарные или двойные - без разницы, но рекомендуют двойные)
    можно писать комментарии к функции, по которым потом можно генерировать документацию через сторонние инструменты.
    Про документацию мы еще поговорим, а пока что запомним, что сюда лучше писать, что делает функция.
    
    Подсчет баланса через 1 год
    """
    return init_sum * (100 + interest_rate) / 100

def full_profit(init_sum, interest_rate, years):
    """Подсчет баланса через years лет"""
    final_sum = init_sum
    for i in range(years):
        final_sum = balance_after_a_year(final_sum, interest_rate)
    return final_sum - init_sum

In [5]:
full_profit(1000, 5, 2)

102.5

### Аргументы по-умолчанию
В примере с балансом выше мы объявили в функции `full_profit`, что она принимает три аргумента.
Но это одновременно стало и обузой: теперь этой функции надо передавать обязательно три аргумента.

Смотрите сами, сейчас мы получим ошибку:

In [8]:
full_profit(1000, 5)

TypeError: full_profit() missing 1 required positional argument: 'years'

Не пугайтесь красного цвета, все не так плохо! Вы только что увидели свою первую ошибку (или _исключение_, как их могут называть в других языках программирования).

В ошибке пишут обычно ее имя (это `TypeError` в последней строке, выделено красным), затем через двоеточие пишут текст ошибки, который должен помочь понять, что пошло не так. У нас это `full_profit() missing 1 required positional argument: 'years'` - функции `full_profit` не хватает одного аргумента `years` (мы передали 2 аргумента, а ожидается 3).

К ошибкам надо привыкать, на первых порах они будут у вас встречаться сплошь и рядом :)
Не бойтесь читать ошибки, в нх очень часто прячется подсказка, как ее исправить! Обычно самая информативная часть находится в конце текста ошибки, начинать лучше оттуда.

Но как же нам быть, если мы хотим вызывать `full_profit` с двумя аргументами? Можно задать _значение по-умолчанию_. Скажем, если `years` не указано, то пусть будет 1 год.

In [9]:
# Посмотрите на years=1 - это единственное изменение
def full_profit(init_sum, interest_rate, years=1):
    """Подсчет баланса через years лет"""
    final_sum = init_sum
    for i in range(years):
        final_sum = balance_after_a_year(final_sum, interest_rate)
    return final_sum - init_sum

In [12]:
full_profit(1000, 5)

50.0

Значения по-умолчанию можно выставить хоть всем аргументам. Но учтите, что если вы начали с какой-то переменной раздавать значения по-умолчанию, то теперь придется это делать для всех (такая особенность Python).

In [16]:
def official_greeting(first_name='Василий', middle_name='Иванович'):
    print(f'Здравствуйте, {first_name} {middle_name}')


# Тройные кавычки обозначают многострочный комментарий - их можно не только для документации функции использовать
# Таким способом можно изолировать "опасный" код
# Попробуйте убрать тройные кавычки и посмотрите, как возникает ошибка.
# Не забудьте вернуть кавычки :)
"""
# Код ниже не работает, т.к. middle_name должно иметь значение по-умолчанию, поскольку fist_name перед ним уже имеет
# Напишет ошибку "non-default argument follows default argument"
def official_greeting(first_name="Василий", middle_name):
    print("Этот код не работает")
"""

official_greeting()
official_greeting("Иван", "Николаевич")

Здравствуйте, Василий Иванович
Здравствуйте, Иван Николаевич


### Вызов в вызове и call stack
Одна функция может в ходе выполнения вызвать другую функцию.
В этом случае выполнение "внешней" функции приостановится, Python запомнит ее состояние и уйдет выполнять "внутреннюю" функцию.
Когда внутренняя функция закончит выполняться, Python вернется ко "внешней" функции и продолжит ее выполнять с того места, где остановился.

In [22]:
def inner_func(m):
    print('считаем a')
    a = m // 2
    a = a * a
    print('возращаем a')
    return a

def outer_func(num):
    num += 2
    print(num)
    print('входим во внутреннюю функцию')
    k = inner_func(num)
    print('печатаем k')
    print(k, num)
    
outer_func(20)
# call stack

22
входим во внутреннюю функцию
считаем a
возращаем a
печатаем k
121 22


## Ошибки: как с ними дружить
Мы уже встречались с ошибками, но пока только умеем их читать глазами.
Уметь обрабатывать ошибки важно, когда речь заходит о построении надежных программ - каждый случай должен быть рассмотрен и программа не должна вылетать с необработанными ошибками.

В принципе, exceptions в Python не являются "ошибками" в обычном понимании. Это скорее исключительные ситуации - когда программа не знает, что делать в возникшей ситуации, она выбрасывает исключение и прекращает свое выполнение, чтобы не навредить системе дальнейшими командами. Отсюда и название exception (с англ. _исключение_).

Как же работать над ошибками в Python?

### Базовый синтаксис
Ошибки можно и нужно обрабатывать. Для этого в Python есть конструкция `try/except`:

In [28]:
try:  # двоеточие в конце обязательно
    1 / 0  # табом отбиваем "опасные" команды
except ZeroDivisionError:  # после except пишем имя ошибки. Встроенных ошибок много, их надо искать в документации
    print('Попытались делить на ноль, я поймал ошибку и не дал пройти дальше')
    
print('Пишем строку после опасного кода, т.к. программа не упала')

Попытались делить на ноль, я поймал ошибку и не дал пройти дальше
Пишем строку после опасного кода, т.к. программа не упала


Обратите внимание: опять блоки, обозначенные табами. Почему блоки? Давайте по порядку.

`try` определяет блок из "опасных" операций - тех, что могут выкинуть ошибку.
Затем идет `except` (его нельзя пропустить), в котором пишется имя ошибки, которую он будет "ловить", а затем начинается блок операций, которые будут выполнены при поимке _именно этой же_ ошибки. В примере блок `except` ловит ошибку `ZeroDivisionError` и только ее.

Список встроенных в Python названий ошибок можно найти в [документации](https://docs.python.org/3/library/exceptions.html#concrete-exceptions).

### Обработка нескольких ошибок
Как видите, `except` ловит одну ошибку. Что же делать, если ошибок может вылететь несколько? Объявлять несколько блоков `except`:

In [34]:
a = [1, 0, 3]  # в пустом списке нет a[2], a[1], a[0] - никого из них
# В try/except ловится первая вылетевшая ошибка. Раскомментируйте пример ниже
# a = [0, 1]  # тут все ок со вторым print, но a[2] не существует, поэтому получим IndexError
# А тут уже не ок с ZeroDivisionError, поэтому первый print пройдет, а второй - нет
# a = [1, 0, 1]
try:
    # Если элемента нет, то вылетит ошибка
    # ошибка зовется IndexError, очень часто встречается на практике
    print(a[2])
    print(a[0] / a[1])
except IndexError:
    print('такого элемента нет')
except ZeroDivisionError:
    print('Где-то делят на 0')

Где-то делят на 0


Как видите, если в `try` закинуть много кода, то часть может пройти, а часть нет - и неясно будет, где конкретно что упало.
Поэтому есть рекомендация оборачивать в `try/except` минимальный объем кода - только тот, который действительно может упасть.


### Ленивый вариант (не рекомендуется)
В `except` есть возможность не указывать ошибку. Но делать так **крайне не рекомендуется**, потому что может привести к очень неочевидным ошибкам дальше в программе. Если вылетит ошибка, которую вы никак не ожидали на этапе разработки, то она просто "проглотится" такой конструкцией `except` и программа будет дальше выполняться как ни в чем не бывало - даже если ошибка критична и дальнейшее выполнение может причинить вред аппаратуре, людям, частной информации и т.п.

In [38]:
try:
    1 / 0
except:  # не нужно так делать, стоит всегда указывать ошибку, которую ловим
    print('Произошла какая-то ошибка')

Произошла какая-то ошибка


Обработку ошибок можно комбинировать с функциями, циклам и другими блоками

In [42]:
def get_second_element(array):
    try:
        return array[1]
    except IndexError:
        print('### Элемент не найден, печатаю все значения для разбора причин: ###')
        for elem in array:
            print(f'### {elem} ###')
        return None
    
print(f'Коррректный вызов: вернул {get_second_element((1, 2, 3))}')
print(f'Некорректный вызов: вернул {get_second_element([1])}')
# Сначала print изнутри функции, потом снаружи - ведь мы должны подсчитать get_second_element([1]), прежде чем его отдать в print()

Коррректный вызов: вернул 2
### Элемент не найден, печатаю все значения для разбора причин: ###
### 1 ###
Некорректный вызов: вернул None


## Ссылочная модель данных
Хорошо, функции могут принимать значения из других переменных себе на вход и проделывать какие-то операции над ними.
Предположим, мы редактируем переменную внутри функции. Что будет с нашими изменениями "снаружи" функции?

Ошибки из-за незнания этого очень легко совершить на начальных этапах. Давайте разбираться на примерах.

### Пример с изменением переменной внутри функции
Практический пример: в банке, где мы работаем, клиент может установить лимит трат на месяц. Пусть у нас есть список уже понесенных трат за месяц. Выставим проверку на каждую покупку клиента: в момент совершения покупки мысленно добавим ее сумму к списку трат, подсчитаем сумму и сравнивим с лимитом. Если получилось меньше - даем добро, иначе отклоняем. Подчеркнем: пока что покупка не совершена, это только прикидка.

In [43]:
def can_purchase(amount, history, limit):
    # Добавим в history покупку
    history.append(amount)
    # Затем просуммируем все элементы в history, сравним с limit и вернем True или False
    return sum(history) <= limit


# Кажется, что обе функции одинаковы. Но так ли это?
limit = 100
history = [50, 40]

# Приходит параллельно два запроса на покупки (ни одну еще не совершил по факту)
# Должно дать добро на покупку, т.к. 90 + 4 <= 100
print(can_purchase(4, history, limit))
# Тоже должно дать добро, т.к. 90 + 7 <= 100
print(can_purchase(7, history, limit))

True
False


Второй вызов вернул `False`, это что-то не то.
Если посмотреть внимательно, то можно увидеть, что 90 + 4 + 7 уже больше 100 - ошибка может быть в этом.

Давайте выведем список:

In [44]:
def can_purchase(amount, history, limit, do_print=False):
    history.append(amount)
    if do_print:
        print(history)
    return sum(history) <= limit


limit = 100
client_history = [50, 40]

print(can_purchase(4, client_history, limit, do_print=True))  # Аргументы можно передавать по имени: явно говорим, что do_print будет равно True
print(can_purchase(7, client_history, limit, do_print=True))

[50, 40, 4]
True
[50, 40, 4, 7]
False


Наша догадка подтвердилась: во втором вызове функции список содержал покупку из первого.

Хм, а если написать так?

In [45]:
def can_purchase(amount, history, limit, do_print=False):
    local_copy = history.copy()  # работаем с копией history
    local_copy.append(amount)
    if do_print:
        print(local_copy)
    return sum(local_copy) <= limit


limit = 100
client_history = [50, 40]

print(can_purchase(4, client_history, limit, do_print=True))
print(can_purchase(7, client_history, limit, do_print=True))

[50, 40, 4]
True
[50, 40, 7]
True


Все стало хорошо! Как же помогло использование `.copy()`?


### Модель памяти в Python
Придется немного обратиться к модели памяти в Python. Начнем с того, что память компьютера _линейна_ - это значит, что данные в ней лежат длинным сплошным списком из нулей и единиц. Никаких двумерных матриц.
Но мы уже знаем, что переменная позволяет записать некоторый объект в определенное имя, не задумываясь об устройстве памяти.
Так, мы записали в `history` список `[50, 40]`. Мы можем в него добавлять элементы, удалять их - и не думать о линейности памяти и ее внутреннем устройстве. Как же достигается эта магия?

В Python для достижения такого удобства оператор присваивания работает в две стадии (упрощенно):
1. Где-то в памяти компьютера резервируется большое место под список и в нем создается список `[50, 40]`. 
2. Где-то еще в памяти компьютера резервируется маленькое место под имя переменной и в него кладется два значения: имя переменной и адрес в памяти, где должно лежать ее фактическое значения. В адрес памяти кладется фактический адрес созданного в п.1 списка.

В результате наша переменная `history` сама по себе не является списком - она является _ссылкой_ на список. Это похоже на ссылки в Интернете: они не содержат в себе сам сайт, но знают его адрес и по ним можно этот сайт открыть.

Теперь разберем наш пример.
Когда мы на входе функции принимали аргумент `history`, мы по факту принимали указатель на список, который уже заранее был создан.
Вызывая `.append()`, мы изменяли список "на месте" - добавляли элемент в тот же объект. После такого объект, на который ссылается `history`, изменяется навсегда - он был `[50, 40]`, а становится `[50, 40, 4]`. И следующий вызов функции уже будет получать на вход ссылку, указывающую на список `[50, 40, 4]`.

Когда же мы делали `.copy()`, то фактически создавали новый объект в другом месте памяти, куда ушли все значения из `history`, и делали все изменения в новом объекте. Когда функция `can_purchase` завершилась, копия `history` уничтожилась - **в конце выполнения функции все созданные в ней переменные уничтожаются**.

### Создать и сразу использовать
Есть третий вариант, который свободен от проблем выше. Оператор `+` не изменяет список - он создает новый, куда входят сначала элементы из списка слева, потом элементы из списка справа. Раз мы не меняем ничего, то и ошибки быть не должно.
Этот новый объект удалится, как только мы выйдем из функции.

"Создать объект и тут же применить над ним операцию, минуя присваивание" - хорошая техника в программировании. Только следите за тем, что результат расчета действительно используется только один раз.

In [46]:
def can_purchase(amount, history, limit):
    # Через + добавим к списку history список из 1 элемент [amount], просуммируем и сравним с limit
    # Результат никуда не сохраняем, а сразу используем
    return sum(history + [amount]) <= limit

limit = 100
client_history = [50, 40]

print(can_purchase(4, client_history, limit))
print(can_purchase(7, client_history, limit))

True
True


## Изменяемые и неизменяемые типы данных
В примере выше мы почуяли, что `.append()` изменяет само место в памяти, где лежит список - он добавляет к нему элемент.

Такую операцию над своими данными поддерживают не все типы. Некоторые типы данных не дают себя менять - как вы их создали в памяти, такими они и останутся до конца. Такие типы данных называются **неизменяемыми** (англ. _immutable_). Их противоположность - изменяемый объект (англ. _mutable object_).

Чтобы сделать изменение в неизменяемых объектах, надо создать новый объект в памяти и положить туда все значения, которые останутся после предлагаемых изменений.

### Сложение через копирование
К примеру, строки в Python неизменяемые, но тем не менее их можно складывать:

In [47]:
sum_string = 'a' + 'b'
sum_string

'ab'

Под капотом это работает так: в памяти выделяется место под новую строку, после чего в это место сначала копируется целиком левая строка, потом правая, и ссылка на результат записывается в `sum_string`.
Поэтому складывать строки не рекомендуется - вы будете тратить лишние вычисления на копирования внутри памяти.

Обычно неизменяемые типы данных не имеют каких-либо функцию или операторов, изменяющих значения, чтобы не путать людей, но могут быть операторы `+` для их сложения (через копирование, как описано выше).

Например, кортеж (_tuple_) неизменяем - и у него нет `.append()`, `.delete()`, `.pop()`. Но складывать их можно: как и со строками, создатся копия, состоящия из объектов слева и справа.

In [58]:
(1, 3) + (2, 5, 8)

(1, 3, 2, 5, 8)

На первый вгляд такие знания кажутся тонкостью, но в реальной разработке незнание этих фактов может привести к просадке в производительности из-за необдуманных копирований.
Мы разберем задачу на это в блоке собеседований.

### Хэш
Есть еще одна причина, почему неизменяемость важна.
Для всех встроенных в Python неизменяемых объектов можно **подсчитать хэш**. Это свойство называется _hashable_, т.е. верно утверждение "tuple is hashable".

Хэш - это некая функция, которая берет на вход объект и считает одно число, причем для разных объектов это число разное.
У хэш-функции есть два главных свойства:
1. Она быстро считается.
2. При малейшем изменении объекта хэш-функция меняется лавинообразно.

Хэш-функции позволяют организовать быстрый поиск и быстрое обращение по элементу, поэтому их использует "под капотом" _словарь_ и _множество_.
Собственно, из-за этого ключом в словаре не может выступать изменяемый объект (например, `list`) - для него нельзя подсчитать хэш.
В прошлом уроке это просто проговорили, теперь же мы знаем причину.

## Срезы
Срез - это кусок из списка или кортежа (вообще всего, что имеет упорядоченные индексы).

Проще показать:

In [59]:
a = [1, 5, 8, 3, 4]
a[2:4]  # забрать элементы с третьего по пятый НЕ включительно (третий, четвертый)

[8, 3]

In [61]:
# если опустить первый аргумент, то будет от начала списка
a[:4]  # по пятый НЕ включительно

[1, 5, 8, 3]

In [62]:
# если опустить второй аргумент, то будет до конца списка
a[2:]

[8, 3, 4]

In [70]:
# нумеровать можно отрицательными числами
# ниже описывается пример, как это будет считаться
# [1, 5, 8, 3, 4]
#  0  1  2  3  4
# -5 -4 -3 -2 -1
#a[1:len(a)-1]
a[1:-1]  # правый конец не включается, поэтому отдаст список со второго по предпоследний элемент

[5, 8, 3]

In [72]:
# Может ничего не попасть
a[-1:-2]

[]

In [73]:
a[-2:-1]

[3]

In [75]:
# Есть еще третий аргумент - это шаг. Его можно пропустить
a[1:4:2]

[5, 3]

In [76]:
a[::2]  # выдаст первый, третий и т.д.

[1, 8, 4]

In [77]:
a[::-1]  # каждый "минус первый" - это каждый первый, только в обратном порядке, т.е. просто развернет лист

[4, 3, 8, 5, 1]

In [78]:
# развернет и через один
a[::-2]

[4, 8, 1]

In [79]:
a[3:1:-1]  # учтите, что в квадратных скобках индексы задаются от неразвернутого листа
# тут левый конец больше правого - при обратном порядке это нормально

[3, 8]

In [81]:
# но при прямом это не сработает (от четвертого элемента до второго при движении вправо нет ничего)
a[3:1]

[]

Срезы работают над кортежами и строками:

In [82]:
(1, 5, 9)[1:]

(5, 9)

In [83]:
'hello'[:1:-1]

'oll'

## Продвинутая работа со строками
В оставшемся куске рассмотрим приемы со строками, которые часто используются на практике.

In [87]:
# проверка символа
'l' in 'hello'

True

In [88]:
# проверка подстроки
print('ll' in 'hello')
print('wl' in 'hello')

True
False


In [89]:
# регистр
print('HeLlO'.lower())
print('hello'.upper())

hello
HELLO


In [91]:
# В нижнем ли регистре
print('hello'.islower())
print('Hello'.islower())

True
False


In [92]:
# В верхнем ли регистре
print('HELLO'.isupper())

True


In [93]:
# Поменять все найденные куски
# .replace(кого, на_что)
'hello llevo'.replace('ll', 'mm')

'hemmo mmevo'

In [94]:
'abra'.replace('zz', 'ww')  # если не нашел, то ничего не делает

'abra'

In [95]:
# Разбить строку по пробелам
'Сегодня чудесный день'.split()

['Сегодня', 'чудесный', 'день']

In [100]:
name, surname = input().split()

Алексей Кожарин


In [101]:
name

'Алексей'

In [102]:
surname

'Кожарин'

In [103]:
# Убрать мусорные пробелы вокруг строки (но не внутри!)
'   После опознания текста много    пробелов     '.strip()

'После опознания текста много    пробелов'

In [107]:
# Хорошо комбинировать split() и strip()
bad_string = '   После опознания текста много    пробелов     '
result = []
for word in (bad_string.strip()).split():
    result.append(word)
    
result

['После', 'опознания', 'текста', 'много', 'пробелов']

Запомните `split()` и `strip()` - с ними часто приходится иметь дело на практике.