# Что помните с прошлого занятия?

Расскажите какие идеи есть по решению задачи с прошлого семинара про испарение жидкости?
Нужно ли разбирать по округлению задачки?

# Сколько памяти занимает объект в Python

https://stackoverflow.com/questions/449560/how-do-i-determine-the-size-of-an-object-in-python

https://docs.python.org/3/library/sys.html#sys.getsizeof

https://towardsdatascience.com/the-strange-size-of-python-objects-in-memory-ce87bdfbb97f

In [4]:
import sys

In [5]:
sys.getsizeof(1)

28

In [7]:
sys.getsizeof('')

49

In [8]:
a = ''

print(sys.getsizeof(a))

a += '12'

print(sys.getsizeof(a))

49
51


In [10]:
a = [[1, 2, 3, 4, 5], 5, 6]
sys.getsizeof(a)

80

In [11]:
sys.getsizeof(a[0])

104

Посмотрим, сколько памяти у нас занимали list и array с числами

In [12]:
list_gen = range(1000)
list_ints = [i for i in range(1000)]

sys.getsizeof(list_ints), sys.getsizeof(list_gen)

(8856, 48)

In [15]:
def gen(n):
  i = 0
  while i < n:
    yield i
    i += 1
sys.getsizeof(gen(1000))

104

In [16]:
list_gen_ints = [i for i in gen(1000)]
sys.getsizeof(list_gen_ints)

8856

Еще немного про геренаторы. Можно их представить двумя программами, которым вы даете разный приоритет исполнения. Похожим образом работает планировщик выполнения процессов Операционной Системы. Будем разбирать подробнее в блоке про асинхрон.

In [39]:
import random

def function_1():
    i = 0
    while True:
        yield i
        i += 1

def function_2():
    j = 0
    while True:
        yield j
        j += 1

func1_gen = function_1()
func2_gen = function_2()
for _ in range(20):
  prob = random.random()
  if prob < 0.25:
    value = next(func1_gen)
    print(f"Function 1 generated: {value}")
  elif prob < 0.50:
    value = next(func2_gen)
    print(f"Function 2 generated: {value}")
  else:
    print("No function called in this round")

No function called in this round
Function 1 generated: 0
No function called in this round
Function 1 generated: 1
No function called in this round
Function 1 generated: 2
Function 1 generated: 3
Function 2 generated: 0
No function called in this round
No function called in this round
No function called in this round
Function 1 generated: 4
No function called in this round
Function 2 generated: 1
Function 1 generated: 5
No function called in this round
No function called in this round
No function called in this round
Function 2 generated: 2
No function called in this round


# Functions

Functions -- "first class objects":
    
    - создаются в рантайме
    - присваиваются переменным или элементам в структурах данных
    - используются как аргумент в других функциях
    - возвращаются как результат работы функций
    
Ровно так же работают, например, string, list и прочие рассмотренные ранее примеры.

В других языках функции могут быть обьектами второго класса, тогда что то из вышеперечисленных свойств к ним не применяется.

## Базовый синтаксис

### Аргументы и вызов

In [None]:
def func():  # name and function arguments
    '''
    Doc string to be shown in help
    '''
    print("Hello, world!") # body

func()

Hello, world!


In [None]:
help(func)

Help on function func in module __main__:

func()
    Doc string to be shown in help



In [None]:
func.__doc__

'\n    Doc string to be shown in help\n    '

Пример простейшей функции с аргументами

In [44]:
def func(a, b):
    print(a + b)

func([1, 2], [4, 4])

[1, 2, 4, 4]


In [41]:
func('d', 3)

ddd


Аргументы функций могут иметь дефолтные значения

In [13]:
def func(a, b='value'):
    print(a, b)

In [14]:
func(1)  # value -- дефолтное значение

1 value


При вызове функции мы оперируем понятиями `positional argument` и `keyword argument`

In [15]:
func(b='another_value', a=10)  # Вызвали с использованием keyword arguments

10 another_value


In [16]:
func(10, 'another_value')  # Вызвали с использованием positional arguments

10 another_value


В сигнатуре можно явно задать необходимость указания аргументов по имени, * оператор

In [47]:
def func(a, b='value', *, c='important named arg'):
    print(a, b, c)

In [49]:
func(1, 'val', 'val2')

TypeError: func() takes from 1 to 2 positional arguments but 3 were given

In [50]:
func(1, 'val')

1 val important named arg


In [None]:
func(1, 'val', c='val2')

1 val val2


/ оператор говорит о том, что все аргументы перед должны быть позиционными, можно использовать вместе с *

In [54]:
def func(a, b='value', /, *, c='important named arg'):
    print(a, b, c)

func(1, 'val', c='val2')

1 val val2


In [51]:
def func(a, b='value', /, c='important named arg'):
    print(a, b, c)

In [2]:
func(1, 'val', 'val2')

1 val val2


In [3]:
func(1, b='val', c='val2')

TypeError: func() got some positional-only arguments passed as keyword arguments: 'b'

### return

Функция может возвращать что-то

In [25]:
def func(a, b='value', *, c='important named arg'):
    return a, b

In [26]:
a = 1
b = 'some_val'

c, d = func(a, b)

In [None]:
id(a), id(b)

(140181943425328, 140179002586800)

In [None]:
id(c), id(d)

(140181943425328, 140179002586800)

In [42]:
def change_list(a: list):
    a.append(10)

In [41]:
b = [1, 2, 3]

a = change_list(b)

a, b

([1, 2, 3, 10], [1, 2, 3, 10])

# Лямбды

In [52]:
b = 5

a = lambda x: x*b

a(2)

10

## Рекурсия

Функция может вызывать саму себя внутри. Классический пример -- вычисление факториала

In [None]:
def fact(n):
    if n == 0:
        return 1  # условие выхода из рекурсии
    return n * fact(n - 1)

In [None]:
fact(4)

24

In [None]:
1 * 2 * 3 * 4

24

[pythontutor.com](https://pythontutor.com/visualize.html#code=def%20fact%28n%29%3A%0A%20%20%20%20if%20n%20%3D%3D%201%3A%0A%20%20%20%20%20%20%20%20return%201%0A%20%20%20%20return%20n%20*%20fact%28n-1%29%0A%20%20%20%20%0Aprint%28fact%285%29%29%0A%0Adef%20fact_stack%28n%29%3A%0A%20%20%20%20stack%20%3D%20%5B%5D%0A%20%20%20%20result%20%3D%201%0A%20%20%20%20%0A%20%20%20%20while%20n%20%3E%201%3A%0A%20%20%20%20%20%20%20%20stack.append%28n%29%0A%20%20%20%20%20%20%20%20n%20-%3D%201%0A%20%20%20%20%0A%20%20%20%20while%20stack%3A%0A%20%20%20%20%20%20%20%20result%20*%3D%20stack.pop%28%29%0A%20%20%20%20%0A%20%20%20%20return%20result%0A%0Aprint%28fact_stack%285%29%29&cumulative=false&heapPrimitives=true&mode=edit&origin=opt-frontend.js&py=311&rawInputLstJSON=%5B%5D&textReferences=false) - рекурсию можно представить как стек
напоминалка про head и teil рукурсии - но в питоне, к сожалению, нет оптимизации

In [1]:


def fact_stack(n):
    stack = []
    result = 1

    while n > 1:
        stack.append(n)
        n -= 1

    while stack:
        result *= stack.pop()

    return result

fact_stack(4)


24

Closure - захват переменных из окружения, можно продебажить в pythontutor.com - посмотреть что происходит с х

https://en.wikipedia.org/wiki/Closure_(computer_programming)

In [55]:
def f1(x):
  def f2():
    return x
  return f2
f1(5)()

5

Еще можно управлять видимостью c nonlocal

In [56]:
def outer_func():
    a = 5
    def inner_func():
        nonlocal a
        a = 10
    inner_func()
    print(a)

outer_func()

10


### Variable scope

In [58]:
def func_1(a):
    print(a)
    print(second_va_)

func_1(42)

42


NameError: name 'second_va_' is not defined

Логичная ошибка

In [59]:
second_va_ = 1337

func_1(42)

42
1337


А что если?

In [61]:
b = 6
def func_2(a):
    print(a)
    print(b)
    b = 9


func_2(42)

42


UnboundLocalError: local variable 'b' referenced before assignment

Заметим, что 42 у нас напечаталось! Почему не напечаталось b?

Потому что в Python предполагается, что локальные переменные объявлены внутри функции. И поскольку объявление b внутри функции есть, мы получаем ошибку.

Как можно поправить?

In [13]:
b = 6
def func_fixed(a):
    global b
    print(a)
    print(b)
    b = 9
func_fixed(42)

42
6


Но be careful!

In [None]:
b

9

## Практика

### Бинпоиск

Поиск элемента в отсортированном по неубыванию массиве.

1. Считаем индекс середины массива
2. Если элемент по этому индексу и есть искомый, то возвращаем индекс
3. Если средний элемент < искомого, то производим такой же поиск в правой половине массива
4. Если средний элемент > искомого, то ищем в левой половине

In [15]:
def binary_search_recursive(arr, low_ind, high_ind, val):

    # base case

    print(low_ind, high_ind, arr[low_ind: high_ind])

    if high_ind >= low_ind:
        mid_ind = (high_ind + low_ind) // 2

        if val == arr[mid_ind]:
            return mid_ind

        elif arr[mid_ind] > val:
            return binary_search_recursive(arr, low_ind, mid_ind - 1, val)

        else:
            return binary_search_recursive(arr, mid_ind + 1, high_ind, val)

    else:
        return -1

In [62]:
a = list(range(20))

binary_search_recursive(a, 0, len(a) - 1, 32)

0 19 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18]
10 19 [10, 11, 12, 13, 14, 15, 16, 17, 18]
15 19 [15, 16, 17, 18]
18 19 [18]
19 19 []
20 19 []


-1

In [20]:
def binary_search(arr: list, val: int) -> int:

    low_ind = 0
    high_ind = len(arr) - 1

    while high_ind >= low_ind:
        mid_ind = (high_ind + low_ind) // 2

        print(low_ind, high_ind, mid_ind, arr[low_ind: high_ind])

        if arr[mid_ind] > val:
            high_ind = mid_ind - 1

        elif arr[mid_ind] < val:
            low_ind = mid_ind + 1

        else:
            return mid_ind

    return -1

In [21]:
binary_search(a, 12)

0 19 9 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18]
10 19 14 [10, 11, 12, 13, 14, 15, 16, 17, 18]
10 13 11 [10, 11, 12]
12 13 12 [12]


12

### Bisect

https://docs.python.org/3/library/bisect.html

**bisect** -- модуль, в котором реализованы операции по поиску наилучшего идекса вставки элемента в отсортированный массив. Внутри функции реализованы по принципу бинарного поиска по аналогии с алгоритмом, который мы рассмотрели выше

In [23]:
from bisect import bisect_left, bisect_right

def binary_search_bisect(arr, value):
    i = bisect_left(arr, value)
    if i != len(arr) and arr[i] == value:
        return i
    else:
        return -1

In [63]:
arr = [1, 3, 4, 5, 5, 8, 9, 12, 15, 29, 45]
value = 5

print(bisect_left(arr, value)) # непосредственно индекс числа
print(bisect_right(arr, value)) # следующий после числа

3
5


Проверим, насколько использование bisect быстрее, чем обычная проверка за линию

In [30]:
size = 10**6
large_array = [i for i in range(size)]

In [31]:
value = 900000

In [32]:
%%timeit -n 1000
value in large_array

10.1 ms ± 317 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [33]:
%%timeit -n 1000
large_array.index(value)

11.6 ms ± 464 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [34]:
%%timeit -n 1000
binary_search_bisect(large_array, value)

859 ns ± 213 ns per loop (mean ± std. dev. of 7 runs, 1000 loops each)


Некоторые примеры из документации

In [None]:
def index(a, x):
    'Locate the leftmost value exactly equal to x'
    i = bisect_left(a, x)
    if i != len(a) and a[i] == x:
        return i
    raise ValueError

def find_lt(a, x):
    'Find rightmost value less than x'
    i = bisect_left(a, x)
    if i:
        return a[i-1]
    raise ValueError

def find_le(a, x):
    'Find rightmost value less than or equal to x'
    i = bisect_right(a, x)
    if i:
        return a[i-1]
    raise ValueError

def find_gt(a, x):
    'Find leftmost value greater than x'
    i = bisect_right(a, x)
    if i != len(a):
        return a[i]
    raise ValueError

def find_ge(a, x):
    'Find leftmost item greater than or equal to x'
    i = bisect_left(a, x)
    if i != len(a):
        return a[i]
    raise ValueError

### Наибольший общий делитель

$a$, $b$ -- неотрицательные числа. Наибольший общий делитель -- наибольшее число, которое является делителем и $a$, и $b$.  Делитель числа так же делитель остатка от деления.

Существует алгоритм Евклида, который можно писать так:

`gcd(a, b) = a if b = 0`

`gcd(a, b) = gcd(b, a mod b) otherwise`

**Реализация рекурсией**

In [35]:
def gcd_recursive(a, b):
  print(a, b)
  if b == 0:
    return a
  else:
    return gcd_recursive(b, a % b)

In [37]:
gcd_recursive(9, 27)

9 27
27 9
9 0


9

**Реализация циклом**

In [None]:
def gcd(a, b):
    while b!=0:
      a, b = b, a % b
    print(a)

### Проверка на палиндром

A phrase is a palindrome if, after converting all uppercase letters into lowercase letters and removing all non-alphanumeric characters, it reads the same forward and backward. Alphanumeric characters include letters and numbers.

Given a string s, return true if it is a palindrome, or false otherwise.

Напишите функцию проверки, которая принимает в качестве параметра Iterable из предложений и возвращает результат в формате:
`[index of example: is palindrome,...]`

In [None]:
tests = [
    'A nut for a jar of tuna.',
    'Borrow or rob?',
    'Was it a car or a cat I saw?',
    '''Dennis, Nell, Edna, Leon, Nedra, Anita,
    Rolf, Nora, Alice, Carol, Leo, Jane, Reed,
    Dena, Dale, Basil, Rae, Penny, Lana, Dave,
    Denny, Lena, Ida, Bernadette, Ben, Ray, Lila,
    Nina, Jo, Ira, Mara, Sara, Mario, Jan, Ina,
    Lily, Arne, Bette, Dan, Reba, Diane, Lynn,
    Ed, Eva, Dana, Lynne, Pearl, Isabel, Ada, Ned,
    Dee, Rena, Joel, Lora, Cecil, Aaron, Flora,
    Tina, Arden, Noel, and Ellen sinned.''',
    'Murder for a jar of red rum.'
]

In [None]:
from typing import Callable, Iterable


def is_palindrome(s: str) -> bool:
    # your code
    pass

def check_tests(pal_func: Callable, tests: Iterable[str]) -> list:
    # your code
    pass

In [None]:
%%timeit -n 1000

''.join([letter for letter in tests[3].lower() if letter.isalpha()])

13.3 µs ± 3.89 µs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)


In [None]:
%%timeit -n 1000

''.join(filter(str.isalpha, tests[3].lower()))

8.32 µs ± 3.08 µs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)


## Higher order functions

Что-то там было про функции в качестве аргументов и возвращаемых значений...

Рассмотрим пример на списке, у которого элементы имеют разные типы

In [7]:
sample_list = [1, [2.], '3 ', (4, 5), 8.]
sample_list

[1, [2.0], '3 ', (4, 5), 8.0]

Как бы нам его посортировать...

In [65]:
sorted(sample_list)

TypeError: '<' not supported between instances of 'list' and 'int'

Не понятно, как сравнивать разные типы. Но теперь-то мы можем создавать свои функции, давайте исправим. Какие варианты вы можете предложить? Давайте рассуждать? (hint:  isinstance проверяет тип переменной)

In [12]:
def my_key(element):
    return str(element) # можно еще проше

print(list(map(my_key, sample_list)))
sorted(sample_list, key=my_key)

['1', '[2.0]', '3 ', '(4, 5)', '8.0']


[(4, 5), 1, '3 ', 8.0, [2.0]]

Еще один пример -- функция **map**

In [11]:
int_texts = [1, 2, 4]
_list = [a for a in map(lambda x : x+1, int_texts)]
_list

[2, 3, 5]

Возвращает объект, по которому нужно проитерироваться

In [13]:
for elem in map(int, int_texts):
    print(elem)

1
2
4


In [14]:
int_texts = '377'

Помог перезапуск окружения colab. (Error : 'list' object is not callable)

In [15]:
list(map(int, int_texts))

[3, 7, 7]

## Annotations

В Python можно назначить метаданные для аргументов и выходного значения функции

In [80]:
def test_str(s: str, max_len: int = 10, name: str = 'test') -> int:
    some_var = 0
    other_var = '10'
    return s[:max_len]

Аннотации могут быть любым выражением. Они игнорируются во время выполнения программы. Доступ можно получить через поле `__annotations__`

In [81]:
test_str.__annotations__

{'s': str, 'max_len': int, 'name': str, 'return': int}

Эту информацию могут использовать декораторы, ide или библиотеки (например, для проверки синтаксиса)

In [83]:
from inspect import signature

In [84]:
sig = signature(test_str)

In [85]:
sig.return_annotation

int

In [None]:
sig.parameters.values()