# Променливи, разклонения, цикли, типове, функции

## Динамично vs. статично типизиране. Round 1

Python е **динамично-типизиран** език. 

Това означава, че за разлика от статично-типизираните езици (като например C++, Java или C#), променливите (които биват наричани ***имена***/***names***/ в Python) биват проверявани за коректността на типа им при изпълнението на програмата, а не при компилацията (каквато и няма в Python, понеже кодът се интерпретира вместо да се компилира). 

Друга особеност е, че типът на променливата **може да се промени** по време на изпълнението на програмата и също така **не се декларира** предварително.

In [None]:
# I want it to be a number
a = 42

a

: 

In [None]:
# No, sorry, changed my mind, let it be a string
a = "a string"

a

'a string'

In [None]:
# Actually l... You know what? Screw it. I don't need it.
del a

a   # 💥

NameError: name 'a' is not defined

*Note*: Относно Jupyter notebooks (тетрадки):
1. Всичко, което се изпълнява в една клетка, се запазва в паметта на ядрото (kernel) и може да бъде използвано в следващите клетки.
2. Ако последният ред от клетка връща стойност (различна от `None`), тя се показва като резултат от изпълнението на клетката.

Т.е. горните три клетки, изпълнени една след друга, са еквивалентни на следния Python скрипт:

In [None]:
# I want it to be a number
a = 42
print(a)

# No, sorry, changed my mind, let it be a string
a = "a string"
print(a)

# Actually l... You know what? Screw it. I don't need it.
del a
print(a)  # 💥


42
a string


NameError: name 'a' is not defined

*Note 2*: с `print(...)` се пише на изхода на програмата (STDOUT), а с `input(...)` се чете от входа (STDIN).

## Какви типове има?

### Числа

Съществуват три основни вградени типа, които описват числови стойности: **int**, **float** и **complex**.

* `int` - цели числа
* `float` - реални числа (с плаваща запетая)
* `complex` - комплексни числа

И за трите типа са дефинирани аритметичните оператори `+`, `-`, `*`, `/`, както и `**` (степенуване).

In [None]:
whole = -42
fraction = 0.999
imag = 3 + 2j  # this is the complex number (3 + 2i)

1j ** 2

(-1+0j)

⚠️ Резултатът на `/`, приложен между два `int`-а е `float`. Всички от останалите оператори запазват резултата в `int`.

In [None]:
4 / 2

2.0

In [None]:
1 / 3

0.3333333333333333

За целочислени сметки имаме и операторите `//` и `%` (целочислено деление и остатък от деление).

`//` е и операторът, който трябва да ползваме, ако искаме при делението на два `int`-а да получим отново `int`.

In [None]:
7 / 2

3.5

In [None]:
7 // 2

3

In [None]:
7 % 2

1

Hey Siri, how much is 0 divided by 0?

In [None]:
0 / 0

ZeroDivisionError: division by zero

С безкрайността обаче нямаме такъв проблем (`math.inf` е специален `float`, който има за цел да бъде еквивалентен на $\infty$ откъм аритметични операции):

In [None]:
from math import inf

1 / inf

0.0

Размерът на `int` не е фиксиран както в повечето статично-типизирани езици, при които програмистът избира дали да използва 32-битов, 64-битов или някаква друга размерност за целочислена променлива. Тук integer overflow се избягва като динамично се изчислява размерът на паметта, нужен за съхранението на число с произволна големина.

In [None]:
from sys import getsizeof

print("size of 1 is",            getsizeof(1),            "bytes")
print("size of 2 ** 16 is",      getsizeof(2 ** 16),      "bytes")
print("size of 2 ** 30 is",      getsizeof(2 ** 30),      "bytes")
print("size of 2 ** 30 ** 5 is", getsizeof(2 ** 30 ** 5), "bytes")

size of 1 is 28 bytes
size of 2 ** 16 is 28 bytes
size of 2 ** 30 is 32 bytes
size of 2 ** 30 ** 5 is 3240028 bytes


Обърнете внимание, че изписаните резултати са в байтове, а не битове. Причината числото $ 1 $ да заема цели 28 байта например е понеже в python всичко е обект и си има своите член-данни и методи, дори и типове като `int`.

От друга страна, `float` винаги заема фиксиран брой байтове. Причината за това е, че прецизността е константна - до 18 знака след десетичната запетая. В случай, че не ни е достатъчна такава прецизност, могат да се използват типове от някои вградени и не-вградени библиотеки, като например `decimal.Decimal`, с който можем да боравим с до 28 знака след десетичната запетая.

Целочислени литерали могат да се задават и в двоична, осмична и 16-ична бройни системи, използвайки като префикс съответно `0b`, `0o` и `0x`:

In [None]:
a = 0b1010
b = 0o12
c = 0xA

print("a =", a)
print("b =", b)
print("c =", c)

a = 10
b = 10
c = 10


### Низове

Текстовите низове в Python имат тип `str`. Те могат да бъдат с произволна дължина, като в литерал се обграждат или с `"`, или с `'` (без значение).

In [None]:
s1 = "abra"
s2 = 'cad'

s1 + s2 + s1 + '!'

'abracadabra!'

Многоредови низови литерали биват задавани с тройни кавички, също както специалните многоредови коментари, наричани `docstring`-ове (повече за тях в следваща лекция):

In [None]:
multiple_rows_text = """This text contains multiple rows.
This is the second one.
Here comes the third one.
Back and fourth."""

multiple_rows_text

'This text contains multiple rows.\nThis is the second one.\nHere comes the third one.\nBack and fourth.'

При едноредови низове, ако редът става прекалено дълъг можем и да разделим низа на части така:

In [None]:
too_long = "This is a very very very very very very very " \
           "very very very very very very very very very " \
           "long snake 🐍."

too_long

'This is a very very very very very very very very very very very very very very very very long snake 🐍.'

Друг вариант, ако не ви харесват обратните наклонени черти (line-continuation characters) и нагласената индентация, е да се ползват скоби.

*Note*: тези два начина са приложими не само за дълги низове, а и за дълги редове като цяло, например аритметични/булеви изрази, comprehension-и и т.н.

In [None]:
also_too_long = (
    "This is a very very very very very very very "
    "very very very very very very very very very "
    "long snake 🐍."
)

also_too_long

'This is a very very very very very very very very very very very very very very very very long snake 🐍.'

Подържат се Unicode символи, но трябва да се внимава при взимането на дължината им (например емоджитата с флагове кодират двоен брой байтове, което доведе до [това](https://www.theverge.com/2018/10/11/17963230/twitter-emoji-character-limit-bug-fixed-diversity)):

In [None]:
moyai_and_china = "🗿🇨🇳"

print("the length of it =", len(moyai_and_china))
# never ignore the red flags...

the length of it = 3


Escape символът както обикновено е `\`. Някои специални символи по този начин написани са:
* `\n` - нов ред (Line Feed, ASCII стойност 13 (0x0D))
* `\t` - хоризонтална табулация (ASCII стойност 9)
* `\r` - Carriage Return, ASCII стойност 10 (0x0A)

С `\'` или  `\"` се запазват и кавичките в случай, че видът кавичка съвпада с тази, ограждаща низа. 

Самата обратно-наклонена черта се въвежда с `\\`.


In [None]:
s = 'Is it readable?\nYesn\'t\n'

s

"Is it readable?\nYesn't\n"

Ако знаем 16-ичния код на конкретен Unicode символ, можем да го запишем след `\u`:

In [None]:
rip_lemmy = "A\u2660"

rip_lemmy

'A♠'

В случай пък че ни трябва конкретен байт в низа, чийто 16-ичен код знаем, може да се използва `\x`. Например `\x00` е null-byte, a `\x1B` - `ESC`.

In [None]:
not_your_c_string = "You can safely have \x00 in the middle of a string"

print(not_your_c_string)

You can safely have   in the middle of a string


Относно ASCII кодове, съществуват две функции за преобразуване *от* и *във* кода на символа: `chr` и `ord` съответно.

In [None]:
print("ord('A') =", ord("A"))
print("chr(65) =", chr(65))

# don't worry about not understanding the following line,
# it's just to catch a glimpse of the mighty Python's power
alphabet_kebab = "-".join(chr(c) for c in range(ord("A"), ord("Z")+1))

print(alphabet_kebab)


ord('A') = 65
chr(65) = A
A-B-C-D-E-F-G-H-I-J-K-L-M-N-O-P-Q-R-S-T-U-V-W-X-Y-Z


Съществува и тип за низ от *байтове* - `bytes`. Има си и литерал, който е като този на `str`, но просто с едно `b` преди отварящите кавички.

Конвертирането му от и до `str` става единственo чрез подбиране на правилен енкодинг (UTF-8 или друг) и може да хвърли грешка.

In [None]:
bytes_literal = b"You can use ASCII characters as well as \x5C\x78 syntax, e.g. \x00\x01, etc."
bytes_literal

b'You can use ASCII characters as well as \\x syntax, e.g. \x00\x01, etc.'

In [None]:
type(bytes_literal)

bytes

In [None]:
str_from_bytes = bytes_literal.decode("utf-8")
str_from_bytes

'You can use ASCII characters as well as \\x syntax, e.g. \x00\x01, etc.'

In [None]:
type(str_from_bytes)

str

In [None]:
bytes_from_str = str_from_bytes.encode("utf-8")
bytes_from_str

b'You can use ASCII characters as well as \\x syntax, e.g. \x00\x01, etc.'

In [None]:
deadbeef = b"\xDE\xAD\xBE\xEF"
deadbeef.decode("utf-8")

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbe in position 2: invalid start byte

Интерполацията на низове е възможна по три основни начина:
* Форматиране с `%` (old-school)
* `str.format` (от Python 3 насам, back-port-нат към Python 2.7)
* f-strings (от Python 3.6 насам)

%-formatting:

In [None]:
"The %s programming language was created in %d by %s." % ("C", 1972, "Dennis Ritchie")

'The C programming language was created in 1972 by Dennis Ritchie.'

str.format:

In [None]:
from math import pi

"{} only knows the first 5 decimal places of π: {:.5f}.".format("MC Ton4ou", pi)

'MC Ton4ou only knows the first 5 decimal places of π: 3.14159.'

In [None]:
chinese_template = "由于{reason}，{subject}被屏蔽"
english_template = "{subject} is blocked due to {reason}"

subject = "@gosho_the_dove"
reason = "spam"

print(chinese_template.format(subject=subject, reason=reason))
print(english_template.format(subject=subject, reason=reason))

由于spam，@gosho_the_dove被屏蔽
@gosho_the_dove is blocked due to spam


f-strings:

In [None]:
from time import time

name = "bot.py"

f"Program {name} finished execution at {time():.2f} unix time."

'Program bot.py finished execution at 1726320488.99 unix time.'

In [None]:
some_variable = 0xdeadbeef

f"Debug info: {some_variable=}"  # the '=' here puts the name as well as the value

'Debug info: some_variable=3735928559'

Низовете са колекции и могат да бъдат използвани като такива. Повече за тях в следваща лекция, засега може да ги мислим като масиви от символи.

In [None]:
s = "Hello"

length = len(s)     # the length
first_char = s[0]  # the first character (element @ index 0)

print(f"{length=}, {first_char=}")

for char in s:
    print("===" + char + "===")


length=5, first_char='H'
===H===
===e===
===l===
===l===
===o===


Обработката на низове става сравнително лесно чрез предоставените ни вградени функции и методи:

`replace`:

In [None]:
"Deutschland über alles!".replace("ü", "ue")

'Deutschland ueber alles!'

`split`:

In [None]:
post_hastags = "#nofilter #nomakeup #feltcutemightdeletelater #f4f #follow4follow"

# first remove all '#', then split using a space as a delimiter into a list of strings
# (those operators can be chained)
tags_list = post_hastags.replace("#", "").split(" ")

# `tags_list` is of type `list` - more on this type later
tags_list

['nofilter', 'nomakeup', 'feltcutemightdeletelater', 'f4f', 'follow4follow']

`join`:

In [None]:
# `join` accepts an iterable (like a `list`) as an argument
# and glues all the elements together using the string it's called on
"; ".join(tags_list)

'nofilter; nomakeup; feltcutemightdeletelater; f4f; follow4follow'

`lower`, `upper`, `capitalize`:

In [None]:
"SpOnGeBoB squarepants".lower()

'spongebob squarepants'

In [None]:
"SpOnGeBoB squarepants".upper()

'SPONGEBOB SQUAREPANTS'

In [None]:
"SpOnGeBoB squarepants".capitalize()

'Spongebob squarepants'

### Булеви

Тип `bool` има две възможни стойности: `True` и `False`.

За разлика от повечето други езици, вместо `!`, `||` и `&&` използваме `not`, `or` и `and`. Както си и трябва.

In [None]:
t = True
f = not t

f

False

In [None]:
not f

True

In [None]:
t or f

True

In [None]:
t and f

False

In [None]:
t and not f

True

⚠️ `or` и `and` всъщност не връщат винаги `bool`, а стойността на първия операнд отляво надясно, след който каквито и да са стойностите на другите резултатът остава същия:

In [None]:
1 or 2 or 3

1

In [None]:
1 and 2 and 3

3

In [None]:
1 or 0 or 3

1

In [None]:
1 and 0 and 3

0

Можем да се възползваме от това в кода ни с изрази и функции, чието изпълнение зависи от предходния резултат:

In [None]:
def func1():
    print("Function 1 is being executed.")
    return True

def func2():
    print("Function 2 is being executed.")
    return True

if func1() or func2():
    print("OK")

Function 1 is being executed.
OK


### `None`

`None` е стойност (и тип), обозначаваща липса на стойност (🤔).

*Note*: Когато една функция **не** преминава през `return` израз, тя всъщност връща `None` като резултат.

In [None]:
result_of_print = print("The print function isn't intended to return a specific value.")
print(result_of_print)

The print function isn't intended to return a specific value.
None


### `type`
`type` е функция, която ни връща типа на дадена стойност:

In [None]:
type(42)

int

Но всичко в Python е обект, включително и функциите:

In [None]:
type(print)

builtin_function_or_method

Следователно, `type` също си има тип:

In [None]:
type(type)

type

😵‍💫

In [None]:
type(type(type(type(type(type)))))

type

### `tuple`, `list`, `set`, `dict`: четирите вградени колекции

* `tuple`: наредена $n$-торка (още **кортеж**), която **не може да се променя** (immutable) 
* `list`: **списък** от елементи, който **може да се променя** (mutable)
* `set`: **множество** от елементи без наредба и повторения (HashSet) (mutable)
* `dict`: **речник** от ключове и стойности (HashMap) (mutable)

Елементите и на четирите колекции могат да бъдат от различни типове.

In [None]:
t = (1, "b", False)  # tuples are with () or without any brackets
t

(1, 'b', False)

In [None]:
t = 1, "b", False
t

(1, 'b', False)

In [None]:
l = [1, "b", False]  # lists are with []
l

[1, 'b', False]

In [None]:
s = {1, "b", False}  # sets are with {}
s

{1, False, 'b'}

In [None]:
d = {"a": 1, "b": 2, "c": 3, "幸": None}  # dicts are also with {}
d

{'a': 1, 'b': 2, 'c': 3, '幸': None}

⚠️ `{}` е празен `dict`, а не празен `set`. За празен `set` се ползва конструктора `set()`.

In [None]:
type({})

dict

⚠️ Понеже нормалните скоби са и... нормални скоби, които обособяват израз и връщат стойността му, `tuple` с един елемент се дефинира със запетайка след елемента. Освен това няма нужда от обграждащи скоби при задаване на `tuple` с повече от нула елементи.

In [None]:
one_element_tuple = (42,)
one_element_tuple

(42,)

In [None]:
one_element_tuple_again = 42,
one_element_tuple_again

(42,)

*Въпрос:* Как да създадем празен `tuple`? 🤔

Кога кое да ползваме? Rule of thumb:
* `tuple` - когато искаме функция да върне няколко наредени неща / списък, който не може да бъде променян и може да бъде хеширан /  анонимен `dataclass` (проста структурка с няколко елемента)
* `list` - когато искаме нареден списък, който да може да бъде променян и може да има повторения
* `set` - когато наредбата не ни трябва и нямаме повторения / когато искаме да проверим за принадлежност на елемент към множество ($ O(1) $ vs. $ O(n) $ за `list`)
* `dict` - когато искаме да асоциираме дадени ключове с дадени стойности

Ключовата дума `in` е полезна при работа с такива колекции. Тя връща `bool` който ни казва дали даден елемент се среща вътре:

In [None]:
impostor = 1j
squad = [0, 1j, 2, 3, 4, 5]

impostor in squad

True

In [None]:
members = {"A": 0, "B": 1j, "C": 2, "D": 3, "E": 4, "F": 5}

# `in` searches in the dictionary's keys, not values
impostor in members

False

In [None]:
impostor in members.values()

True

In [None]:
impostor in members.keys()

False

`in` може да се ползва и за `str`:

In [None]:
"mile" in "smiles"

True

Дължината им се взима с `len`:

In [None]:
len([0, 1, 2])

3

In [None]:
len((0, 1, 2))

3

In [None]:
len({1, 1, 1, 1, 1, 2, 3})

3

In [None]:
len("abracadabra")

11

`tuple` и `list` поддържат индексиране, като за `tuple` това е само read-only:

In [None]:
t = ("a", "b", "c")
t[0]

'a'

In [None]:
l = ["a", "b", "c"]
l[0]

'a'

In [None]:
l[0] = "A"
l

['A', 'b', 'c']

In [None]:
t[0] = "A"  # 💥

TypeError: 'tuple' object does not support item assignment

По същия начин става взимането/записването на стойност в `dict`. Съществува и метода `get` който ни предоставя по-безопасен начин при достъпването на несъществуващи ключове:

In [None]:
d = {}  # an empty dictoinary
d

{}

In [None]:
d["a"] = 1
d

{'a': 1}

In [None]:
d["a"]

1

In [None]:
d.get("a")

1

In [None]:
print(d.get("b"))  # using `print`` because Jupyter doesn't show `None` as output

None


In [None]:
d.get("b", "default value")

'default value'

In [None]:
d["b"]  # 💥

KeyError: 'b'

*Pro tip*: `collections.defalutdict` е `dict` със зададена стойност по подразбиране, която се връща при липсващ ключ.

## Mutable vs Immutable

Имената в Python *сочат* към някаква стойност в паметта.

In [None]:
name = 1
name += 1000

name

1001

Горното парче код не променя стойността на `1`, а кара `name` да сочи към нова стойност - `1001`.

Това е така, понеже `int` е **immutable** тип (такъв който не може да си променя стойността). Immutable са още всички числа, низове, `tuple`, `True`, `False`, `None` и [т.н.](https://www.youtube.com/watch?v=pNc1kboPuDU&list=PLkROH3Eqs0T8cWGQnJ2ZfLE5y9yohLk3x)

Mutable типовете пък са `list`, `set`, `dict` и почти всичко останало.

In [None]:
a = 1
b = a
b += 1

print("a = ", a)
print("b = ", b)

a =  1
b =  2


In [None]:
l1 = [1, 2]
l2 = l1
l2.append(3)

print("l1 = ", l1)
print("l2 = ", l2)

l1 =  [1, 2, 3]
l2 =  [1, 2, 3]


Важно е да се отбележи също, че валидни **ключове** за `dict` и елементи за `set` са само **immutable** стойности. По-точно, тези, които имат имплементация на хеширане (методът `__hash__`).

In [None]:
l = [1, 2]
d = {l: 1}  # 💥

TypeError: unhashable type: 'list'

### Unpacking

Unpacking-ът ни позволява да извлечем всички елементи от колекции в няколко различни други имена.

In [None]:
firstname, lastname = "Вовеки", "Веков"

tup = 1, 2, 3
a, b, c = tup

print(f"{firstname=}, {lastname=}")
print(f"{a=}, {b=}, {c=}")

firstname='Вовеки', lastname='Веков'
a=1, b=2, c=3


Pro tip: размяната на стойностите на две променливи в Python не изисква да дефинираме трета:

In [None]:
a, b = 1, 2
a, b = b, a

print(f"{a=}, {b=}")

a=2, b=1


За да посочим име, в което да се присвоят всички останали неприсвоени елементи от колекцията, която unpack-ваме, използваме астериск `*` (няма нищо общо с pointer, спокойно). Типът на такава променлива винаги става `list`.

In [None]:
head, *tail = [1, 2, 3, 4, 5]
first, *inbetween, last = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

print(f"{head=}, {tail=}")
print(f"{first=}, {inbetween=}, {last=}")


head=1, tail=[2, 3, 4, 5]
first=1, inbetween=[2, 3, 4, 5, 6, 7, 8, 9], last=10


Това може да бъде приложимо при слепване на колекции, като за `dict` ползваме `**`:

In [None]:
original_ingredients = ["water", "salt", "sugar"]
new_ingredients = ["flour", "eggs", "butter", *original_ingredients]

new_ingredients

['flour', 'eggs', 'butter', 'water', 'salt', 'sugar']

In [None]:
studio_band = {"GUITAR": "Vasko", "MICROPHONE": "Ceca"}
live_band = {"BASS": "Pesho", "DRUMS": "亚历山大", **studio_band}

live_band

{'BASS': 'Pesho', 'DRUMS': '亚历山大', 'GUITAR': 'Vasko', 'MICROPHONE': 'Ceca'}

## Конвертиране между типове

В C/C++/Java трябва да ползваме `atoi`, `atof`, `strtol`, `strtof`, `Integer.parseInt`, `Float.parseFloat` и т.н. за конвертиране на числа от низове и обратно.

В С/С++/С# имаме и синтаксис от рода на `(int)...`, `(float)...`, `(string)...` и т.н.

Тук няма нужда от това.

Просто използваме *конструкторите* на типовете (да припомним, че в Python всичко е обект, и си има конструктор):

In [None]:
str(42)

'42'

In [None]:
int("42")

42

In [None]:
int(42.69)

42

In [None]:
float(42)

42.0

In [None]:
bool(42)

True

In [None]:
bool(0)

False

In [None]:
list("абвгдежзийклмнопрстуфхцчшщъьюя")

['а',
 'б',
 'в',
 'г',
 'д',
 'е',
 'ж',
 'з',
 'и',
 'й',
 'к',
 'л',
 'м',
 'н',
 'о',
 'п',
 'р',
 'с',
 'т',
 'у',
 'ф',
 'х',
 'ц',
 'ч',
 'ш',
 'щ',
 'ъ',
 'ь',
 'ю',
 'я']

In [None]:
tuple([1, 2, 3])

(1, 2, 3)

In [None]:
list((1, 2, 3))

[1, 2, 3]

In [None]:
set([1, 1, 1, 2, 3, 3, 3, 3, 3])

{1, 2, 3}

In [None]:
dict([("a", 1), ("b", 2), ("c", 3)])

{'a': 1, 'b': 2, 'c': 3}

## Блокове

В Python блоковете от код се отделят не чрез къдрави скоби, а с индентация.

За съжаление на хората, предпочитащи скоби, това няма да се промени в бъдещи версии на езика:

In [None]:
from __future__ import braces

SyntaxError: not a chance (3905450354.py, line 1)

Важно е да се отбележи, че всеки блок започва след двуеточие и всеки негов ред започва с определен брой интервали (или една табулация) по-навътре от предходния блок. За да бъде валдна индентацията трябва да е консистентна в целия файл, в противен случай ще се хвърли `IndentationError`. Общоприето е в Python да си използват 4 интервала за тази цел.

In [None]:
if True:
    print("This line is ok")
        print("But this one is not")

IndentationError: unexpected indent (1618609151.py, line 3)

Side note: едноредови блокове могат да се запишат и на същия ред след двуеточието. Често срещана конвенция обаче е да не се пишат по този начин.

In [None]:
if True: print("This will run")

This will run


## Контролни структури

### `if`

In [None]:
age = 21

if age == 18:
    print("Barely legal")
elif age < 18:
    print("Sorry, you are not allowed.")
else:
    print("You good.")

You good.


Няма нужда от скоби около условията (и не пишете такива, за да не ви се караме за глупости). 

Едно условие се оценява на `False`, когато стойността му е `False`, `None`, `0`, `0.0`, `0j`, `''`, `b''`, `[]`, `{}` и всички празни контейнери. Всички други стойности се оценяват до `True`.

Съществува и едноредова версия на `if` с `else`, която има за цел да служи като тернарния оператор в повечето езици:

In [None]:
num = 420
statement = "odd" if num % 2 == 1 else "definitely not odd"

statement

'definitely not odd'

Операторите за сравнение са `==`, `!=`, `<`, `>`, `<=`, `>=`. Съществува и `<>`, който е просто различен запис на `!=`.

В Python е възможно комбинирането им. Например `1 < 2 and 2 < 3` може да бъде записано като `1 < 2 < 3`.

In [None]:
code = 404

if 100 <= code < 200:
    print("Informational response")
elif 200 <= code < 300:
    print("OK response")
elif 300 <= code < 400:
    print("Redirection")
elif 400 <= code < 500:
    print("Client error")
elif 500 <= code < 600:
    print("Server error")
else:
    print("Not a valid HTTP status code")

Client error


Ключовата дума `is` сравнява по референция, докато `==` сравнява по стойност:

In [None]:
a = [1, 2, 3]
b = [1, 2, 3]

if a == b:
    print("a and b are equal")
else:
    print("a and b are not equal")

if a is b:
    print("a points to the same thing as b")
else:
    print("a does not point to the same thing as b")

a and b are equal
a does not point to the same thing as b


Side note: сравнение с `None` може да бъде направено и по двата начина, но за четимост се ползва по-често `is`.

In [None]:
result = None

if result is not None:  # clear 'nuff, innit 
    print(f"We got a result, it is {result}.")
else:
    print("No result.")

No result.


⚠️ Трябва да се внимава винаги с очакваната прецизност на числата с плаваща запетая:

In [None]:
if 0.1 + 0.2 == 0.3:
    print("Естествено, че ще влезе тука")
else:
    print(f"Да, ама не: 0.1 + 0.2 == {0.1 + 0.2}")

Да, ама не: 0.1 + 0.2 == 0.30000000000000004


### `while`

In [None]:
num = 0
while num < 20:
    num += 1
    current_output = f"{num}: "

    if num % 3 == 0 and num % 5 == 0:
        current_output += "FizzBuzz"
    elif num % 3 == 0:
        current_output += "Fizz"
    elif num % 5 == 0:
        current_output += "Buzz"

    print(current_output)

1: 
2: 
3: Fizz
4: 
5: Buzz
6: Fizz
7: 
8: 
9: Fizz
10: Buzz
11: 
12: Fizz
13: 
14: 
15: FizzBuzz
16: 
17: 
18: Fizz
19: 
20: Buzz


`continue` прекъсва изпълнението на текущaта итерация и продължава със следващата.

`break` прекъсва изпълнението на цикъла.

In [None]:
n = 0
while True:
    if n > 100:
        break

    n += 1

    if n % 3 != 0 or n % 5 != 0:
        continue
    
    print(n)

15
30
45
60
75
90


Възможно е да се напише и `else` блок след тялото на `while`-a. Тогава той ще се изпълни само ако условието в `while`-a стане `False` без да бъде прекъсвано изпълнението на цикъла чрез `break` или `return`:

In [None]:
# try re-running the cell with and without "queen" in the list
stekchi = ["king", "emperor", "tsar", "queen", "kaiser", "sultan", "pharaoh", "khan"]

while stekchi:  # while the list is not empty
    last_element = stekchi.pop()  # pop() both removes and returns an element, by default the last one

    if last_element == "queen":
        print("I want to break free!")
        break

    print(f"There is a {last_element}.")
else:
    print("No queen found.")


There is a khan.
There is a pharaoh.
There is a sultan.
There is a kaiser.
I want to break free!


### `for`

`for`-циклите в Python итерират върху дадена колекция:

In [None]:
ingredients = ["eggs", "milk", "flour", "sugar"]

for i in ingredients:
    print(f"I will need {i}")

I will need eggs
I will need milk
I will need flour
I will need sugar


In [None]:
ingredients_price = {"eggs": 0.98, "milk": 1.23, "flour": 1.59, "sugar": 0.88}

for ingr, price in ingredients_price.items():  # IMPORTANT: .items() returns a tuple of (key, value)
    print(f"We got {ingr} for ${price}")

We got eggs for $0.98
We got milk for $1.23
We got flour for $1.59
We got sugar for $0.88


*Tip*: Питонският начин при обхождане да боравим и с индекса, и със самата стойност на колекцията, е чрез `enumerate`:

In [None]:
for i, ingr in enumerate(ingredients):  # enumerate() returns a tuple of (index, element)
    print(f"Ingredient {i+1}: {ingr}")

Ingredient 1: eggs
Ingredient 2: milk
Ingredient 3: flour
Ingredient 4: sugar


`range` ни позволява да създадем колекция от числа от началото до края на даден интервал през определена стъпка:

In [None]:
for i in range(20):
    print(i, end=" ")

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 

In [None]:
for i in range(10, 20):
    print(i, end=" ")

10 11 12 13 14 15 16 17 18 19 

In [None]:
for i in range(10, 20, 3):
    print(i, end=" ")

10 13 16 19 

In [None]:
for i in range(20, 10, -3):
    print(i, end=" ")

20 17 14 11 

По същия начин както при `while`-циклите, `else` може да бъде използван и с `for`:

In [None]:
for n in range(2, 20):
    for x in range(2, n):
        if n % x == 0:
            print(f"{n} = {x} * {n // x}")
            break
    else:
        print(f"{n} is a prime number")


2 is a prime number
3 is a prime number
4 = 2 * 2
5 is a prime number
6 = 2 * 3
7 is a prime number
8 = 2 * 4
9 = 3 * 3
10 = 2 * 5
11 is a prime number
12 = 2 * 6
13 is a prime number
14 = 2 * 7
15 = 3 * 5
16 = 2 * 8
17 is a prime number
18 = 2 * 9
19 is a prime number


### `match` (version 3.10+ !!!)

В Python `switch-case` нарочно няма. От версия 3.10 насам обаче съществува `match`, което е по-скоро подобно на `switch` или `match` във функционалните езици за програмиране. С него можем да съпоставяме структурата на изрази в различни случаи, които ни интересуват, елиминирайки нуждата от вложени `if`-ове, проверки за типа на променливи, сложни проверки за размерности и структура на колекции и др. Това е мощно ново свойство на езика, за което повече информация може да намерим [тук](https://realpython.com/python310-new-features/#structural-pattern-matching).

## Функции

In [None]:
def f(x):
    return x ** x

f(8)

16777216

`def` е ключовата дума, която започва дефинията на функция. След името и списък от аргументите в скоби, следва блок с код, който се изпълнява при извикването ѝ.

При достигане на `return` или крaя на блокът от код, изпълнението на функцията прекъсва. Във втория случай или когато след `return` няма нищо посочено, функцията връща `None`.


In [None]:
def procedure():
    print("I am Procedure.")
    print("I shall be the reigning lord of the kingdom of side effects.")
    print("I don't return anything.")
    print("...Or do I?")

result = procedure()
print(result)


I am Procedure.
I shall be the reigning lord of the kingdom of side effects.
I don't return anything.
...Or do I?
None


In [None]:
def greeting(name):
    if not name:
        return
    
    print(f"Hello, {name}!")

greeting("")
greeting("John Smith")

Hello, John Smith!


> "Можем и рекурсия, ако можем рекурсия" - *Валери Божинов*

(btw GitHub Copilot каза, че е от [тука](https://xkcd.com/244/), което е close enough (are we obsolete already dammit))

In [None]:
def factorial(n):
    if n <= 0:
        return 1
    
    return n * factorial(n - 1)


factorial(69)  # https://www.youtube.com/watch?v=kw6l_uTakRA

171122452428141311372468338881272839092270544893520369393648040923257279754140647424000000000000000

Аргументите на функциите могат да имат стойности по подразбиране:

In [None]:
def add(a, b=0):
    return a + b

In [None]:
add(1)

1

In [None]:
add(1, 2)

3

Аргументите на фунцкиите в Python могат да се подават по два начина: 
1. **позиционeн** (positional) (определени от реда, в който са подадени)
2. **именован** (keyword) (определени от името на аргумента, следвано от `=`) 

След именован аргумент не можем да подадем позиционен.

In [None]:
def my_custom_print(text="", terminator="\n", capitalize=False):
    new_text = text.capitalize() if capitalize else text
    print(new_text, end=terminator)

my_custom_print()
my_custom_print("hello")
my_custom_print("hello", capitalize=True)
my_custom_print("hello", "!\n", capitalize=True)
my_custom_print("hello", terminator="!\n", capitalize=True)
my_custom_print("hello", capitalize=True, terminator="!\n")
my_custom_print(capitalize=True, terminator="!\n", text="hello")
# my_custom_print(capitalize=True, "\t")  # 💥 positional argument can't follow keyword argument



hello
Hello
Hello!
Hello!
Hello!
Hello!


Можем да укажем функцията да приема произволен брой позиционни и именовани аргументи, като използваме `*` и `**` съответно (споко, това отново няма нищо общо с пойнтъри!). 

`*args` и `**kwargs` са само конвенция, можем да използваме каквито и да е имена, но е важно да се отбележи, че `*` и `**` са задължителни.

`*args` е `tuple` с всички позиционни аргументи, които не са били консумирани от другите аргументи.

`**kwargs` е `dict` с всички именовани аргументи, които не са били консумирани от другите аргументи.


In [None]:
def variadic_args(fixed_arg1, fixed_arg2, *args, **kwargs):
    print(f"{fixed_arg1=}")
    print(f"{fixed_arg2=}")
    print(f"{args=}")
    print(f"{kwargs=}")

variadic_args(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, name="Pesho", age=20)


fixed_arg1=1
fixed_arg2=2
args=(3, 4, 5, 6, 7, 8, 9, 10)
kwargs={'name': 'Pesho', 'age': 20}


**Pro tip**: Можем да забраним позиционните или именованите аргументи преди/след дадено място чрез вмъкване на `/` или `*` в сигнатурата на функцията. Как точно:

Ако имаме 
```python
def func(a, b, c, /, d, e, f, *, g, h, i):
    ...
```
това означава, че:
* `a`, `b` и `c` могат да бъдат подадени само позиционно
* `d`, `e` и `f` могат да бъдат подадени както позиционно, така и именовано
* `g`, `h` и `i` могат да бъдат подадени само именовано

In [None]:
def submit_experiment(experiment_name, *, environment_name, user_name):
    # everything after the * MUST BE provided as a keyword argument
    print(f"Experiment {experiment_name} submitted by {user_name} in {environment_name} environment.")

submit_experiment("GPT-6", environment_name="Azure ML", user_name="OpenAI")
submit_experiment("BgGPT", user_name="INSAIT", environment_name="unknown")  # notice the order
submit_experiment("LandcoreGPT", "FMI", "AJ")  # 💥

Experiment GPT-6 submitted by OpenAI in Azure ML environment.
Experiment BgGPT submitted by INSAIT in unknown environment.


TypeError: submit_experiment() takes 1 positional argument but 3 were given

In [None]:
def c_function(_a, _b, _c, /):
    return _a + _b + _c

print(c_function(1, 2, 3))
print(c_function(1, 2, _c=3))  # 💥

6


TypeError: c_function() got some positional-only arguments passed as keyword arguments: '_c'

## Обхвати на видимост

Всякo име може да бъде свързанo със стойност (binding). Съществуват операции, които променят свързването, като `=`. 

Свързването на име със стойност може да се проверява с две функции, връщащи речници: `locals` и `globals`, които пазят стойностите на всички имена в локалния и в глобалния обхват на видимост съответно.

Едно име дефинирано в локален обхват (scope) не се вижда от глобалния такъв:

In [None]:
global_one = 1

def foo():
    local_one = 2
    print(locals())


foo()
print(globals()["global_one"])  # `print(globals())` will not have a very pretty output in the Jupyter notebook but you can try it
print(globals()["local_one"])

{'local_one': 2}
1


KeyError: 'local_one'

Всеки блок от код си има своя област на видимост, в която стоят локално дефинираните имена.
Ако една функция не може да намери дадена променлива в локалния си scope, търси в обграждащия (глобалния) за променлива със същото име:

In [None]:
global_one = 1

def foo():
    print(global_one)

foo()

1


По подразбиране пренасочването на имена става в локалния scope.
Използването на ключовата дума `global` позволява пренасочването на глобални имена. Това обаче въобще не е добра практика.

In [None]:
global_one = 1

def foo():
    global_one = 2
    print(global_one)
    print(locals())

foo()

print(globals()["global_one"])

2
{'global_one': 2}
1


Аргументите на функциите отиват в `locals` речника, достъпен от тялото им (съответно не и извън него):

In [None]:
def fn(x, y, *args, **kwargs):
    print(locals())

fn(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, name="Pesho", age=20)

{'x': 1, 'y': 2, 'args': (3, 4, 5, 6, 7, 8, 9, 10), 'kwargs': {'name': 'Pesho', 'age': 20}}


В случай, че имаме вложени блокове, ключовата дума `nonlocal` позволява пренасочване на име, дефинирано в обграждащ блок (за разлика от `global`, където името е дефинирано в глобалния обхват). Също както `global`, изполването му е лоша практика.

**Pro tip**: няма нужда да "декларираме" празна променлива преди даването ѝ на стойност в `if` (стига всички пътища да дават стойност), например:

In [None]:
def some_function(x):
    # няма нужда тука преди if-a да пишем например
    # result = ""

    if x:
        result = f"{x} is truethy"
    else:
        result = f"{x} is falsy"

    return result

print(some_function([]))
print(some_function([0]))

[] is falsy
[0] is truethy


# Обектно-ориентирано програмиране

## Основни принципи
1. Енкапсулация
2. Абстракция
3. Наследяване
4. Полиморфизъм

Обектно-ориентираното програмиране се основава на използването на класове от обекти, които обменят съобщения помежду си. В Python използваме ключовата дума `class`, за да започнем дефиницията на клас:

In [None]:
class ExampleClass:
    pass

(ключовата дума `pass` обозначава празен блок (еквивалентно на `{}` в езиците, използващи скоби за scope))

Инстанции на класа можем да създаваме чрез синтаксис подобен на извикването на функция със същото име. Новосъздадените обекти отиват в динамичната памет и по подразбиране когато искаме да `print`-нем информация за тях Python ни показва адреса в паметта, на който се намират, както и типа им (класа):

In [None]:
example_object = ExampleClass()
print(example_object)

example_object_2 = ExampleClass()
print(example_object_2)

<__main__.ExampleClass object at 0x113bed6a0>
<__main__.ExampleClass object at 0x112dbbc40>


`is` сравнява дали два обекта съвпадат, т.е. ще върне `False`, когато адресите им в паметта са различни. Операторът `==` пък не е дефиниран за горния клас и затова и неговата стойност засега ще бъде `False` (по премълчаване се дефинира чрез `is`):

In [None]:
print(f"{example_object is example_object_2 = }")
print(f"{example_object == example_object_2 = }")

example_object is example_object_2 = False
example_object == example_object_2 = False


Горният клас с име `ExampleClass` така дефиниран е празен - не притежава нито член-данни, нито методи. Добре е да се знае, обаче, че поради динамичния характер на езика, такива могат да бъдат добавяни (и отнемани) по всяко време (както като част от инстанцията, така и като част от класа). Достъпът до атрибути и методи става чрез точка `.`:

In [None]:
example_object.example_property = "I am an attribute of this instance only"
print(f"{example_object.example_property = }")

ExampleClass.example_shared_property = "I am a shared/static attribute"
print(f"{ExampleClass.example_shared_property = }")
print(f"{example_object.example_shared_property = }")
print(f"{example_object_2.example_shared_property = }")

del example_object.example_property
print(f"{example_object.example_property = }")  # 💥


example_object.example_property = 'I am an attribute of this instance only'
ExampleClass.example_shared_property = 'I am a shared/static attribute'
example_object.example_shared_property = 'I am a shared/static attribute'
example_object_2.example_shared_property = 'I am a shared/static attribute'


AttributeError: 'ExampleClass' object has no attribute 'example_property'

Обикновено обаче искаме да знаем винаги какви член-данни да очакваме от един клас, както и да можем да ги задаваме при конструирането му. Това е възможно, чрез дефинирането на `__init__` метода в класа:

In [None]:
class Point:
    def __init__(self, x, y):
        self.x = x
        self.y = y

Това е първият от редица "dunder" (**d**ouble **under**score - двойна подчертавка) методи (още наричани *магически* методи), които ще разгледаме в лекцията. Този се нарича ***инициализатор*** и приема като първи аргумент новосъздадения обект (по конвенция го кръщаваме винаги `self`, но на теория може да е всякак). Следващите параметри дефинираме и означаваме по наш избор. 

Обърнете внимание, че нарочно не го наричаме *контруктор*, понеже истинският конструктор създава и връща нов обект от даден клас, докато инициализаторът приема този обект и задава начални стойности на член-данните му или изпълнява някакъв друг вид инициализация. Такъв конструктор има и в Python ([`__new__`](https://www.pythontutorial.net/python-oop/python-__new__/)), но на него няма да се спираме подробно.

In [None]:
p1 = Point(2, 3)
p2 = Point(5j, 3.14)

print(f"{p1.x = }, {p1.y = }")
print(f"{p2.x = }, {p2.y = }")

p1.x = 2, p1.y = 3
p2.x = 5j, p2.y = 3.14


Инициализаторът си е функция като всяка други и може да има стойности на параметрите по подразбиране, както и `args` и `kwargs`:

In [None]:
class Coordinate:
    def __init__(self, la=0, lo=0, **kwargs):
        self.latitude = la
        self.longitude = lo
        self.metadata = kwargs

sofia = Coordinate(42.69, 23.420, city="Sofia", country="Bulgaria")
null_island = Coordinate()

print(f"{sofia.latitude = }, {sofia.longitude = }, {sofia.metadata = }")
print(f"{null_island.latitude = }, {null_island.longitude = }, {null_island.metadata = }")

sofia.latitude = 42.69, sofia.longitude = 23.42, sofia.metadata = {'city': 'Sofia', 'country': 'Bulgaria'}
null_island.latitude = 0, null_island.longitude = 0, null_island.metadata = {}


Произволни методи дефинираме по същия начин:

In [None]:
class Path:
    def __init__(self, start, end):
        self.start = start
        self.end = end
    
    def length(self):
        return ((self.start.x - self.end.x) ** 2 + (self.start.y - self.end.y) ** 2) ** 0.5

p1 = Point(0, 3)
p2 = Point(4, 0)

path = Path(p1, p2)
l = path.length()

print(f"{l = }")

l = 5.0


Липсата на `self` като първи аргумент ще е грешка, понеже Python винаги ще се опита да предаде инстанцията на класа като първи параметър на метода:

In [None]:
class A:
    def a():
        pass

A().a()

TypeError: a() takes 0 positional arguments but 1 was given

## Енкапсулация

В Python достъпа до всичко е [публичен](https://www.youtube.com/watch?v=8H1nuRZrE6g).

По конвенция е общоприето `protected` имената да започват с една подчертавка (`_name`), а `private` - с две (`__name`).


In [None]:
class Counter:
    def __init__(self, value=0):
        self._value = value

    def get_value(self):
        return self._value
    
    def increment(self):
        self._value += 1
    
    def decrement(self):
        self._value -= 1

c = Counter(41)
c.increment()

print(f"{c.get_value() = }")
print(f"{c._value = }")


c.get_value() = 42
c._value = 42


При двойните подчертавки обаче съществува една особеност, която ни улеснява в енкапсулирането на private член-данни. Нарича се **name mangling** и представлява добавянето на `_` и името на класа в началото на името на тези член-данни. Тоа се прави с цел замаскиране на атрибута и премахването на достъпа чрез оригиналното му име.

In [None]:
class Counter:
    def __init__(self, value=0):
        self.__value = value  # private access from within the class is OK

    def get_value(self):
        return self.__value

    def increment(self):
        self.__value += 1

    def decrement(self):
        self.__value -= 1


c = Counter(41)
c.increment()

print(f"{c.get_value() = }")
print(f"{c._Counter__value = }")  # name has been mangled
print(f"{c.__value = }")  # 💥 cannot be accessed at its original name


c.get_value() = 42
c._Counter__value = 42


AttributeError: 'Counter' object has no attribute '__value'

Дълга тема за дискусия е колко често и кога да използваме public, private или protected член-данни и методи в Python. За разлика от повечето езици, които проповядват всичко по подразбиране да е максимално скрито, докато не ни се наложи друго, в Python не е толкова често срещана необходимостта от строгото забраняване на достъп, даже напротив, подходът най-често е по-скоро обратен. 

Хубави отговори на този въпрос може да намерите [тук](https://stackoverflow.com/a/7456865).

## Наследяване

Както споменахме, всичко в Python е обект. По-точно `object`.

`object` е най-базовия клас в езика, който имплицитно бива наследяван от всички класове.

In [None]:
class A:
    pass

a = A()

print(f"{isinstance(a, A) = }")
print(f"{isinstance(a, object) = }")

isinstance(a, A) = True
isinstance(a, object) = True


(с вградената функция `isinstance` проверяваме дали даден обект е инстанция на даден клас или на негов базов такъв)

Дори и да изглежда празен класът А, в него в момента се съдържат доста член-методи. С вградената функция `dir` можем да видим пълния набор от атрибути и методи, които даден обект притежава:

In [None]:
dir(a)

['__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__']

Почти всички от тези магически методи и атрибути са наследени от `object`:

In [None]:
dir(object())

['__class__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__']

Ако искаме да наследим друг клас, записваме името му в скоби преди дефиницията на наследника:

In [None]:
class BaseClass:
    x = 69

class SubClass(BaseClass):
    pass

sub = SubClass()
print(f"{sub.x = }")

sub.x = 69


Виждаме, че няма нужда да пишем експлицитно, че наследяваме от `object`. Важно е да се отбележи обаче, че това е задължително за Python 2.

Предефинирането на методи от базовия клас не изисква някаква специална ключова дума. Тяхната дефиниция просто бива замествана от новата.

In [None]:
class Foo:
    def foo(self):
        print("foo")

class Bar(Foo):
    def foo(self):
        print("foobar")

#  (I'm sorry I couldn't come up with anything creative this time)

bar = Bar()
bar.foo()

foobar


Използването на `super()` ни връща обект-прокси, който пренасочва дефиниции на методи към базов клас:

In [None]:
class Drink:
    def __init__(self, name, alcoholic_percentage):
        self.name = name
        self.alcoholic_percentage = alcoholic_percentage


class SoftDrink(Drink):
    def __init__(self, name):
        super().__init__(name, 0)


drincc = SoftDrink("Coca-Cola")
print(f"{drincc.name = }, {drincc.alcoholic_percentage = }%")


drincc.name = 'Coca-Cola', drincc.alcoholic_percentage = 0%


Python е един от малкото езици, в които **множественото наследяване е позволено**. За избягване на проблема на [диаманта](https://youtu.be/nrSlqAb4ZLw?t=10) и други подобни, които често това поражда, е хубаво базовите класове да са семпли и с ясно-дефинирана функционалност, по възможност непокриваща се.

Mixin-ите са най-честия пример за използване на множествено наследяване в Python. Те са базови класове, които предоставят "наготово" имплементация на конкретна допълнителна функционалност.

In [None]:
import json

class JSONSerializableMixin:
    def to_json(self):
        return json.dumps(self.__dict__)

class DebugMixin:
    def __repr__(self):
        arguments = ", ".join(f"{k}={v}" for k, v in self.__dict__.items())
        return f"{self.__class__.__name__}({arguments})"


class Person(JSONSerializableMixin, DebugMixin):
    def __init__(self, name, age):
        self.name = name
        self.age = age

class Employee(Person, JSONSerializableMixin, DebugMixin):
    def __init__(self, name, age, salary):
        self.salary = salary
        super().__init__(name, age)


elon = Employee("Elon Musk", 51, 1_000_000_000)
print(f"{elon.to_json() = }")
print(f"{elon = }")

elon.to_json() = '{"salary": 1000000000, "name": "Elon Musk", "age": 51}'
elon = Employee(salary=1000000000, name=Elon Musk, age=51)


В горните примери дефинирахме два mixin-a: един, който дефинира как да бъде сериализиран до JSON всеки обект, а другия - как да бъде принтиран в дебъг конзолата. Класът `Employee` наслодява както `Person`, така и двата други класа, като придобива всичката функционалност. В този случай `super()` знае към кой базов клас да се обърне чрез поредността на изпълнение на методи (Method Resolution Order), който зависи от реда, в който сме изброили базовите класове (може да се види чрез `__mro__`)

In [None]:
Employee.__mro__

(__main__.Employee,
 __main__.Person,
 __main__.JSONSerializableMixin,
 __main__.DebugMixin,
 object)

Повече за `super()` може да прочетете [тук](https://realpython.com/python-super/).

В примерът по-горе използвахме доста непознати dunder-и: `__repr__`, `__dict__`, `__class__`, `__name__`. За тях, както и други, ще разясним в следващата секция.

## Магическите методи ✨

Документация: [https://docs.python.org/3/reference/datamodel.html](https://docs.python.org/3/reference/datamodel.html)

### [`__repr__`](https://docs.python.org/3/reference/datamodel.html#object.__repr__)

От англ. "representation".

Изиква се при изпълнението на `repr(self)`. Трябва да върне низ с репрезентация на обекта, подходящ за принт в конзолата при дебъгване например. Хубаво е тя максимално много да наподобява начина, по който можем да пресъздадем обекта с изпълним код. Ако това не е възможно е хубаво да върне низ във вида `<... някакво полезно инфо...>`.

Например за клас `Point` (точка) с атрибути `x` и `y`, които инициализаторът приема, вместо `(x, y)` е по-удачно да върнем `Point(x, y)`, понеже това може директно да бъде изпълнено като Python код и да получим еквивалентен обект.

In [None]:
class Point:
    def __init__(self, x, y):
        self.x = x
        self.y = y

    def __repr__(self):
        return f"Point({self.x}, {self.y})"

p = Point(2, 3)
print(p)
print(repr(p))

Point(2, 3)
Point(2, 3)


### Конвертиране в други типове

Можем да предефинираме начинът, по който нашият клас бива конвертиран в някои други вградени типове, чрез специалните `dunder` методи с тяхното име, предназначени за това. Възможните типове са `str`, `bytes`, `bool`, `int`, `float`, `complex`.

In [None]:
class Point:
    def __init__(self, x=0, y=0):
        self.x = x
        self.y = y

    def __repr__(self):
        return f"Point({self.x}, {self.y})"

    def __str__(self):
        return f"({self.x}, {self.y})"

    def __bool__(self):
        """Return `True` only for (0, 0)."""
        return not (not self.x and not self.y)

p = Point(2, 3)

print(f"{str(p) = }")
print(f"The `__str__` method is called when using string interpolation: {p}")
print(f"If we want to use the `__repr__` instead we should write it like this: {p!r}")

print(f"{bool(p) = }")

# `__bool__` is useful when building conditions

if p:
    print("p is truthy")

z = Point()

if not z:
    print("z is falsey")


str(p) = '(2, 3)'
The `__str__` method is called when using string interpolation: (2, 3)
If we want to use the `__repr__` instead we should write it like this: Point(2, 3)
bool(p) = True
p is truthy
z is falsey


Note: За доста от класовете, които бихте срещнали, върнатите низове от `repr` и `str` съвпадат. Тук обаче умишлено сме избрали пример, в който има повече смисъл да са различни - `repr` е debuggable репрезентация на обекта точка (валиден изпълним код), а `str` - стандартен математически запис на точка.

In [None]:
class Fraction:
    def __init__(self, numerator=0, denominator=1):
        self.numerator = numerator
        self.denominator = denominator

    def __float__(self):
        return self.numerator / self.denominator

    def __int__(self):
        return self.numerator // self.denominator  # alternative is `return int(float(self))`
    
    def __complex__(self):
        return complex(float(self))  # alternative is `return float(self) + 0j`
    
    def __str__(self):
        return f"{self.numerator}/{self.denominator}"

    def __repr__(self):
        return f"Fraction({self.numerator}, {self.denominator})"

    def __bool__(self):
        return self.numerator != 0


frac = Fraction(6, 9)
print(f"{float(frac) = }")
print(f"{int(frac) = }")
print(f"{complex(frac) = }")
print(f"{str(frac) = }")
print(f"{repr(frac) = }")
print(f"{bool(frac) = }")


float(frac) = 0.6666666666666666
int(frac) = 0
complex(frac) = (0.6666666666666666+0j)
str(frac) = '6/9'
repr(frac) = 'Fraction(6, 9)'
bool(frac) = True


Note 2: Обърнете внимание, че `dunder(x)` в случая е същото като `x.__dunder__()`. Обикновено нямаме причина да използваме втория запис.

### Аритметични и логически оператори

В Python (също както в С++ и повечето други ООП езици) можем да предефинираме поведението на аритметичните и логическите оператори от езика, когато биват извикани върху обект от нашия клас.

Съответните магически методи за това са:

| оператор   |  `dunder`                       |
| ---------- | ------------------------------- |
| `==`       | `__eq__`                        |
| `!=`/`<>`  | `__neq__`                       |
| `<`        | `__lt__`                        |
| `<=`       | `__le__`                        |
| `>`        | `__gt__`                        |
| `>=`       | `__ge__`                        |
| `+` (2)    | `__add__`/`__radd__`            |
| `*`        | `__mul__`/`__rmul__`            |
| `-` (2)    | `__sub__`/`__rsub__`            |
| `/`        | `__truediv__`/`__rtruediv__`    |
| `//`       | `__floordiv__`/`__rfloordiv__`  |
| `%`        | `__mod__`/`__rmod__`            |
| `divmod`   | `__divmod__`/`__rdivmod__`      |
| `**`/`pow` | `__pow__`/`__rpow__`            |
| `<<`       | `__lshift__`/`__rlshift__`      |
| `>>`       | `__rshift__`/`__rrshift__`      |
| `&`        | `__and__`/`__rand__`            |
| `^`        | `__xor__`/`__rxor__`            |
| `\|`       | `__or__`/`__ror__`             |
| `+=`       | `__iadd__`                      |
| `*=`       | `__imul__`                      |
| `-=`       | `__isub__`                      |
| `/=`       | `__itruediv__`                  |
| `//=`      | `__ifloordiv__`                 |
| `%=`       | `__imod__`                      |
| `**=`      | `__ipow__`                      |
| `<<=`      | `__ilshift__`                   |
| `>>=`      | `__irshift__`                   |
| `&=`       | `__iand__`                      |
| `^=`       | `__ixor__`                      |
| `\|=`      | `__ior__`                      |
| `-` (1)    | `__neg__`                       |
| `+` (1)    | `__pos__`                       |
| `abs`      | `__abs__`                       |
| `~`        | `__invert__`                    |


In [None]:
class Fraction:
    def __init__(self, numerator=0, denominator=1):
        self.numerator = numerator
        self.denominator = denominator
    
    def __add__(self, other):
        return Fraction(
            self.numerator * other.denominator + other.numerator * self.denominator,
            self.denominator * other.denominator
        )
    
    def __sub__(self, other):
        return Fraction(
            self.numerator * other.denominator - other.numerator * self.denominator,
            self.denominator * other.denominator
        )
    
    def __mul__(self, other):
        return Fraction(
            self.numerator * other.numerator,
            self.denominator * other.denominator
        )

    def __truediv__(self, other):
        return Fraction(
            self.numerator * other.denominator,
            self.denominator * other.numerator
        )

    def __iadd__(self, other):
        self.numerator = self.numerator * other.denominator + other.numerator * self.denominator
        self.denominator = self.denominator * other.denominator
        return self

    def __isub__(self, other):
        self.numerator = self.numerator * other.denominator - other.numerator * self.denominator
        self.denominator = self.denominator * other.denominator
        return self

    def __imul__(self, other):
        self.numerator = self.numerator * other.numerator
        self.denominator = self.denominator * other.denominator
        return self

    def __itruediv__(self, other):
        self.numerator = self.numerator * other.denominator
        self.denominator = self.denominator * other.numerator
        return self
    
    def __repr__(self):
        return f"Fraction({self.numerator}, {self.denominator})"


frac1 = Fraction(1, 2)
frac2 = Fraction(1, 3)

summ = frac1 + frac2
diff = frac1 - frac2
prod = frac1 * frac2
quot = frac1 / frac2

print(f"{summ = }")
print(f"{diff = }")
print(f"{prod = }")
print(f"{quot = }")

frac1 += frac2
print(f"{frac1 = }")


summ = Fraction(5, 6)
diff = Fraction(1, 6)
prod = Fraction(1, 6)
quot = Fraction(3, 2)
frac1 = Fraction(5, 6)


Вариантите на методите, започващи с `r`, дефиниращи поведението на операторите, се извикват с разменени аргументи. Те се използват само в случая, когато левият операнд не поддържа съответната операция и операндите са от различни типове.

Нека например имаме израза `x - y` и нека `y` имплементира `__rsub__`. Той ще се извика в случая, когато `x` не поддържа `__sub__` (няма го дефиниран или връща `NotImplemented`) и `x` и `y` са от различни типове.

### Хеширане

Колекции като `dict`, `set` и `frozenset` изискват елементите им да могат да се хешират. Това се осъществява чрез извикването на вградената функция `hash()`, която връща цяло число - съответният хеш.

In [None]:
hash(1)

1

In [None]:
hash(420)

420

In [None]:
hash("a")

-5016004937874941484

In [None]:
hash((1, "a", False))

-5093137992435649037

In [None]:
hash([1, "a", False])

TypeError: unhashable type: 'list'

Rule of thumb във всички езици за програмиране е с дефиниране на `__hash__` винаги да има и дефиниция на `__eq__` (обратното не е задължително да е вярно), понеже няма смисъл да се хешира обект, който не може да се сравнява с други.

В Python при дефиниране на клас, по премълчаване той получава готова default-на дефиниция на `__eq__` и `__hash__`. Тяхното поведение е такова, че две различни инстанции от този клас не са равни и не произвеждат един и същ хещ (равни са единствено на себе си, т.е. равенство настъпва само при сравняване на имена, сочещи към едно и също място в паметта).

In [None]:
class Point:
    def __init__(self, x=0, y=0):
        self.x = x
        self.y = y

p1 = Point(4, 2)
p2 = Point(4, 2)

print(f"{hash(p1) = }")
print(f"{hash(p2) = }")

visited = set()
visited.add(p1)
visited.add(p2)

print(f"{visited = }")

hash(p1) = 289920877
hash(p2) = 289920985
visited = {<__main__.Point object at 0x1147d7d90>, <__main__.Point object at 0x1147d76d0>}


В случая от примера може би не искаме две точки с едни и същи координати да се третират като различни. За да го постигнем, трябва да дефинираме `__eq__` и `__hash__`:

In [None]:
class Point:
    def __init__(self, x, y):
        self.x = x
        self.y = y

    def __eq__(self, other):
        return self.x == other.x and self.y == other.y

    def __hash__(self):
        return hash((self.x, self.y))  # the hash of the tuple of the coordinates is sufficient


p1 = Point(4, 2)
p2 = Point(4, 2)

print(f"{hash(p1) = }")
print(f"{hash(p2) = }")

visited = set()
visited.add(p1)
visited.add(p2)

print(f"{visited = }")


hash(p1) = -9131917124991031250
hash(p2) = -9131917124991031250
visited = {<__main__.Point object at 0x113d60790>}


По този начин (чрез предефиниране на `==` и евентуално и на `hash()`) определяме еднаквост между инстанциите. След това единственият начин, по който можем да различим дали обектите съвпадат (т.е. са едни и същи от гледна точка на паметта) остава чрез използване на `is`.

In [None]:
p1 is p2

False

In [None]:
p1 == p2

True

### Контейнери и итератори

Съществуват методи, които ни помагат в дефинирането на контейнери и мапинги:

* `__len__(self)`: трябва да върне дължината на контейнера (цяло число $ \ge 0 $). Извиква се от вградената функция `len()`.
* `__getitem__(self, key)`: връща елемента с ключ `key` (на позиция `key`). Извиква се при read-only достъп с `[]`.
* `__setitem__(self, key, value)`: задава стойността на елемента с ключ `key` (на позиция `key`) да бъде `value`. Извиква се при присвояване с `[]`.
* `__delitem__(self, key)`: изтрива елемента с ключ `key` (на позиция `key`). Извиква се от ключовата дума `del`.
* `__iter__(self)`: връща итератор, който да се използва за обхождане на контейнера. При мапинги трябва да обхожда ключовете на контейнера. Извиква се от вградената функция `iter()` когато е необходимо. Итераторът трябва да имплементира `__next__`, така че при обхождането му да връща следващия елемент при всяко извикване на `next()`.
* `__reversed__(self)`: връща обратен итератор, който да се използва за обхождане на контейнера. Извиква се от вградената функция `reversed()`.
* `__contains__(self, item)`: връща `bool`, казващ дали `item` се съдържа в контейнера. Извиква се при използване на `in` за проверка на съдържанието.

In [None]:
class DefaultArray:
    """
    A container that behaves like a list with a maximum size (array)
    but returns a default value for missing indices.
    """

    def __init__(self, limit, default_element_func):
        self._limit = limit
        self._default_element_func = default_element_func
        self._list = [None] * limit

    def __len__(self):
        return self._limit

    def __getitem__(self, index):
        element = self._list[index]
        return self._default_element_func() if element is None else element

    def __setitem__(self, index, element):
        self._list[index] = element

    def __delitem__(self, index):
        self._list[index] = None

    def __contains__(self, item):
        return item in self._list

arr = DefaultArray(10, int)  # `int` can be viewed as a function that returns 0 upon calling

print(f"{arr[1] = }")  # __getitem__

arr[1] = 42  # __setitem__

print(f"{arr[1] = }")
print(f"{42 in arr = }")  # __contains__

del arr[1]  # __delitem__

print(f"{arr[1] = }")
print(f"{42 in arr = }")



arr[1] = 0
arr[1] = 42
42 in arr = True
arr[1] = 0
42 in arr = False


Индексирането в Python е гъвкаво и позволява взимането на цели части (`slice`s) от дадена колекция, както и броене отзад-напред. 

Синтаксисът е `iterable[start:stop:step]`, където:
* `iterable` е въпросната колекция
* `start` е началния индекс (default = 0)
* `stop` е крайният индекс (***невключително***) (default = len)
* `step` е стъпката (default = 1), през която се взимат елементи. Ако е отрицателна, то обхождането е наобратно.

Индексът, както и `start`/`stop` могат да бъдат отрицателни числа. В такъв случай `-1` означава последният елемент, `-2` - предпоследният и т.н.

Също е хубаво да се отбележи, че при slicing не се хвърля `IndexError`, в случай че някой от индексите е извън колекцията.

Най-добре всичко това се демонстрира чрез примери:

In [None]:
items = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

print(f"{items[9] = }")
print(f"{items[-1] = }")
print()
print(f"{items[1:5] = }")
print(f"{items[1:] = }")
print(f"{items[:5] = }")
print(f"{items[:-1] = }")
print(f"{items[-6:-1] = }")
print()
print(f"{items[1:5:2] = }")
print(f"{items[1:5:-1] = }")
print(f"{items[5:1:-1] = }")
print()
print(f"{items[5::-1] = }")
print(f"{items[::-1] = }")
print(f"{items[:] = }")


items[9] = 9
items[-1] = 9

items[1:5] = [1, 2, 3, 4]
items[1:] = [1, 2, 3, 4, 5, 6, 7, 8, 9]
items[:5] = [0, 1, 2, 3, 4]
items[:-1] = [0, 1, 2, 3, 4, 5, 6, 7, 8]
items[-6:-1] = [4, 5, 6, 7, 8]

items[1:5:2] = [1, 3]
items[1:5:-1] = []
items[5:1:-1] = [5, 4, 3, 2]

items[5::-1] = [5, 4, 3, 2, 1, 0]
items[::-1] = [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
items[:] = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


Чрез имплементиране на `__getitem__` нашият клас поддържа имплицитно slicing. Това е така, понеже горепоказаният начин за slicing е синтактична захар на създаването на `slice` обект и предаването му чрез `[]`.

С други думи, следните две операции са екивалентни:

In [None]:
usa_weekdays = ["Sun", "Mon", "Tue", "Wed", "Thu", "Fri", "Sat"]

workdays1 = usa_weekdays[1:-1]
workdays2 = usa_weekdays[slice(1, -1, None)]

print(f"{workdays1 = }")
print(f"{workdays2 = }")


workdays1 = ['Mon', 'Tue', 'Wed', 'Thu', 'Fri']
workdays2 = ['Mon', 'Tue', 'Wed', 'Thu', 'Fri']


Това означава, че ако искаме (или пък нарочно и експлицитно не искаме) да поддържаме slicing по адекватен начин в нашия обект, в`__getitem__(self, key)`, `__setitem__(self, key)` и `__delitem__(self, key)` може да е необходимо да проверяваме дали `key` е от тип `slice` в случаите, в които това има значение. Това може да стане с `isinstance(key, slice)` например.

В горния пример с `DynamicArray` няма да имаме проблем, понеже параметъра го предаваме директно на `__getitem__` на листа който си пазим, а листовете както видяхме вече успешно се справят със `slice`-ове.

In [None]:
arr[:]

[None, None, None, None, None, None, None, None, None, None]

Итерирането в Python става с помощта на итератори. Итераторите са обекти, които имплементират метода `__next__`, който връща следващия елемент при всяко извикване. Когато няма повече елементи, трябва да се хвърли изключение `StopIteration`. Итераторите се използват от `for`-циклите.

In [None]:
iterable = [1, 2, 3]

# `for i in iterable: print(i)` is equal to the following calls:

iterator = iter(iterable)  # the `for` loop uses the iterator of the object

print(f"{iterator = }")  # printing here the iterator just for demo purposes

print(f"{next(iterator) = }")  # first iteration
print(f"{next(iterator) = }")  # second iteration
print(f"{next(iterator) = }")  # third iteration
print(f"{next(iterator) = }")  # this exception is caught by the `for` loop and is its exit condition
# let's not catch it and let it boom 💥

iterator = <list_iterator object at 0x118986490>
next(iterator) = 1
next(iterator) = 2
next(iterator) = 3


StopIteration: 

С други думи, `for` циклите правят следното:

In [None]:
def for_from_aliexpress(iterable, func):
    iterator = iter(iterable)
    while True:
        try:
            element = next(iterator)
        except StopIteration:
            break

        func(element)

for_from_aliexpress([1, 2, 3], print)

1
2
3


Ако не разбирате част от кода горе, не се притеснявайте. В последваща лекция ще учим за грешки и изключения, както и в друга говорим за итериране и функции от по-висок ред в повече дълбочина.

За бъде итеруем (iterable) един клас, трябва да имплементира `__iter__`, връщайки итератор. Възможно е да върне и собствената си инстанция, в случай, че има имплементиран `__next__`.

In [None]:
class NotAnIterable:
    pass

not_an_iterable = NotAnIterable()

for i in not_an_iterable:
    print(i)

TypeError: 'NotAnIterable' object is not iterable

In [None]:
class DefaultArray:
    """
    A container that behaves like a list with a maximum size (array)
    but returns a default value for missing indices.
    """

    def __init__(self, limit, default_element_func):
        self._limit = limit
        self._default_element_func = default_element_func
        self._list = [None] * limit

    def __len__(self):
        return self._limit

    def __getitem__(self, index):
        element = self._list[index]
        return self._default_element_func() if element is None else element

    def __setitem__(self, index, element):
        self._list[index] = element

    def __delitem__(self, index):
        self._list[index] = None

    def __contains__(self, item):
        return item in self._list

    def __iter__(self):
        return iter(self._list)

arr = DefaultArray(10, int)

for i in range(10):
    arr[i] = i*i*i  # squares are overrated, let's print the cubes

for element in arr:  # __iter__ is called here
    print(element)


0
1
8
27
64
125
216
343
512
729


In [None]:
class FibonacciGenerator:
    def __init__(self, max_index):
        self.max_index = max_index
        self._a = 1
        self._b = 1
        self._current_index = 0

    def __iter__(self):
        return self

    def __next__(self):
        if self._current_index >= self.max_index:
            raise StopIteration

        current = self._a

        self._a, self._b = self._b, self._a + self._b
        self._current_index += 1

        return current


lateralus = FibonacciGenerator(16)

for i in lateralus:
    print(i)


1
1
2
3
5
8
13
21
34
55
89
144
233
377
610
987


In [None]:
class YetAnotherCustomIterable:
    class CustomIterator:
        def __init__(self, iterable):
            self._iterable = iterable
            self._index = 0

        def __next__(self):
            if self._index >= len(self._iterable):
                raise StopIteration

            element = self._iterable[self._index]
            self._index += 1
            return element
    
    def __init__(self, iterable):
        self._iterable = iterable
    
    def __iter__(self):
        return YetAnotherCustomIterable.CustomIterator(self._iterable)

it = YetAnotherCustomIterable("strings are also iterables")

print("👏".join(i for i in it))  # __iter__ is also called by comprehensions
# more info on list/generator/dict comprehensions in another lecture


s👏t👏r👏i👏n👏g👏s👏 👏a👏r👏e👏 👏a👏l👏s👏o👏 👏i👏t👏e👏r👏a👏b👏l👏e👏s


### Функции

Искате обектът ви да бъде извикан като функция?

Няма проблеми.

In [None]:
class LinearBinomial:
    def __init__(self, a, b):
        self.a = a
        self.b = b

    def __call__(self, x):
        return self.a * x + self.b

    def __str__(self):
        A = f"{self.a}x" if self.a != 1 else "x"
        B = f"{self.b}" if self.b != 0 else ""
        return f"{A} + {B}"


f = LinearBinomial(1, 2)

print(f"f(x) = {f}")

print(f"f(0) = {f(0)}")
print(f"f(1) = {f(1)}")


f(x) = x + 2
f(0) = 2
f(1) = 3


### Pure witchcraft

In [None]:
class ExampleClass:
    """This is an example class.
    
    Note: The first multiline comment in a definition of a class, module or function
    is called a 'docstring'.
    """

    def __init__(self, var):
        """Take a variable and store it in the instance.

        Note: It is good practice to document as many public methods and classes as possible.
        """
        self.var = var

    def __repr__(self):
        """Return repr(self).
        
        Note: there are established strict conventions as to what good code documentation sould look like.
        For example, such comments should always be imperative (e.g. 'return', not 'returns').
        For more info check out `pydocstyle` (https://www.pydocstyle.org/en/stable/). It includes a linter
        that can be configured inside your IDE to constantly check and give out warnings
        regarding your code documentation and style.
        Good thing to check out as well is PEP-8 but keep in mind that we will cover PEP-8 in details
        in a following lecture.
        """
        return f"ExampleClass({self.var})"

    __str__ = __repr__  # after all, methods are objects too. They can be passed around and assigned.


instance = ExampleClass(42)

# now let the black magic begin
print(f"{instance.__doc__ = }")           # the docstring of the object
print(f"{instance.__repr__.__doc__ = }")  # the docstring of a method of the object
print(f"{ExampleClass.__name__ = }")  # the name of the class as a string
print(f"{instance.__class__ = }")  # the class of the instance as a class object
print(f"{instance.__module__ = }")  # the name of the module in which the object exists. In this case, it's `__main__` because we are in the REPL.
print(f"{instance.__dict__ = }")  # a `dict` containing all the attributes of the instance. It is returned by the `vars` builtin function:
print(f"{vars(instance) = }")
print(f"{instance.__repr__.__code__ = }")  # the code object of the method. Don't expect to see the exact code though, this is some representation of the compiled code.
print(f"{instance.__repr__.__code__.co_code = }")  # the actual compiled code. This is a `bytes` object.
print(f"{instance.__str__.__code__.co_code = }")  # it's the same picture


instance.__doc__ = "This is an example class.\n    \n    Note: The first multiline comment in a definition of a class, module or function\n    is called a 'docstring'.\n    "
ExampleClass.__name__ = 'ExampleClass'
instance.__class__ = <class '__main__.ExampleClass'>
instance.__module__ = '__main__'
instance.__dict__ = {'var': 42}
vars(instance) = {'var': 42}
instance.__repr__.__code__ = <code object __repr__ at 0x113d91df0, file "/var/folders/7x/gdf0mbts74n8p_ckv_b_mfc40000gp/T/ipykernel_62173/2566046567.py", line 15>
instance.__repr__.__code__.co_code = b'd\x01|\x00j\x00\x9b\x00d\x02\x9d\x03S\x00'
instance.__str__.__code__.co_code = b'd\x01|\x00j\x00\x9b\x00d\x02\x9d\x03S\x00'


## Някои полезни помощни класове и декоратори

### Но първо, какво е "декоратор"?

Накратко (понеже в друга лекция ще обясним по-подробно), това е функция, обграждаща и "добавяща" функционалност на друга такава. Т.е. приема за параметър някоя функция и връща друга, която е модифицирана версия на първата. В Python може да се използва и чрез `@`, което е удобен syntax sugar за декориране.

In [None]:
def logged(func):
    def wrapper(*args, **kwargs):
        print(f"Calling {func.__name__} with {args} and {kwargs}")
        return func(*args, **kwargs)
    return wrapper

@logged
def fibonacci(n=10_000):
    a = 0
    b = 1
    for i in range(n):
        a, b = b, a + b
    return a

lateralus = fibonacci(16)  # here we observe the added side effect of logging the call

print(f"{lateralus = }")  # as above, so below

# and beyond I imagine
fibonacci()


Calling fibonacci with (16,) and {}
lateralus = 987
Calling fibonacci with () and {}


3364476487643178326662161200510754331030214846068006390656476997468008144216666236815559551363373402558206533268083615937373479048386526826304089246305643188735454436955982749160660209988418393386465273130008883026923567361313511757929743785441375213052050434770160226475831890652789085515436615958298727968298751063120057542878345321551510387081829896979161312785626503319548714021428753269818796204693609787990035096230229102636813149319527563022783762844154036058440257211433496118002309120828704608892396232883546150577658327125254609359112820392528539343462090424524892940390170623388899108584106518317336043747073790855263176432573399371287193758774689747992630583706574283016163740896917842637862421283525811282051637029808933209990570792006436742620238978311147005407499845925036063356093388383192338678305613643535189213327973290813373264265263398976392272340788292817795358057099369104917547080893184105614632233821746563732124822638309210329770164805472624384237486241145309381220656491403

Съществуват различни полезни декоратори, които ни улесняват с имплеменетирането на често-срещани ООП фунцкионалности.

### `@property`

В някои езици наричано "computed property", това е поле/атрибут, чиято стойност се изчислява при използването му и обикновено не се съхранява никъде. На практика това е метод, който се използва със синтаксиса атрибут. Достатъчно е да декорираме с `@property` нормален метод, за да го превърнем в атрибут.

In [None]:
class Player:
    def __init__(self, name):
        self._name = name

    @property
    def name(self):
        return self._name

doncho = Player("Doncho")
print(doncho.name)

Doncho


### `@setter`

Освен read-only computed property-та, можем да имаме и writable такива. Това се постига чрез декоратора `@{propertyname}.setter`, който се използва върху метод, който да се изпълнява при присвояване на стойност на атрибута (`{propertyname}` се замества с името на property-то).

In [None]:
class Player:
    def __init__(self, xp):
        self._xp = xp

    @property
    def level(self):
        return self._xp // 1000 + 1
    
    @level.setter
    def level(self, value):  # has to have the same name!
        self._xp = (value - 1) * 1000
    
newb = Player(0)
print(f"{newb.level = }")

print("now the player buys something and advances some levels automatically...")
newb.level = 10  # ...cheater

print(f"{newb.level = }")
print(f"{newb._xp = }")


newb.level = 1
now the player buys something and advances some levels automatically...
newb.level = 10
newb._xp = 9000


### `@staticmethod`

Ако дефинираме функция в блока за дефиниция на клас, тя става метод на класа и при извикването ѝ винаги имплицитно се предава като първи параметър съответната инстанция на класа. Но как да създадем метод, който не зависи от инстанцията?

In [None]:
class A:
    def instance_method(self):
        print(self)

    def static_method():
        print("I am free")

a = A()
a.instance_method()
A.static_method()
a.static_method()

<__main__.A object at 0x113d60be0>
I am free


TypeError: static_method() takes 0 positional arguments but 1 was given

Ако в горния случай изпълним `A.static_method()` няма да бъде направен опит да се предаде инстанция като първи параметър, понеже такава нямаме. Но не винаги можем да сме сигурни, че метода ще бъде извикан върху класа, а не върху конкретен обект. Начинът по който можем да подсигурим безпроблемното изпълнение и в двата случая е да декорираме метода със `@staticmethod`:

In [None]:
class A:

    @staticmethod
    def static_method():
        print("I am free")

a = A()
A.static_method()
a.static_method()

I am free
I am free


### `@classmethod`

Понякога може да искаме като първи аргумент на метода да ни бъде подадена не инстанцията, а самият клас. Такъв метод трябва да декорираме с `@classmethod`. Отново, също както със `self`, името на аргумента може да е всякакво, но по конвенция е прието да се кръщава `cls` (понеже `class` е запазена дума).

In [None]:
class User:
    def __init__(self, username, email, money):
        self.username = username
        self.email = email
        self.money = money

    @classmethod
    def from_json_dict(cls, json):
        username = json["username"]
        email = json["email"]
        money = json["money"]
        return cls(username, email, money)

    def __repr__(self):
        return f"User({self.username}, {self.email}, {self.money})"


json_data = {
    "username": "yalishanda",
    "email": "yalishanda@example.com",
    "money": 420
}

user = User.from_json_dict(json_data)
print(user)


User(yalishanda, yalishanda@example.com, 420)


### `ABC` (Abstract Base Class) и `@abstractmethod`

Модулът `abc` ни предоставя начини, с които да дефинираме абстрактни базови класове. Те не могат да бъдат инстанцирани, когато съдържат един или повече от един абстрактни метода, чиято цел е да опишат общ интерфейс и да бъдат имплементирани от наследниците на класа.

In [None]:
from abc import ABC, abstractmethod

class Animal(ABC):
    def __init__(self, name):
        self._name = name

    @abstractmethod
    def make_sound(self):
        pass

    def pet(self):
        print(f"Petting {self._name}...")
        self.make_sound()

class Dog(Animal):
    def make_sound(self):
        print("woof")

class Cat(Animal):
    def make_sound(self):
        print("purr")

class Snek(Animal):
    def make_sound(self):
        print("sss")

doge = Dog("Doge")
doge.pet()

catto = Cat("Мишо")
catto.pet()

snek = Snek("Съска")
snek.pet()

base = Animal("опа")

Petting Doge...
woof
Petting Мишо...
purr
Petting Съска...
sss


TypeError: Can't instantiate abstract class Animal with abstract method make_sound

# Примери (задачи за решаване в час)

## Пример 1

Напишете клас `Rectangle`, описващ правоъгълник, със следните характеристики:

- дължина
- широчина
- цвят (низ)
- методи, връщащи стойностите на член-данните на класа
- метод за изчисляване на лице

Напишете клас `Circle`, описващ кръг, със следните характеристики:

- радиус
- цвят (низ)
- методи, връщащи стойностите на член-данните на класа
- метод за изчисляване на лице

Напишете клас `Shapes`, със следните характеристики:

- съдържа в себе си горе-дефинираните геометрични фигури
- метод за добавяне на нов кръг към колекцията
- метод за добавяне на нов правоъгълник към колекцията
- метод, който връща сумата от всички лица на правоъгълниците
- метод, който връща сумата от всички лица на кръговете
- метод, който връща геометрична фигура по подаден индекс

## Пример 2

*Съществуват различни видове броячи - някои могат само да увеличават бройката, която пазят, други могат и да я намалят, а трети имат ограничение до колко могат да отброяват.*

### Клас `Counter`

*Най-простият брояч - само нагоре, без ограничение.*

- Инициализатор с параметри `initial=0` (начална стойност) и `step=1` (стъпка)
- `increment()`: увеличава текущата стойност със стъпката на брояча
- `get_total()`: връща `int` - текущата отброена стойност
- `get_step()`: връща `int` - стъпката на брояча (не трябва да може да бъде променяна)

### Клас `TwowayCounter`

*Брояч, който може и да намалява отброяваната стойност.*

Освен всичко изброено в `Counter`, съдържа и:
- `decrement()`: намалява текущата стойност със стъпката на брояча

### Клас `LimitedCounter`

*Брояч, който отброява само до дадена максимална стойност.*

- Инициализатор с 3 параметъра `max` (максимална стойност), `initial=0` (начална ст-т) и `step=1` (стъпка)
- `increment()`: увеличава текущата стойност със стъпката на брояча само ако няма да надмине максималната
- `get_max()`: връща `int` - максималната стойност на брояча
- `get_total()`: същия като този на `Counter`
- `get_step()`: същия като този на `Counter`

### Клас `LimitedTwowayCounter`

*Той е и LimitedCounter, и TwowayCounter едновременно: може да отброява нагоре до определена максимална стойност и надолу до определена минимална стойност.*

- Инциализатор с 4 параметъра `min` (минимална ст-т), `max` (максимална ст-т), `initial=0` (начална ст-т) и `step=1` (стъпка)
- `increment()`: същия като на `LimitedCounter`
- `decrement()`: намаля текущата стойност със стъпката на брояча само ако няма да стане по-ниска от минималната
- `get_min()`: връща минималната стойност на брояча
- `get_max()`: същия като този на `LimitedCounter`
- `get_total()`: същия като този на `Counter`
- `get_step()`: същия като този на `Counter`

### Клас `Semaphore`

*Най-простия бинарен семафор - това е `LimitedTwowayCounter`, който има минимална стойност 0, максимална стойност 1 и стъпка 1. Използва се от процесите в операционнитe системи за синхронизационни цели. (За повече информация: https://skelet.ludost.net)*

- Инициализатор с 1 параметър `is_available=False`. При `True` началната стойност на брояча е 1, а при `False` е 0.
- `is_available()`: връща `bool`, показващ дали стойността на брояча е над 0
- `wait()` - прави същото като `decrement()` на `LimitedTwowayCounter`
- `signal()` - прави същото като `increment()` на `LimitedTwowayCounter`

***Pythonic bonus:*** Use `@property` instead of all the getters.

###### Двата примера достигат до вас благодарение на [курса по ООП 2020/2021 за СИ](https://github.com/yalishanda42/oop2021).

# Задачи за упражнение (за вкъщи)

## Задача 0

Дефинирайте клас `PolarCoordinate`, който да моделира точка чрез двумерни полярни координати. Класът трябва да има:

* инициализатор, който приема два аргумента - радиус $ r $ и ъгъл $ \phi $ (ще интерпретираме мерната му единица да е в радиани)
* атрибути/методи `r` и `angle` за достъп до съответните полета, но не и за тяхната промяна
* метод `to_cartesian()`, който връща `tuple` от две числа `(x, y)` - координатите на точката, конвертирани в декартова система по формулата:
    * $ x = r\cos(\phi) $
    * $ y = r \sin(\phi) $
* клас-метод `from_cartesian(x, y)`, който приема два аргумента - координатите на точката в декартова система - и създава и връща инстанция на `PolarCoordinate`, изчислена по формулата:
    * $ r = \sqrt{x^2 + y^2} $
    * $ \phi = \arctan(\frac{y}{x}) $
* дефинирана подходяща репрезентация на обекта
* дефиниция на конвертиране в `str` във формат `(r: {self.r}, angle: {self.angle})`
* дефиниране на хеширане
* дефиниране на сравнение с `==` и `!=`

Важно: стойностите на полетата на класа не трябва да могат да бъдат променяни по никакъв начин, освен чрез инициализатора, с цел гарантиране на immutability.



In [None]:
from math import sqrt, sin, cos, atan  # you will need these
from math import pi, isclose  # the tests below will need these


class PolarCoordinate:
    pass  # your code here


p1 = PolarCoordinate(1, pi/6)

print(p1.r == 1)
print(p1.angle == pi/6)

p2 = PolarCoordinate.from_cartesian(3, 4)
print(isclose(p2.r, 5))
print(isclose(p2.angle, atan(4/3)))

x, y = p2.to_cartesian()
print(isclose(x, 3))
print(isclose(y, 4))

p3 = PolarCoordinate(1, 0)
print(str(p3) == "(r: 1, angle: 0)")
print(repr(p3) == "PolarCoordinate(1, 0)")

pp1, pp2, pp3 = PolarCoordinate(1, pi/6), PolarCoordinate.from_cartesian(3, 4), PolarCoordinate(1, 0)
print(p1 == pp1)
print(p2 == pp2)
print(p3 == pp3)

d = {p1: "A", p2: "B", p3: "C"}
print(d[pp1] == "A")
print(d[pp2] == "B")
print(d[pp3] == "C")

s = {p1, p2, p3, pp1, pp2, pp3, p1, p2, p3}
print(len(s) == 3)

## Задача 1

Дефинирайте клас `Player`, който да моделира играч от RPG игра. Трябва да има следните атрибути и техните условия към тях:

  * `name` - име на играча (read-only)
  * `hp` - жизнени точки на играча (да не могат да падат под 0, по подразбиране са 10)
  * `xp` - опит на играча (да може само да бъде увеличаван, по подразбиране е 0)
  * `level` - ниво на играча (read-only), зависи от `xp` по формулата: 
    * $ level = 1 $, ако `xp` е по-малко от 300;
    * $ level = 2 + \log_2 int(\frac{xp}{300}) $, иначе.
    
  (т.е. 0-299 XP са ниво 1, 300-599 XP са ниво 2, 600-1199 XP са ниво 3, 1200-2399 са ниво 4 и т.н.)

Имате свобода при имплементацията на класа, стига горните атрибути да съществуват и условията им да са винаги изпълнени.

*Note*: за $ log_2 $ може да използвате `math.log2`. Функцията `int` в горната формула е аналогична на конструктора на `int` в Python, както и на `floor` функцията, т.е. закръглянето към цяло число е винаги надолу.

## Задача 2

Дефинирайте клас `Vector3D`, който да репрезентира вектор в тримерното пространство. Класът трябва да има поне следните методи:

  * `__init__(self, x, y, z)`: инициализира вектора със стойности `x`, `y` и `z`
  * `__repr__(self)`: връща репрезентация на обекта
  * `__str__(self)`: връща стрингово представяне на вектора във формат `"(x, y, z)"` (например, `"(1, 2, 3)"`)
  * `__add__(self, other)`: връща сумата на два вектора (или на вектор (вляво) с число (вдясно))
    за целите на задачата, нека дефинираме:
    * сума на вектор $ v = (v_x, v_y, v_z) $ с вектор $ u = (u_x, u_y, u_z) $ като $ u + v = (v_x + u_x, v_y + u_y, v_z + u_z) $
    * сума на вектор $ v = (v_x, v_y, v_z) $ с число $ \lambda $ като $ u + \lambda = (v_x + \lambda, v_y + \lambda, v_z + \lambda) $
  * `__radd__(self, other)`: връща сумата на число (в ляво) с вектор (в дясно)
  * `__iadd__(self, other)`: прибавя `other` към `self` и връща `self`
  * `__mul__(self, other)`: връща "произведение", дефинирано по следния начин:
    * произведението $ v * u $ на два вектора $ v = (v_x, v_y, v_z) $ и $ u = (u_x, u_y, u_z) $ като $ v * u = (v_x u_x, v_y u_y, v_z u_z) $
    * произведението $ v * \lambda $ на вектора $ v = (v_x, v_y, v_z) $ и числото $ \lambda $ като $ v * \lambda = (v_x \lambda, v_y \lambda, v_z \lambda) $
  * `__rmul__(self, other)`: връща произведението (както е дефинирано горе) на число с вектор
  * `__imul__(self, other)`: умножава `other` към `self` и връща `self`
  * `__eq__(self, other)`: връща `True`, ако два вектора са поелементно равни, и `False` в противен случай
  * `__ne__(self, other)`: връща обратното на `__eq__`
  * `__abs__(self)`: връща дължината на вектора (по формулата $ \sqrt{x^2 + y^2 + z^2} $ )
  * `__getattr__(self, name)`: пренасочва `X`, `Y` и `Z` към `x`, `y` и `z` (например `vector.X` да е еквивалентно на `vector.x`)
  * `__setattr__(self, name, value)`, аналогичен на горния
  * `__iter__(self)`: връща итератор на вектора, който да позволява итериране в реда `x`, `y`, `z`.

Добавете още каквито методи смятате за нужни.

*Note 1*: нека в контекста на задачата за скалари смятаме `int`, `float` и `complex`.

*Note 2*: корен квадратен може да изчислите с `math.sqrt` или като повдигнете нещо на степен 0.5.

*Note 3*: понеже още не сме учили грешки и изключения, не се очаква да хвърляте такива в случай, че някой аргумент е невалиден. Очаква се обаче поне където се налага да проверите за това. Ако не ви се разучава как да `raise`-нете `TypeError`, `AttributeError` или `ValueError`, може вместо това да `return`-нете `None` за сега.

## Задача 3

В тази задача ще направим мини-framework за чертане на UI в конзолата.

С цел той да бъде декларативен и лесно композируем, всички елементи трябва да имат метод `render()`, който да връща `str` със съдържанието на елемента.

Различните елементи могат да биват:

* `Spacer(length=1)`: празно място с дадена дължина (`length` на брой интервали)
* `Line(length, symbol="-")`: ред от символи с дадена дължина (примерно `Line(10).render()` трябва да върне `"----------"`)
* `Text(text)`: текст със съдържание `text`
* `FancyText(text, symbol="=")`: текст със съдържание `text`, между всeки символ на който има сложен `symbol`, както и в началото и в края му (примерно `FancyText("Hello").render()` трябва да върне `"=H=e=l=l=o="`)
* `HorizontalStack(*elements)`: елементи, подредени един до друг в ред (слепени на реда / разделени чрез "") (примерно `HorizontalStack(Text("Hello"), Line(3), Text("World")).render()` трябва да върне `"Hello---World"`)
* `VerticalStack(*elements)`: елементи, подредени един под друг (разделени чрез симвла за празен ред) (примерно `VerticalStack(Text("Hello"), Line(3), Text("World")).render()` трябва да върне `"Hello\n---\nWorld"`)
* `Box(width, *elements)`: елемент, който е като `VerticalStack`, с разликата че:
    * преди и след `elements` добавя `HorizontalStack(Text("+"), Line(width - 2, symbol="="), Text("+"))`
    * всеки ред е с дължина `width` и започва и завършва с `"|"`, т.е. при `render()`-ването на всеки елемент от `elements` добавя `Text("|")` в началото и в края на реда. В случай, че дължината на реда е повече от `width` отрязва излишъка от подадения елемент, a в случай, че дължината е по-малка - добавя `Spacer` след елемента с дължина `width - len(element.render()) - 2`.
* `ProgressBar(length, progress)`: прогрес бар с дължина `length` символа и коефициент на запълване `progress` ($ \in [0, 1] $) (примерно `ProgressBar(10, 0.5).render()` трябва да върне `"[====----]"`)

Добавяйте каквито прецените други класове и методи към тях.

#### Пример

```python
ui = Box(19,
    FancyText("WELCOME!"),
    Spacer(),
    Text("Loading packages:THIS SHOULD NOT BE SHOWN IN THE BOX"),
    HorizontalStack(
        Line(3),
        Spacer(),
        Text("cowsay")
    ),
    HorizontalStack(
        Line(3),
        Spacer(),
        Text("lolcat")
    ),
    HorizontalStack(
        Line(3, symbol=">"),
        Spacer(),
        Text("whoami"),
        Text("...")
    ),
    Spacer(),
    HorizontalStack(
        Spacer(),
        ProgressBar(15, 0.4),
        Spacer()
    )
)

print(ui.render())
```

Изход:
```
+=================+
|=W=E=L=C=O=M=E=!=|
|                 |
|Loading packages:|
|--- cowsay       |
|--- lolcat       |
|>>> whoami...    |
|                 |
| [======-------] |
+=================+
```

# Функционално програмиране
План на лекцията:
- Какво е функционално програмиране ?
- Immutability & side-effects
- Функции като обекти
- Декоратори
- Анонимни (lambda) функции
- Lazy evaluation
- Generators
- Map
- Filter
- Reduce
- Zip
- List comprehension
- Скорост
- Dict comprehension
- Pattern matching
- Примери

## Какво е функционално програмиране ?

Функционалното програмиране е парадигма в програмирането, фокусираща се върху използването на функции. В езиците за функционално програмиране, функциите могат да се третират като обекти. Друга особенност на функционалното програмиране (или поне в чистата му форма), е липсата на състояние (а и от там, липсата на променливи в традиционния смисъл). В повечето езици за функционално програмиране липсват и класове. 

Основни концепции във функционалното програмиране:
- Функции като обекти
- Функции от по-висок ред
- "Чисти" функции
- Рекурсия 

Примери за езици, които следват единствено функционалната парадигма са Scheme, Haskell, Lisp.

В повечето модерни езици за програмиране могат да се открият елементи от функционалното програмиране - Python не е изключение. 


## Immutability и странични ефекти

### Накратко за mutable/immutable
По дефиниция, една променлива е `mutable`, ако можем да променим стойността ѝ, след като е създадена. Съответно `immutable` променлива, е променлива, на която не можем да променяме стойността. На практика, това означава, че стойността на една `immutable` променлива може да бъде задедена, само при създаването на променливата. 

В езици като C++ или Java, това е еквивалентно на дефинирането на променлива като константа. Тогава стойността ѝ е ясна по време на компилация.

### Накратко за страничните ефекти
Страничен ефект е когато променим състоянието на някоя променлива от дадена функция. Например нека разгледаме следната функция

In [None]:
def add_to_list(l):
    l.append(5)

l = []

add_to_list(l)
print(l)

add_to_list(l)
print(l)

[5]
[5, 5]


Тази функция, променя стойността на подадения аргумент `l`. Казваме, че тази функция съдържа страничен ефект. 

Страничните ефекти са силно използвани в обектно-ориентираното и процедурното програмиране, за разлика от функционалното програмиране. Както по-горе споменахме, в класическите езици за функционално програмиране, липсват променливи в познатия ни вид. Там можем да присвоим име на дадена стойност, без да я променяме повече. 

Функции, които не променят стойностите на променливи, се наричат "чисти". Във функционалното програмиране (а и не само), е прието всички функции да са чисти.

Можем да променим нашата функция `add` по следния начин, за да стане чиста:

In [None]:
def add_to_list(l):
    return l + [5]

l = []

l1 = add_to_list(l)
print(l1)

l2 = add_to_list(l)
print(l2)

print(l)

[5]
[5]


## Функции, като обекти


В Python, функциите са т.нар. "first-class objects" - което на български може да се преведе като "първокласни обекти". А ако трябва да го обясним с прости думи, функциите могат да се третират като "нормалните" типове - числа, низове и т.н. Това означава, че можем да ги използваме като променливи - да им даваме имена, да ги подаваме към аргументи на други функции, да ги връщаме като резултат от функции и да ги пазим в колекции.

In [None]:
def multiply(a, b):
    return a * b

f = multiply

print(f(2, 3))

6


Важно е да направим разлика между `f = multiply` и `f = multiply()`. Макар и разликата да е малка синтактично, поведението на двата реда е различно. Първото извикване **присвоява функцията** към променливата `f`, докато второто **присвоява резултата от извикването** на функцията.  

Когато присвоим цялата функция (може да си го представяме като function pointer в C++), можем да ползваме функцията като нормална променлива:

In [None]:
def multiply(a, b):
    return a * b

def sum_(a, b):
    return a + b


def apply_to_numbers(a, b, f):
    print(f'Applying a function to {a} and {b}')
    return f(a, b)

print(apply_to_numbers(2, 3, sum_))
print(apply_to_numbers(2, 3, multiply))

Applying a function to 2 and 3
5
Applying a function to 2 and 3
6


А можем и да връщаме функция като резултат от друга функция:

In [None]:
def foo():
    print("Foo called")

def bar():
    return foo

f = bar()
f()

Foo called


В тялото на една функция, можем да дефинираме друга функция, която да върнем:

In [None]:
def foo():
    def bar():
        print("Bar called")
    
    return bar

f = foo()
f() 

Bar called


Това, че функциите са обекти, ни позволява да правим интересни неща - например, можем да направим проста функция, която да използваме за logging.

In [None]:
def log_and_run(f, args=(), kwargs={}):
    print(f'Calling {f} with {args} and {kwargs}')
    return f(*args, **kwargs)

def add(a, b):
    return a + b

print(log_and_run(add, (2, 3)))

Calling <function add at 0x7f2c9d108320> with (2, 3) and {}
5


Припомням, че `args` съдържа позиционните аргументи и е от тип `Tuple`, а `kwargs` съдържа keyword аргументите и е от тип `dict`.

Освен като аргументи и резултат, функциите могат да се пазят и в колекции (списъци, речници, т.н.):

In [None]:
def add(a, b):
    return a + b

def subtract(a, b):
    return a - b

def multiply(a, b):
    return a * b

def divide(a, b):
    return a / b

actions = {
    '+': add,
    '-': subtract,
    '*': multiply,
    '/': divide
}

first = input('Enter a number: ')
operation = input('Enter an operation (+, -, * or /)')
second = input('Enter a number: ')

if operation not in actions:
    print('Operation not supported')
else:
    if not first.isnumeric() or not second.isnumeric():
        print('Input is not a number')
    else:
        first = int(first)
        second = int(second)

        result = actions[operation](first, second)
        print(f'{first} {operation} {second} = {result}')


Enter a number: 2
Enter an operation (+, -, * or /)+
Enter a number: 3
2 + 3 = 5


## Декоратори

Една от по-интересните функционалности на Python са т.нар. декоратори (decorators). Всъщност, ние вече видяхме как се пише декоратор и как работи - нека се върнем на примера от по-горе с `log_and_run`:

In [None]:
def log_and_run(f, args=(), kwargs={}):
    print(f'Calling {f} with {args} and {kwargs}')
    return f(*args, **kwargs)

def add(a, b):
    return a + b

print(log_and_run(add, (2, 3)))

Calling <function add at 0x7f2c9d0b7170> with (2, 3) and {}
5


Това изглежда леко грозно, да трябва да извикваме `log_and_run` вместо функцията, която всъщност искаме да извикаме. Ако добавим функции за изваждане, умножение и деление, всяко извикване ще трябва да преминава през `log_and_run`. 

А няма ли по-лесен начин с който да кажем - нека преди изпълнението на нашата функция `f1`, да се изпълни функция `f` (Както преди `add` се изпълнява `log_and_run`) ?

Преди да разгледаме как точно се прави декоратор функция в Python, нека всъщност разберем какво искаме да постигнем:
1. Искаме да приемем функция (нека я кръстим `g`), която да изпълним
2. Преди да изпълним `g`, искаме да изпълним някакви други действия (нека те са събрани във функцията `f`
3. Искаме да върнем нова функция (нека да я кръстим `h`), която първо да изпълни `f`, а после `g`.

Нека първо се фокусираме върху 1 и 2 :

In [None]:
def pseudo_decorator(f, g):
    f()
    g()


def print_hello():
    print("Hello")

def print_bye():
    print("Bye")


pseudo_decorator(print_hello, print_bye)

Hello
bye


Нека променим поведението на `pseudo_decorator` от това просто да изпълнява `f` и `g` към това да връща нова функция, която да изпълнява `f` и `g`

In [None]:
def pseudo_decorator(f, g):
    def inner():
        f()
        g()
    return inner


def print_hello():
    print("Hello")

def print_bye():
    print("bye")


f = pseudo_decorator(print_hello, print_bye)
f()

Hello
bye


Почти сме до истинските декоратори. За съжаление, следващата част е възможна заради малко синтактична захар. 

Основната идея е, че искаме да вземем нашата функция `g` и да я заместим с резултата от `pseudo_decorator`, без да се налага реално да извикваме `pseudo_decorator`. С цел опростяване, ще приемем, че `f` е просто принтиране. 

In [None]:
def print_decorator(g):
    def inner():
        print("Hello")
        g()
    return inner

@print_decorator
def print_bye():
    print("bye")

print_bye()

Hello
bye


С помощта на `@`, последвано от функция, която връща друга функция, ние можем да "декорираме" всяка функция в Python.

Това, което се случва в случая е, че взимаме `print_bye` като първи аргумент на `print_decorator` и изпълняваме `print_decorator`. Тя от своя страна ни връща нова функция, която принтира "Hello" и след това изпълнява подадената от нас функция. 

Обяснено още по-просто: При извикване на `print_bye`, всъщност ще се извика `print_decorator` с аргумент `print_bye`. 

Нека използваме този нов подход върху примера с `log_and_run` (която ще преименуваме само на `log`)

In [None]:
def log(f):
    def inner(*args, **kwargs):
        print(f'Calling {f} with {args} and {kwargs}')
        return f(*args, **kwargs)
    return inner

@log
def add(a, b):
    return a + b

print(add(2, 3))

Calling <function add at 0x7f2c9d0be440> with (2, 3) and {}
5


Сега ако добавим нови методи за изваждане, умножение и деление, можем лесно да се използваме от `log`, без да се налага да променяме начина им на извикване:

In [None]:
def log(f):
    def inner(*args, **kwargs):
        print(f'Calling {f} with {args} and {kwargs}')
        return f(*args, **kwargs)
    return inner

@log
def add(a, b):
    return a + b

@log 
def subtract(a, b):
    return a - b

@log
def multiply(a, b):
    return a * b

@log
def divide(a, b):
    return a / b

print(add(2, 3))
print(subtract(3, 1))
print(multiply(1.5, b=3))
print(divide(a=12, b=6))

Calling <function add at 0x7f2c9d0be170> with (2, 3) and {}
5
Calling <function subtract at 0x7f2c9d0be440> with (3, 1) and {}
2
Calling <function multiply at 0x7f2c9d0bedd0> with (1.5,) and {'b': 3}
4.5
Calling <function divide at 0x7f2c9d0bef80> with () and {'a': 12, 'b': 6}
2.0


Друг пример за декоратор може да бъде декоратор, който измерва времето за изпълнение на функция:

In [None]:
import time

def time_it(f):
    def inner(*args, **kwargs):
        start = time.time()
        result = f(*args, **kwargs)
        end = time.time()
        print(f'{f} took {end - start:.2f} second')
    return inner

@time_it
def slow_function(a):
    return (a ** a) ** a

slow_function(1000)

<function slow_function at 0x7f2c9d0c4950> took 1.56 second


## Анонимни (lambda) функции

Lambda функции идват от т.нар ламбда смятане (lambda calculus) и изразяват изпълнението на дадени изчисления върху дадени стойности. Няма да навлизаме в математическите доказателства и формализми. Lambda функциите са анонимни функции - т.е. не се дефинират с `def` и без да е необходимо да им се дава име. 

Всяка ламбда функция има две основни части - входни променливи и един израз (expression). В Python, ламбда функциите се дефинират с ключовата дума `lambda`

In [None]:
lambda x: x + 1

<function __main__.<lambda>(x)>

По-горната функция приема един аргумент (на име `x`), и изпълнява израза `x + 1`. Важно е да се отбележи, че една ламбда функция може да съдържа само един израз.

Припомням, че израз в Python е всичко, което съдържа някакъв индетификатор (напр. променлива), литерал (напр. `'hello'`) или оператор (напр. извикване на функция, оператор `[]`)

Или казано по-просто: не може да създадем ламбда, която да присвоява стойност на някаква променлива:

In [None]:
lambda x: a = x

SyntaxError: ignored

Не можем също и да имаме два израза един след друг (Това чисто синтактично няма как да ни се позволи - ламбдите са на един ред, а в Python нямаме символ за край на израз.

Можем да извикваме дадена lambda функция, като просто използваме `()` след нея

In [None]:
(lambda x: print(x))(5)

5


Макар и анонимни, можем да присвоим ламбда функция към дадена променлива

In [None]:
f = lambda x: x + 1

print(f(5))

6


Горното парче код изпълнява следните стъпки:
1. Създава анонимна функция, която приема един аргумент (`x`) и връща стойноста на `x` събрана с 1
2. Присвояваме новосъздадената ни функция към променливата `f`
3. Принтираме резултата от извикването на `f` със стойност 5
    - В тялото на ламбда функцията, стойноста на `x` се замества с 5
    - От там, 5 + 1 = 6

Едно от местата, където често се ползват lambda функции, са вградените функции за сортиране. Както знаем, метода `.sort()` може да приема функция, която да сравнява обектите. 

In [None]:
l = [5, 2, 7, 3]
l.sort(key=lambda x: -x)
print(l)

[7, 5, 3, 2]


С помощта на тази ламбда, можем да сортираме числата в обратен ред. 

Можем да използваме ламбди за да сортираме и по-сложни списъци - например списък от наредени n-торки.

Нека е даден списък, съставен от имена на хора, и тяхната възраст. 

In [None]:
people_data = [('Иван', 22), ('Георги', 71), ('Мария', 35), ('Митко', 51), ('Любо', 35)]
people_data.sort(key=lambda person: (person[1], person[0]))
print(people_data)

[('Иван', 22), ('Любо', 35), ('Мария', 35), ('Митко', 51), ('Георги', 71)]


Тук първо сортираме хората по тяхната възраст, а после лексикографкси, по тяхното име.

Можем да използваме и функцията `sorted` с ламбда функция:

In [None]:
people_data = [('Иван', 22), ('Георги', 71), ('Мария', 35), ('Митко', 51), ('Любо', 35)]
print(sorted(people_data, key=lambda person: (person[1], person[0])))

[('Иван', 22), ('Любо', 35), ('Мария', 35), ('Митко', 51), ('Георги', 71)]


## Lazy evaluation

Съществуват различни стратегии за оценяване (или изчисляване) на изрази - най-позната е т.нар. "нетърпеливо оценяване" или "оценяване на момента" - целия израз се изчислява на момента.

Нека е даден израза `a + b + c`. Първо, ще бъде оценена стойността на `a`, после на `b`. Следващата стъпка е да се извърши операцията събиране. Резултатът от първата операция ще бъде използван за следващата операция събиране, заедно с `c`. 

Пример за оценяване на момента може да бъде следната функция:

In [None]:
def f(x):
    print(f'x = {x}')
    return x

print(f(1) + f(2))

x = 1
x = 2
3


При оценяването на момента (eager evaluation), всички необходими данни за извършване на изчислението (променливи, функции, др.) се зареждат наведнъж в паметта. Освен това, всички изчисления трябва да бъда извършени точно на момента.

Тук се намесва т.нар. "мързеливо" оценяване - изчисленията се извършват само при необходимост. Това ни позволява да си спестим някои изчисления (както и да работим с т.нар. "безкрайни" колекции).

Най-близкото до "мързеливо" оценяване, което познаваме е изчисляването на логическите изрази при `if` блокове и други булеви изрази - там, всеки елемент от израза се изчислява, при условие че предишния израз не е достатъчен за оценяване на целия израз (т.е. ако имаме един израз който е със стойност на `True` при изрази съдържащи `or`, тези след него не се оценяват. Ако имаме израз, който съдържа `and`, трябва да оценим всички стойности). 

По подобен начин работи и мързеливото оценяване, с разликата, че изразите се оценяват при поискване. 

## Generators

Генераторите са специални функции, които позволяват "мързеливо" итериране на дадена (дори и безкрайна) поредица. Генераторите не държат всичките си стойности в паметта, а изчисляват стойността при поискване (това позволява работата с "безкрайни" поредици).

Нека разгледаме следния пример - искаме да създадем генератор, който да ни връща числата, които са точни квадрати (число, получено чрез повдигане на друго цяло число на квадрат - 1, 4, 9, 16, 25, т.н.). 

Ако за момент се абстрахираме от идеята за генератори, как бихме могли да напишем функция, която ни връща `n`-тия точен квадрат ? Първия точен квардрат е 0 ($0^2 = 0$, защото са неотрицателни), втория е 1 ($1^2 = 1$), третия е 4 ($2^2 = 4$) и т.н. 

In [None]:
def generate_nth_perfect_square(n):
    return (n-1) ** 2

print(generate_nth_perfect_square(3))

4


Можем да променим нашата функция, която да ни връща списък от всички точни квадрати до `n`-тия. 

In [None]:
def generate_all_perfect_squares_until(n):
    result = []
    for i in range(1, n+1):
        result.append(generate_nth_perfect_square(i))
    
    return result

print(generate_all_perfect_squares_until(5))

[0, 1, 4, 9, 16]


Проблемът с горната функция, е че изчислява всички стойности до `n` едновременно - ние искаме те да се изчисляват една по една, при поискване. По-важното е, че искаме да можем да итерираме по тях - т.е. да ги вкараме в един `for` цикъл, и да ги обходим.

За да постигнем тази цел, ни трябват две неща - функция, която да "спре" изпълнението до дадено място и да ни върне някаква стойност - функцията, която извършва това, е `yield`. 

In [None]:
def perfect_squares(n):
    for i in range(1, n+1):
        yield generate_nth_perfect_square(i)


print(perfect_squares(5))

<generator object perfect_squares at 0x7f2c9d0b8350>


Тук виждаме, че нашата функция вече ни връща `generator` обект. 

За да работим с нашия генератор обект, е необходимо да го подадем като обект на функцията `next` - тя ни връща следващия елемент от генератор/итератор.

In [None]:
perfect_square_generator = perfect_squares(5)
print(next(perfect_square_generator))
print(next(perfect_square_generator))
print(next(perfect_square_generator))
print(next(perfect_square_generator))

0
1
4
9


Както се вижда, `next` изпълнява нашия код, до следващото срещане на `yield`, и връща стойността, която `yield` връща.

Благодарение на факта, че получваме генератор, може да използваме нашата функция `perfect_squares` директно във `for` цикъл. Начина по който `for` цикъла работи е, че извиква `next` метода на подадения от нас обект. 

In [None]:
for i in perfect_squares(5):
    print(i)

0
1
4
9
16


Нека направим нещата една идея по-сложни. Вместо да създаваме генератор на точни квадрати до дадено число, нека променим нашия генератор, да връща точни квадрати до безкрайност (понеже точните квадрати са дефинирани върху всички неотрицателни числа, е възможно до безкрайност да генерираме такива).

In [None]:
def perfect_square():
    n = 1
    while True:
        yield generate_nth_perfect_square(n)
        n += 1

In [None]:
perfect_square_generator = perfect_square()
print(next(perfect_square_generator))
print(next(perfect_square_generator))
print(next(perfect_square_generator))
print(next(perfect_square_generator))

0
1
4
9


Използването на `yield` не е единствения начин да бъде създаден генератор. Python поддържа т.нар. "generator expressions". Generator expressions е синтактична конструкция, която ни позволява да създаваме генератор на базата на друга колекция/генератор. Синтактично, generator expression следва математическата нотация за дефиниране на множество:

$$ S = \{x^2 \mid x \in [1;100] , x \text{ is even}\} $$

Това математическо заклинание ни дава целите числа в диапазона от 1 до 100, които са четни, като всяко от тях е повдигнато на квадрат.

В общият случай, един generator expression изглежда по следния начин: `(f(x) for x in X if p(x))`, където `f` е функция, която прилагаме върху `x`, а `p` е филтрираща функция (повече за прилагането на функции върху елементи и филтрирането му по-долу)

Ако искаме да запишем нашата функция `perfect_squares(n)`, която ни връща точните квадрати до `n` като generator expression, тя би изглеждала по следния начин.

In [None]:
perfect_squares_generator_exp = (generate_nth_perfect_square(i) for i in range(1, 6))

print(perfect_squares_generator_exp)
print(next(perfect_squares_generator_exp))
print(next(perfect_squares_generator_exp))
print(next(perfect_squares_generator_exp))

<generator object <genexpr> at 0x7f2ca22f6950>
0
1
4


В горния пример, нашия генератор ще ни върне първите 5 точни квадрата, с помощта на generator expression. Как би изглеждал кода обаче, ако искаме да можем да приемаме `n`, с което да заместим 5 ?

In [None]:
perfect_squares_n_generator_exp = lambda n: (generate_nth_perfect_square(i) for i in range(1, n + 1))

for num in perfect_squares_n_generator_exp(3):
    print(num)

print('--')
for num in perfect_squares_n_generator_exp(10):
    print(num)

0
1
4
--
0
1
4
9
16
25
36
49
64
81


Една бележка за `next` - освен генератора, `next` приема и `default` стойност, която се връща при изчерпване на генератора:

In [None]:
def short_generator():
    for i in range(3):
        yield i

g = short_generator()

print(next(g, "Default"))
print(next(g, "Default"))
print(next(g, "Default"))
print(next(g, "Default"))
print(next(g, "Default"))

0
1
2
Default
Default


## range и enumerate

Един от най-използваните генератори е `range`. `range` приема три аргумента - начало, край и стъпка. В резултат, получаваме генератор, който генерира числата от това множество. 

In [None]:
for i in range(2, 7, 2):
    print(i)

2
4
6


Няма значение колко е голям размера на `range`-а за представянето му - това е защото `range` изчислява следващия елемент на момента. 

Друг полезен генератор, е `enumerate`. Той приема колекция, и връща индексът на който се намира всеки елемент, както и самия елемент.

In [None]:
fruits = ["Apple", "Banana", "Cherry", "Watermelon", "Grapes"]

for fruit in enumerate(fruits):
    print(fruit)

(0, 'Apple')
(1, 'Banana')
(2, 'Cherry')
(3, 'Watermelon')
(4, 'Grapes')


Можем да използваме unpacking, за да разделим индекса и обекта:

In [None]:
fruits = ["Apple", "Banana", "Cherry", "Watermelon", "Grapes"]

for i, fruit in enumerate(fruits):
    print(f'{fruit} is on position {i}')

Apple is on position 0
Banana is on position 1
Cherry is on position 2
Watermelon is on position 3
Grapes is on position 4


Можем да зададем и начален индекс, от който да се отброява:

In [None]:
fruits = ["Apple", "Banana", "Cherry", "Watermelon", "Grapes"]

for i, fruit in enumerate(fruits, start=100):
    print(f'{fruit} is on position {i}')

Apple is on position 100
Banana is on position 101
Cherry is on position 102
Watermelon is on position 103
Grapes is on position 104


## Map



Map е специална функция, която има една-единствена цел - да приложи друга функция към всеки елемент от дадена колекция. Нека е даден списък с числа и функция, която приема число, и го умножава по 2.

In [None]:
numbers = [2, 7, 3, 9, -1, 12]

def multiply(number):
    return number * 2

Ако трябва сами да разпишем map функцията, тя би изглеждала по следния начин:

In [None]:
def my_map(map_function, collection):
    result = []

    for item in collection:
        result.append(map_function(item))
    
    return result

Нека извикаме нашата map функция, с дефинираните по-горе числа и функция, която да бъде приложена

In [None]:
print(f'Squared numbers: {my_map(multiply, numbers)}')

Squared numbers: [4, 14, 6, 18, -2, 24]


Можем да подадем и функция, която променя типа на обектите - нека разгледаме функция, която приема цяло число от 1 до 7 и връща съответния ден от седмицата (1 - Понеделник, 2 - Вторник, т.н.)

In [None]:
def number_to_day(number):
    days = ["Monday", "Tuesday", "Wednesday", "Thursday", "Friday", "Saturday", "Sunday"]
    return days[number - 1]

days = [2, 3, 1, 4, 6]

print(f'Days of the week: {my_map(number_to_day, days)}')

Days of the week: ['Tuesday', 'Wednesday', 'Monday', 'Thursday', 'Saturday']


Нека сега разгледаме и вградена функция `map` в Python - тя приема като първи аргумент функцията, която ще бъде приложена, а като втори - колекцията, върху която да се приложи.

In [None]:
numbers = [1, 2, 3, 4]

def square(number):
    return number ** 2

print(f'Appyling map directly returns: {map(square, numbers)}')

Appyling map directly returns: <map object at 0x7f2c9d1100d0>


Важно е да се отбележи, че резултатът от map функцията е `map` обект - или поне така изглежда. Всъщност това, което се връща е генератор, който ни дава новите стойности. Съвсем лесно можем да превърнем този генератор в списък, с едно просто извикване на `list()` функцията.


In [None]:
numbers = [1, 2, 3, 4]

def square(number):
    return number ** 2

print(f'Converting the map object into a list: {list(map(square, numbers))}')

Converting the map object into a list: [1, 4, 9, 16]


Освен да подаваме нормална функция, можем да използваме и `lambda`.

In [None]:
numbers = [1, 2, 3, 4]

mapped_numbers = map(lambda number: number ** 2, numbers)
result = list(mapped_numbers)

print(result)

[1, 4, 9, 16]


Нека усложим нещата - ако се върнем на първоначалната ни дефиниция за `map` (Функция, която прилага друга функция върху колекция), си задаваме въпроса - какво става, ако имаме повече от една колекция, върху която искаме да приложим функция ? Възможно ли е въобще ? 

Отговора е да - `map` приема една или повече колекции. Единствената особенност е, че функцията която подаваме трябва да може да приеме повече от един аргумент. На по-прост език - ако подадем два списъка на `map`, функцията която ще се приложи върху тях трябва да приема два аргумента.

In [None]:
first_numbers = [1, 2, 3, 4]
second_numbers = [5, 6, 7, 8]

def multiply(a, b):
    return a * b

print(list(map(multiply, first_numbers, second_numbers)))

[5, 12, 21, 32]


Важно е да се отбележи, че резултата от `map` операция винаги е **една** поредица от обекти - дори и да приемем 10 колекции, винаги на изхода ще имаме една. 

**Въпрос:** Как може да "измамим" системата, и да върнем повече от една колекция ?

### Отговор

Няма как да върнем повече от една колекция - това което можем да направим, е да върнем колекция, която съдържа наредени n-торки (tuples).

In [None]:
first_numbers = [1, 2, 3, 4]
second_numbers = [5, 6, 7, 8]

def return_as_tuple(a, b):
    return a, b

print(list(map(return_as_tuple, first_numbers, second_numbers)))

[(1, 5), (2, 6), (3, 7), (4, 8)]


## Zip

Нека се върнем за кратко към примера за използването на `map`, при който от два списъка, ние направихме един, който съдържаше елементите на двата, групирани по позицията им:

In [None]:
first_numbers = [1, 2, 3, 4]
second_numbers = [5, 6, 7, 8]

def return_as_tuple(a, b):
    return a, b

print(list(map(return_as_tuple, first_numbers, second_numbers)))

[(1, 5), (2, 6), (3, 7), (4, 8)]


В Python има готова функция, която прави това обединение за нас - `zip`

In [None]:
first_numbers = [1, 2, 3, 4]
second_numbers = [5, 6, 7, 8]

print(zip(first_numbers, second_numbers))
print(list(zip(first_numbers, second_numbers)))

<zip object at 0x7f2c9d130f00>
[(1, 5), (2, 6), (3, 7), (4, 8)]


Не е нужно списъците да са от еднакви типове елементи.

In [None]:
names = ['Иван', 'Любо', 'Алекс']
favorite_number = [3, 20, 8]

print(list(zip(names, favorite_number)))

[('Иван', 3), ('Любо', 20), ('Алекс', 8)]


Ако единият списък е по-дълъг от другия, по-дългия списък ще бъде отрязан:

In [None]:
names = ['Иван', 'Любо', 'Алекс', 'Иво']
favorite_number = [3, 20, 7]

print(list(zip(names, favorite_number)))

[('Иван', 3), ('Любо', 20), ('Алекс', 7)]


In [None]:
names = ['Иван', 'Любо', 'Алекс']
favorite_number = [3, 20, 7, -1]

print(list(zip(names, favorite_number)))

[('Иван', 3), ('Любо', 20), ('Алекс', 7)]


Или поне това е поведението по подразбиране. `zip` предлага още два метода на работа. С помощта на аргумента `strict=True`, ако подадените списъци са с различен размер, `zip` ще ни хвърли грешка (това е въведено в Python3.10). 

In [None]:
names = ['Иван', 'Любо', 'Алекс']
favorite_number = [3, 20, 7, -1]

zip(names, favorite_number, strict=True)

TypeError: ignored

А ако искаме да добавим някакви "празни" стойности към по-късия списък, може да използваме 

In [None]:
from itertools import zip_longest

names = ['Иван', 'Любо', 'Алекс']
favorite_number = [3, 20, 7, -1, -2]

print(list(zip_longest(names, favorite_number, fillvalue='Dummy')))

[('Иван', 3), ('Любо', 20), ('Алекс', 7), ('Dummy', -1), ('Dummy', -2)]


Ако трябва да сме на 100% коректни, `zip` приема каквато и да е колекция:

In [None]:
numbers = [1, 2, 3]
letters = ['a', 'b', 'c']

print(list(zip(map(lambda x: x ** 2, numbers), letters)))

[(1, 'a'), (4, 'b'), (9, 'c')]


Горният пример, малко по-културно разписан, изглежда по следния начин:

In [None]:
numbers = [1, 2, 3]
letters = ['a', 'b', 'c']

squared_numbers = map(lambda x: x ** 2, numbers)
zipped_together = zip(squared_numbers, letters)
zipped_together_as_a_list = list(zipped_together)

print(zipped_together_as_a_list)

[(1, 'a'), (4, 'b'), (9, 'c')]


## Filter


Както името подсказва, `filter` е функция която ни връща елементите от дадена колекция, удолетворяващи дадено условие.

Нека отново имаме някакви числа, и функция която връща дали дадено число е четно или не.

In [None]:
numbers = [2, 7, 11, 12]

def is_even(number):
    return number % 2 == 0

Ако трябва сами да разпишем функцията, тя би изглеждала по следния начин:

In [None]:
def my_filter(filter_fn, collection):
    result = []
    for item in collection:
        if filter_fn(item):
            result.append(item)
    
    return result

In [None]:
print(my_filter(is_even, numbers))

[2, 12]


Извикването на вградената функция `filter` изглежда по следния начин

In [None]:
print(filter(is_even, numbers))

<filter object at 0x7f2c9d0c7510>


Както `map`, така и `filter` връщат генератор обекти - с едно извикване на `list` можем да превърнем резултата в списък

In [None]:
print(list(filter(is_even, numbers)))

[2, 12]


Може и с `lambda`

In [None]:
print(list(filter(lambda number: number % 2 == 0, numbers)))

[2, 12]


Ако искаме да вземем първия елемент от резултата на `filter`, може да използваме `next()`.

In [None]:
next(filter(lambda number: number % 2 == 0, numbers))

2

In [None]:
red_bull_team = "Verstappen", "Perez"
top10 = ["Leclerc", "Sainz", "Verstappen", "Norris", "Piastri", "Russel", "Perez", "Hülkenberg", "Lawson", "Colapinto"]

next(driver for driver in top10 if driver in red_bull_team)

'Verstappen'

## Reduce

Тук нещата стават една идея по-сложни. Нека започнем с един пример: трябва да намерим произведението на всички числа в даден списък.

Нека за момент се абстрахираме от програмирането - как бихме намерили произведението на числа 3, 5 и 8 ? Първо бихме умножили 3 и 5, което прави 15. След това, получения резултат от предишната операция (в нашия случай 15) и ще го умножим с 8.

Тази процедура може да бъде използвана за списъци с произволен брой числа - всяко следващо число бива умножено с резултата до момента.

Ако трябва да представим тази идея с код, тя би изглеждала по следния начин:

In [None]:
def get_product_of_all_nums(nums):
    result = nums[0]

    for num in nums[1:]:
        result = result * num
    
    return result

In [None]:
numbers = [3, 5, 8]
print(get_product_of_all_nums(numbers))

120


Нека генерализираме нашата функция - вместо умножение, тя да може да работи с подадена функция, приемаща два аргумента - резултата до момента и текущото число

In [None]:
def my_reduce(function, collection):
    result = collection[0]

    for item in collection[1:]:
        result = function(result, item)
    
    return result

In [None]:
numbers = [3, 5, 8]
def multiply(result_so_far, current_number):
    return result_so_far * current_number

print(my_reduce(multiply, numbers))

120


Една промяна, която можем да направим е следната - вместо за начало да взимаме първия елемент от колекцията, може да приемаме началната стойност като аргумент на функцията. Така нашата функция би работела и с празни колекции. 

In [None]:
def my_reduce_with_start(function, collection, start):
    result = start

    for item in collection:
        result = function(result, item)
    
    return result

In [None]:
numbers = [3, 5, 8]
def multiply(result_so_far, current_number):
    return result_so_far * current_number

print(my_reduce_with_start(multiply, numbers, 1))

120


Ето че стигнахме и до `reduce` - функция, която приема функция и колекция. Функцията бива приложена върху резултата, който имаме до момента и всеки елемент от колекцията.
Важно е да уточним терминологията тук - в някои езици може да срещенете тази функция като `accumulate`, `fold` или пък `foldl`.

Тук е важно да спомена за наличието на т.нар "ляв" и "десен" `reduce`. В други функционални езици (като Haskell), имаме концепцията за ляв и десен `fold` - в каква посока се изпълнява функцията - отляво надясно или отдясно наляво. За някои операции (например умножение) реда на изпълнение няма значение, но например при деление би имало значение дали започваме от ляво или от дясно. Повече информация за fold функцията в другите езици, може да намерите [тук](https://www.wikiwand.com/en/Fold_(higher-order_function)). 

Вградената функция reduce в Python се намира в библиотеката `functools`. За да я използваме, първо трябва да я заредим (`import`)

In [None]:
from functools import reduce

numbers = [3, 5, 8]

def multiply(result_so_far, current_number):
    return result_so_far * current_number

print(reduce(multiply, numbers, 1))

120


Както може би сте се досетили, тук не получаваме генератор - резултатът от `reduce` е една стойност (в нашия случай това е число).

`reduce`, също както `map` и `filter` работи и с `lambda` функции. Тук е добро място да се отбележи, че първия аргумент, който бива подаден на функцията е стойността до момента (или стойността, която се е **акумулирала** (**accumulate**). 

In [None]:
numbers = [3, 5, 8]

print(reduce(lambda acc, number: acc * number, numbers))

120


А можем и да подадем начална стойност:

In [None]:
numbers = [3, 5, 8]
print(reduce(lambda acc, number: acc * number, numbers, 1))
print(reduce(lambda acc, number: acc * number, numbers, 2))

120
240


А сега един по-сложен пример: Нека имаме списък, чийто елементи са списъци с числа. С помощта на `reduce`, подходяща функция и подходяща начална стойност, бихме могли да получим един списък, който съдържа числата, без те да са в отделни списъци.

In [None]:
numbers_2d = [[1, 2, 3], [4, 5, 6], [7, 8, 9, 10]]

print(reduce(lambda acc, item: acc + item, numbers_2d, []))

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


Припомням, че операция събиране (`+`) приложена върху два списъка ни връща конкатенацията на двата списъка. 

В горната операция, ние взехме един списък, и го "изравнихме" (flatten). Операцията "flatten" върху списъци е често срещата в езиците за функционално програмиране, макар и в Python да нямаме готова функция за това. 

## List comprehension

В Python съществува функционалност, наречена "list comprehension". List comprehension е синтактична конструкция, която ни позволява да създаваме списъци на базата на други колекции/итератори/генератори. Синтактично, list comprehension прилича на generator expressions:

Можем да изразим тази идея в Python като използваме вече познатите ни `map` и `filter`:


In [None]:
numbers = range(1, 101)

even_numbers = filter(lambda x: x % 2 == 0, numbers)
squared_numbers = map(lambda x: x ** 2, even_numbers)

print(f'Squared even numbers: {list(squared_numbers)}')

Squared even numbers: [4, 16, 36, 64, 100, 144, 196, 256, 324, 400, 484, 576, 676, 784, 900, 1024, 1156, 1296, 1444, 1600, 1764, 1936, 2116, 2304, 2500, 2704, 2916, 3136, 3364, 3600, 3844, 4096, 4356, 4624, 4900, 5184, 5476, 5776, 6084, 6400, 6724, 7056, 7396, 7744, 8100, 8464, 8836, 9216, 9604, 10000]


В общия случай, синтаксиса на list comprehension е следния: `[f(item) for item in collection if p(item)]` - т.е. кода по-горе би изглеждал по следния начин като list comprehension:

In [None]:
print(f'Squared even numbers: {[x ** 2 for x in range(1, 101) if x % 2 == 0]}')

Squared even numbers: [4, 16, 36, 64, 100, 144, 196, 256, 324, 400, 484, 576, 676, 784, 900, 1024, 1156, 1296, 1444, 1600, 1764, 1936, 2116, 2304, 2500, 2704, 2916, 3136, 3364, 3600, 3844, 4096, 4356, 4624, 4900, 5184, 5476, 5776, 6084, 6400, 6724, 7056, 7396, 7744, 8100, 8464, 8836, 9216, 9604, 10000]


`if` часта или функцията, която се прилага върху всяка променливата могат да бъдат изпуснати:

In [None]:
numbers = [1, 2, 3]
print(f'Odd numbers: {[number for number in numbers if number % 2 != 0]}')
print(f'Multiplying all numbers by 2: {[number * 2 for number in numbers]}')

Odd numbers: [1, 3]
Multiplying all numbers by 2: [2, 4, 6]


Тук е добре да отбележем, че основната синтактична разлика между list comprehension и generator comprehension е скобите (`[]` за list comprehension и `()` за generator comprehension)

In [None]:
def calculate_area_of_rectangle(a, b):
    return a * b

rectangles = [(1, 2), (5, 4), (3, 2.5), (-2, 3)]
areas = [calculate_area_of_rectangle(x, y) for x, y in rectangles if x >= 0 and y >= 0]

print(f'Areas of valid rectangles: {areas}')

Areas of valid rectangles: [2, 20, 7.5]


Може би забелязвате, че когато функцията която изпълняваме не е външна, не използваме `lambda`, а директно пишем операцията която искаме да приложим - това е част от опростяването на синтаксиса на list comprehension-ите. 

Нека имаме дадени числа - искаме да върнем списък, в който за всяко число да пише "Yes" ако се дели на 3 или 5 и "No" в противен случай. Това може да стане лесно, чрез използването на тернарния оператор в Python.

In [None]:
numbers = [7, 12, 5, 6, 9, 15, 1, 11]

results = ["Yes" if number % 3 == 0 or number % 5 == 0 else "No" for number in numbers]

print(f'Results are: {results}')

Results are: ['No', 'Yes', 'Yes', 'Yes', 'Yes', 'Yes', 'No', 'No']


## Скорост

Едно от най-"шокиращите" неща в Python е скоростта, която получаваме при използването на обикновенни `for` цикли, `map` или list comprehension.

За да демонстрираме разликата, ще създадем функция, която повдига число на квадрат, и ще я приложим върху списък от 40 000 000 числа.

In [None]:
from time import time

def power_up(a):
    return a ** 2

numbers = list(range(1, 40000000))

for_loop_start = time()

for_loop_result = []
for number in numbers:
    for_loop_result.append(power_up(number))

for_loop_end = time()
print(f'For-looping took {for_loop_end - for_loop_start:.2f} seconds')


map_start = time()

map_result = list(map(power_up, numbers))

map_end = time()
print(f'map() took {map_end - map_start:.2f} seconds')


list_comprehension_start = time()

list_comprehension_result = [power_up(x) for x in numbers]

list_comprehension_end = time()
print(f'List comprehension took {list_comprehension_end - list_comprehension_start:.2f} seconds')

For-looping took 19.72 seconds
map() took 13.60 seconds
List comprehension took 15.08 seconds


Основната разлика във времето идва от факта, че `append()` операцията е бавна. `map` и list comprehension-ите използва хитрини при заделянето на паметта, затова може да се каже че са с около 30% по-бързи. Няма да се впускам повече в темата, за по-любопитните, [тук](https://web.archive.org/web/20190319205826/http://blog.cdleary.com/2010/04/efficiency-of-list-comprehensions/) нещата са обяснение в повече детайли.

На въпросът, кой от трите подхода се използват, моят отговор е следния: list comprehension и `map` дават доста по-добро представяне спрямо `for` loop + `append`, затова и са за предпочитане. Синтаксисът на list comprehension-ите е по-прост спрямо този на `map` (особенно ако трябва и да филтрираме елементите), което води до това, че **list comprehension-ите са за предпочитане**.

## Dict comprehension

Подобно на list comprehension, можем да използваме подобен запис да създадем и речник (dictionary, dict).

Синтаксисът е същият, само че вместо `[]`, използваме `{}`. Също така, вместо един елемент, използваме `key:value` - т.е. общия вид би изглеждал по следния начин: `{f(item):g(value) for item in collection if p(item)}`

Нека като пример разглеждаме dict, който съдържа число (измежду 1 и 10), и дали е четно или не

In [None]:
my_dict = {num:num%2 == 0 for num in range(1, 11)}

print(my_dict)

{1: False, 2: True, 3: False, 4: True, 5: False, 6: True, 7: False, 8: True, 9: False, 10: True}


Както при generator изразите и list comprehension, можем да добавим `if` част.

Нека създадем речник, който съдържа четните числа от 1 до 20, както и тяхната репрезентация като низ.

In [None]:
even_numbers_as_strs = {num:str(num) for num in range(1, 21) if num % 2 == 0}

print(even_numbers_as_strs)

{2: '2', 4: '4', 6: '6', 8: '8', 10: '10', 12: '12', 14: '14', 16: '16', 18: '18', 20: '20'}


## Walrus operator

В Python 3.8 се появява нов оператор, който ни позволява да имаме т.нар. "assignment expression" - израз, в който можем да присвояваме променливи.

Чрез него можем да спестим изчисляването на дадени изрази, като ги присвоим към име на места, в който това не бе позволено.

In [None]:
numbers = [4, 7, 6, 3, 1, 8]

data = {
    'count': len(numbers),
    'sum': sum(numbers),
    'average': sum(numbers) / len(numbers)
}

data

{'count': 6, 'sum': 29, 'average': 4.833333333333333}

Тук, изчисляваме дължината и сумата на елементите два пъти. Можем да отделим тези сметки в променливи, и да ги преизползваме.

In [None]:
numbers = [4, 7, 6, 3, 1, 8]

count = len(numbers)
total_sum = sum(numbers)

data = {
    'count': count,
    'sum': total_sum,
    'average': total_sum / count
}

data

{'count': 6, 'sum': 29, 'average': 4.833333333333333}

Проблемът тук е, че използваме тези променливи само за речника. Можем да "преместим" това дефиниране на стойностите вътре в речника, чрез използването на walrus оператора. 

Той изглежда по следният начин: `(name := expression)`. Важно е да се отбележи, че скобите са задължителни.

In [None]:
numbers = [4, 7, 6, 3, 1, 8]

data = {
    'count': (count := len(numbers)),
    'sum': (total_sum := sum(numbers)),
    'average': total_sum / count
}

data

{'count': 6, 'sum': 29, 'average': 4.833333333333333}

Най-честото използване на walrus оператора е в list comprehension-и.

В долният пример имаме клас `Point`, както и функция `calculate_length`, която изчислява разстоянието между две точки.

Дадени са ни 4 точки, като искаме да върнем точките и разстоянието между тях, ако то е по-малко от 3.

In [None]:
import math

class Point:
    def __init__(self, x, y):
        self.x = x
        self.y = y

    def __str__(self):
        return f'({self.x}, {self.y})'
    
    def __repr__(self):
        return str(self)

def calculate_length(a, b):
    return math.sqrt((a.x - b.x) ** 2 + (a.y - b.y) ** 2)

point_1 = Point(2, 3)
point_2 = Point(3, 4)
point_3 = Point(4, 5)
point_4 = Point(1, 0)

first_points = [point_1, point_2]
second_points = [point_3, point_4]

In [None]:
distances = [(first, second, calculate_length(first, second)) for first, second in zip(first_points, second_points) if calculate_length(first, second) > 3]
distances

[((3, 4), (1, 0), 4.47213595499958)]

Прилагайки walrus оператора тук, кодът ни изглежда по следния начин:

In [None]:
distances = [(first, second, length) for first, second in zip(first_points, second_points) if (length := calculate_length(first, second)) > 3]
distances

[((3, 4), (1, 0), 4.47213595499958)]

## namedtuple

В горният пример, дефинирахме клас `Point`, който единствено държи две стойности - `x` и `y`. Към него липсват методи (освен `__str__` и `__repr__`). 

Алтернативен вариант би бил да представим нашата точка като `tuple`. 

In [None]:
point_1 = (2, 3)

print(f'({point_1[0]}, {point_1[1]})')

(2, 3)


Проблемът с този подход, е че трябва да гадаем на какво отговоря всеки от елементите на tuple-а. 

Python ни позволява да създадем т.нар. именувана n-торка (`namedtuple`). Този тип е подтип на `tuple`, но с избрано име от нас, и именувани член-данни.

Можем да създадем `namedtuple` по следния начин:

In [None]:
from collections import namedtuple
point = namedtuple('Point', ['x', 'y'])

point_1 = Point(2, 3)

print(f'({point_1.x}, {point_1.y})')
print(point_1)

(2, 3)
(2, 3)


Забелязваме, че `namedtuple` има предефиниран `__str__` и `__repr__` методи.

## Pattern matching и `match` израза

Pattern matching-а (или шаблонното съпоствяне на български) е една от най-полезните функционалности в езиците за функционално програмиране. Тя ни позволява да проверяваме дали даден обект отговаря на даден шаблон, и да извличаме данни от него.

В Python3.10 за първи път се появява възможността на pattern matching. Тя е реализирана чрез `match` израза.

Общият вид на `match` конструкцията изглежда по следния начин:

```python
match <обект>:
    case <условие> <guard>:
        тяло
    case <условие2>:
        тяло
    case <условие3> <guard>:
        тяло
    ...
```

### Прости примери

Нека напишем кратка програма калкулатор. Потребителят ще въведе две числа от клавиатурата и операция, която да се извърши.

In [None]:
first_number = int(input('Enter the first number: '))
second_number = int(input('Enter the second number: '))

operation = input('Enter an operation (+, -, * or /)')

match operation:
    case '+':
        result = first_number + second_number
    case '-':
        result = first_number - second_number
    case '*':
        result = first_number * second_number
    case '/':
        result = first_number / second_number
    case _:
        print('Operation not supported')

print(f'{first_number} {operation} {second_number} = {result}')

1 + 2 = 3


Какво се случва тук ? Прочитаме две числа и операция която да се извърши върху тях. След това подаваме операцията на `match` израза.

Оттам, започваме да сравняваме `operation` с различните възможности. Ако `operation` съвпада с някой от `case`-овете, изпълняваме съответното тяло.

Важна забележка - `_` винаги съвпада с всичко. Това ни позволява да си направим "default" клауза, която да се изпълни, ако няма друга която да се съвпада.

На мястото на `<обект>` можем да поставим и обект от тип `tuple`:

In [None]:
numbers = (5, 3)


match numbers:
    case (1, 2):
        print('First case')
    case (3, 3):
        print('Second case')
    case (5, 3):
        print('Third case')
    case _:
        print('Default case')

Third case


Тук `numbers` се оценява спрямо всички възможни случаи. Първият който съвпада, е `(5, 3)`, и съответно се изпълнява тялото на съответния `case`.


С помощта на `_` можем да укажем че не ни интересува конкретната стойност на даден елемент от tuple-а.

In [None]:
numbers = (5, 3)

match numbers:
    case (5, _):
        print('First case')
    case (5, 3):
        print('Second case')
    case _:
        print('Default case')

First case


В тази ситуация, `match` изразът ще изпълни първия случай, защото той е първия който съвпада.

### По-сложни примери

Силата на `match` израза идва в това какви изрази поддържа. Ще разгледаме някои от тях:

#### Or pattern

In [None]:
numbers = (5, 3)

match numbers:
    case (5, 3) | (2, 4):
        print('First case')
    case (5, 3):
        print('Second case')
    case _:
        print('Default case')

First case


In [None]:
numbers = (2, 4)

match numbers:
    case (5, 3) | (2, 4):
        print('First case')
    case (5, 3):
        print('Second case')
    case _:
        print('Default case')

First case


`or` pattern-ът ни позволява да сравняваме даден обект с няколко условия. Той се използва с `|` оператора.

При сравнението се проверява дали подадения израз съвпада с първата или втората част от `case`-а.

#### As pattern

Ако искаме да проверим кое точно от pattern-ите съвпада, можем да използваме конструкцията `as`:

In [None]:
numbers = (5, 3)

match numbers:
    case (5, 3) | (2, 4) as a:
        print(f'First case: {a}')
    case (5, 3):
        print('Second case')
    case _:
        print('Default case')

First case: (5, 3)


Тук, след като `case`-а съвпадне, стойността на numbers ще бъде присвоена на `x`.

In [None]:
numbers = (2, 4)

match numbers:
    case (5, 3) | (2, 4) as a:
        print(f'First case: {a}')
    case (5, 3):
        print('Second case')
    case _:
        print('Default case')

First case: (2, 4)


In [None]:
numbers = (2, 4)

match numbers:
    case (2 as a, 4 as b):
        print(f'First case: {a}')
    case (5, 3):
        print('Second case')
    case _:
        print('Default case')

First case: 2


#### Value pattern

In [None]:
def divide(x, y):
    if y == 0:
        return None
    
    return x / y

match divide(10, 2):
    case None:
        print('Division by zero')
    case result:
        print(f'Result is {result}')

Result is 5.0


Можем да сравняваме и спрямо конкретни стойности - можем да проверяваме дали даден обект е None, или някакъв друг литерал

`type` pattern-ът ни позволява да сравняваме спрямо типа на дадения обект. В примера, функцията `divide(10, 2)` ще върне `int``, което ще се присвои на `result`.

#### Sequence pattern

In [None]:
numbers = [1, 2, 3, 4, 5]

match numbers:
    case [1, 2, 3]:
        print('First case')
    case [1, 2, 3, 4, 5]:
        print('Second case')

Second case


In [None]:
numbers = [1, 2, 3, 4, 5]

match numbers:
    case [1, 2, 3, *rest]:
        print('First case')
    case [1, 2, 3, 4, 5]:
        print('Second case')

First case


In [None]:
numbers = [1, 2, 3, 4, 5]

match numbers:
    case [1, 2, *rest, 5]:
        print(f'First case, {rest}')

First case, [3, 4]


### Guard-ове

`match` израза ни позволява да добавяме и условия, които да се проверяват след като съвпадне pattern-а (т.нар guard-ове).

Те се добавят след шаблона в case частта.

In [None]:
numbers = (5, 3)
some_other_value = 42

match numbers:
    case (5, 3) if some_other_value % 2 != 0:
        print('First case')
    case _:
        print('Default case')

Default case


In [None]:
numbers = (5, 3)

match numbers:
    case (a, b) if a == 5:
        print('First case')
    case _:
        print('Default case')

First case


### Class pattern

Можем да прилагаме `match` върху инстанции на класове. За целта, трябва да подадем името на класа, последвани от стойностите за атрибутите му.

In [None]:
class Point:
    def __init__(self, a, b, c):
        self.x = a
        self.y = b
        self.z = c

point = Point(2, 3, 4)

match point:
    case Point(x=0, y=0):
        print("Point at the origin")
    case Point(x=x, y=0):
        print(f"Point on the x-axis at x={x}")
    case Point(x=0, y=y):
        print(f"Point on the y-axis at y={y}")
    case Point(x=x, y=y, z=z):
        print(f"Point at coordinates ({x}, {y}, {z})")
    case _:
        print("Unknown point")


Point at coordinates (2, 3, 4)


Забележете, че трябва да подадем експлицитно имената на атрибутите. Ако искаме да използваме позиционни аргументи, то това ще работи в две ситуации:

1. Ако инстанцията е от тип `bool`, `bytearray`, `bytes`, `dict`, `float`, `frozenset`, `int`, `list`, `set`, `str`, `tuple`
2. Ако сме предифинирали метода `__match_args__`.

Повече за клас pattern-а, може да прочетете [тук](https://docs.python.org/3.11/reference/compound_stmts.html#class-patterns)

### Използване

Изпозването на `match` не е често срещано в Python. Макар и да е мощен, доста често може да бъде заместен с `if-else` блок. 

Ще покажем няколко примера за използването му, в които според нас има смисъл да се използва `match`.

С помощта на match можем да напишем програма, която проверява дали дадена дума е палиндром.

In [None]:
def palindrome_with_match(word):
    match word:
        case [a, *word, b] if a == b:
            return palindrome_with_match(word)
        case [] | [_]:
            return True
        case _:
            return False

In [None]:
words = ['aba', 'abab', 'tacocat', '', 'a']

for word in words:
    print(f'Is "{word}" palindrome ? {palindrome_with_match(list(word))}')

Is "aba" palindrome ? True
Is "abab" palindrome ? False
Is "tacocat" palindrome ? True
Is "" palindrome ? True
Is "a" palindrome ? True


Важно е да отбележим, че `match` не работи добре със `str`, затова се налага да превърнем думата в `list`.

(Side-note) В Python можем да проверим дали даден низ е палиндром по следния начин: `word == word[::-1]`

Друг пример е когато се налага да обработваме по-сложни колекции от данни:

In [None]:
def handle_person(data):
    match data:
        case {
            "name": {"first": first, "last": last},
            "age": age,
            "address": {"city": city, "zip": zip_code},
            "employment": {"position": "Manager"}
        }:
            return f"Manager {first} {last}, Age: {age}, City: {city}, Zip: {zip_code}"
        case {
            "name": {"first": first, "last": last},
            "age": age,
            "address": {"city": city}
        }:
            return f"{first} {last}, Age: {age}, City: {city}"
        case _:
            return "Unknown person format"

In [None]:
data_manager = {
    "name": {
        "first": "Alice",
        "last": "Johnson"
    },
    "age": 42,
    "address": {
        "city": "New York",
        "zip": "10001"
    },
    "employment": {
        "position": "Manager",
        "company": "TechCorp"
    }
}

data_employee = {
    "name": {
        "first": "Bob",
        "last": "Smith"
    },
    "age": 30,
    "address": {
        "city": "San Francisco"
    }
}
data_unknown = {
    "first_name": "Charlie",
    "age": 25,
    "city": "Los Angeles",
    "employment_status": "Unemployed"
}

print(handle_person(data_manager))
print(handle_person(data_employee))
print(handle_person(data_unknown))

Manager Alice Johnson, Age: 42, City: New York, Zip: 10001
Bob Smith, Age: 30, City: San Francisco
Unknown person format


Можем да използваме `match` и за валидация на типа на дадена променлива.

В конкретният пример ще проверяваме дали подадената променлива е `int` или `str`. Ако е `str`, ще опитаме да я превърнем в `int`.

In [None]:
def extract_value(variable):
    match variable:
        case int():
            return variable
        case str() if variable.isnumeric():
            return int(variable)
        case _:
            return None

print(extract_value("42"))
print(extract_value(5))
print(extract_value("asd"))

42
5
None


## Примери

Нека разгледаме някои примери за функционално програмиране от живия живот

### Пример 1


Нека е даден клас `Student` с полета `name`, `student_id_number`, `year`, `courses`, където `courses` е списък с курсове и оценки към тях, представени от класа `Course`.

Да се напише функция, която приема списък от студенти, и връща списък, съдържащ номерата на студентите, които имат среден успех над 4.50.

In [None]:
class Course:
    def __init__(self, name='', grade=2.0):
        self.__name = name
        self.__grade = grade
    @property
    def name(self):
        return self.__name
    
    @property
    def grade(self):
        return self.__grade

    @grade.setter
    def grade(self, new_grade):
        self.__grade = new_grade

class Student:
    def __init__(self, name, student_id_number, year):
        self.__name = name
        self.__student_id_number = student_id_number
        self.__year = year
        self.__courses = []
    
    @property
    def name(self):
        return self.__name

    @property
    def student_id_number(self):
        return self.__student_id_number

    @property
    def year(self):
        return self.__year

    @property
    def courses(self):
        return self.__courses

    def start_new_year(self):
        self.__year += 1
        self.__courses = []
    
    def add_new_course(self, course):
        self.__courses.append(course)

student_1 = Student('Ivan the Programmer', '12345', 1)
student_1.add_new_course(Course('Algebra', 4.50))
student_1.add_new_course(Course('Intro to programming', 6.00))
student_1.add_new_course(Course('Geometry', 3.00))
student_1.add_new_course(Course('Calculus', 2.00))

student_2 = Student('Maria', '12346', 1)
student_2.add_new_course(Course('Algebra', 5.75))
student_2.add_new_course(Course('Intro to programming', 6.00))
student_2.add_new_course(Course('Geometry', 6.00))
student_2.add_new_course(Course('Calculus', 6.00))

student_3 = Student('Gosho from break', '12347', 1)
student_3.add_new_course(Course('Algebra', 2.00))
student_3.add_new_course(Course('Intro to programming', 2.00))
student_3.add_new_course(Course('Geometry', 2.00))
student_3.add_new_course(Course('Calculus', 3.00))


#### Решение на Пример 1

In [None]:
def average_grade(student):
    grades = [course.grade for course in student.courses]
    return sum(grades) / len(grades)

def get_students_with_high_enough_grades(students):
    target_grade = 4.50

    return [student.name for student in students if average_grade(student) >= target_grade]

all_students = [student_1, student_2, student_3]

print(get_students_with_high_enough_grades(all_students))

['Maria']


### Пример 2


Напишете декоратор, който "защитава" изпълнението на функция със специална супер секретна парола (например 'super_safe_password`). Нашият декоратор трябва да пита потребителя за парола. Ако въведената парола съвпада, изпълнява подадената функция. В противен случай, връща 'Invalid password'. 

#### Решение на пример 2

In [None]:
def login_required(f):
    def inner():
        password = input('Please enter a password')
        if password == 'super_safe_password':
            result = f()
        else:
            result = 'Invalid password'
        return result
    return inner

In [None]:
@login_required
def get_super_secret_message(name):
    return f'Hi, {name}. Your mission is to learn Python.'

@login_required
def foo(a, b, c, d):
    return a + b + c + d

print(foo(2, 3, 4, d=5))

TypeError: inner() takes 0 positional arguments but 4 were given

### Пример 3

`range` ни връща генератор, който ни дава числата в даден интервал. Нека разширим тази идея, и напишем генератор, който ни дава координатите в двумерно пространство при зададено начало и край.

Пример: начало - (1, 1), край - (3, 4)

Резултат: (1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3)

#### Решение на Пример 3

In [None]:
def range_2d(start, end):
    for i in range(start[0], end[0]):
        for j in range(start[1], end[1]):
            yield (i, j)

# for coord in range_2d((1, 1), (3, 4)):
#     print(coord)

save = range_2d((1, 1), (3, 4))
current = range_2d((1, 1), (3, 4))

print(next(current))
print(next(current))
print(next(save))

(1, 1)
(1, 2)
(1, 1)


### Пример 4

Напишете функция `bind_countries_to_capitals`, която приема два списъка - списък с имена на държави и списък с имена на столици.
Функцията трябва да върне речник, който съдържа държавите като ключове и съответните им столици като стойности. (приемаме, че на същия индекс на който е държавата стои и столицата ѝ в другия списък)

#### Решение на пример 4

In [None]:
def bind_countries_to_capitals(countries, capitals):
    return dict(zip(countries, capitals))


countries = ['Bulgaria', 'Italy', 'Turkey']
capitals = ['Sofia', 'Rome', 'Ankara']

result = bind_countries_to_capitals(countries, capitals)
print(result)
# {'Bulgaria': 'Sofia', 'Italy': 'Rome', 'Turkey': 'Ankara'}

{'Bulgaria': 'Sofia', 'Italy': 'Rome', 'Turkey': 'Ankara'}


### Пример 5

#### Условие 1
Даден е следният клас `RGB`, който моделира цвят в RGB формат:

In [None]:
class RGB:
    def __init__(self, r, g, b):
        """Initialize the RGB class with the given values for red, green and blue.
        Each value should be an integer between 0 and 255.
        """

        if r < 0 or r > 255:
            raise ValueError('Invalid red value')
        if g < 0 or g > 255:
            raise ValueError('Invalid green value')
        if b < 0 or b > 255:
            raise ValueError('Invalid blue value')

        self._r = r
        self._g = g
        self._b = b

    @property
    def r(self):
        return self._r

    @property
    def g(self):
        return self._g

    @property
    def b(self):
        return self._b

    def to_hex(self):
        return f'#{self.r:02X}{self.g:02X}{self.b:02X}'
    
    @classmethod
    def from_hex(cls, hex):
        r = int(hex[1:3], base=16)
        g = int(hex[3:5], base=16)
        b = int(hex[5:7], base=16)

        return cls(r, g, b)
        
    def __repr__(self):
        return f'RGB({self.r}, {self.g}, {self.b})'

    def __eq__(self, other):
        return self.r == other.r and self.g == other.g and self.b == other.b

    def __hash__(self):
        return hash((self.r, self.g, self.b))

Да се напишат функции `rgb_pallette_to_hex_str` и `hex_str_pallette_to_rgb`, които:

* `rgb_pallette_to_hex_str`: конвертира лист от цветове като `RGB` до лист от `str` (цветовете във формат `#RRGGBB`, където `RR`, `GG`, `BB` са сътответно стойностите на червеното, зеленото и синьото в шестнадесетична бройна система)
* `hex_str_pallete_to_rgb`: конвертира лист от `str` в горепосочения hex формат (case-insensitive!) и връща лист от `RGB` обекти (цветовете в RGB формат)

***Hint 1***: съществуват начини в `str.format` или `f-string`-овете да се специфицират колко цифри и в каква бройна система да се използват при форматиране на числа

***Hint 2***: разгледайте всички варианти на конструиране на `int` по даден `str`

In [None]:
def rgb_pallette_to_hex_str(colors):
    return [color.to_hex() for color in colors]

colors = [RGB(255, 0, 255)]

def hex_pallette_to_rgb(hex_colors):
    return [RGB.from_hex(hex_color) for hex_color in hex_colors]

result = rgb_pallette_to_hex_str(colors)
print(result)

print(hex_pallette_to_rgb(result))

['#FF00FF']
[RGB(255, 0, 255)]


#### Условие 2

Нека имаме и имена за някои от цветовете:

In [None]:
PALLETTE = {
    RGB(255, 255, 255): 'white',
    RGB(0, 0, 0): 'black',
    RGB(255, 0, 0): 'red',
    RGB(0, 255, 0): 'green',
    RGB(0, 0, 255): 'blue',
    RGB(69, 69, 69): "the 51st shade of grey",
}

In [None]:
hex_colors = ["#696969", "#00FF00", "#AAAAAA"]

def extract_only_named_colors(hex_colors):
    # 1. Convert hex to RGB objects
    # 2. Check if each RGB object is in Pallette
    # 3. Return the names those who are in Pallette

    rgb_objects = hex_pallette_to_rgb(hex_colors)
    filtered_objects = [rgb_object for rgb_object in rgb_objects if rgb_object in PALLETTE]
    names_of_filtered_objects = [PALLETTE[filtered_object] for filtered_object in filtered_objects]

    return names_of_filtered_objects

Да се напише функция `extract_only_named_colors` по подаден списък от цветове във формат `#RRGGBB` връща списък от имената им (само на тези, които присъстват в `PALLETTE` - другите се игнорират).

### Пример 6

Рефакторирайте долния код така, че да съответства на функционалния стил на програмиране:

In [None]:
class PrettyPrint:
    def __init__(self):
        self.__border = '|'
        self.__content = ''
        self.__prefix = '***'
        self.__suffix = '***'

    def pretty_print(self):
        return f'{self.__border} {self.__prefix} {self.__content} {self.__suffix} {self.__border}'

    @property
    def border(self):
        return self.__border

    @border.setter
    def border(self, new_border):
        self.__border = new_border

    @property
    def content(self):
        return self.__content

    @content.setter
    def content(self, new_content):
        self.__content = new_content

    @property
    def prefix(self):
        return self.__prefix

    @prefix.setter
    def prefix(self, new_prefix):
        self.__prefix = new_prefix

    @property
    def suffix(self):
        return self.__suffix

    @suffix.setter
    def suffix(self, new_suffix):
        self.__suffix = new_suffix

pretty_printer = PrettyPrint()

pretty_printer.content = 'Hello world'
print(pretty_printer.pretty_print())

pretty_printer.prefix = '<<<'
pretty_printer.suffix = '>>>'
print(pretty_printer.pretty_print())

| *** Hello world *** |
| <<< Hello world >>> |


In [None]:
def pretty_print(content, border='|', prefix='666', suffix='666'):
    return f'{border} {prefix} {content} {suffix} {border}'

print(pretty_print('Hell world'))

| 666 Hell world 666 |


### Пример 7

Направете преводач от кирилица към "шльокавица".

Нека приемем, че азбуката на шльокавицата e A, B, V, G, D, E, J, Z, I, Y, K, L, M, N, O, P, R, S, T, U, F, H, C, 4, 6, 6T, U, Y, YU, Q.

### Пример 8

Напишете собствена версия на `enumerate`. Тя трябва да приема като аргументи колекцията, по която ще итерираме, както и незадължителен аргумент `start` (=0).

In [None]:
def my_enumerate(collection, start=0):
    pass

# Data Structures & Oddities

Структурите от данни са класове и обекти с интерфейс чрез който ги използваме, като се абстрахираме от имплементацията им.

Алгоритмите са генерализирани процедури (парчета код/функции) които решават даден проблем (изпълняват дадена задача).

Oddities са модули на Python, които нямат място в друга тема, но са интересни за решаването на проблеми.

## Str

`str` е поредица от символи. Ще разгледаме:

- [str](https://docs.python.org/3/library/stdtypes.html#text-sequence-type-str) методи и
- [string](https://docs.python.org/3/library/string.html) често употребявани константи

Стринговете в Python са immutable -> Повечето операции са $O(n)$

In [None]:
# Python speaks   UTF-8 :) https://en.wikipedia.org/wiki/UTF-8
s = '🐍 is awesomeͤͤͤͤͤ'
print(s)


🐍 is awesomeͤͤͤͤͤ


In [None]:
if 'самобукви'.isalpha():
    print('{букви} = alphabetic')

# Можем ли да конвертираме стринга до int?
if '1232367457'.isdigit():
    print('{числа} = digit')

# Бърза проверка дали работим с дума или изречение (изречението има паузи и символи)
if '1283912873andLetters'.isalnum():
    print('{числа, букви} = alpha-numeric')

# Трябва ли да пишем код който разбира от главни букви?
if 'малкибукви'.islower():
    print('{малки букви} = lowercase')

if 'ГОЛЕМИБУКВИ'.isupper():
    print('{големи букви} = uppercase')

# Използваме при разбиване на стрингове - if space : do X else do Y
if '\t\n  '.isspace():
    print('{празни символи} = space')


{букви} = alphabetic
{числа} = digit
{числа, букви} = alpha-numeric
{малки букви} = lowercase
{големи букви} = uppercase
{празни символи} = space


In [None]:
s = '🐍 is awesomeͤͤͤͤͤ'

if s.endswith('e'):
    print('s завършва на e')  # eͤͤͤ != e

if s.startswith('🐍 is'):
    print("s започва с '🐍 is'")

print('is е на индекс', s.find('is'))  # Индекс по символ, не по байт

print("'e' се среща", s.count('e'), 'пъти')


s започва с '🐍 is'
is е на индекс 2
'e' се среща 2 пъти


Библиотеката `string` предоставя някои удобни константи

In [None]:
import string

# Вместо да хардкодваме "abcdef..."
print('all letters:', string.ascii_letters)
print('all lowercase:', string.ascii_lowercase)
print('all digits as a string:', string.digits)
print('all symbols:', string.punctuation)
print('all whitespaces:', string.whitespace, string.whitespace.encode())


all letters: abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
all lowercase: abcdefghijklmnopqrstuvwxyz
all digits as a string: 0123456789
all symbols: !"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
all whitespaces:  	
 b' \t\n\r\x0b\x0c'


## Int

Python няма ограничение за големината на int (C++ long long има ограничение $2^{63}-1$). Но операциите с големи числа са бавни - не са $O(1)$, а $O(log(number)) = O(number\;of\;digits)$

Когато стойността надвиши $2^{63}-1$ числата се обръщат в BigInt.

[https://www.codementor.io/@arpitbhayani/how-python-implements-super-long-integers-12icwon5vk](https://www.codementor.io/@arpitbhayani/how-python-implements-super-long-integers-12icwon5vk)

In [None]:
%%time

result = 1
for x in range(1, 100000):
    result *= x
# Същият код на C++ минава за total: 0.001 s.
# Но не връща верен отговор :)


CPU times: user 4.23 s, sys: 22.9 ms, total: 4.25 s
Wall time: 4.27 s


In [None]:
# За по голяма прицизност може да използваме `decimal` модула
# По дефолт има прецизност 28 знака след запетаята,
# но може да му дадем повече :)
from decimal import *
getcontext().prec = 56
print(Decimal(22) / Decimal(7))


3.1428571428571428571428571428571428571428571428571428571


## Math

In [None]:
import math

print('Закръгляне нагоре 2.2 ->', math.ceil(2.2))
print('Закръгляне надолу 2.7 ->', math.floor(2.7))

# Може да правим побитово итериране на  числото
print('Преброяване на битовете на числото 257 =', math.ceil(math.log2(257)))
# Полезно при построяване на Trie/radix sort/заделяне на hashmap
print('Преброяване на цифрите на числото 14532 =', math.ceil(math.log10(14532)))

# Математически важни функции
print('Най-голям общ делител на 35 и 15 =', math.gcd(35, 15))
print('Можем да смятаме inverse елемента по модул 15^-1 mod 26 =', pow(15, -1, 26))

# Комбинаторика (често се среща в задачи, но има и други)
print('N choose K -> 10 choose 2 =', math.comb(10, 2))


Закръгляне на горе 2.2 -> 3
Закръгляне на долу 2.7 -> 2
Преброяване на битовете на числото 257 = 9
Преброяване на цифрите на числото 14532 = 5
Най-голям общ делител на 35 и 15 = 5
Можем да смятаме inverse елемента по модул 15^-1 mod 26 = 7
N choose K -> 10 choose 2 = 45


`math` модулът има още много функции на които няма да се спираме, защото не се използват често:
- Тригонометрични функции
- Хиперболични функции
- Гама функция
- Конвертиране между градуси и радиани
- Други

## List

Саморазширяващ се списък/масив от елементи. Въпреки името list, структурата е динамичен масив, а не свързан списък.

In [None]:
arr = [0] * 10  # инициализиране на списък с 10 елемента O(n)
print('Списък с 10 елемента:', arr)

arr = list()  # празен списък O(1)
arr.clear()  # O(1) еквивалентно на ' = list()'
print('Празен списък:', arr)

# O(1*) за разлика от конкатенацията на стрингове ('abc' + 'd') която е O(n)
arr.append(1)
arr.insert(0, -1)  # O(n)
arr = [-2] + arr  # O(n) еквивалентно на горното АКО елементите НЕ СА list
print('До момента имаме:', arr)

arr.reverse()  # O(n)
print('Може да обърнем списъка', arr)

arr.sort()  # O(n * log n)
print('И да го сортираме', arr)

last_element = arr.pop()  # O(1)
print('pop премахва последния елемент и го връща', arr, last_element)


Списък с 10 елемента: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
Празен списък: []
До момента имаме: [-2, -1, 1]
Може да обърнем списъка [1, -1, -2]
И да го сортираме [-2, -1, 1]
pop премахва последния елемент и го връща [-2, -1] 1


## Array 

`array` предоставя по-ефективно използване на паметта от `list`. Повече прилича на стандартните масиви в други езици. Добавянето на елемент в края на `array` е $O(1)$.

Има същите функционалности като `list`.

При инициализиране трябва да окажем типа на елементите в списъка.

Ако се е стигнало до използване на по-оптимизирани структури в Python най-добре да използваме някоя библиотека като `numpy`.

In [None]:
%%capture
# %%capture is a jupyter instruction to hide output
from array import array

array('l')  # array<32 bit int>
array('u', 'hello \u2641')  # array<unicode character>
array('d', [1.0, 2.0, 3.14])  # array<double>
array('I', [1, 2, 3])  # array<unsigned 16 bit int>


## Dict

`dict` е питонската имплементация на Hash-Table. Повечето операции с `dict` са $O(1)$. Изключение правят операциите за обработка на всички елементи, които са $O(n)$.

Елементите на `dict` са `key`-`value` (ключ - стойност). Ключът задължително трябва да е от тип, който може да се хешира, стойността може да е всякаква.

Забележка: Казваме, че операциите са $O(1)$, но всъщност зависят от размера на ключа. Обикновено ключовете са малки по размер в паметта и за това на повечето места в литературата се казва че операциите са $O(1)$, но ако ключовете ни са стрингове с дължина 100,000 символа, то сложността на операциите не е точно $O(1)$ :)

In [None]:
my_dict = {}  # Инициализираме празен dict
my_dict = dict()  # dict() == {}

my_dict['is big'] = 'not'
print('dict с 1 елемент', f'{my_dict = }')
del my_dict['is big']  # del изтрива елемент
print('празен dict след като изтрихме ключа "is big"', f'{my_dict = }')
# Ако се опитаме да достъпим или изтрием ключ който не
# съществува ще гръмнем с KeyError
del my_dict['non-existent key']


dict с 1 елемент my_dict = {'is big': 'not'}
празен dict след като изтрихме ключа "is big" my_dict = {}


KeyError: 'non-existent key'

In [None]:
# Итериране по dict
person_age = {
    'Gosho na pochivka': 25,
    'Gosho na fmi': 11001,
}

result = []
for x in person_age:  # == .keys()
    result.append(x)
print('for x in dict:', result)

result = []
for x in person_age.keys():
    result.append(x)
print('for x in dict.keys():', result)

result = []
for x in person_age.values():
    result.append(x)
print('for x in dict.values():', result)

result = []
for x in person_age.items():
    result.append(x)
print('for x in dict.items():', result)


for x in dict: ['Gosho na pochivka', 'Gosho na fmi']
for x in dict.keys(): ['Gosho na pochivka', 'Gosho na fmi']
for x in dict.values(): [25, 11001]
for x in dict.items(): [('Gosho na pochivka', 25), ('Gosho na fmi', 11001)]


In [None]:
# По време на итериране не е позволено да променяме dict
palindromes = {
    'ami': 'ima',
    'pari': 'irap',
    'nema': 'amen',
}

for x in palindromes:
    palindromes[x] = 'nali ne mojelo da se promenq e bai xy*'

print(palindromes)

for x in palindromes:
    del palindromes[x]  # промяна върху ключовете не работи :(


{'ami': 'nali ne mojelo da se promenq e bai xy*', 'pari': 'nali ne mojelo da se promenq e bai xy*', 'nema': 'nali ne mojelo da se promenq e bai xy*'}


RuntimeError: dictionary changed size during iteration

In [None]:
print('въпреки грешката на предишната стъпка изтрихме 1 ключ (на рандъм)', palindromes)

# Тъй като не може да променяме dict докато итерираме ще трябва да създадем нов
changed = {k: 'shte si napravq moi dict togava'
           for k, _ in palindromes.items() if k != 'pari'}
print(changed)


въпреки грешката на предишната стъпка изтрихме 1 ключ (на рандъм) {'pari': 'nali ne mojelo da se promenq e bai xy*', 'nema': 'nali ne mojelo da se promenq e bai xy*'}
{'nema': 'shte si napravq moi dict togava'}


In [None]:
# Задача

my_list = [1,2,3,4,5]
my_dict = {1:'a', 2:'b', 3:'c', 4:'d', 5:'e'}

# Коя операция е по-бърза
if 4 in my_list:
    print('list')
if 4 in my_dict:
    print('dict')

"""Изпълни клетката за хинт"""
import base64
print(base64.b64decode(
    '0J7Qv9C10YDQsNGC0L7RgNGK0YIgaW4g0LLRitGA'
    '0YXRgyBsaXN0INC1IE8obiksINCwINCy0YrRgNGF'
    '0YMgZGljdCDQtSBPKDEqKQ=='.encode()).decode())


### Defaultdict

`defaultdict` живее в модула `collections`. Има същата функционалност като `dict`, но при инициализация трябва да окажем от какъв тип ще са стойностите. При достъпване на ключ, който не съществува, ще се създаде ключа и стойност - дефолтен обект от типа, който задаваме при инициализация.

Обикновено го използваме за удобство - не е нужно да проверяваме дали стойността зад някой ключ е инициализирана.

In [None]:
from collections import defaultdict

my_default_dict = defaultdict(list)
print(my_default_dict)
my_default_dict['what']
print('дори само с достъпване на ключа създаваме дефолтен обект', my_default_dict)

del my_default_dict['what']
for index, char in enumerate('this is a string'):
    my_default_dict[char].append(index)  # Това ще изгърми с нормален dict

my_default_dict


defaultdict(<class 'list'>, {})
дори само с достъпване на ключа създаваме дефолтен обект defaultdict(<class 'list'>, {'what': []})


defaultdict(list,
            {'t': [0, 11],
             'h': [1],
             'i': [2, 5, 13],
             's': [3, 6, 10],
             ' ': [4, 7, 9],
             'a': [8],
             'r': [12],
             'n': [14],
             'g': [15]})

In [None]:
# Задача (advanced)
# Как може да имплементираме Trie чрез defaultdict

import base64
print(base64.b64decode(
    'ZGVmIHRyaWUoKToKICAgIHJldHVybi'
    'BkZWZhdWx0ZGljdCh0cmllKQo='.encode()).decode())


### Counter

`Counter` е още един под-клас на `dict`. При инициализация може да се подаде колекция (или друг обект който може да се итерира и елементите му могат да се хешират), която бива итерирана и елементите ѝ се преброяват.
Елементите на колекцията стават ключове, а стойностите са колко пъти даден елемент е срещнат в колекцията.

In [None]:
from collections import Counter

Counter('string isn\'t a collection, but it\'s iterable')


Counter({'s': 3,
         't': 6,
         'r': 2,
         'i': 5,
         'n': 3,
         'g': 1,
         ' ': 6,
         "'": 2,
         'a': 2,
         'c': 2,
         'o': 2,
         'l': 3,
         'e': 3,
         ',': 1,
         'b': 2,
         'u': 1})

In [None]:
# Задача
# Напишете функция която извежда най-често срещаните букви на даден стринг

import base64
print(base64.b64decode(
    'ZGVmIGNvdW50KHMpOgogICAgY291bnRzID0gbGl'
    'zdChDb3VudGVyKHMpLml0ZW1zKCkpCiAgICBjb3'
    'VudHMuc29ydChrZXk9bGFtYmRhIHg6IC14WzFdK'
    'QogICAgcHJpbnQoY291bnRzKQo='.encode()).decode())


## Set

`set` е `dict`, който има само ключове, стойностите не ни интересуват. Добавяне/премахване/проверка дали елемент е в сет-а се случва за $O(1)$

`set` се използва по-рядко от `dict`, и основно за да намерим уникалните елементи на колекция.

In [None]:
uniques = set()  # няма по-кратък начин за инициализране на сет, както {} за dict
# Може директно да го инициализираме от колекция
uniques = set([1, 2, 3, 3, 3, 3, 3, 3])
print('инициализация от колекция', uniques)

uniques.add(1)  # добавяме елемент
print('елемент, който вече е в сета няма да се добави отново', uniques)

print('Може да обединим 2 сета', set([1, 2, 3]).union(set([2, 3, 4])))
print('Може да вземем само общите елементи', set([1, 2, 3]) & set([2, 3, 4]))
print('Може да вземем елементите които не са общи',
      set([1, 2, 3]) ^ set([2, 3, 4]))
print('Може да проверим дали даден елемент е в сета: 5 in [1,2,3]?', 5 in set(
    [1, 2, 3]))


инициализация от колекция {1, 2, 3}
елемент, който вече е в сета няма да се добави отново {1, 2, 3}
Може да обединим 2 сета {1, 2, 3, 4}
Може да вземем само общите елементи {2, 3}
Може да вземем елементите които не са общи {1, 4}
Може да проверим дали даден елемент е в сета: 5 in [1,2,3]? False


In [None]:
# Задача: колко различни букви са използвани в следния стринг
# 'The quick brown fox jumps over the lazy dog'

import base64
print(base64.b64decode(
    'bGVuKHNldCgKICAgICdUaGUgcXVpY2sgYnJvd24gZm9'
    '4IGp1bXBzIG92ZXIgdGhlIGxhenkgZG9nJwogICAgLm'
    'xvd2VyKCkKICAgIC5yZXBsYWNlKCcgJywgJycpCikpC'
    'g=='.encode()).decode())


### Frozenset

`frozenset` = immutable `set`. Immutability носи плюсове и минуси:
- (+) може да хешираме сета (да го използваме като ключ в `dict` или да го добавим в друг `set`)
- (-) не може да го променяме (да добавяме/премахваме елементи)

In [None]:
my_dict = {
    set([1, 2, 3]): 'sets are unhashable, trust me',
}


TypeError: unhashable type: 'set'

In [None]:
numbers = set([1, 2, 3])

my_dict = {
    frozenset(numbers): 'my password',
    frozenset('characters'): 'ако подадем string, ще конструираме set от буквите'
}
my_dict


{frozenset({1, 2, 3}): 'my password',
 frozenset({'a',
            'c',
            'e',
            'h',
            'r',
            's',
            't'}): 'ако подадем string, ще конструираме set от буквите'}

## Stack

`stack` (стак/стек) е LIFO (Last In First Out) структура, която ни позволява бърз достъп до последния добавен елемент. В Python няма клас `Stack`, защото `list` има всички необходими методи.

![](https://i.imgur.com/IDr4JQL.png)

In [None]:
stack = []
for x in range(100):
    stack.append(x)

first10 = 0
for i in range(10):
    first10 += stack.pop()  # Достъп до последния елемент е О(1)

print('Сумата на първите 10 елемента е: ', first10)  # sum(100 до 90) = 945


Сумата на първите 10 елемента е:  945


## Queue

`queue` е thread-safe имплементация на опашка (FIFO). Може да я създадем с ограничен размер `Queue(maxsize=42)` - ако се напълни и се пробваме да добавим нов елемент ще се блокира нишката. `maxsize=0` означава че няма лимит и ще се разширява докато имаме памет.

Ако работим в multithreaded среда, то операциите като `qsize()`, `empty()`, `full()` и повечето други нямат гаранции, че връщат винаги точен резултат. Резултатът е близък до точен, но няма гаранция.

Пример: Ако имаме опашка която е пълна и от 1 нишка извикаме `full()` докато се изпълнява `full` може някоя друга нишка да извика `get()` и да премахне елемент - съответно ще получим `True` когато трябва да е `False`.

![](https://i.imgur.com/c8rMyYo.png)


In [None]:
import queue

que = queue.Queue()
for x in range(100):
    que.put(x)

print('Елементите ги борим с qsize: ', que.qsize())

total = 0
while not que.empty():  # Работим на 1 нишка така че това е детерминистично
    total += que.get()

print('Сумата на всички елементи е: ', total)

for x in range(100):
    que.put(x)

first10 = 0
for i in range(10):
    first10 += que.get()

print('Сумата на първите 10 елемента е: ', first10)  # sum(1 до 10) = 45


Елементите ги борим с qsize:  100
Сумата на всички елементи е:  4950
Сумата на първите 10 елемента е:  45


## PriorityQueue

Какво правим ако искаме опашка, но елементите да са поддедени по някакъв приоритет, не по реда в който ги добавяме? - тадаа `PriorityQueue` 🎉

`PriorityQueue` предоставя добавяне/премахване на елемент за $O(logn)$ и достъп до най-малкия елемент за $O(1)$.

In [None]:
import queue
import random

numbers = list(range(1, 11))  # [1, 2, ... 10]
random.shuffle(numbers)
print('Разбъркваме числата с random.shuffle()', numbers)

que = queue.PriorityQueue()
for x in numbers:
    que.put(x)
print('Данните не са подредени в реда в който ги добавяме, но 1 винаги е в началото:',
      que.queue)

top3 = []
for i in range(3):
    top3.append(que.get())

print('Приоритетната опашка връща елементите от най-малък към най-голям', top3)


Разбъркваме числата с random.shuffle() [1, 9, 7, 4, 10, 2, 6, 3, 5, 8]
Данните не са подредени в реда в който ги добавяме, но 1 винаги е в началото: [1, 3, 2, 4, 8, 7, 6, 9, 5, 10]
Приоритетната опашка връща елементите от най-малък към най-голям [1, 2, 3]


За съжаление не е възможно да използваме custom функция за сравнение за да направим Max Heap.

Има 2 начина да решим такава задача, единият е да създаваме клас, който да имплементира `__lt__`/`__gt__`, и `__eq__`.
Вторият ще разгледаме в следващата клетка.

But you know - if you like it hard I won't stop you - https://stackoverflow.com/questions/57487170/is-it-possible-to-pass-a-comparator-to-a-priorityqueue-in-python

## heapq

`heapq` предоставя основните методи за работа с приоритетни опашки поотделно. Тоест, не е нужно да ползваме цялата функционалност на `PriorityQueue`, а може да използваме само 1 от методите - например `heapq.heapify`.

tl;dr как работи приоритетна опашка?

1. Ковертираме произволен масив до `heapq.heapify()` $O(n)$
2. Ако искаме да добавим елемент използваме `heapq.heappush()` $O(log n)$
3. Ако искаме да извадим елемент използваме `heapq.heappop()` $O(log n)$

In [None]:
import heapq
import random

numbers = list(range(1, 11))  # [1, 2, ... 10]
random.shuffle(numbers)
print('Разбъркваме числата с random.shuffle()', numbers)

heapq.heapify(numbers)  # по-бързо от добавянето на елементи 1 по 1
print('Данните не са подредени в реда в който ги вкарваме, но 1 винаги е в началото:',
      numbers)

# Добавянето на нов по-малък елемент ще го постави в началото
heapq.heappush(numbers, 0)
print('0 винаги е в началото:', numbers)

top3 = []
for i in range(3):
    top3.append(heapq.heappop(numbers))

print('Приоритетната опашка връща елементите от най-малък към най-голям', top3)


Разбъркваме числата с random.shuffle() [4, 2, 9, 5, 3, 8, 1, 7, 10, 6]
Данните не са подредени в реда в който ги вкарваме, но 1 винаги е в началото: [1, 2, 4, 5, 3, 8, 9, 7, 10, 6]
0 винаги е в началото: [0, 1, 4, 5, 2, 8, 9, 7, 10, 6, 3]
Приоритетната опашка връща елементите от най-малък към най-голям [0, 1, 2]


## deque

Ако ни трябва опашка + стек, тоест искаме $O(1*)$ за добавяне/премахване на елемент в началото използваме `deque`. Обикновено се имплементира върху Circular Array.

In [None]:
from collections import deque

deq = deque(['опашка ли съм', 'ʞǝꓕɔ иѵи'])
deq.insert(1, '¿?')  # Добавянето на елемент на произволна позиция е О(n)
print(deq)

deq.append('у десно')
deq.append('у десно (1)')
deq.appendleft('у лево')

print(deq)
print('последният елемент за О(1):', deq.pop())
print('първият елемент за О(1):', deq.popleft())


deque(['опашка ли съм', '¿?', 'ʞǝꓕɔ иѵи'])
deque(['у лево', 'опашка ли съм', '¿?', 'ʞǝꓕɔ иѵи', 'у десно', 'у десно (1)'])
последният елемент за О(1): у десно (1)
първият елемент за О(1): у лево


In [None]:
# Интересно приложение на deque е имплементирането на round robin
def roundrobin(*iterables):
    "roundrobin('ABC', 'D', 'EF') --> A D E B F C"
    iterators = deque(map(iter, iterables))
    while iterators:
        try:
            while True:
                yield next(iterators[0])
                iterators.rotate(-1)
        except StopIteration:
            iterators.popleft()


In [None]:
# Задача
# Имаме следната имплементация на BFS. Как може да я обърнем до DFS?

from collections import deque

graph = {
    'A': ['B', 'C'],
    'B': ['D', 'E'],
    'C': ['F'],
    'D': [],
    'E': ['F'],
    'F': []
}

def bfs(graph, start):
  visited = set()
  que = deque()
  visited.add(start)
  que.append(start)

  while que:
    s = que.popleft()
    print(s, end=" ")

    for neighbor in graph[s]:
      if neighbor not in visited:
        visited.add(neighbor)
        que.append(neighbor)

print(base64.b64decode('0JfQsNC80LXQvdGP0LzQsCBkZXF1ZS5wb3BsZWZ0KCk'
  'g0YEgZGVxdWUucG9wKCk='.encode()).decode())


## Algorithms & Oddities

## Binary Search

Бързо ($O(logn)$) търсене в сортиран масив.

`bisect_left` = кой е първият индекс на който може да поставим елемента, за да се запази подредбата?

`bisect_right` = кой е последният индекс на който може да поставим елемента, за да се запази подредбата?

In [None]:
import bisect
numbers = [0, 1, 2, 4, 4, 4, 4, 7, 8, 9]
#          0  1  2  3  4  5  6  7  8  9

print('Ако елемента съществува, връща индекса на първото срещане',
      bisect.bisect_left(numbers, 4))
print('Ако елемента съществува, връща първия индекс след последното срещане',
      bisect.bisect_right(numbers, 4))

print('Ако елемента не съществува, връща индекса на първото срещане',
      bisect.bisect_left(numbers, 5))
print('Ако елемента не съществува, връща първия индекс след последното срещане',
      bisect.bisect_right(numbers, 5))


Ако елемента съществува, връща индекса на първото срещане 3
Ако елемента съществува, връща първия индекс след последното срещане 7
Ако елемента не съществува, връща индекса на първото срещане 7
Ако елемента не съществува, връща първия индекс след последното срещане 7


In [None]:
# Задача
# В сортиран list от числа, напишете функция, която намира броя на срещанията на някое число

print(base64.b64decode('ZGVmIGNvdW50X29jY3VycmVuY2VzKGhh'
    'eXN0YWNrLCBuZWVkbGUpOgogICAgYmlzZWN0LmJpc2VjdF9yaWd'
    'odChoYXlzdGFjaywgbmVlZGxlKSAtIGJpc2VjdC5iaXNlY3RfbG'
    'VmdChoYXlzdGFjaywgbmVlZGxlKQo='.encode()).decode())


## Copy & Deepcopy

Python подава аргументите на функциите по референция, така че може да ги променяме. Това не е винаги желаното поведение, така че Python предоставя 2 метода за копиране да обекти.


In [None]:
from copy import copy, deepcopy

def reset_tree():
    return {
        'value': 'parent',
        'child': {
            'value': 'child',
        }
    }


In [None]:
def level_up(root):
    tree = root  # Това не прави нищо, само преименува променливата
    tree['child']['value'] = 'super child'
    return tree

tree = reset_tree()
same = level_up(tree)
print(tree)
print(same)
print('Когато подаваме елемент по референция във функцията работим със същия елемент')
print(f'{id(tree) = } == {id(same) = }')


{'value': 'parent', 'child': {'value': 'super child'}}
{'value': 'parent', 'child': {'value': 'super child'}}
Когато подаваме елемент по референция във функцията работим със същия елемент
id(tree) = 4399790912 == id(same) = 4399790912


In [None]:
def level_up_swallow(root):
    tree = copy(root)
    tree['child']['value'] = 'super child'
    return tree

tree = reset_tree()
same_but_different_but_same = level_up_swallow(tree)
print(tree)
print(same_but_different_but_same)
print('(shallow) copy копира обекта, но не копира обектите в него')
print(f'{id(tree) = } != {id(same_but_different_but_same) = }')


{'value': 'parent', 'child': {'value': 'super child'}}
{'value': 'parent', 'child': {'value': 'super child'}}
(shallow) copy копира обекта, но не копира обектите в него
id(tree) = 4698146048 != id(same_but_different_but_same) = 4698275328


In [None]:
def level_up_deep(root):
    tree = deepcopy(root)
    tree['child']['value'] = 'super child'
    return tree

tree = reset_tree()
different = level_up_deep(tree)
print(tree)
print(different)
print('deepcopy създава копие, на обекта и рекурсивно на обектите в него')
print(f'{id(tree) = } != {id(different) = }')


{'value': 'parent', 'child': {'value': 'child'}}
{'value': 'parent', 'child': {'value': 'super child'}}
deepcopy създава копие, на обекта и рекурсивно на обектите в него
id(tree) = 4698416960 != id(different) = 4698412800


## Random

`random` модулът предоставя методи за избиране на случаен елемент, случайно число, случайни битове и тн.

Обикновено се използва за тестове (генериране на вход/изход).

За криптографски задачи (криптиране на данни, пароли, генериране на токени и тн), не трябва да се
използва `random`, а `secrets` модула. За да не навлизаме в разликите, нека да кажем че `secrets` генерира
по-рандъм изход от `random` модула :)

In [None]:
import random

# random модулът може да приеме начална стойност, която се използва
# в рандъм алгоритмите, за да върне детерминистичен изход.
# Обикновено се използва за да може даден експеримент/тест да се репродуцира
random.seed(42)

# Това е рандъм число, но заради seed = 42, винаги ще върне 82 в този notebook
random.randint(1, 100)


82

In [None]:
import random

print('рандъм float', random.random())

print('randint [0,1]:', random.randint(0, 1))
# Някои методи в random работят със затворени, някой с отворени интервали.
# Добре е да се провери преди използването им
print('randrange [0,1) не е много рандъм:', random.randrange(0, 1))
# randrange(a,b) = randint(a,b-1)

# Ако имаме колекция от елементи може да използваме choice, за да изберем произволен
# Алтернативният метод е да използваме random.randrange(0, len(collection))
print('Епа кот дойде:', random.choice(['fuck', 'marry', 'kill']))

# Може да задаваме и тежести - 50% ще е първият елемент, 25% втория и 25% третия
print('Понякога рандъм изборът не е много рандъм',
      random.choices(
          ['boiko', 'pak boiko', 'totally not boiko'],
          weights=[2, 1, 1]
      ))

# Понякога трябва да разбъркаме някяква колекция. Например преди да правим quicksort
numbers = list(range(1, 11))
random.shuffle(numbers)
print('shuffle:', numbers)

# При експерименти или когато имаме много данни искаме да изберем произволна подгрупа
print('Избор на 2 елемента без повторения:', random.sample(numbers, 2))


рандъм float 0.11133106816568039
randint [0,1]: 1
randrange [0,1) не е много рандъм: 0
Епа кот дойде: fuck
Понякога рандъм изборът не е много рандъм ['boiko']
shuffle: [8, 3, 6, 7, 1, 4, 5, 10, 9, 2]
Избор на 2 елемента без повторения: [7, 9]


In [None]:
%%capture
import random
# За пълнота трябва да споменем, че random модулът има имплементация на
# повечето видови разпределения от статистиката, но няма да навлизаме в подробности


random.uniform(1, 10)
random.gauss(1, 2)
random.expovariate(1)
random.gammavariate(10, 1)
random.normalvariate(5, 1)


## Itertools

`itertools` модулът предоставя методи улесняващи итерацията по елементи и често използвани конструкции. Вече сме виждали някой подобни функции като `map`/`filter`.

Функциите са доста и улесняват писането на цикли и особено вложени цикли, но понякога отнема повече време да намерим правилната функция от колкото да напишем кода от 0.

Целият списък е [тук](https://docs.python.org/3/library/itertools.html) като има разширение на стандартната библиотека от [more-itertools](https://pypi.org/project/more-itertools/) пакета.

In [None]:
import itertools

# Итератор, който се връща в началото на списъка като се изчерпи.
# Наподобява Ring Buffer
cycle = itertools.cycle('ABC')
for _ in range(10):
    print(next(cycle), end=', ')
print()

# Итератор, който обединява няколко итератора/колекции
# Може да го използваме за да flatten-нем списък от списъци
for x in itertools.chain('first', ' ', 'second'):
    print(x, end=',')
print()

# Към всеки елемент от списъка се прибавя сумата на всички предишни елементи
print(list(itertools.accumulate([-20, +10, +30, -5])))
# Може да го използваме за да генерираме всички префикси на дума
print(list(itertools.accumulate('construct')))

# Генериране на всички уникални двойки. Еквивалентно на 2 вложени цикъла
print(list(itertools.combinations('ABC', 2)))

# Генериране на всички съседни двойки
print(list(itertools.pairwise([1, 5, 7, 10])))

# Всички пермутации
print(list(itertools.permutations([0, 1, 2])))

# A x B - декартово произведение
print(list(itertools.product([1, 2, 3], 'ABC')))


A, B, C, A, B, C, A, B, C, A, 
f,i,r,s,t, ,s,e,c,o,n,d,
[-20, -10, 20, 15]
['c', 'co', 'con', 'cons', 'const', 'constr', 'constru', 'construc', 'construct']
[('A', 'B'), ('A', 'C'), ('B', 'C')]
[(1, 5), (5, 7), (7, 10)]
[(0, 1, 2), (0, 2, 1), (1, 0, 2), (1, 2, 0), (2, 0, 1), (2, 1, 0)]
[(1, 'A'), (1, 'B'), (1, 'C'), (2, 'A'), (2, 'B'), (2, 'C'), (3, 'A'), (3, 'B'), (3, 'C')]


## Functools

`functools` предоставя фунцкии от по-висок ред - декоратори и помощни функции. Концепциите в модула са доста сложни така че ще разгледаме само по-често използваните. В темата за функционално се разлеглежда един от основните методи - `reduce`.

Друг интересен пример е `functools.singledispatch` декоратора, който ни позволява да overload-ваме функции базирано на типа на първият им аргумент. Тъй като това не работи за функции с повече от 1 аргумент които да overload-нем, няма да му отделяме време. But it exists!

In [None]:
%%time
import functools

# Нека си дефинираме наивна рекурсивна функция
def fibonacci(n):
    if n in [0, 1]:
        return 1
    return fibonacci(n - 1) + fibonacci(n - 2)


# Имаме O(2 ^ 40) извиквания на фунцкии :(
fibonacci(40)


CPU times: user 19.8 s, sys: 92 ms, total: 19.9 s
Wall time: 20 s


165580141

In [None]:
%%time
import functools

# Mоже да я забързаме ако кешираме извикванията
# Така няма да правим едно и също изчисление 2 пъти


@functools.lru_cache(maxsize=150)
def fibonacci(n):
    if n in [0, 1]:
        return 1
    return fibonacci(n - 1) + fibonacci(n - 2)


fibonacci(40)
fibonacci(150)
# Дори fib(150) което с наивната рекурсия няма да приключи
# никога минава за под 1ms


CPU times: user 62 µs, sys: 89 µs, total: 151 µs
Wall time: 155 µs


16130531424904581415797907386349

In [None]:
# Ако имаме клас, за който искаме да имплементираме сравнение
# Може да имплементираме само __lt__ и __eq__ и останалите методи
# ще се имплементират за нас
# Защото понякога имплементирането им просто не е тривиално ...

import functools

@functools.total_ordering  # ще имплементира __gt__, __le__, и тн.
class Point:
    def __init__(self, x, y):
        self.x = x
        self.y = y

    def __eq__(self, other):
        return self.x == other.x and self.y == other.y

    def __lt__(self, other):
        # Имплементира Z-order curve подредба на точките
        most_significant_dim = 'x'
        if self.less_msb(self.x ^ other.x, self.y ^ other.y):
            msd = 'y'

        if most_significant_dim == 'x':
            return self.x < other.x
        else:
            return self.y < other.y

    def less_msb(self, x, y):
        return x < y and x < (x ^ y)


## CSV

Python предоставя няколко модула за работа с данни сериализирани под различен формат. Един от тези модули е за работа с CSV файлове (coma-separated values). Ще разгледаме само пример за парсене на такъв файл, но модулът има много различни функционалности и опции.

In [None]:
import csv
from io import StringIO

contents = StringIO(  # == string stream
    '''Lyubo,21,Sofia
Alex,22,Sofia
Ivan,49,"Ne Sofia"
''')

reader = csv.reader(contents)
for index, row in enumerate(reader):
    print(index, ':', row)


0 : ['Lyubo', '21', 'Sofia']
1 : ['Alex', '22', 'Sofia']
2 : ['Ivan', '49', 'Ne Sofia']


## JSON

Друг популярен формат на данни е JSON ... Разбира се в Python има модул `json`.

In [None]:
import json

my_dict = json.loads('{"foo": {"bar":["baz", null, 1.0, 2]}}')
print('От стринг конструирахме dict, който може да използваме:',
      my_dict['foo']['bar'])

print('Обратната операция на сериализиране е удобна за принтене на дебъг съобщения')
print(json.dumps(my_dict, sort_keys=True, indent=4))


От стринг конструирахме dict, който може да използваме: ['baz', None, 1.0, 2]
Обратната операция на сериализиране е удобна за принтене на дебъг съобщения
{
    "foo": {
        "bar": [
            "baz",
            null,
            1.0,
            2
        ]
    }
}


## Regex

Regex или още регулярни изрази са стрингове, които описват някакъв патърн, който може да използваме за търсене в обикновени стрингове.

`regex` може да запълни материала за цял курс, но ще се опитаме да разгледаме само често използвани примери, без да навлизаме в подробности.

Писането на регулярни изрази обикновено е трудоемка задача, за това препоръчваме инструменти като [regexr](https://regexr.com/), които изпълняват regex в реално време и имат обяснение защо даден стринг е match-нал.

In [None]:
import re

# == (.start(), .end())
print(re.search(r'123', '458971985719285712324953928572').span())

ninjas = 'ninjatreenoooinjaforestninjavoicenwvi9ew9ninja'

print('Следва ли стринга този патърн?',
      re.match(r'.*ninja$', ninjas) is not None)

print('Намери всички срещания:',
      re.findall(r'n.*?a', ninjas))

print('Разбиване на стринг на всяко срещане на патърн:',
      re.split(r'n.*?a', ninjas))

print('Субституция на патърн в стринг:',
      re.sub(r'n.*?a', '-NINJA-', ninjas))


(16, 19)
Следва ли стринга този патърн? True
Намери всички срещания: ['ninja', 'noooinja', 'ninja', 'nwvi9ew9ninja']
Разбиване на стринг на всяко срещане на патърн: ['', 'tree', 'forest', 'voice', '']
Субституция на патърн в стринг: -NINJA-tree-NINJA-forest-NINJA-voice-NINJA-


## Силата на Python

Ще разгледаме няколко задачи, решени на Python, и на C++

[Two sum](https://leetcode.com/problems/two-sum/)

In [None]:
from collections import defaultdict
def twoSum(nums, target: int):
    counter = defaultdict(list)
    for i, num in enumerate(nums):
        counter[num].append(i)

    for first in nums:
        second = target - first
        if second in counter and first != second:
            return [counter[first][0], counter[second][0]]
        elif second in counter and len(counter[first]) > 1:
            return [counter[first][0], counter[second][1]]
    return []

Еквивалетното решение на C++:

```c++
vector<int> twoSum(vector<int>& nums, int target) {
    std::unordered_map<int, std::vector<int>> counter = std::unordered_map<int, std::vector<int>>();

    for (int i = 0; i < nums.size(); i++) {
        int num = nums[i];
        auto it = counter.find(num);
        if (it != counter.end()) {
            it->second.push_back(i);
        }
        else {
            counter.insert({num, {i}});
        }
    }

    for (const int first: nums) {
        int second = target - first;
        auto second_it = counter.find(second);
        auto first_it = counter.find(first);

        if (second_it != counter.end() && first != second) {
            return {first_it->second[0], second_it->second[0]};
        }
        else if(second_it != counter.end() && first_it->second.size() > 1) {
            return {first_it->second[0], second_it->second[1]};
        }
    }
    return {};
}
```

Java решение:

```java
public static int[] twoSum(int[] nums, int target) {

    HashMap<Integer, ArrayList<Integer>> counter = new HashMap<>();

    for (int i = 0; i < nums.length; i++) {
        counter.putIfAbsent(nums[i], new ArrayList<Integer>());
        counter.get(nums[i]).add(i);
    }

    for (int first : nums) {
        int second = target - first;

        if (counter.containsKey(second) && first != second)
            return new int[] { counter.get(first).get(0), counter.get(second).get(0) };
        else if (counter.containsKey(second) && counter.get(first).size() > 1)
            return new int[] { counter.get(first).get(0), counter.get(second).get(1) };
    }

    return new int[] {};
}
```

Забележете разликата в работата с `unordered_map` спрямо `dict`.

[Valid palindrome](https://leetcode.com/problems/valid-palindrome/)

In [None]:
def isPalindrome(self, s):
    s = ''.join(c for c in s.lower() if c.isalnum())
    return s == s[::-1]

C++ решение:

```c++
bool isPalindrome(const std::string &s) {
    std::string filtered;

    for (char ch : s) {
        if (std::isalnum(ch)) {
            filtered += std::tolower(ch);
        }
    }
    
    // Check if the filtered string is a palindrome
    int left = 0, right = filtered.size() - 1;
    while (left < right) {
        if (filtered[left] != filtered[right]) {
            return false;
        }
        left++;
        right--;
    }
    
    return true;
}
```

Java решение:

```java
public static boolean isPalindrome(String s) {
    StringBuilder filtered = new StringBuilder();

    for (char ch : s.toCharArray()) {
        if (Character.isLetterOrDigit(ch)) {
            filtered.append(Character.toLowerCase(ch));
        }
    }

    int left = 0, right = filtered.length() - 1;
    while (left < right) {
        if (filtered.charAt(left) != filtered.charAt(right)) {
            return false;
        }
        left++;
        right--;
    }

    return true;
}

```

Тук преимуществото на Python е в използванто на `.join` и slicing-а.

## Допълнителни задачи

- https://leetcode.com/problems/find-the-town-judge/ ([solution](https://github.com/luchev/interview-preparation/blob/master/leetcode/997.%20Find%20the%20Town%20Judge/1.py))
- https://leetcode.com/problems/number-of-islands/ ([solution](https://github.com/luchev/interview-preparation/blob/master/leetcode/200.%20Number%20of%20Islands/1.py))
- https://leetcode.com/problems/network-delay-time/ ([solution](https://github.com/luchev/interview-preparation/blob/master/leetcode/743.%20Network%20Delay%20Time/1.py))

# Type Hints

## Динамично vs. статично типизиране. Round 2

Динамичното типизиране позволява гъвкавост, но това идва и със своите недостатъци от гледна точка на поддръжката и четимостта на кода.

Например, ако имаме следната функция:

In [None]:
def validate_serial_number(serial_number):
    pass  # definition is irrelevant for this example

Ако нямаме поглед над имплементацията на функцията (или пък имаме, но не е тривиално да се прецени точно имплементацията с какви типове борави), то тогава как да разберем `serial_number` дали да ѝ го подадем като `int` или `str`? Или пък може да е `list` от `int`-ове дори?

Също така, от името на функцията не става много ясно тя какво връща - дали не връща нищо, а само изпълнява проверки и странични ефекти, или пък проверява валидността на номера и връща `bool`, или пък връща някакъв тип за грешка при неуспех, а `None` при успех?

## Type Hints and `mypy`

От Python 3.5 насам можем да пишем "подсказки" за очаквания тип (или очакваните типове, в случай че са повече от един).

В случая функцията можем да я анотираме по следния начин:

In [None]:
def validate_serial_number(serial_number: str) -> bool:
    pass  # ...

Трябва да се отбележи, че тези анотации са само hints ("подсказки" за програмиста), т.е. не получаваме поведението на статично типизираните езици, тъй като интерпретатора не следи за спазването на анотациите:

In [None]:
def add(a: int, b: int) -> int:
    return a + b

print("Passing `int`: ", add(1, 2))
print("Passing `str`: ", add("1", "2"))

Passing `int`:  3
Passing `str`:  12


Това въпросно следене може да стане чрез т.нар. "type checkers". Най-използваният е [mypy](http://mypy-lang.org/).

В PyCharm би трябвало по подразбиране да е включено, докато във VS Code може да се включи от настройките на [Pylance extension-a](https://marketplace.visualstudio.com/items?itemName=ms-python.vscode-pylance):

![Pylance setting](assets/pylance-setting.png)

При включването на настройката за пръв път би трябвало да се покаже долу вдясно диалогов попъп, от който да може да се инсталира `mypy` автоматично.

След включването, всяка некоректност ще се показва като грешка във VSCode по подобен начин:

![mypy in action](assets/mypy-in-action.png)

## Синтаксис и особености на анотациите

Анотациите са добавени в Python 3.0 и оригинално са нямали конкретна семантика или общоприета употреба. Понеже са интуитивно удобни за указване на типове, [PEP484](https://peps.python.org/pep-0484/) и [PEP526](https://www.python.org/dev/peps/pep-0526/) предлагат и стандартизират точно тази им употреба.

Анотации могат да се добавят към променливи и функции. Те отиват в `__annotations__` списъка на модула или на функцията, респективно. Това означава, че могат и runtime да бъдат достъпни:

In [None]:
variable: int = 42

print(f"{__annotations__ = }")  # module.__annotations__ keeps the annotations of all variables in the module


def function(f: float, b: bool = True) -> int:
    return int(f) if b else 0  # this is the most meaningless function ever

print(f"{function.__annotations__ = }")  # functions have that dunder as well

__annotations__ = {'variable': <class 'int'>}
function.__annotations__ = {'f': <class 'float'>, 'b': <class 'bool'>, 'return': <class 'int'>}


*Забележка*: По общоприета питонска конвенция за стил, интервали около `=` на именованите аргументи се слагат ако има анотация, но се пропускат ако няма:

ОК:
```python
def foo(a: int, b: int = 0) -> int:
    return a + b

def foo(a, b=0):
    return a + b
```

Not quite OK:

```python
def foo(a: int, b: int=0) -> int:
    return a + b

def foo(a, b = 0):
    return a + b
```

*Забележка 2*: Възможна е анотация на имe без да му бъде присвоявана стойност. Опитът за достъп обаче преди да му бъде присвоена такава впоследствие ще доведе до грешка, понеже още не е дефинирана:

In [None]:
name: str

print(name)

NameError: name 'name' is not defined

## Анотиране на различните вградени типове

Както видяхме, използваме самият тип за да го анотираме, т.е. `bool`, `int`, `float`, `complex`, `str`, `bytes`, `None` и т.н. са валидни в анотации. (да, `None` освен стойност, е и тип сам по себе си)

In [None]:
def i_wanna_print(something: str, terminator: str = "\n") -> None:
    print(something, end=terminator)

def extract_nums_from_input_row(row: str) -> list:
    return list(map(int, row.split()))

Във функцията `extract_nums_from_input_row` в горният пример обаче не знаем всичко за return типа. Знаем, че е `list`, но лист от какво?

Проблемът с такива generic типове като `list`, `tuple`, `dict`, `set` и т.н. решаваме като укажем типа на елементите в тях в квадратни скоби. От Python 3.9 насам можем директно да ползваме builtin типовете, но за версии 3.5 до 3.8 вкл. трябва да импортнем подходящите класове от `typing` модула:

In [None]:
# Python 3.5 to 3.8

from typing import List, Tuple, Dict

def extract_nums_from_input_row(row: str) -> List[int]:
    return list(map(int, row.split()))

def dot_product(a: Tuple[int, int, int], b: Tuple[int, int, int]) -> int:
    return sum(x * y for x, y in zip(a, b))

def bind_names_to_ages(names: List[str], ages: List[int]) -> Dict[str, int]:
    return dict(zip(names, ages))

In [None]:
# Python 3.9+

def extract_nums_from_input_row(row: str) -> list[int]:
    return list(map(int, row.split()))

def dot_product(a: tuple[int, int, int], b: tuple[int, int, int]) -> int:
    return sum(x * y for x, y in zip(a, b))

def bind_names_to_ages(names: list[str], ages: list[int]) -> dict[str, int]:
    return dict(zip(names, ages))

Ако искаме `tuple` да има точно 2 елемента от тип `int` например, можем да го анотираме като `Tuple[int, int]`. Ако искаме да има произволен брой елементи от тип `int`, можем да го анотираме като `Tuple[int, ...]`.

In [None]:
def calculate_polynomial(coefficients: tuple[float, ...], x: float) -> float:
    return sum(k * (x ** n) for n, k in enumerate(reversed(coefficients)))

При указване на `*args` и/или `**kwargs` е нужно да укажем само типа на съответните елементи, без `tuple` или `dict`:

In [None]:
def calculate_polynomial(*coefficients: float, x: float) -> float:
    return sum(k * (x ** n) for n, k in enumerate(reversed(coefficients)))

За удобство можем да си създваме alias-и за различни типове, които да ги използваме по-късно:

In [None]:
Vector3D = tuple[float, float, float]

def dot_product(a: Vector3D, b: Vector3D) -> float:
    return sum(x * y for x, y in zip(a, b))

В случай, че искаме да анотираме функция, която например подаваме като параметър, ползвамe `Callable`:

In [None]:
from typing import Callable

def bubble_sort(arr: list[int], comparator: Callable[[int, int], bool]) -> list[int]:
    arr = arr.copy()
    for _ in range(len(arr)):
        for j in range(len(arr) - 1):
            if not comparator(arr[j], arr[j + 1]):
                arr[j], arr[j + 1] = arr[j + 1], arr[j]
    return arr

bubble_sort([1, 2, 3], lambda x, y: x > y)

[3, 2, 1]

### `Union` и `Optional`

Понякога можем да поддържаме по няколко възможни типа. Целта на `Union` е да "обедини" тези типове в един. Например, ако искаме да можем да подаваме и `int` и `str` като аргументи на функция, можем да го анотираме като `Union[int, str]`  или  `Union[str, int]`:

In [None]:
from typing import Union

def is_serial_number_valid(serial_number: Union[str, int]) -> bool:
    serial = str(serial_number)
    return (
        len(serial) == 10 
        and serial.isdigit() 
        and serial[-1] == sum(map(int, serial[:-1])) % 10
    )

От Python 3.10 насам можем да използваме оператора `|` вместо `Union`:

In [None]:
def is_serial_number_valid(serial_number: str | int) -> bool:
    serial = str(serial_number)
    return (
        len(serial) == 10 
        and serial.isdigit() 
        and serial[-1] == sum(map(int, serial[:-1])) % 10
    )

def calculate_polynomial(*coefficients: int | float | complex, x: int | float | complex) -> complex:
    return complex(sum(k * (x ** n) for n, k in enumerate(reversed(coefficients))))

calculate_polynomial(-1, 5j, 6.9, 0, 94, x=42)

(-3099430.4+370440j)

Много често се налага да имаме стойност по подразбиране `None` вместо такава на даден тип или пък да връщаме `None` вместо стойност от даден тип. Това е и идеята на `Optional`, който е тип на практика еквивалентен на `Union` с `None`:

In [None]:
import hashlib

from typing import Optional

def hash_password(password: str, salt: Optional[str] = None) -> bytes:
    hash = hashlib.sha256(password.encode())
    if salt is not None:
        hash.update(salt.encode())
    return hash.digest()

In [None]:
# Equivalent:

import hashlib

def hash_password(password: str, salt: str | None = None) -> bytes:
    hash = hashlib.sha256(password.encode())
    if salt is not None:
        hash.update(salt.encode())
    return hash.digest()

### `Any`

По подразбиране, ако на променлива/аргумент/return type липсва анотация, то тя/той е от тип `Any`.

Ако искаме все пак експлицитно да анотираме даден тип като произволен, то можем да го направим с `Any`. Type-checker-ите няма да хвърлят грешка, който и тип да подаваме като стойност на нещо, което се очаква да е от тип `Any`.

In [None]:
from typing import Any

def i_wanna_print(something: Any, terminator: str = "\n") -> None:
    print(something, end=terminator)

def play_audio(filename: str, options: dict[str, Any]) -> None:
    if options["BITRATE"] == 320:
        print("Playing in high quality")
    
    if options["LOOP"] == True:
        print("Playing in loop")

    #...

### Generics

В някои случаи обаче ако използваме `Any` директно всъщност заличаваме информация, която ни е нужна после. 

Например нека разгледаме следната функция:

In [None]:
import random
from typing import Any

def shuffled(l: list[Any]) -> list[Any]:
    return random.sample(l, len(l))

 Ако я използваме обаче в следния контекст:

In [None]:

suits = "♠♥♦♣"
ranks = "AKQJT98765432"

brand_new_deck = [f"{rank}{suit}" for suit in suits for rank in ranks] # -> list[str]

shuffled_deck = shuffled(brand_new_deck) # -> list[Any] !!!

# Сега `shuffled_deck` вече е list[Any] вместо list[str]
# т.е. изгубихме типовата информация, която би трябвало да имаме.

from collections import Counter
suits_dealt = Counter(card[1] for card in shuffled_deck[::4]) # ⚠️ card[1] ще ни го дава като опит за индексиране на `Any`, а не `str`
print(suits_dealt)

Counter({'♦': 5, '♠': 5, '♣': 2, '♥': 1})


За да се справим с този проблем трябва да обявим такива типови параметри като generics чрез `TypeVar`:

In [None]:
from typing import TypeVar

T = TypeVar("T")
def shuffled(l: list[T]) -> list[T]:
    return random.sample(l, len(l))

С примерът горе статичния type-checker ще знае, че каквито елементи има листът, който е подаден като аргумент на `shuffled`, такива и ще бъдат елементите на върнатия лист.

Можем и да дадем ограничения за `TypeVar`-овете. Ако искаме в горния пример `T` да ни бъде `int` или `str`, можем да напишем:

In [None]:
from typing import TypeVar

T = TypeVar("T", int, str)
def shuffled(l: list[T]) -> list[T]:
    return random.sample(l, len(l))

### Собствени типове

Нашите собствени класове също могат да се използват като типове:

In [None]:
class Person:
    def __init__(self, name: str, age: int) -> None:
        self.name = name
        self.age = age

    def __repr__(self) -> str:
        return f"Person(name={self.name}, age={self.age})"

    def to_dict(self) -> dict[str, Any]:
        return {"name": self.name, "age": self.age}


def get_people() -> list[Person]:
    return [Person("John", 42), Person("Jane", 37)]

Тук особеното е, че в дефиницията на методи няма нужда да анотираме `self` - той винаги ще е от типа на класа.

Когато обаче имаме метод, който приема или връща обект от типа на класа, към който е, съществуват особености за различните версии на езика. В Python 3.10 не е грешка да се използва името на класа още в дефиницията му, докато в по-старите версии - е. От Python 3.7+ може да се импортне `from __future__ import annotations`, за да работи това, докато за по-стари версии решението е просто да се напише името на класа като стринг в анотацията.

In [None]:
class Person:
    def __init__(self, name: str, age: int) -> None:
        self.name = name
        self.age = age

    def __repr__(self) -> str:
        return f"Person(name={self.name}, age={self.age})"

    def to_dict(self) -> dict[str, Any]:
        return {"name": self.name, "age": self.age}

    # Python 3.10+ way
    # or for Python 3.7-3.9 you also have to add `from __future__ import annotations`
    @classmethod
    def from_dict(cls, data: dict[str, Any]) -> Person:
        return cls(**data)

    # Python <3.7 way
    @classmethod
    def from_dict(cls, data: dict[str, Any]) -> "Person":
        return cls(**data)

Можем да си декларираме собствени типове, които да са съставени от други типове. Това се прави с `NewType`:

In [None]:
from typing import NewType, Optional

PersonId = NewType("PersonId", int)

class Person:
    def __init__(self, id: PersonId, name: str, age: int) -> None:
        self.id = id
        self.name = name
        self.age = age

    def __repr__(self) -> str:
        return f"Person(id={self.id}, name={self.name}, age={self.age})"

    def to_dict(self) -> dict[str, Any]:
        return vars(self)

    @classmethod
    def from_dict(cls, data: dict[str, Any]) -> Person:
        return cls(**data)

def get_person_by_id(id: PersonId, database: list[Person]) -> Optional[Person]:
    return next((person for person in database if person.id == id), None)  # `next` has an optional second parameter - default value

database = [
    Person(PersonId(37), "Lana Xes", 18),
    Person(PersonId(69), "Axl Rose", 60),
]

print(get_person_by_id(PersonId(37), database))
print(get_person_by_id(PersonId(666), database))

Person(id=37, name=Lana Xes, age=18)
None


Тук обаче бихме имали проблем в случай, че имаме наследник на този клас. Например:

In [None]:
class Admin(Person):
    def __init__(self, id: PersonId, name: str, age: int, can_ban: bool) -> None:
        super().__init__(id, name, age)
        self.can_ban = can_ban

    def __repr__(self) -> str:
        return f"Admin(id={self.id}, name={self.name}, age={self.age}, can_ban={self.can_ban})"

    def ban(self, person: Person) -> None:
        if self.can_ban:
            print(f"{self.name} is banning {person.name}.")
        else:
            print(f"{self.name} is not allowed to ban anyone.")


pesho = Person(PersonId(42), "Pesho", 42)
peshos_dict = pesho.to_dict()

pesho_evolved = Admin.from_dict({**peshos_dict, "can_ban": True})  # -> Person, at least for the static type checker

pesho_evolved.ban(pesho)  # ⚠️ type checker will complain that type `Person` has no method `ban`

Pesho is banning Pesho.


Това поправяме отново с `TypeVar`, този път използвайки именования параметър `bound`:

In [None]:
from typing import Type

PersonId = NewType("PersonId", int)
TPerson = TypeVar("TPerson", bound="Person")  # в кавички, защото `Person` още не съществува

class Person:
    def __init__(self, id: PersonId, name: str, age: int) -> None:
        self.id = id
        self.name = name
        self.age = age

    def __repr__(self) -> str:
        return f"Person(id={self.id}, name={self.name}, age={self.age})"

    def to_dict(self) -> dict[str, Any]:
        return vars(self)

    @classmethod
    def from_dict(cls: Type[TPerson], data: dict[str, Any]) -> TPerson:  # <- тук са промените
        return cls(**data)

    def some_other_common_method(self: TPerson) -> Any:  # <- тук е важно да укажем какъв тип е `self`, ако ще се наследява
        pass 

class Admin(Person):
    def __init__(self, id: PersonId, name: str, age: int, can_ban: bool) -> None:
        super().__init__(id, name, age)
        self.can_ban = can_ban

    def __repr__(self) -> str:
        return f"Admin(id={self.id}, name={self.name}, age={self.age}, can_ban={self.can_ban})"

    def ban(self, person: Person) -> None:
        if self.can_ban:
            print(f"{self.name} is banning {person.name}.")
        else:
            print(f"{self.name} is not allowed to ban anyone.")

### Консистентни типове

Type checker-ите се оплакват само когато видят неконсистенти типове.

Казваме, че типът `T` е консистентен с типа `U`, тогава и само тогава когато **поне едно** от следните условия е изпълнено:

1. `T` е подтип на `U`  ($ T \subset U $)
2. `T` е `Any`
3. `U` е `Any`

Тук е хубаво да отбележим, без да навлизаме в много подробности, че това дали `T` е подтип на `U` в случаите на generic типове зависи от тяхната вариантност. Например, като отчетем факта, че `bool` е подтип на `int`, получаваме следното поведение:

* **Ковариантност:** `tuple[bool]` е подтип на `tuple[int]` ( $ T \subset U \Rightarrow C[T] \subset C[U] $)
* **Инвариантност:** `list[bool]` не е нито подтип, нито надтип на `list[int]`
* **Контравариантност:** `Callable[[int], ...]` е подтип на `Callable[[bool], ...]` ( $ T \subset U \Rightarrow C[U] \subset C[T] $)

По подразбиране, ако не се посочи друго, анотациите на `TypeVar`-овете ни са **инвариантни**. Ако искаме да укажем дали да са ковариантни или контравариантни, можем да го направим чрез `covariant=True` или `contravariant=True` респ. в инициализацията на `TypeVar`.

### Duck typing

> Ако изглежда като патка, плува като патка и квака като патка, то е патка.

В програмирането съществуват два варианта за типизация: **номинална** и **структурна**. 

* При **номиналната** типизация типовете са именувани и се сравняват по име и декларация, например `bool` наследява `int`, защото така е деклариран. В Python се ползва предимно номинално типизиране.
* При **структурната** типизация типовете се сравняват по-скоро по тяхната структура, т.е. какви методи притежават и т.н. Като пример можем да дадем `__len__` - можем на теория да декларираме *структура* `Sized`, към която би принадлежало всичко, което има метод `__len__`, независимо от името и декларацията му.

В динамичната типизация често са по-важни наборът от методи, които един обект притежава, а не конретния му тип и декларация на базови класове. Именно това стои зад термина duck typing.

В `typing` модулът ни предоставя готови такива структури (или протоколи), които са често използвани. Например точно такъв `Sized` какъвто описахме по-горе има там:

In [None]:
from typing import Sized

def get_length_squared(obj: Sized) -> int:
    return len(obj) ** 2

В горният метод е най-удачно да се анотира аргумента със `Sized`, понеже `Any` би подвел програмиста, че абсолютно всичко е окей, но на практика не е съвсем така - абсолютно всичко, ***което дефинира `__len__`*** е окей. Точно това ни казва протоколът `Sized`.

Други полезни и често-използвано протоколи са например `Sequence`, `Iterable`, `Iterator` и `Container`:

* `Iterable[]` - итеруеми, т.е. всичко, което дефинира `__iter__` ***или*** `__getitem__`
* `Sequence[]` - редици, т.е. всичко, което дефинира `__getitem__` ***и*** `__len__`
* `Container[]` - всичко, което дефинира `__contains__`
* `Iterator[]` - всичко, което дефинира `__next__` ***и*** `__iter__`

Конкретно тези 4 протокoла са и абстрактни базови класове. От Python 3.9 насам е deprecate-нато те да се импортват от `typing` модула - вместо това може да си се използва директно `collections.abc`.

`Sequence` дефинира още и `__contains__` и `__reversed__`, които използват имплементацията на другите два метода. Също така по дефиниця може да забележим, че всички редици са и итеруеми, и контейнери.

In [None]:
from collections.abc import Iterable

Number = int | float | complex

def multiply(a: Iterable[Number], b: Iterable[Number]) -> Number:
    return sum(a * b for a, b in zip(a, b))

#### `Protocol`

Можем естествено и сами да си дефинираме протокол, с `typing.Protocol`.

Да предположим, че имаме подобни класове (примерно предоставени от някои библиотеки):

In [None]:
class Child:
    def quack(self) -> None:
        print("Quack!")

class Physicist:
    def quack(self) -> None:
        print("Quark.")

Номинално те нямат нищо общо (нямат общ базов клас), но структурно имат общ метод. Да предположим и че точно този метод ни трябва за някаква функция, като тази:

In [None]:
def make_quack(duck):
    duck.quack()

Как ще анотираме аргумента `duck` на функцията? 

`Any` не ни върши достатъчна работа, понеже не всичко може да `quack()`-а. На практика искаме да си дефинираме наш си протокол, който да съдържа само този метод:

In [None]:
from typing import Protocol

class Duck(Protocol):
    def quack(self) -> None:
        ...  # yes, this is valid Python syntax apparently

def make_quack(duck: Duck) -> None:
    duck.quack()

peshi = Child()
feynman = Physicist()

make_quack(peshi)
make_quack(feynman)
# static type-checkers will not complain about above 2 invocations.

Quack!
Quark.


Ако искаме `isinstance` и `issubclass` да работят с протоколите ни, трябва да ги декорираме с `typing.runtime_checkable`:

In [None]:
from typing import Protocol, runtime_checkable

@runtime_checkable
class Duck(Protocol):
    def quack(self) -> None:
        ...

print(f"{isinstance(peshi, Duck) = }")
print(f"{issubclass(Physicist, Duck) = }")


isinstance(peshi, Duck) = True
issubclass(Physicist, Duck) = True


*Note:* преди Python 3.8 `Protocol` се намира в `typing_extensions` модула.

## `@dataclass`

Говорейки за typing няма как вече да не намесим и един полезен декоратор - `dataclasses.dataclass`, вмъкнал се в езика с Python 3.7.

Както подсказва донякъде името му, той има за цел да помогне с дефинирането на прости класове, които имат за цел предимно да съхраняват някакви атрибути с някакви данни (подобно на типовете, за които бихме използвали `struct` вместо `class` в С++ / С# например).

Предоставя ни изключително голямо синтактично удобство, понеже следния клас:

In [None]:
from dataclasses import dataclass

@dataclass
class User:
    id: int
    username: str
    email: str
    is_admin: bool = False

е абсолютно еквивалентен на:

In [None]:
class User:
    def __init__(self, id: int, username: str, email: str, is_admin: bool = False) -> None:
        self.id = id
        self.username = username
        self.email = email
        self.is_admin = is_admin

    def __repr__(self) -> str:
        return f"User(id={self.id}, username={self.username}, email={self.email}, is_admin={self.is_admin})"

    def __eq__(self, other: object) -> bool:
        if not isinstance(other, User):
            return False

        return vars(self) == vars(other)

    # Python 3.10+ only, used for the `match` statement
    def __match_args__(self) -> tuple[int, str, str, bool]:
        return self.id, self.username, self.email, self.is_admin

И това са само част от способностите на `@dataclass`. Той приема различни параметри, с които още можем да укажем дали класът да е immutable (`frozen=True`), да има `__hash__`, дефиниции на операторите за сравнение, и др.

```python
@dataclasses.dataclass(*, 
    init=True, 
    repr=True, 
    eq=True, 
    order=False, 
    unsafe_hash=False, 
    frozen=False, 
    match_args=True, 
    kw_only=False, 
    slots=False, 
    weakref_slot=False
)
```

In [None]:
from dataclasses import dataclass

@dataclass(frozen=True)
class Point:
    x: int | float = 0
    y: int | float = 0

s = {Point(1, 2), Point(), Point(1, 2)}
print(s)

{Point(x=1, y=2), Point(x=0, y=0)}


Повече информация в [документацията](https://docs.python.org/3/library/dataclasses.html#dataclasses.dataclass).

# Грешки и изключения

Понякога се случват неща, които не очакваме, или програмата ни влиза в състояние, което е грешно или пък е с недефинирано поведение. Например, ако се опитаме да отворим файл, който не съществува, или ако се опитаме да разделим число на 0 и т.н. Ако такава "грешка" е фатална, то е редно програмата да спре изпълнението си, съобщавайки за това с някаъв вид програмна грешка (error). Ако не е толкова фатална, например е просто специален случай, който можем да третираме по по-различен начин, то това наричаме "изключение" (exception). Ние като програмисти не е редно да "хващаме" и обработваме грешките, а само изключенията.

## (Синтактични) Грешки

В Python грешките биват единствено синтактични - от тип `SyntaxError`. Тази грешка се хвърля когато Python parser-a забележи синтектичен проблем в кода, което би довело до невъзможността му за изпълнение.

In [None]:
print(("I like brackets")

SyntaxError: incomplete input (1478308394.py, line 1)

## Изключения

Дори и кодът да е синтактично правилен обаче, изпълнението му е възможно да доведе до грешка. Такива грешки, които се засичат по време на изпълнението на програмата се наричат "изключения" (exceptions) и е възможно да бъдат "хванати" и обработени по желан от нас начин. Примери за често-срещани изключения:

In [None]:
42 / 0

ZeroDivisionError: division by zero

In [None]:
"I love " + name_of_crush

NameError: name 'name_of_crush' is not defined

In [None]:
"1" + 1

TypeError: can only concatenate str (not "int") to str

In [None]:
import math
math.sqrt(-1)

ValueError: math domain error

In [None]:
l = [1, 2, 3]
l[3]

IndexError: list index out of range

In [None]:
d = {"a": 1, "b": 2}
d["c"]

KeyError: 'c'

*Note:* въпреки, че са всъщност exceptions, а не errors, имената на доста вградени изключения завършват на `Error` в Python.

## Хващане на изключения

С `try-except` конструкцията можем да хванем изключение при изпълнение на даден код и да извършим някакво действие, ако се случи такова. В `try` блокът се слага кодът, който искаме да изпълним, а в `except` блокът - кодът, който искаме да се изпълни, ако се случи изключение. При хващане на изключение програмата не се терминира, а продължава изпълнението си след `try-except` конструкцията.

In [None]:
while True:
    try:
        x = int(input("Please enter a number: "))
        print("You entered: ", x)
        break
    except ValueError:
        print("Sorry bro, that's not a valid number. Try again...")

Sorry bro, that's not a valid number. Try again...
Sorry bro, that's not a valid number. Try again...
You entered:  123


Забележете, че можем да укажем изрично типа на изключението, което искаме да хванем, като аргумент на `except` блока. В горният пример искаме да хванем единствено изключения от тип `ValueError`, т.е. проблеми с въведената стойност. Така позволяваме на потребителят например да приключи изпълнението на програмата с Ctrl+C (или подобен метод), понеже това действие би хвърлило `KeyboardInterrupt` изключение.

Можем естествено и да не укажем тип, а да хванем абсолютно всички възможни изключения:

In [None]:
try:
    risky_func()
except:
    pass  # never ever do this, for the sake of humanity

Много коварен antipattern обаче е обграждането на проблематичен код с `except` блок, който е празен. Повече по темата: https://realpython.com/the-most-diabolical-python-antipattern/

Вместо това, може например да логнем грешката в някой файл или на стандартния изход (или по-добре от STDOUT - в STDERR). Има библиотеки, улесняващи логването, включително и вградена такава - `logging`.

In [None]:
import logging

logger = logging.getLogger()

try:
    risky_func()
except Exception as e:
    logger.error(e)

name 'risky_func' is not defined


Както се вижда от примера, можем да присвоим изключението към променлива, която да използваме в `except` блока. Това е полезно ако искаме да използваме изключението или аргументите на изключението, които се намират в `args` атрибута на всяко изключение.

In [None]:
try:
    risky_func()
except Exception as e:
    logger.error(e.args)

("name 'risky_func' is not defined",)


Можем да очакваме повече от един тип изключения по няколко начина:

In [None]:
def f(): return 42
def g(): return 0

try:
    # f()[2]    # uncomment for third error
    # y = h()  # uncomment for second error
    y = f() / g()
except ZeroDivisionError:
    print("Division by zero.")
except NameError as e:
    print("Name error: ", e)
except Exception as e:
    print("Other error: ", e)

try:
    y = f() / g() + h()
except (ZeroDivisionError, NameError) as e:
    print("Oops: ", e)

Division by zero.
Oops:  division by zero


Създателите на Python обичат да дефинират `else` блокове за всевъзможни езикови контролни конструкции, и `try` не е изключение (no pun intended). Кодът в `else` след `try-except` би се изпълнил само тогава, когато не е засечена никаква грешка при изпълнение.

In [None]:
try:
    # y = 0 / 42
    y = 42 / 0
except ZeroDivisionError:
    print("Division by zero.")
else:
    print("Everything is fine.")

Division by zero.


Освен това имаме и друг опционален блок - `finally`. Той се изпълнява абсолютно винаги като последна част на `try-(except)-(else)-finally` конструкцията, независимо от това дали е била прихваната грешка или не.

In [None]:
try:
    # y = 0 / 42
    y = 42 / 0
except ZeroDivisionError:
    print("Division by zero.")
else:
    print("Everything is fine.")
finally:
    print("I'm always here. o.o")

Division by zero.
I'm always here. o.o


<img src="assets/try_except_else_finally.png" width="500" heigth="400" />

## Хвърляне на изключения

Изключенията наследяват класa `Exception`. Списък от вграденитe такива може да откриете тук: https://docs.python.org/3/library/exceptions.html

Изключенията ги "хвърляме" с ключовата дума `raise`:

In [None]:
raise Exception("This is an exceptionally exceptional exception.")

Exception: This is an exceptionally exceptional exception.

In [None]:
raise ValueError  # може и без извикването на конструктора от нас

ValueError: 

In [None]:
def get_name_by_id(id: int) -> str | None:
    if not isinstance(id, int):
        raise TypeError("id must be int!")
    
    if id < 0:
        raise ValueError("id must be a positive integer!")

    database = ["Alex", "Lyubo", "Vankata"]

    if id >= len(database):
        return None
    
    return database[id]

Те се пропагират нагоре по стека на изпълнението на програмата, докато не се срещне `try` блок, който може да ги обработи. Ако няма такъв, програмата се терминира и се извежда съобщение за грешка. Това пропагиране е и причината да виждаме т.нар. Stacktrace:

In [None]:
def a(): raise Exception("Hello, stack!")
def b(): a()
def c(): b()
def d(): c()
def e(): d()

def f():
    try:
        e()
    except:
        print(f"Goodbye, stack. ;-;")

def g(): f()
def h(): g()
def i(): h()


i()  # f will catch it

e()  # nothing will catch it and kaboom

Goodbye, stack. ;-;


Exception: Hello, stack!

Можем да си дефинираме собствени изключения, като наследяваме класа `Exception` (или някой от неговите наследници):

In [None]:
class InvalidPortionException(Exception):
    def __init__(self, portion: tuple[str, str]) -> None:
        super().__init__(*portion)
    
    def __str__(self) -> str:
        ingredients = " sus ".join(self.args)
        return f"Ama kak taka, ne moje {ingredients}!"


class LelkataOtStolaDoNas:
    def __init__(self):
        osnovni = ("schnietzel", "kyufteta", "kartofeni kyufteta")
        garnituri = ("kartofi", "oriz", "zele")
        self.__allowed_portions = dict(zip(osnovni, garnituri))  # private shototo samo tq si gi znae...
    
    def order(self, osnovno: str, garnitura: str) -> None:
        portion = (osnovno, garnitura)

        if portion not in self.__allowed_portions.items():
            raise InvalidPortionException(portion)
        
        print("Krem, airqn?")

lelkata = LelkataOtStolaDoNas()
lelkata.order("kyufteta", "kartofi")

InvalidPortionException: Ama kak taka, ne moje kyufteta sus kartofi!

Възможно е освен това да се chain-ват изключения, когато в `except` блока се хвърли друго:

In [None]:
class UnbeknownstToMeException(Exception):
    def __init__(self, fact: str) -> None:
        msg = f"Е аз откъде да знам, че не може {fact}..."
        super().__init__(msg)


lelka = LelkataOtStolaDoNas()
try:
    lelka.order("kyufteta", "zele")
except InvalidPortionException as e:
    portion = " със ".join(e.args)
    raise UnbeknownstToMeException(portion)

UnbeknownstToMeException: Е аз откъде да знам, че не може kyufteta със zele...

*Disclaimer:* историята е по действителен случай, obv.

За да индикираме, че дадено изключение е директно следствие на друго, може да използваме `raise ... from ...`. Повече инфо в [документацията](https://docs.python.org/3/tutorial/errors.html#exception-chaining).

`assert`

Когато искаме да предпазим изпълнението на код от недифинрано поведение, можем да използваме ключовата дума `assert`. Тя проверява дали дадено условие е изпълнено и ако не е, то хвърля `AssertionError` с някакво съобщение за грешка, което може да зададем ако искаме. Обикновено се използва на фаза разработка и тестване на код, но може и да се използва и в production код, ако сме сигурни, че няма никога да се изпълни и че ако все пак се изпълни, то е окей програмата ни да крашне.

In [None]:
from typing import Iterable

def evaluate(test_results: Iterable[int], actual_results: Iterable[int]) -> float:
    assert len(test_results) == len(actual_results), "Expected and actual result series must be of equal length!"
    return (sum((t - a) ** 2 for t, a in zip(test_results, actual_results)) / len(test_results)) ** 0.5  # RMSE


print(evaluate([1, 2, 3], [2, 2, 4]))
print(evaluate([1, 2, 3], [2, 2, 4, 5]))

0.816496580927726


AssertionError: Expected and actual result series must be of equal length!

В някои случаи можем да очакваме да прихванем и `AssertionError`, примерно за да логнем това състояние, вместо да ни крашне програмата:

In [None]:
try:
    evaluate([1, 2, 3], [2, 2, 4, 5])
except AssertionError as e:
    logger.error(e)

Expected and actual result series must be of equal length!


# Работа с файлове в Python
План на лекцията:
- Кратка интродукция за работата с пътища, Windows и Unix
- Представяне на файловете в Python
- Четене на файлове
- Писане на файлове
- Работа с файлове и пътища
- Използване на `with`
- `tell` и `seek`
- Примери
- Задачи

### Предварителна подготовка 

In [None]:
!mkdir files
!curl -o files/lorem_ipsum.txt https://raw.githubusercontent.com/lyubolp/PythonCourse2022/08_files/08%20-%20Files/files/1.txt
!echo "hello" > files/hello.txt

## Кратка интродукция за работата с пътища, Windows и Unix.

Път в една файлова система посочва локацията и името на даден обект (бил той файл или директория). Пример за път в Linux/MacOS е `/home/user/myfile.txt`, а в Windows - `C:\Users\user\myfile.txt`. 

Забелязва се, че пътищата в Windows и Unix-базираните ОС се разделят с различни черти. Нашият Python код трябва да е съвместим и с двата начина за разделя на пътища. 

За наше улеснение, Python предлага функцията `os.path.join`, която по подадени имена на директории/файлове, конструира правилния спрямо нашия OS път.

In [None]:
import os

os.path.join('/home', 'lyubo', 'myfile.txt')

Понеже кодът е изпълнен под Linux, получаваме Unix-ски път. Ако изпълним обаче същия код под Windows, ще получим правилен Windows-ки път. 

## Представяне на файловете в Python

Python предоставя API за работа с файлове и потоци. Python работи с т.нар. "file objects" - това може да са файлове на диска, sockets, pipes и други потоци.

Освен с текстови файлове, можем да работим и с бинарни файлове. За момента обаче, ще се спрем само върху текстовите файлове.

Можем да отворим един файл за работа, с помощта на функцията `open`. В най-простия си вид, тя приема път към файл. 

In [None]:
fd = open(os.path.join('files', 'lorem_ipsum.txt'))

print(fd)

fd.close()

След като приключим работа с един файл, не трябва да забравяме да го затворим. Затварянето на един файл става с помощта на `close` метода. 

Забелязваме, че обекта който получаваме като резултат от `open` има име (`files/lorem_ipsum.txt`), режим (`r`) и кодиране (`UTF-8`).

Един файл може да бъде отворен в няколко различни режима:
- `r` - отваря файла за четене
- `w` - отваря файла за писане, като файла първо бива зачистен
- `a` - отваря файла за писане, като новото съдържание се записва в края на файла
- `x` - създава файла, ако не съществува. Ако файла вече съществува, се хвърля `FileExistsError`
- `b` - отваря файл в бинарен режим
- `t` - отваря файл в текстови режим
- `+` - отваря файла за четене и писане

Освен режима на отваряне, можем да променим и кодирането, с което се опитваме да четем файла. По подразбиране, използваме `UTF-8`. 

Ако се опитаме да запишем файл в несъществуваща директория, ще получим грешка

In [None]:
fd = open(os.path.join('files', 'non_existing_dir', 'new_file.txt'), 'w')

fd.write('content')

fd.close()

## Четене на файлове

В Python имаме три метода, чрез които можем да четем от файлове: `read`, `readline` и `readlines`.  

Нека първо разгледаме метода `read`. Той прочита целия файл и запазва съдържанието му в променлива, като един голям низ. 

In [None]:
import os

fd = open(os.path.join('files', 'lorem_ipsum.txt'))

content = fd.read()
print(f'content={content}')

fd.close()

Веднъж прочетен един файл, следващото прочитане ще ни върне празен низ. 

In [None]:
fd = open(os.path.join('files', 'lorem_ipsum.txt'))

content = fd.read()
print(f'content={content}')

content = fd.read()
print(f'content={content}')

fd.close()

Друг вариант за четене на файл, е ред по ред - това става с помощта на метода `readline`. 

In [None]:
import os
fd = open(os.path.join('files', 'lorem_ipsum.txt'))

content = fd.readline()
print(f'content={content}')

content = fd.readline()
print(f'content={content}')

fd.close()

След прочитане на последния ред, `readline` връща празен низ.

In [None]:
import os
fd = open(os.path.join('files', 'lorem_ipsum.txt'))

content = fd.readline()
print(f'content={content}')

while content != '':
    content = fd.readline()
    print(f'content={content}')

fd.close()

Ако искаме да получим списък от всички редове във файл, можем да използваме `readlines`.

In [None]:
import os
fd = open(os.path.join('files', 'lorem_ipsum.txt'))

content = fd.readlines()
print(f'content={content}')

fd.close()

In [None]:
import os
fd = open(os.path.join('files', 'lorem_ipsum.txt'))

content = fd.readlines()

for line in content:
    print(f'content={line}')

fd.close()

Вместо да използваме `readlines`, можем да итерираме директно по файл обекта.

In [None]:
import os
fd = open(os.path.join('files', 'lorem_ipsum.txt'))

for line in fd:
    print(f'content={line}')

fd.close()

## Писане на файлове

За писане на файлове в Python може да използваме методите `write` и `writelines`

Методът `write` записва низ във файла. Позицията зависи от начина по който е отворен файла (с или без изтриване на текущото съдържание).

In [None]:
import os
fd = open(os.path.join('files', 'hello_world.txt'), 'w')

fd.write('Hello world')

fd.close()

In [None]:
import os
fd = open(os.path.join('files', 'hello_world.txt'))

content = fd.read()
print(content)
fd.close()

Припомням, че ако отворим файла в режим `w`, то ще изтрием текущото му съдържание.

In [None]:
import os

fd = open(os.path.join('files', 'my_important_file.txt'), 'w')
fd.write('Really important')
fd.close()

# Oops, forgot to write something down

fd = open(os.path.join('files', 'my_important_file.txt'), 'w')
fd.write('Should really not forget this')
fd.close()


In [None]:
import os
fd = open(os.path.join('files', 'my_important_file.txt'))

content = fd.read()
print(content)
fd.close()

Ако искаме да пишем в края на файла, трябва да използваме режим `a`

In [None]:
import os

fd = open(os.path.join('files', 'my_important_file_2.txt'), 'a')
fd.write('Really important\n')
fd.close()

# Oops, forgot to write something down

fd = open(os.path.join('files', 'my_important_file_2.txt'), 'a')
fd.write('Should really not forget this\n')
fd.close()

In [None]:
import os
fd = open(os.path.join('files', 'my_important_file_2.txt'))

content = fd.read()
print(content)
fd.close()

Методът `writelines` приема списък от "редове", които да бъдат записани във файла.

**Забележка**: `writelines` не добавя автоматично нови редове след всеки елемент, затова се очаква всеки елемент от списъка да съдържа нов ред в себе си. 

In [None]:
import os

fd = open(os.path.join('files', 'writelines_example.txt'), 'w')

lines_to_write = ['hello\n', 'this\n', 'are\n', 'my\n', 'lines\n']
fd.writelines(lines_to_write)

fd.close()

In [None]:
import os
fd = open(os.path.join('files', 'writelines_example.txt'))

content = fd.read()
print(content)
fd.close()

Тук е добре да се отбележи, че можем да записваме и други типове данни, освен низове (е не точно, но...).

Стига даден тип (или обект) да има низово представяне, можем да го запишем във файл.

In [None]:
import os

other_types_in_files = os.path.join('files', 'other_types_in_files.txt')

fd = open(other_types_in_files, 'w')

fd.write(str(2) + '\n')
fd.write(str([2, 3, 4]) + '\n')
fd.write(str({'a': 2, 'b': 3, 'c': 4}) + '\n')
fd.write(str((2, 3)) + '\n')

fd.close()

fd = open(other_types_in_files)
content = fd.read()
print(content)
fd.close()

## Работа с файлове и пътища

Python предлага удобен начин за работа с файлове. Вградената библиотека `os` съдържа всичко необходимо за работата с файлове и директории. 

Ще разгледаме как можем да:
- Прегледаме съдържанието на директория
- Преместим файл
- Изтрием файл
- Създадем директория
- Преместим директория
- Изтрием директория
- Обща работа с пътища
- Обхождане на директории

### Преглеждане на съдържание на директория

Можем да видим съдържанието на директория като използваме `os.listdir` метода. Той ни връща списък от низове, съдържащи имената на директориите и файловете в исканата от нас папка. 

In [None]:
import os

print(os.listdir('files'))

### Преместване на файл

Преместването на файл става чрез "преименуването му" (или всъщност, преименуването на файл е преместването му като файл с друго име 🤔) - това в Python става с помощта на функцията `os.rename`. Тя приема два аргумента - source път и destination път (т.е. старото и новото име на файла)

In [None]:
import os

file_to_be_moved = os.path.join('files', 'to_be_moved.txt')

fp = open(file_to_be_moved, 'w')
fp.write('This file is to be moved')
fp.close()

print(f'Before = {os.listdir("files")}')

file_moved = os.path.join('files', 'file_moved.txt')

os.rename(file_to_be_moved, file_moved)

print(f'After = {os.listdir("files")}')

Ако вече съществува файл със същото име се случват едно от две неща:
- Ако кодът се изпълнява под Windows, се хвърля `FileExistsError`. 
- Ако кодът се изпълнява под Linux/MacOS и имаме права върху файла върху който ще пишем, той ще бъде презаписан

Нека разгледаме следната ситуация: имаме файл `files/a/file.txt`, който искаме да преместим в `files/b`, но директорията `b` не съществува.

In [None]:
!mkdir files/a

In [None]:
import os

file_to_be_moved = os.path.join('files', 'a', 'file.txt')

fp = open(file_to_be_moved, 'w')
fp.write('This file is to be moved')
fp.close()

os.rename(file_to_be_moved, os.path.join('files', 'b', 'file.txt'))

### Изтриване на файл

Изтриването на файл се случва чрез метода `os.remove`. Той приема един аргумент - пътят към файла, който ще бъде изтрит.

In [None]:
import os

file_path = os.path.join('files', 'to_removed.txt')
fp = open(file_path, 'w')
fp.write('This file will be deleted')
fp.close()

print(f'Before = {os.listdir("files")}')

os.remove(file_path)

print(f'After = {os.listdir("files")}')

Ако се опитаме да изтрием директория с `os.remove`, ще получим грешка `IsADirectoryError`.

In [None]:
import os

os.remove('files')

А ако опитаме да изтрием файл, който не съществува, ще получим грешка `FileNotFoundError`.

In [None]:
import os

non_existant_path = os.path.join('files', 'this_file_does_not_exist.txt')

os.remove(non_existant_path)

### Копиране на файлове

В Python можем да копираме файлове с помощта на `shutil` библиотеката. Тя ни предоставя методи за копиране на файлове.

Ще разгледаме част от тях:

- `shutil.copy()` - копира файл от едно място на друго. Приема два аргумента - source и target пътища. Ако файлът вече съществува на новото място, ще бъде презаписан. Ако target е директория, ще се запише копие на файла в тази директория със същото име.
- `shutil.copy2()` - работи по същия начин като `shutil.copy()`, но запазва и метаданните на файла (например времето на създаване)
- `shutil.copystat()` - копира само метаданните на файла
- `shutil.copytree()` - копира директория и всички файлове в нея. Приема два аргумента - source и target пътища. 

In [None]:
import os
import shutil

print(f'Before = {os.listdir("files")}')

shutil.copy(os.path.join('files', '1.txt'), os.path.join('files', '1_1.txt'))
shutil.copy2(os.path.join('files', '1.txt'), os.path.join('files', '1_2.txt'))

print(f'After = {os.listdir("files")}')

Before = ['1.txt']
After = ['1_2.txt', '1.txt', '1_1.txt']


### Създаване на директория

В Python създаването на директория става чрез метода `os.mkdir`. Той приема пътя към директорията, която да бъде създадена. 

In [None]:
import os

print(f'Before = {os.listdir("files")}')

file_path = os.path.join('files', 'mkdir_example')
os.mkdir(file_path)

print(f'After = {os.listdir("files")}')

Само за информация: Можем да зададем права на директорията, с помощта на аргумента `mode`. 

Ако се опитаме да създадем директория, която вече съществува, ще получим `FileExistsError`. 

In [None]:
import os

file_path = os.path.join('files', 'mkdir_existing_directory')
os.mkdir(file_path)

os.mkdir(file_path)

Нека опитаме да създадем няколко нови директории, една под друга. 

In [None]:
import os

print(f'Before = {os.listdir("files")}')

file_path = os.path.join('files', 'mkdir_example_parent', 'mkdir_example_child')
os.mkdir(file_path)

print(f'After = {os.listdir("files")}')

Тук получаваме грешка - `os.mkdir` не може да създаде несъществуващите директории над последната. За целта трябва да използваме метода `os.makedirs`. Той приема отново като аргумент пътят към директорията, която искаме да създадем, както и права на директорията/директориите. 

In [None]:
import os

print(f'Before = {os.listdir("files")}')

file_path = os.path.join('files', 'mkdir_example_parent', 'mkdir_example_child')
os.makedirs(file_path)

print(f'After = {os.listdir("files")}')

Един допълнителен аргумент, който `makedirs` приема, е аргумента `exist_ok`. Той контролира дали да се хвърли грешка, ако крайната директория която искаме да създадем, вече съществува. 

### Преместване на директория

Освен за преместване на файлове, `os.rename` работи и за директории. 

In [None]:
import os

file_path = os.path.join('files', 'rename_dir_example_1')
os.makedirs(file_path)

print(f'Before = {os.listdir("files")}')

target_file_path = os.path.join('files', 'renamed_dir_example_1')
os.rename(file_path, target_file_path)
print(f'After = {os.listdir("files")}')

Както споменахме по-горе, ако дестинацията съществува, под Windows `os.rename` хвърля `FileExistsError`. 

Под Unix системи (Linux, MacOS) поведението е малко по-различно:
- Ако source пътя е файл, а destination пътя е директория, се хвърля `IsADirectory` грешка
- Ако source пътя е директория, а destination пътя е файл, се хвърля `NotADirectory` грешка
- Ако destination е съществуваща директория:
    - Ако е празна, преместването е успешно
    - Ако не е празна, се хвърля `OSError` грешка


### Изтриване на директория

Изтриването на директория става чрез функцията `os.rmdir`. Тя приема пътя към директорията, която трябва да бъде изтрита. 

In [None]:
import os

file_path = os.path.join('files', 'remove_dir_example_1')
os.makedirs(file_path)

print(f'Before = {os.listdir("files")}')

os.rmdir(file_path)
print(f'After = {os.listdir("files")}')

Ако директорията, която се опитаме да изтрием, не е празна, ще получим `OSError`. А ако тя не съществува, ще получим `FileNotFoundError`. 

In [None]:
import os

non_existing_dir = os.path.join('files', 'non_existing_dir')

os.rmdir(non_existing_dir)
os.rmdir('files')

In [None]:
import os

os.rmdir('files')

Освен `os.rmdir`, Python предлага и друга функция за изтриване на директории - `os.removedirs`. Тя обаче работи по специфичен начин. `os.removedirs` приема път до директория, като освен да премахва последната директория от пътя, функцията се опитва да премахне и всички празни директории нагоре, като спира при първата директория, която не е успяла да премахне успешно.

Нека за целта създадем следната структура - `files/remove_dirs_example` ще е основната ни директория. В нея ще имаме две поддиректории - `first` и `second`. В `first` ще създадем още няколко поддиректории, като всичките ще са празни. В `second` ще създадем един файл и една поддиректория.

Ще се опитаме да извикаме `os.removedirs` върху най-долната директории в `first` и `second`

In [None]:
import os

main_dir = os.path.join('files', 'remove_dirs_example')

first_dir = os.path.join(main_dir, 'first')
empty_first_subdirs = os.path.join(first_dir, 'a', 'b', 'c')

second_dir = os.path.join(main_dir, 'second')
empty_second_subdir = os.path.join(second_dir, 'd')
empty_second_dir_file = os.path.join(second_dir, 'e')

os.makedirs(empty_first_subdirs)
os.makedirs(empty_second_subdir)


fd = open(empty_second_dir_file, 'w')
fd.write('Hi')
fd.close()

print(f'Before = {os.listdir(main_dir)}')

os.removedirs(empty_first_subdirs)
os.removedirs(empty_second_subdir)

print(f'After = {os.listdir(main_dir)}')

Как работи `os.removedirs` в този случай ?

Върху `files/first/a/b/c`:
1. Опитваме да изтрием `c` => тя е празна, изтрива се
2. Опитваме да изтрием `b` => тя е празна, изтрива се
3. Опитваме да изтрием `a` => тя е празна, изтрива се
4. Опитваме да изтрием `first` => тя е празна, изтрива се
5. Опитваме да изтрием `remove_dirs_example` => тя не е празна, спираме

Върху `files/second/d`:
1. Опитваме да изтрием `d` => тя е празна, изтрива се
2. Опитваме да изтрием `second` => тя не е празна, спираме

`os.removedirs` е много подходяща когато имаме много празни директории една в друга, но е редно да се използва внимателно.

За любопитните: Съществува функция [`rmtree`](https://docs.python.org/3.10/library/shutil.html#shutil.rmtree), намираща се в `shutil` библиотеката, която изтрива папка и всички в нея. Нея няма да я разглеждаме в курса.

### Обща работа с пътища

В началото видяхме, че за да построим един път до файл или директория в Python, трябва да използваме `os.path.join`. Освен `join`, [`os.path`](https://docs.python.org/3.10/library/os.path.html) предлага много други полезни функции за работа с пътища. 

Ще се спрем върху една част от тях, която е по-вероятно да използвате във всекидневната си работа с Python:

- os.path.exists - проверка дали пътят сочи към валиден файл или директория
- os.path.isdir - дали пътят сочи към валидна директория
- os.path.isfile - дали пътят сочи към валиден файл
- os.path.split - отделя последната част от път

In [None]:
import os
print(f'Does the files directory exist: {os.path.exists("files")}')
print(f'Does the files/lorem_ipsum.txt file exist: {os.path.exists(os.path.join("files", "lorem_ipsum.txt"))}')
print(f'Does the files/ala-bala.txt file exist: {os.path.exists(os.path.join("files", "ala-bala.txt"))}')

In [None]:
import os
print(f'Is "files" a directory: {os.path.isdir("files")}')
print(f'Is "files/lorem_ipsum.txt" a directory: {os.path.isdir(os.path.join("files", "lorem_ipsum.txt"))}')
print(f'Is "files/ala-bala.txt" a directory: {os.path.isdir(os.path.join("files", "ala-bala.txt"))}')  # Although the file does not exist, isdir returns False

In [None]:
import os
print(f'Is "files" a file: {os.path.isfile("files")}')
print(f'Is "files/lorem_ipsum.txt" a file: {os.path.isfile(os.path.join("files", "lorem_ipsum.txt"))}')
print(f'Is "files/ala-bala.txt" a directory: {os.path.isfile(os.path.join("files", "ala-bala.txt"))}')  # Although the file does not exist, isfile returns False

`os.path.split` отделя последната част от пътя от останалия. Връща ни наредена двойка от `head` и `tail`, където `tail` съдържа последната част от пътя, а `head` останалото 

In [None]:
import os

long_path = os.path.join('/', 'foo', 'bar', 'baz')
print(f'long_path = {long_path}')

print(f'long_path splitted: {os.path.split(long_path)}')

Важно е да отбележим няколко по-специални случая:

- Ако пътят е празен, `split` ще ни върне празни `head` и `tail`
- Ако пътят завършва с `/` (или `\` под Windows), `tail` ще е празен низ
- Ако пътят не съдържа `/`(или `\` под Windows), `head` ще е празен низ

In [None]:
empty_path = ''
print(f'split with empty path returns = {os.path.split(empty_path)}')

ending_with_separator = '/foo/bar/'
print(f'split with path ending in / returns = {os.path.split(ending_with_separator)}')

no_separators = 'foo'
print(f'split with no separators returns = {os.path.split(no_separators)}')

### Обхождане на директории

Понякога искаме да обходим цялото директорийно дърво отдадена точка надолу. Python ни позволява да направи това сравнително лесно, с помощта на функцията `os.walk`. 

Тя приема като аргумент директорията, от което започва обхождането. Като резултат, тя ни връща генератор съдържащ името на текущата директория, имената на директориите в текущата директория и имената на файловете в текущата директория.



In [None]:
import os

# Setup
example_root_dir = os.path.join('files', 'walk_example')

d_dir = os.path.join(example_root_dir, 'a', 'b', 'c', 'd')
os.makedirs(d_dir, exist_ok=True)

os.makedirs(os.path.join(example_root_dir, 'a', 'b1'), exist_ok=True)

b2_dir = os.path.join(example_root_dir, 'a', 'b2')
os.makedirs(b2_dir, exist_ok=True)

os.makedirs(os.path.join(example_root_dir, 'a', 'b', 'c', 'd1'), exist_ok=True)
os.makedirs(os.path.join(example_root_dir, 'a', 'b', 'c', 'd2'), exist_ok=True)

files_for_d = [os.path.join(d_dir, f'file{i}') for i in range(5)]

for file_for_d in files_for_d:
    with open(file_for_d, 'w') as fp:
        fp.write(f'Content for {file_for_d}')

files_for_b2 = [os.path.join(d_dir, f'file{i}') for i in range(3)]

for file_for_b2 in files_for_b2:
    with open(file_for_b2, 'w') as fp:
        fp.write(f'Content for {file_for_b2}')


# os.walk

for dirname, subdirs, files in os.walk(example_root_dir):
    print(f'In {dirname}, which has subdirs: {subdirs} and files: {files}')

## Използване на `with`

Досега в работата ни с файлове, забелязахме че трябва да подсигурим, че сме затворили файла. Проблемът идва, когато трябва да се справим с грешки, които могат да бъда хвърлени от различните операции с файлове. Дори и при хвърлена грешка, ние все пак трябва да си затворим файла.

Python ни позволява два начина да се справим с този проблем - `try/finally` и `with`.

След всеки `try` блок, може да поставим един друг блок, който да се изпълнява винаги след `try` или `except` блоковете. Този допълнителен блок се казва `finally`. 

In [None]:
def raiser():
    raise ValueError('Hello there')

try:
    raiser()
finally:
    print('After the exception, this will be printed')

По подобен начин можем да използваме `finally` за да затворим отворения файл.

In [None]:
import os
fp = open(os.path.join('files', 'lorem_ipsum.txt'))
try:
    print(fp.read())
finally:
    fp.close()

Така, дори и да получим грешка при четене (или каквато и да е друга операция в `try` блока), файла ще бъде затворен.

От тук можем да стигнем до заключението - при работата с ресурси, имаме процес по отваряне и процес по затваряне (независимо от грешки). Python ни предлага и друга синтактична конструкция за работа с такива структури - `with`.

`with` ни позволява отварянето на нов контекст. В него може да отворим ресурс, а след излизането от блока, този ресурс се затваря автоматично. 

Общият вид на `with` е следния:
```python
with <expression> as <variable>:
    f(variable)
```

Ако искаме да отворим файл и да прочетем нещо с `with`, кода би изглеждал по следния начин:

In [None]:
import os
with open(os.path.join('files', 'lorem_ipsum.txt')) as fp:
    print(fp.read())

print(f'Is the file closed ? {fp.closed}')

Дори и при грешка, файлът ще бъде затворен. Ако искаме обаче да хванем грешката, все пак трябва да изпозлваме `try/catch`.

In [None]:
import os

try:
    with open(os.path.join('files', 'lorem_ipsum.txt')) as fp:
        print(fp.read())
except OSError as err:
    print(err)

Начинът по който `with` работи е, че извиква два специални магически метода - `__enter__` и `__exit__`, който се изпълняват при влизане и излизане съответно от контекст мениджъра. 

По-конкретно, `__enter__` метода се изивиква в `as` частта на `with`. В него връщаме обекта, който ще бъде присвоен на променливата след `as`.


Файловите обекти имплементират `__exit__` метода, където затварят отворения файл.

Ако искаме и нашите класове да работят с контекстните мениджъри, трябва да имплементираме `__enter__` и `__exit__` методите. 

In [None]:
class ContextableClass:
    def __init__(self, some_var=42):
        self.some_var = some_var
    
    def __enter__(self):
        print('Entering the context manager')
        return self
    
    def __exit__(self, exc_type, exc_value, traceback):
        print('Exiting the context manager')

In [None]:
with ContextableClass(5) as instance:
    print(instance.some_var)

## `tell` и `seek`

Писането и четенето от файлове всъщност се осъществява символ по символ. Така например за да запишем 'hello', трябва първо да запишем `h`, после `e` и т.н. 

Както при писането с клавиатура имаме позиция върху която пишем, така и при работата с файлове имаме позиция, на която четем или пишем.

Python ни позволява да вземем текущата позиция за четене/писане, както и да преместим тази позиция на друго място. 

Можем да вземем позиция на курсора във файла с помощта на метода `tell`. Той ще ни върне като резултат цяло число, символизиращо броя символи след началото на файла.

In [None]:
import os

file_path = os.path.join('files', 'tell_exampe.txt')

# First lets create the file
with open(file_path, 'w') as fp:
    fp.write('abc\n')
    fp.write('def\n')
    fp.write('ghi\n')

# Now lets read 
with open(file_path) as fp:
    print(f'Current position = {fp.tell()}')
    print(f'Reading a line... {fp.readline()}')

    print(f'Current position = {fp.tell()}')
    print(f'Reading another line... {fp.readline()}')

    print(f'Current position = {fp.tell()}')

Можем да зададем позиция на курсора във файла с помощта на метода `seek`. Той приема два аргумента - какво отместване (`offset`) да направим и от къде (`whence`).

`whence` приема три стойност:
- 0 (или `os.SEEK_SET`) - означава спрямо началото на файла
- 1 (или `os.SEEK_CUR`) - означава спрямо текущата позиция
- 2 (или `os.SEEK_END`) - означава спрямо края на файла

При работа с текстови файлове, отместването е само спрямо началото на файла. Можем единствено да преместим курсора до края на файла с `seek(0, 2)`

In [None]:
import os

file_path = os.path.join('files', 'seek_exampe.txt')

# First lets create the file
with open(file_path, 'w') as fp:
    fp.write('abcdefghijk')

with open(file_path, 'r+') as fp:
    fp.seek(2)
    fp.write('!')

    fp.seek(0, 2)
    fp.write('@')

with open(file_path) as fp:
    print(fp.read())

Бележка: Ако бяхте отворили файла за писане с режим `a`, щяхме да можем да пишем само в края. Режим `r+` ни дава права за четене и пренаписване. 

## `pathlib`

`pathlib` е вграден в езика модул, който предоставя обектно-ориентиран интерфейс за работа с пътища, чрез абстракция над всички гореспоменати функции.

Основния клас, който използваме от `pathlib` е `Path`. Можем да си го импортнем по следния начин:

In [None]:
from pathlib import Path

`Path` предефинира оператор `/` за инуитивна конкатенация на пътища (алтернатива на `os.path.join`):

In [None]:
dataset_dir_path = Path("data_folder") / "raw_datasets" / "some_dataset_dir"
meta_file_path = dataset_dir_path / "meta.csv"
data_dir_path = dataset_dir_path / "data"

data_dir_path

WindowsPath('data_folder/raw_datasets/some_dataset_dir/data')

`Path`, както и `os.path.join`, автоматично проверяват дали пътят трябва да е Windows или Unix-съвместим. 

Details for nerds: В случая на `Path`, който е базов клас, при създаване на обект той автоматично преценява кой от двата subclass-a всъщност да създаде - `WindowsPath` или `PosixPath` (това е възможно чрез предефиниране на дъндъра `__new__`).

`Path` има доста полезни атрибути и методи:

In [None]:
example_dir = Path('files')
example_file = example_dir / "1.txt"

In [None]:
example_file.parent

WindowsPath('files')

In [None]:
example_file.parent.parent

WindowsPath('.')

In [None]:
example_file.name

'1.txt'

In [None]:
example_file.stem

'1'

In [None]:
example_file.suffix

'.txt'

In [None]:
example_file.is_file()

True

In [None]:
example_file.read_text()

'Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. \nUt enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. \nDuis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. \nExcepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum\n'

In [None]:
example_file.read_bytes()

b'Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. \r\nUt enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. \r\nDuis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. \r\nExcepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum\r\n'

In [None]:
new_file = example_dir / "new_file.txt"
new_file.touch()  # creates an empty file

In [None]:
example_file.write_text('Hello world')  # returns the number of bytes written

11

In [None]:
renamed_file = new_file.rename("here.txt")  # can move as well

In [None]:
renamed_file.unlink()

In [None]:
example_dir.is_dir()

True

In [None]:
list(example_dir.iterdir())  # iterates over all files inside

[WindowsPath('files/1.txt')]

In [None]:
list(example_dir.glob('*.txt'))  # iterates over all files inside that end with .txt

# globs can have special syntax for powerful filtering: https://en.wikipedia.org/wiki/Glob_(programming)

[WindowsPath('files/1.txt')]

In [None]:
example_file.resolve()  # relative path -> absolute path

WindowsPath('C:/Users/Owner/Documents/PythonCourse2024/08 - Files/files/1.txt')

In [None]:
# example_file.owner()  # not available on Windows

In [None]:
new_dir = example_dir / "new_dir"
new_dir.mkdir()

In [None]:
new_dir.rmdir()

Ако ви трябва някой `Path` обект като низ, може да използвате `str`:

In [None]:
str(example_file)

'files\\1.txt'

## Примери

### Пример 1

Напишете функция `split_path`, която приема път (като низ), и го разделя на съставните му части. Използвайте `os.path.split`.

#### Решение на пример 1

In [None]:
import os
from typing import List

def split_path(file_path: str) -> List[str]:
    head, tail = os.path.split(file_path)

    result = [tail]
    while head != '' and head != file_path:
        file_path = head
        head, tail = os.path.split(file_path)
        result.append(tail)

    result.reverse()
    return result

In [None]:
print(split_path('/foo/bar/baz'))
print(split_path('/foo/bar/baz/'))
print(split_path('/foo'))
print(split_path('foo'))

### Пример 2

Даден е клас `Person`, който съдържа информация за човек - неговите имена, рожденна дата, възраст и работа.

In [None]:
class Person:
    def __init__(self, first_name: str='', last_name: str='', birthdate: str='', age: int=0, job: str=''):
        self.__first_name = first_name
        self.__last_name = last_name
        self.__birthdate = birthdate
        self.__age = age
        self.__job = job

    @property
    def first_name(self) -> str:
        return self.__first_name
    
    @property
    def last_name(self) -> str:
        return self.__last_name
    
    @property
    def birthdate(self) -> str:
        return self.__birthdate

    @property
    def age(self) -> str:
        return self.__age

    @property
    def job(self) -> str:
        return self.__job

Напишете клас `PersonSerializer`, съдържащ следните методи:
- Метод, който приема обект от тип `Person` и път. Методът записва във файл информацията за човека
- Метод, който приема път и връща обект от тип `Person`, който е създаден на база данните от файла
- Метод, който приема списък от `Person` и път. Методът записва във файл информация за хората
- Метод, който приема път и връща списък от `Person`, които са създадени на база на информацията във файла

При грешка при писането или четенето класът да хвърля `ValueError`. 

Може да приемем, че информацията за един човек ще бъде записана на един ред. 

#### Решение на пример 2

In [None]:
from typing import List

class Person:
    def __init__(self, first_name: str='', last_name: str='', birthdate: str='', age: int=0, job: str=''):
        self.__first_name = first_name
        self.__last_name = last_name
        self.__birthdate = birthdate
        self.__age = age
        self.__job = job

    @property
    def first_name(self) -> str:
        return self.__first_name
    
    @property
    def last_name(self) -> str:
        return self.__last_name
    
    @property
    def birthdate(self) -> str:
        return self.__birthdate

    @property
    def age(self) -> str:
        return self.__age

    @property
    def job(self) -> str:
        return self.__job

    # Adding a __str__ magic method helps us with printing the info
    def __str__(self) -> str:
        return f'{self.first_name}, {self.last_name}, {self.birthdate}, {self.age}, {self.job}'
    
    @staticmethod
    def from_string(person_info: str):
        first_name, last_name, birthdate, age, job = person_info.strip().split(', ')
        return Person(first_name, last_name, birthdate, age, job)
    
class PersonSerializer:
    @staticmethod
    def save_person(person: Person, filepath: str, mode: str='w'):
        with open(filepath, mode) as fp:
            fp.write(str(person) + '\n')
    
    @staticmethod
    def create_person_from_file(filepath: str) -> Person:
        if not os.path.exists(filepath):
            raise ValueError(f'File not found at {filepath}')
        
        with open(filepath) as fp:
            person_info = fp.read()
            return Person.from_string(person_info)

    @staticmethod
    def save_people(people: List[Person], filepath: str):
        for person in people:
            PersonSerializer.save_person(person, filepath, mode='a')
    
    @staticmethod
    def create_people_from_file(filepath: str) -> List[Person]:
        if not os.path.exists(filepath):
            raise ValueError(f'File not found at {filepath}')
        
        with open(filepath) as fp:
            return [Person.from_string(person_info) for person_info in fp]


In [None]:
me = Person('Lyubo', 'Karev', '20-09-1998', 24, 'Developer')
my_filepath = os.path.join('files', 'lyubo.txt')

PersonSerializer.save_person(me, my_filepath)
me_again = PersonSerializer.create_person_from_file(my_filepath)  # Hello me, meet the real me

print(me)
print(me_again)

In [None]:
bunch_of_people = [
    Person('Lyubo', 'Karev', '20-09-1998', 24, 'Developer'),
    Person('Alex', 'Ignatov', '22-10-1998', 24, 'Developer'),
    Person('Ivan', 'Luchev', '28-04-1998', 24, 'Student')
]

our_filepath = os.path.join('files', 'us.txt')

PersonSerializer.save_people(bunch_of_people, our_filepath)
us_again = PersonSerializer.create_people_from_file(our_filepath)

print('Bunch of people:')
for person in bunch_of_people: 
    print(person)

print('Us again:')
for person in us_again: 
    print(person)

### Пример 3

Както споменахме по-горе, `writelines` не добавя автоматично нови редове след всеки подаден елемент от списъка.

Напишете функция `better_writelines`, която поправя тази грешка.

#### Решение на Пример 3

In [None]:
def better_writelines(lines: list[str], filepath: str):
    with open(filepath, 'w') as fp:
        fp.writelines([line + '\n' for line in lines])

### Пример 4

`os.rmdir` изтрива директория, само ако е празна. 

Напишете функция `rm_rf`, която по подадена директория, изтрива съдържанието ѝ, както и самата директория.

#### Решение на Пример 4

In [None]:
def rm_rf(filepath: str):
    if os.path.isdir(filepath):
        for file in os.listdir(filepath):
            rm_rf(os.path.join(filepath, file))
        os.rmdir(filepath)
    else:
        os.remove(filepath)

### Пример 5

Напишете програма за управление на музикални файлове. 

Програмата трябва да поддържа следните функционалности:
- Задаване на работна директория (директория, в която са ни музикалните файлове)
- Извеждане на списък с всички песни (приемете, че всеки файл ще е с име във формат `artist-song_name.mp3`
- Търсене на песен по изпълнител (връща точно съвпадение)
- Търсене на псене по име на песен (връща точно съвпадение)

Потребителския интефейс може да бъде следния:
- Потребителя има достъп до 5 команди (`set`, `list`, `find artist`, `find song` и `exit`)
- Потребителя може да въвежда (и изпълнява) команди, до въвеждане на `exit`, при което програмата спира работа.
(Ако имате други идеи за интерфейса, също ще бъдат приети)

Примерни песни може да свалите от [тук](https://drive.google.com/file/d/1lqRxlPHd0THds_WU6l5DsRie0-yoCXFc/view?usp=sharing)

# Модули и пакети

## Какво е модул?

Всеки един Python файл (.py) на практика е модул. Освен това е възможно библиотека, написана на С, и вмъкната динамично също да бъде модул. Третия тип модули са вградените в езика такива.

В тази лекция се фокусираме върху първия тип и модули и как можем да ги създаваме, вмъкваме и боравим с тях.

## Как да създам модул?

Казахме, че всеки Python файл е валиден модул. 

Нека създадем един такъв с няколко дефиниции вътре (в папката с тази тетрадка вече би трябвало да се съдържа файл `hitchhikers.py`).

## `import`

Имената, функциите и класовете, които създадохме в този файл, не могат да бъдат достъпени директно от друг файл:

In [None]:
compute()

NameError: name 'compute' is not defined

Можем обаче да ги вмъкнем в друг файл (модул) чрез `import {името_на_модула}` (името на файла преди разширението `.py` се превръща в име на модула):

In [None]:
import hitchhikers

hitchhikers.compute()

Hm, I'll have to think about that. Return to this place in exactly 7.5 million years...


42

`import` освен, че интерпретира целия код на модула, добавя имената и дефинициите в един обект от тип модул, имащ името на модула. Затова и ги достъпваме чрез `името_на_модула.име_на_обекта`.

Какво се съдържа в един модул можем лесно да видим с `dir()`:

In [None]:
dir(hitchhikers)

['ANSWER',
 'TheGreatDeepThought',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'compute']

In [None]:
hitchhikers.ANSWER

42

In [None]:
computer = hitchhikers.TheGreatDeepThought()
computer.ask()

Shush! The show is back on.


In [None]:
hitchhikers.__name__

'hitchhikers'

In [None]:
dir()  # by default it shows the contents of the *current* module

['In',
 'Out',
 '_',
 '_2',
 '_3',
 '_4',
 '_6',
 '__',
 '___',
 '__builtin__',
 '__builtins__',
 '__doc__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '__vsc_ipynb_file__',
 '_dh',
 '_i',
 '_i1',
 '_i2',
 '_i3',
 '_i4',
 '_i5',
 '_i6',
 '_i7',
 '_ih',
 '_ii',
 '_iii',
 '_oh',
 'computer',
 'exit',
 'get_ipython',
 'hitchhikers',
 'open',
 'os',
 'quit',
 'sys']

In [None]:
__name__

'__main__'

## Добре, обаче `import` къде точно търси?

1. Директорията, в която се намира Python скрипта, който се изпълнява (или текущата, ако интерпретаторът е пуснат интерактивно)
2. Директориите, които са описани в `PYTHONPATH` променливата на средата
3. Лист от директории, зададен по време на инсталацията на Python

Този списък от възможни директории може да се види със `sys.path`:

In [None]:
import sys
sys.path

['/Users/alexander.ignatov/Documents/PythonCourse2022/13 - Modules',
 '/Users/alexander.ignatov/.vscode/extensions/ms-toolsai.jupyter-2022.11.1003412109/pythonFiles',
 '/Users/alexander.ignatov/.vscode/extensions/ms-toolsai.jupyter-2022.11.1003412109/pythonFiles/lib/python',
 '/opt/homebrew/Cellar/python@3.10/3.10.8/Frameworks/Python.framework/Versions/3.10/lib/python310.zip',
 '/opt/homebrew/Cellar/python@3.10/3.10.8/Frameworks/Python.framework/Versions/3.10/lib/python3.10',
 '/opt/homebrew/Cellar/python@3.10/3.10.8/Frameworks/Python.framework/Versions/3.10/lib/python3.10/lib-dynload',
 '',
 '/Users/alexander.ignatov/Documents/PythonCourse2022/venv/lib/python3.10/site-packages']

## Варианти на `import`

С `from {module} import {something}, {something_else}, ...` можем да импортираме само определени имена от модула, като те биват добавени към съдържанието на текущия (т.е. достъпваме ги без името на оригиналния модул и точка отпред):

In [None]:
from hitchhikers import compute
compute()

Hm, I'll have to think about that. Return to this place in exactly 7.5 million years...


42

С `from {module} import {something} as {alias}, {something_else} as {other_alias}, ...` можем да прекръстим импортираните имена:

In [None]:
from hitchhikers import ANSWER, TheGreatDeepThought as Computer
comp = Computer()
comp.ask() == ANSWER

Shush! The show is back on.


False

In [None]:
"ANSWER" in dir()

True

Ако искаме абсолютно всички имена на вмъкнем и ползваме в текущия модул по този начин (без тези, започващи с подчертавка `_`), можем да използваме астериск `*`:

In [None]:
# изпълни тази клетка ако си изпълнил горните, за да се зачистят import-ите
del hitchhikers, ANSWER, compute, Computer

In [None]:
from hitchhikers import *

compute() == ANSWER

Hm, I'll have to think about that. Return to this place in exactly 7.5 million years...


True

Лимитация на астерикс синтаксиса е, че не може да използва в блок (може само на най-външното ниво на модула):

In [None]:
del compute, ANSWER, TheGreatDeepThought

In [None]:
def obtain_answer():
    from hitchhikers import *  # 💥
    return compute()

SyntaxError: import * only allowed at module level (1537905421.py, line 2)

Както казахме, по подразбиране from {module} import * вмъква абсолютно всички имена от `module`, които не започват с подчертавка. Имаме всъщност контрол над това, кое може да се вмъкне чрез астерикс, като дефинираме `__all__` във въпросния модул. Стойността му е лист от всички имена, които ще бъдат вмъкнати от `*`.

*Пример*:

След добавяне на
```python
__all__ = ['compute', 'TheGreatDeepThought']
```
в `hitchhikers.py`, следният код, изпълнен в `script.py` (в същата директория) ще хвърли `NameError`:
```python
from hitchhikers import *
print(hitchhikers.ANSWER)  # 💥
```

## Пакети

Пакет e набор от модули. За Python всяка директория, в която има модули, се превръща в пакет (package).

*Note*: Във версии по-ранни от Python 3.3 трябва задължително в директорията да има файл с име `__init__.py`.

В директорията на тетрадката би трябвало да има папка `game`, съдържаща няколко файла и папки:

In [None]:
!tree game

[01;34mgame[0m
├── [00mengine.py[0m
├── [00mlevel.py[0m
├── [00mplayer.py[0m
└── [01;34mplayers[0m
    ├── [00mai.py[0m
    ├── [00minput_player.py[0m
    └── [00mmock_player.py[0m

1 directory, 6 files


В горния пример `game` е пакет, съдържащ модулите `engine`, `level` и `player`. Освен тях, той съдържа и подпакетът `players`.

Ако искаме да вмъкнем някой модул от пакета, можем да го направим чрез името на пакета (или всички пакети по веригата, разделени с точка), последвано от точка и името на въпросния модул:

In [None]:
import game.level

game.level.EASY

Level(word='SCRIPT', failed_attempts=10)

In [None]:
import game.players.ai

game.players.ai.AI(10)

<game.players.ai.AI at 0x107ab4610>

Вече въведените по-горе синтактични варианти на `import` също важат:

In [None]:
from game.players.ai import AI
from game.level import EASY as easy, MEDIUM as medium, HARD as hard
from game.engine import *

Освен това, можем и да вмъкнем модули чрез `from {package} import {module} [as {alias}], ...`:

In [None]:
from game import level, engine

print(level.EASY)
print(engine.GameState)

Level(word='SCRIPT', failed_attempts=10)
<enum 'GameState'>


## `__init__.py`

На теория можем и да импортнем само пакета. По подразбиране това няма да добави нови модули и имена:

In [None]:
del game.level, game.player, game.engine  # зачисти тетрадката от предните импорти

In [None]:
import game

game.level  # 💥

AttributeError: module 'game' has no attribute 'level'

Ако искаме да добавим и модули от пакета при импортирането му, можем да ги импортнем в `__init__.py`, намиращ се в директорията на пакета.

Т.е. ако в `game/__init__.py` имаме:
```python
import game.engine, game.level, game.player
```

то можем да импортнем пакета `game` и да използваме всички модули от него:
```python
# в друг файл, извън пакета `game`:
import game
print(game.level.EASY)  # no error
```

В `__init__.py` можем да напишем какъвто искаме инициализационен код, глобален за всички модули в пакета. Съдържанието на скрипта се изпълнява веднага при импортиране на пакета.

Както при модулите, така и тука можем да дефинираме поведението на `from {package} import *` чрез `__all__`. По подразбиране, както видяхме за `import {package}`, това е празен списък, т.е. нищо няма да се вмъкне (за разлика от поведението при модулите, когато се вмъква абсолютно всяко име от модула, което не започва с подчертавка).

Т.е. ако напишем в `game/__init__.py`:

```python
__all__ = ["engine", "level", "player"]
```

то ще можем:

```python
# в друг файл, извън пакета `game`:
from game import *
print(level.EASY)  # no error
```

## Релативни импорти

Дотук разгледахме примерни за **абсолютни** импорти, т.е. достъпът до даден модул от рамките на пакета или извън него става през пътя от пакета до модула, например `game.players.ai` достъпва модулът `ai` от пакета `players` в пакета `game`.


In [None]:
import game.players.ai

Със значението на `.` и `..` от Unix файловата система, можем да използваме същите тези символи за **релативни** импорти в Python. Те се оценяват спрямо локацията на `import` statement-a.

Например, във файла `game/players/input_player.py` ни трябва `player` модула от пакета `game`. Можем да го направим по абсолютен и релативен начин:

```python
from game import player  # абсолютен импорт
```

```python
from .. import player  # релативен импорт
```

* `..` означава "пакетът, намиращ се над текущия".
* `..pkg` означва модулът/пакетът `pkg` от пакетът, намиращ се над текущия.

Например:
```python
from ..player import Player
```
Ще вмъкне името `Player` от модула `player` от пакета, намиращ се над текущия.

* `.` означава "текущия пакет".
* `.pkg` означава модулът/пакетът `pkg` от текущия пакет.

Релативните импорти имат недостатъка обаче, че зависят от местоположението на `import`-a. Освен това в скриптове (т.е. изпълним код, който не е вмъкнат чрез модул) имат различно поведение:

In [None]:
from . import hitchhikers

ImportError: attempted relative import with no known parent package

## `if __name__ == "__main__"`

Както бяхме споменали, при импорт се изпълнява кода на съответния модул. Като пример за това можем да изведем философията на Python, намираща се във вградения модул `this`:

In [None]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


Текущо-изпълнимият файл/модул/скрипт за Python се казва `"__main__"`, т.е. неговия `__name__` е `"__main__"`:
```python

In [None]:
__name__

'__main__'

Ако файлът не се изпълнява директно, а бъде импортнат от друг, то в неговия `__name__` ще е името на модула. Това означава, че можем да различим дали файлът се изпълнява директно или е импортнат. 

Полезно е в случаите, когато искаме да напишем примерно някакви тестове или демонстрации на модула, които да се изпълнят само ако го изпълним директно, и да не се изпълняват при всяко вмъкване. . В такива случаи използваме `if __name__ == "__main__": ...` (разгледайте например `game/engine.py`).

## Управление на пакети

### Какво е `pip`?

Пакетите се създават с цел лесно преизползване. При използване на външни пакети в проекта се появяват конкретни проблеми, които трябва да се решават - как да се инсталират, как да се обновят, как да се изтрият, как да се решават зависимостите и т.н. С това ни помагат различните "package manager"-и, като python-ският такъв е `pip` (името му е рекурсивен акроним: "**P**IP **I**nstalls **P**ackages").

### Къде е `pip`?

Управлението на пакетите е важна част от разработката и затова от Python 3.4 и 2.7.9 насам `pip` е част от инсталацията на Python 3 и Python 2 респективно.

Можем да проверим дали PIP е инсталиран като се опитаме да видим локацията на `pip3` командата като изпълним `which pip3` (или `where pip3` под Windows):

```bash

In [None]:
!which pip3  # linux / macOS

/Users/alexander.ignatov/Documents/PythonCourse2022/venv/bin/pip3


В случай, че няма `pip3`, е възможно да съществува само `pip` командата:

In [None]:
!which pip

/Users/alexander.ignatov/Documents/PythonCourse2022/venv/bin/pip


В случай, че имаме и двете команди, можем да ги сраним като видим разликите във версията (ако са еднакви, то няма значение дали използваме `pip` или `pip3`. Оттук нататък до края на тетрадката ще ги считаме за едни и същи):

In [None]:
!pip3 --version && pip --version

pip 22.2.2 from /Users/alexander.ignatov/Documents/PythonCourse2022/venv/lib/python3.10/site-packages/pip (python 3.10)
pip 22.2.2 from /Users/alexander.ignatov/Documents/PythonCourse2022/venv/lib/python3.10/site-packages/pip (python 3.10)


### Как да преинсталирам `pip` ако нещо не е наред?

В случай, че `pip` не може да бъде намерен, има два варианта:

1. `pip` е инсталиран, но пътя до него не е в `$PATH` променливата на средата
2. `pip` не е инсталиран. Тогава можем да го сложим по два начина:
    1. Инсталираме `pip` от [`get-pip.py`](https://github.com/pypa/get-pip) скрипта
    2. Инсталираме `pip` чрез [`ensurepip`](https://docs.python.org/3/library/ensurepip.html#module-ensurepip) модула

In [None]:
!python3 -m ensurepip --upgrade  # за windows е `python` вместо `python3`

Looking in links: /var/folders/q1/7m4c3ff153j93q271xrs9y5r0000gq/T/tmpi5sy7acy


***NOTE***: `ensurepip` не тегли от интернет нищо - директно инсталира версията на `pip`, която е bundle-ната със съответната версия на Python. В случай, че искаме по-нова от дадената, трябва след това ръчно да актуализираме `pip` чрез `python3 -m pip install --upgrade pip` или `pip3 install --upgrade pip` (респективно само `python` вместо `python3` под Windows).

### Какви подкоманди има `pip`?

Пакети се инсталират с `pip install <package1_name> [<package2_name> ...]`:

In [None]:
!pip install requests

Collecting requests
  Using cached requests-2.28.1-py3-none-any.whl (62 kB)
Installing collected packages: requests
Successfully installed requests-2.28.1

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip available: [0m[31;49m22.2.2[0m[39;49m -> [0m[32;49m22.3.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


Пакетите по подразбиране се търсят в [PyPI](https://pypi.org/) (чете се "пай пи ай", а не "[пипи](https://i.kym-cdn.com/entries/icons/original/000/027/193/Screen_Shot_2018-09-20_at_1.02.37_PM.jpg)"/"пайпи"/"пайпай"), който е Python Package Index. Това е публичен индекс от пакети, към който всеки потребител може да добавя, допринася, търси и ползва.

Ако искаме `pip` да търси в друг индекс (примерно такъв с частни репозиторита), можем да го променим чрез `-i [index_url]` аргумент към `pip install`. Повече за това [тук](https://realpython.com/what-is-pip/#using-a-custom-package-index).

Информация за инсталиран пакет може да изведем с `pip show <package_name>`:

In [None]:
!pip show requests

Name: requests
Version: 2.28.1
Summary: Python HTTP for Humans.
Home-page: https://requests.readthedocs.io
Author: Kenneth Reitz
Author-email: me@kennethreitz.org
License: Apache 2.0
Location: /Users/alexander.ignatov/Documents/PythonCourse2022/venv/lib/python3.10/site-packages
Requires: certifi, charset-normalizer, idna, urllib3
Required-by: 


Деинсталирането пък съответно става по същия начин, но този път с подкомандата `uninstall`:

In [None]:
!pip uninstall requests <<< "y"

Found existing installation: requests 2.28.1
Uninstalling requests-2.28.1:
  Would remove:
    /Users/alexander.ignatov/Documents/PythonCourse2022/venv/lib/python3.10/site-packages/requests-2.28.1.dist-info/*
    /Users/alexander.ignatov/Documents/PythonCourse2022/venv/lib/python3.10/site-packages/requests/*
Proceed (Y/n)?   Successfully uninstalled requests-2.28.1


Всички инсталирани пакети и техните версии може да видим с `pip list`:

In [None]:
!pip list | head

Package            Version
------------------ ---------
appnope            0.1.3
asttokens          2.2.1
backcall           0.2.0
certifi            2022.12.7
charset-normalizer 2.1.1
comm               0.1.2
debugpy            1.6.4
decorator          5.1.1
ERROR: Pipe to stdout was broken

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip available: [0m[31;49m22.2.2[0m[39;49m -> [0m[32;49m22.3.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


Извеждането на списъка със зависимости (инсталирани пакети + версия) в "requirements" формат може да се извърши с `pip freeze`:

In [None]:
!pip freeze | head

appnope==0.1.3
asttokens==2.2.1
backcall==0.2.0
certifi==2022.12.7
charset-normalizer==2.1.1
comm==0.1.2
debugpy==1.6.4
decorator==5.1.1
entrypoints==0.4
executing==1.2.0


Обикновено изхода от командата се запазва във файл, наречен `requirements.txt`. Повече за това по-надолу.

## Виртуални среди и `venv`

### Защо?

Когато инсталираме пакет, той след това може да бъде използван от всички Python проекти на машината (или на потребителя). Това обаче може да доведе до конфликти. Да предположим, че имаме един проект, който изисква например пакетът `А` да бъде с версия $ \geq X $, докато друг да е направен да работи с версия на `A`, която да е по-малка от $ X $ (т.е. ъпдейтването до версия $ X $ би счупило проекта). Инсталацията на пакетът `A` по познатия начин обаче е глобална и не върши работа в случая - трябва ни някакъв начин, по който да имаме различни инсталации на пакета за различните проекти.

Това е идеята на т.нар. "virtual environments" - създават виртуална среда, която да се отнася само за конкретен проект, в която той да се конфигурира, да се изтеглят пакетите, от които зависи и т.н.

### Как?

С вградената билбиотека `venv` създаваме virtual environment. Изпълняваме я като модул (с флаг `-m`) и като параметър указваме името на виртуалната среда, която ще бъде създадена в текущата директория:

In [None]:
!python3 -m venv venv

***Note 1***: Обикновено се кръщава също `venv`.

***Note 2***: Директорията (`venv` в този случай) на виртуалната среда трябва да бъде игнорирана от Git (т.е. да ѝ се добави името на нов ред в `.gitignore` файла).

Предната команда ще създаде в текущата директория папката `venv`, в която се намира всичко необходимо на виртуалната среда, за да работи. Тя обаче още няма да е активирана, като това става чрез изпълняване веднъж на:

In [None]:
!source venv/bin/activate

***Note***: на Windows ще е `venv\Scripts\activate.bat` (или `venv\Scripts\activate.ps1` на PowerShell)

Това ще пренасочи команди като `python`/`python3` и `pip`/`pip3` към локалните копия, намиращи се под директорията на виртуалната среда. Инсталираните пакети също отиват там. По подразбиране няма такива (освен самите `pip` и `setuptools`):

In [None]:
!source venv/bin/activate && pip list  # активираме пак понеже jupyter клетките не запазват bash сесиите

Package    Version
---------- -------
pip        22.2.2
setuptools 65.4.1

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip available: [0m[31;49m22.2.2[0m[39;49m -> [0m[32;49m22.3.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


Работата във виртуалната среда приключва, когато приключи текущата конзолна сесия или когато бъде изпълнена командата `deactivate` (`venv\Scripts\deactivate.bat` под Windows).

## `requirements.txt`

Ако свалим даден проект локално и се опитаме да го изпълним, то ако той зависи от някакви third-party модули/пакети/билбиотеки, ще ни хвърли `ImportError`, понеже няма да ги намери. Трудно и излишно времеемко е обаче ръчно да проверим кои зависимости ги няма и да ги свалим. Затова ни служи `requirements.txt` - файл, в който всички dependency-та са описани (име на пакет и версии).

Създава се чрез изхода на `pip freeze`:

In [None]:
!pip freeze > requirements.txt

Съдържанието е във формат `{има на пакет}{знак за сравнение}{версия}`:

In [None]:
!cat requirements.txt | head

appnope==0.1.3
asttokens==2.2.1
backcall==0.2.0
certifi==2022.12.7
charset-normalizer==2.1.1
comm==0.1.2
debugpy==1.6.4
decorator==5.1.1
entrypoints==0.4
executing==1.2.0


Използването на файла (т.е. изтеглянето на всички правилни версии на описаните пакети) става чрез аргумента `-r` на `pip install`:

In [None]:
!pip install -r requirements.txt


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip available: [0m[31;49m22.2.2[0m[39;49m -> [0m[32;49m22.3.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


## Да обобщим: setup на проект for dummies

1. Създаване на виртуална среда:

    `python3 -m venv venv`

    *Важно:* при използване на система за контрол на версиите (напр. Git) трябва новосъздадената директория да бъде игнорирана от нея (`>> .gitignore`).
2. Активиране на средата:

    `source venv/bin/activate` (unix) или `venv\Scripts\activate.bat` (windows)

3. Подсигуряване на това, че `pip` е последна версия:

    `pip install --upgrade pip`

3. Работата по инсталиране на пакети, пускане на кода и т.н. трябва задължително да става докато е активирана виртуалната среда

    ...

4. След инсталиране на всеки пакет трябва да се обновява списъкът със зависимости:

    `pip freeze > requirements.txt`


