# Структури от данни и Алгоритми

Структурите от данни са класове и обекти с интерфейс чрез който ги използваме, като се абстрахираме от имплементацията им.

Алгоритмите са генерализирани процедури (парчета код/функции) които решават даден проблем (изпълняват дадена задача).

## Защо?

Структурите от данни и алгоритми:

- Се използват често (по-простите от тях: List/Dict/Sort)
- Подпомагат разбирането на други езици за програмиране (e.g. JavaScript обектите са Dict)
- Са основа на по-сложни системи и приложения (e.g. Приоритетната опашка може да се реализира чрез запазване на опашката в база данни)
- Са ключови за Google-style интервютата

![https://i.imgur.com/dVcLsFl.png](https://i.imgur.com/dVcLsFl.png)

## 3.. 2.. 1.. Go

## Сложност на алгоритми

https://www.bigocheatsheet.com/

За оценка на сложност (бързина) на алгоритми използваме нотацията "Big O" $O(...)$.

Сложността оценяваме спрямо размера на входа, като най-често използваме $n$, за да обозначим размера на входа.

Примери за $n$:
- За list K: $n = len(K)$
- За str K: $n = len(K)$
- За int K: $n = bytes of K = log_8(K) \approxeq log_2(K)$ (но обикновено int казваме че има константен размер $O(1)$)

Най-важните сложности са:
- Constant $O(1)$
- Linear $O(n)$
- Linearithmic $O(n \times log(n))$
- Quadratic $O(n^2)$

In [1]:
# O(1)
def constant(x):
    return x + 1

# O(n)
def linear(arr): # O(n x 1) = O(n)
    for x in arr: # O(n)
        print(x) # O(1)

# O(n * log n)
def linearithmic(arr):
    logi = 1
    while logi < len(arr): # O(log n)
        logi *= 2 # iterations = len(arr) = 2 ^ logi -> solve for logi -> logi = log(len(arr))
        linear(arr)

# O(n * log n)
def linearithmic2(arr):
    arr.sort() # O(n * log n)

# O (n^2)
def quadratic(arr): # O(n * n * 1) = O(n^2)
    for row in range(len(arr)): # O(n)
        for column in range(len(arr)): # O(n)
            print(arr[row][column]) # O(1)

## str

`str` е поредица от символи. Ще разгледаме:

- [str](https://docs.python.org/3/library/stdtypes.html#text-sequence-type-str) методи и
- [string](https://docs.python.org/3/library/string.html) често употребявани константи

Стринговете в Python са immutable -> Повечето операции са $O(n)$

In [3]:
# Python speaks   UTF-8 :) https://en.wikipedia.org/wiki/UTF-8
s = '🐍 is awesomeͤͤͤͤͤ'
print(s)

🐍 is awesomeͤͤͤͤͤ


In [5]:
# .encode() Конвертира стринг до байтове.
# Някой байтове не могат да се представят със символ от азбуката
# и използват Hexadecimal Escape Sequence

# Често се използва при работа с файлове - понякога четем и пишем байтове вместо стрингове
encoded = s.encode('utf-8')
print(f'{s} -> {encoded}')
print('От байтове може да се върнем в стринг:', encoded.decode())
# 🐍 = \xf0\x9f\x90\x8d
# сложи символ отгоре = '\xcd'
# какво да се сложи отгоре = '\xa4'

print('🐍 =', b'\xf0\x9f\x90\x8d'.decode()) # = 🐍 Поредица от байтове се индикира с b''
print("b'' е просто списък от uint8:", bytes([0xf0, 0x9f, 0x90, 0x8d]).decode())
print('Дължината на 🐍 e: ', len(b'\xf0\x9f\x90\x8d')) # len(\xYY) = 1 byte

# Итерирането по стринг работи чрез итериране по символи, не по байтове
print([x for x in 'cool 🐍'])

🐍 is awesomeͤͤͤͤͤ -> b'\xf0\x9f\x90\x8d is awesome\xcd\xa4\xcd\xa4\xcd\xa4\xcd\xa4\xcd\xa4'
От байтове може да се върнем в стринг: 🐍 is awesomeͤͤͤͤͤ
🐍 = 🐍
b'' е просто списък от uint8: 🐍
Дължината на 🐍 e:  4
['c', 'o', 'o', 'l', ' ', '🐍']


In [7]:
print('Форматирането работи! {0} * {1} = {2}'.format('🐍', '🐍', '🐍²'))

Форматирането работи! 🐍 * 🐍 = 🐍²


In [8]:
if 'самобукви'.isalpha():
    print('{букви} = alphabetic')

# Можем ли да конвертираме стринга до int?
if '1232367457'.isdigit():
    print('{числа} = digit')

# Бърза проверка дали работим с дума или изречение (изречението има паузи и символи)
if '1283912873andLetters'.isalnum():
    print('{числа, букви} = alpha-numeric')

# Трябва ли да пишем код който разбира от главни букви?
if 'малкибукви'.islower():
    print('{малки букви} = lowercase')

if 'ГОЛЕМИБУКВИ'.isupper():
    print('{големи букви} = uppercase')

# Използваме при разбиване на стрингове - if space : do X else do Y
if '\t\n  '.isspace():
    print('{празни символи} = space')

{букви} = alphabetic
{числа} = digit
{числа, букви} = alpha-numeric
{малки букви} = lowercase
{големи букви} = uppercase
{празни символи} = space


In [10]:
if s.endswith('e'):
    print('s завършва на e') # eͤͤͤ != e

if s.startswith('🐍 is'):
    print("s започва с '🐍 is'")

print('is е на индекс', s.find('is')) # Индекс по символ, не по байт

print("'e' се среща", s.count('e'), 'пъти')

s започва с '🐍 is'
is е на индекс 2
'e' се среща 2 пъти


In [12]:
print(s)
print('Не винаги субституциите работят както ни се иска:',
    s.replace('awesome', 'много лесен курс'))

import re
print('Но може да сработят с regex:', re.sub(r'awesome.*', 'бЪрЗ', s))

print('Може да направим всички символи голем:', s.upper())
# Често използваме за да оеднаквим символите, A = a и няма защо да ги третираме различно
print('или малки:', 'THICC ->', 'THICC'.lower())
# Ако някой въведе "me@mail.com  " то очевидно няма спейс в края на мейла -> strip() -> "me@mail.com"
print("Да разчистим празните символи '    нещо ми духа '-> '" + '    нещо ми духа  '.strip() + "'")

🐍 is awesomeͤͤͤͤͤ
Не винаги субституциите работят както ни се иска: 🐍 is много лесен курсͤͤͤͤͤ
Но може да сработят с regex: 🐍 is бЪрЗ
Може да направим всички символи голем: 🐍 IS AWESOMEͤͤͤͤͤ
или малки: THICC -> thicc
Да разчистим празните символи '    нещо ми духа '-> 'нещо ми духа'


In [13]:
# Много подпомага дебъгването и не оставя запетая след последния елемент!!
print('Удобно е да принтираме списъци:', ', '.join(['1','2','3','4','worldwide']))
# При разбиване на стрингове (данни, които знаем че са разделени с някакъв символ)
print('или да разбиваме стринг на елементи:', 'fmi:poluchi:li?'.split(':'))

# за по-сложни разбивания - regex (:
import re
print(re.split(r',|:|\?', 'kude:sym,az?kude:si,ti?'))

Удобно е да принтираме списъци: 1, 2, 3, 4, worldwide
или да разбиваме стринг на елементи: ['fmi', 'poluchi', 'li?']
['kude', 'sym', 'az', 'kude', 'si', 'ti', '']


Библиотеката `string` предоставя някои удобни константи

In [82]:
import string

# Вместо да хардкодваме "abcdef..."
print('all letters:', string.ascii_letters)
print('all lowercase:', string.ascii_lowercase)
print('all digits as a string:', string.digits)
print('all symbols:', string.punctuation)
print('all whitespaces:', string.whitespace, string.whitespace.encode())

all letters: abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
all lowercase: abcdefghijklmnopqrstuvwxyz
all digits as a string: 0123456789
all symbols: !"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
all whitespaces:  	
 b' \t\n\r\x0b\x0c'


## int

Python няма ограничение за големината на int (C++ long long има ограничение $2^{63}-1$). Но операциите с големи числа са бавни - не са $O(1)$, а $O(log(number)) = O(number\;of\;digits)$

Когато стойността надвиши $2^{63}-1$ числата се обръщат в BigInt.

[https://www.codementor.io/@arpitbhayani/how-python-implements-super-long-integers-12icwon5vk](https://www.codementor.io/@arpitbhayani/how-python-implements-super-long-integers-12icwon5vk)

In [90]:
%%time
result = 1
for x in range(1, 100000):
    result *= x
# Същият код на C++ минава за total: 0.001 s. Но не връща верен отговор :)

CPU times: user 4.28 s, sys: 22.2 ms, total: 4.31 s
Wall time: 4.34 s


In [102]:
import sys
print('int is {0} bytes'.format(sys.getsizeof(int(1))))
print('10^1000 is {0} bytes'.format(sys.getsizeof(int(10**1000))))
print('float is {0} bytes'.format(sys.getsizeof(float(1))))
# float има прецизност като double в C++ (~14 знака след запетаята)

int is 28 bytes
10^1000 is 468 bytes
float is 24 bytes


In [105]:
# За по голяма прицизност може да използваме `decimal` модула
# По дефолт има прецизност 28 знака след запетаята, но може да му дадем повече :)
from decimal import *
getcontext().prec = 56
print(Decimal(1) / Decimal(7))

0.14285714285714285714285714285714285714285714285714285714


In [31]:
# Начин на използване

print('Стринг -> int:', int('42'))
print('Конвертиране от други бройни системи, освен base10:', int('ff', 16))
print('Премахване на знаците след десетичната запетая', int(-5.2), int(5.2))
print('Абсолютна стойност(-5) =', abs(-5))

Стринг -> int: 42
Конвертиране от други бройни системи, освен base10: 255
Премахване на знаците след десетичната запетая -5 5
Абсолютна стойност(-5) = 5


## Math

In [46]:
import math

print('Закръгляне на горе 2.2 ->', math.ceil(2.2))
print('Закръгляне на долу 2.7 ->', math.floor(2.7))

# Може да правим побитово итериране на  числото
print('Преброяване на битовете на числото 257 =', math.ceil(math.log2(257)))
# Полезно при построяване на Trie/radix sort/заделяне на hashmap
print('Преброяване на цифрите на числото 14532 =', math.ceil(math.log10(14532)))

# Математически важни функции
print('Най-голям общ делител на 35 и 15 =', math.gcd(35, 15))
print('Можем да смятаме inverse елемента по модул 15^-1 mod 26 =', pow(15, -1, 26))

# Комбинаторика (често се среща в задачи, но има и други)
print('N choose K -> 10 choose 2 =', math.comb(10, 2))

Закръгляне на горе 2.2 -> 3
Закръгляне на долу 2.7 -> 2
Преброяване на битовете на числото 257 = 9
Преброяване на цифрите на числото 14532 = 5
Най-голям общ делител на 35 и 15 = 5
Можем да смятаме inverse елемента по модул 15^-1 mod 26 = 7
N choose K -> 10 choose 2 = 45


In [47]:
# Специални стойности на float:
# Not a Number (полезно като дъно на стел)
print('Not a Number =', math.nan)
# Infinity (полезно като последен елемент на масив, нещо като терминираща нула в C++)
print('Infinity =', math.inf)
# -Infinity
print('-Infinity =', -math.inf)

# Константи
print('π = ', math.pi)
print('e = ', math.e)

Not a Number = nan
Infinity = inf
-Infinity = -inf
π =  3.141592653589793
e =  2.718281828459045


`math` модулът има още много функции на които няма да се спираме, защото не се използват често:
- Тригонометрични функции
- Хиперболични функции
- Гама функция
- Конвертиране между градуси и радиани
- Други

## List
https://docs.python.org/3/library/stdtypes.html#sequence-types-list-tuple-range

## Data structures
https://docs.python.org/3/library/collections.html


## Array 
https://docs.python.org/3/library/array.html

## Dict

### defaultdict

### Counter

## Set
https://docs.python.org/3/library/stdtypes.html#set

### Frozenset

## Queue
https://docs.python.org/3/library/queue.html

## deque

## heapq
https://docs.python.org/3/library/heapq.html

## Algorithms
https://docs.python.org/3/library/bisect.html

https://docs.python.org/3/library/copy.html

https://docs.python.org/3/library/random.html

https://docs.python.org/3/library/itertools.html

https://docs.python.org/3/library/functools.html

https://docs.python.org/3/library/csv.html

https://docs.python.org/3/library/json.html

https://docs.python.org/3/library/re.html