# Структури от данни и Алгоритми

Структурите от данни са класове и обекти с интерфейс чрез който ги използваме, като се абстрахираме от имплементацията им.

Алгоритмите са генерализирани процедури (парчета код/функции) които решават даден проблем (изпълняват дадена задача).

## Защо?

Структурите от данни и алгоритми:

- Се използват често (по-простите от тях: List/Dict/Sort)
- Подпомагат разбирането на други езици за програмиране (e.g. JavaScript обектите са Dict)
- Са основа на по-сложни системи и приложения (e.g. Приоритетната опашка може да се реализира чрез запазване на опашката в база данни)
- Са ключови за Google-style интервютата

![https://i.imgur.com/dVcLsFl.png](https://i.imgur.com/dVcLsFl.png)

## 3.. 2.. 1.. Go

## str

`str` е поредица от символи. Ще разгледаме:

- [str](https://docs.python.org/3/library/stdtypes.html#text-sequence-type-str) методи и
- [string](https://docs.python.org/3/library/string.html) често употребявани константи

In [14]:
s = '🐍 is awesomeͤͤͤͤͤ'
print(s)

🐍 is awesomeͤͤͤͤͤ


In [57]:
# .encode() Конвертира стринг до байтове.
# Някой байтове не могат да се представят със символ от азбуката
# и използват Hexadecimal Escape Sequence
encoded = s.encode('utf-8')
print(f'{s} -> {encoded}')
print('От байтове може да се върнем в стринг:', encoded.decode())
# 🐍 = \xf0\x9f\x90\x8d
# сложи символ отгоре = '\xcd'
# какво да се сложи отгоре = '\xa4'

print('🐍 =', b'\xf0\x9f\x90\x8d'.decode()) # = 🐍 Поредица от байтове се индикира с b''
print("b'' е просто списък от uint8:", bytes([0xf0, 0x9f, 0x90, 0x8d]).decode())
print('Дължината на 🐍 e: ', len(b'\xf0\x9f\x90\x8d')) # \xYY е = 1

# Итерирането по стринг работи чрез итериране по символи, не по байтове
print([x for x in 'cool 🐍'])

🐍 is awesomeͤͤͤͤͤ -> b'\xf0\x9f\x90\x8d is awesome\xcd\xa4\xcd\xa4\xcd\xa4\xcd\xa4\xcd\xa4'
От байтове може да се върнем в стринг: 🐍 is awesomeͤͤͤͤͤ
🐍 = 🐍
b'' е просто списък от uint8: 🐍
Дължината на 🐍 e:  4
['c', 'o', 'o', 'l', ' ', '🐍']


In [59]:
print('Форматирането работи! {0} + {1} = {2}'.format('🐍', '🐍', '🐍²'))

Форматирането работи! 🐍 + 🐍 = 🐍²


In [60]:
if 'самобукви'.isalpha():
    print('{букви} = alphabetic')

if '1232367457'.isdigit():
    print('{числа} = digit')

if '1283912873andLetters'.isalnum():
    print('{числа, букви} = alpha-numeric')

if 'малкибукви'.islower():
    print('{малки букви} = lowercase')

if 'ГОЛЕМИБУКВИ'.isupper():
    print('{големи букви} = uppercase')

if '\t\n  '.isspace():
    print('{празни символи} = space')

{букви} = alphabetic
{числа} = digit
{числа, букви} = alpha-numeric
{малки букви} = lowercase
{големи букви} = uppercase
{празни символи} = space


In [62]:
if s.endswith('e'):
    print('s завършва на e') # eͤͤͤ != e

if s.startswith('🐍 is'):
    print("s започва с '🐍 is'")

print('is е на индекс', s.find('is')) # Индекс по символ, не по байт

print("'e' се среща", s.count('e'), 'пъти')

s започва с '🐍 is'
is е на индекс 2
'e' се среща 2 пъти


In [63]:
print('Не винаги субституциите работят както ни се иска:',
    s.replace('awesome', 'много лесен курс'))

import re
print('Но може да сработят с regex:', re.sub(r'awesome.*', 'бЪрЗ', s))

print('Може да направим всички символи голем:', s.upper())
print('или малки:', 'THICC ->', 'THICC'.lower())
print("Да разчистим празните символи '    нещо ми духа '-> '" + '    нещо ми духа  '.strip() + "'")

Не винаги субституциите работят както ни се иска: 🐍 is много лесен курсͤͤͤͤͤ
Но може да сработят с regex: 🐍 is бЪрЗ
Може да направим всички символи голем: 🐍 IS AWESOMEͤͤͤͤͤ
или малки: THICC -> thicc
Да разчистим празните символи '    нещо ми духа '-> 'нещо ми духа'


In [80]:
print('Удобно е да принтираме списъци:', ', '.join(['1','2','3','4','worldwide']))
print('или да разбиваме стринг на елементи:', 'fmi:poluchi:li?'.split(':'))

# за по-сложни разбивания - regex (:
import re
print(re.split(r',|:|\?', 'kude:sym,az?kude:si,ti?'))

Удобно е да принтираме списъци: 1, 2, 3, 4, worldwide
или да разбиваме стринг на елементи: ['fmi', 'poluchi', 'li?']
['kude', 'sym', 'az', 'kude', 'si', 'ti', '']


Библиотеката `string` предоставя някои удобни константи

In [82]:
import string

print('all letters:', string.ascii_letters)
print('all lowercase:', string.ascii_lowercase)
print('all digits as a string:', string.digits)
print('all symbols:', string.punctuation)
print('all whitespaces:', string.whitespace, string.whitespace.encode())

all letters: abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
all lowercase: abcdefghijklmnopqrstuvwxyz
all digits as a string: 0123456789
all symbols: !"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
all whitespaces:  	
 b' \t\n\r\x0b\x0c'


## int

Python няма ограничение за големината на int (C++ long long има ограничение $2^{63}-1$). Но операциите с големи числа са бавни - не са $\Theta(1)$, а $\Theta(log(number)) = \Theta(number\;of\;digits)$

Когато стойността надвиши $2^{63}-1$ числата се обръщат в BigInt.

[https://www.codementor.io/@arpitbhayani/how-python-implements-super-long-integers-12icwon5vk](https://www.codementor.io/@arpitbhayani/how-python-implements-super-long-integers-12icwon5vk)

In [90]:
%%time
result = 1
for x in range(1, 100000):
    result *= x
# Същият код на C++ минава за total: 0.001 s. Но не връща верен отговор :)

CPU times: user 4.28 s, sys: 22.2 ms, total: 4.31 s
Wall time: 4.34 s


In [102]:
import sys
print('int is {0} bytes'.format(sys.getsizeof(int(1))))
print('10^1000 is {0} bytes'.format(sys.getsizeof(int(10**1000))))
print('float is {0} bytes'.format(sys.getsizeof(float(1))))
# float има прецизност като double в C++ (~14 знака след запетаята)

int is 28 bytes
10^1000 is 468 bytes
float is 24 bytes


In [105]:
# За по голяма прицизност може да използваме `decimal` модула
# По дефолт има прецизност 28 знака след запетаята, но може да му дадем повече :)
from decimal import *
getcontext().prec = 56
print(Decimal(1) / Decimal(7))

0.14285714285714285714285714285714285714285714285714285714


In [114]:
# Начин на използване

print('Конструкторът на int приема стринг и го конвертира до число:', int('42'))
print('Може да конвертираме от други бройни системи, освен base10:', int('ff', 16))

Конструкторът на int приема стринг и го конвертира до число: 42
Може да конвертираме от други бройни системи, освен base10: 255


## Math

In [117]:
print('Можем да смятаме inverse елемента по модул 15^-1 mod 26 =', pow(15, -1, 26))

# https://docs.python.org/3/library/math.html

Можем да смятаме inverse елемента по моду 15^-1 mod 26 = 7


## Data structures
https://docs.python.org/3/library/collections.html


## List
https://docs.python.org/3/library/stdtypes.html#sequence-types-list-tuple-range

## Array 
https://docs.python.org/3/library/array.html

## Dict

### defaultdict

### Counter

## Set
https://docs.python.org/3/library/stdtypes.html#set

### Frozenset

## Queue
https://docs.python.org/3/library/queue.html

## deque

## heapq
https://docs.python.org/3/library/heapq.html

## Algorithms
https://docs.python.org/3/library/bisect.html

https://docs.python.org/3/library/copy.html

https://docs.python.org/3/library/random.html

https://docs.python.org/3/library/itertools.html

https://docs.python.org/3/library/functools.html

https://docs.python.org/3/library/csv.html

https://docs.python.org/3/library/json.html

https://docs.python.org/3/library/re.html