# Алгоритмы

1. Проверка числа на простоту. Решето Эратосфена и его эффективная реализация.

- Рекурсия. Реализация функций для вычисления чисел Фибоначчи с помощью рекурсии и циклом снизу вверх. 

- Алгоритм Евклида. Реализация через цикл и через рекурсию.

- Перевод из одной позиционной системы счисления в другую. Быстрое возведение в степень.

- Ханойская башни.

- Двоичный поиск в рекурсивном и нерекурсивном вариантах. Вывод формулы для асимптотики.

- Устойчивость сортировки. Естественность поведения алгоритмов сортировки. Устойчивость сортировок выбором, пузырьком и вставками. Уметь доказывать устойчивость/неустойчивость.

- Сортировки выбором, пузырьком, вставками. Реализация. В чем отличие между сортировками Шелла и расческой? почему у сортировки Шелла лучшая асимптотика?

- Сортировка слиянием и быстрая сортировка, их сравнение. Реализация алгоритмов.

- Алгоритмы сортировки не использующие сравнение элементов друг с другом. Почему иих асимптотика лучше. Сортировка подсчетом и  блочная сортировка. Реализация.

- Поразрядная сортировка. Чем отличаются LSD и MSD сортировки? Когда имеет смысл их использовать?

- Структуры данных список и очередь. Реализация методов для структуры данных список.

- Стек. Проверка правильности скобочной последовательности. Обратная польская нотация.

- Деревья в математике и информатике, основная терминология. Двоичное дерево поиска. Итеративный и рекурсивный алгоритмы поиска элемента в дереве. Обход дерева.

- Вставка узла в двоичное дерево поиска и удаление узла из дерева.

- Сбалансированность двоичного дерева поиска. Вращения (с реализацией).

- АВЛ-дерево. Вставка и удаление узла. Преимущества и недостатки красно-черного и АВЛ-деревьев.

- Красно-черное дерево. Вставка и удаление узла. Преимущества и недостатки красно-черного и АВЛ-деревьев.

- Двоичная куча. Когда применяется двоичная куча? Построение кучи методами снизу вверх и свеху вниз.




### 1. Проверка числа на простоту. Решето Эратосфена и его эффективная реализация.

Суть: определить, является ли число простым, то есть делится только на 1 и само себя. 
`Пример:` 2, 3, 5, 7, 17, 19, 23

Алгоритмов проверки много. Самый простой, что приходит в голову - ту по перебрать все числа от 1 до N и посмотреть, делится ли число N на какие-то еще числа. Но это неэффективно и долго. Асимптотика работы `O(N)` и это нас не радует.

Небольшое усовершенствование - перебирать все числа от 2 до sqrt(N), но у этого алгоритма асимптотика работы будет `O(sqrt(N))`.

In [2]:
#  линейный поиск с барьерным элементом, сложность O(N)
def IsPrime(n):
    d = 2
    while n % d != 0:
        d += 1
    return d == n

#  линейный поиск с барьерным элементом, сложность O(sqrt(N))
def IsPrime(n):
    d = 2
    while d * d <= n and n % d != 0:
        d += 1
    return d * d > n

# еще одна оптимизация - если нечетное число, то проверяем далее нечетные делители, но опять таки все медленно
def isPrime(n):
    if n % 2 == 0:
        return n == 2
    d = 3
    while d * d <= n and n % d != 0:
        d += 2
    return d * d > n

Для нахождения всех простых чисел не больше заданного числа n, следуя методу Эратосфена, нужно выполнить следующие шаги:

1) Выписать подряд все целые числа от двух до n (2, 3, 4, …, n).

2) Пусть переменная p изначально равна двум — первому простому числу.

3) Вычеркнуть из списка все числа от 2p до n, делящиеся на p (то есть, числа 2p, 3p, 4p, …)

4) Найти первое не вычеркнутое число, большее чем p, и присвоить значению переменной p это число.

5) Повторять шаги 3 и 4 до тех пор, пока p не станет больше, чем n

6) Все не вычеркнутые числа в списке — простые числа.

На практике, алгоритм можно немного улучшить следующим образом. На шаге №3, числа можно вычеркивать, начиная сразу с числа $p^2$, потому что все составные числа меньше его уже будут вычеркнуты к этому времени. И, соответственно, останавливать алгоритм можно, когда $p^2$ станет больше, чем n.

Тут ссылка на Вики-реализацию:

https://ru.wikibooks.org/wiki/%D0%A0%D0%B5%D0%B0%D0%BB%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D0%B8_%D0%B0%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC%D0%BE%D0%B2/%D0%A0%D0%B5%D1%88%D0%B5%D1%82%D0%BE_%D0%AD%D1%80%D0%B0%D1%82%D0%BE%D1%81%D1%84%D0%B5%D0%BD%D0%B0#Python_3.x

In [34]:
# Возвращает список простых чисел
def eratosthen(n):
    sieve = list(range(n + 1))
    sieve[1] = 0
    result = []
    for i in sieve:
        if i > 1:
            for j in range(i + i, len(sieve), i):
                sieve[j] = 0
    for i in range(n):
        if sieve[i] != 0:
            result.append(sieve[i])
    return result

print('Первый вариант реализации \n', eratosthen(100), '\n')

# Еще способ реализации
n = 100
numbers = list(range(2, n + 1))
for number in numbers:
    if number != 0:
        for candidate in range(2 * number, n+1, number):
            numbers[candidate - 2] = 0  #не поняла, почему тут -2  
print('Второй вариант реализации: \n', *list(filter(lambda x: x != 0, numbers)),'\n')

# через генераторы списков
n = 100
s = [x for x in range(2, n) if x not in [i for sub in [list(range(2 * j, n, j)) for j in range(2, n // 2)] for i in sub]]
print('Реализация генератором списков: \n', *s,'\n')

# ну и последний вариант
flag = True
L = []
for x in range(1, n):
    for y in range(1, n):
        if x != y and y != 1:
            # если x не делится на y
            if not x % y:
                flag = False
                break
    if flag == True:
        L.append(x)
    flag = True
print('Реализация с фрагами:\n',L)

Первый вариант реализации 
 [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97] 

Второй вариант реализации: 
 2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97 

Реализация генератором списков: 
 2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97 

Реализация с фрагами:
 [1, 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97]


### 2. Рекурсия. Реализация функций для вычисления чисел Фибоначчи с помощью рекурсии и циклом снизу вверх.

Рекурсия - вызов функции в самой функции. Например, числа Фибоначчи:

`0, 1, 1, 2, 3, 5, 8, 13, 21, ...`

$A_{n} = A_{n-1} + A_{n-2}$

$A_0 = 0, A_1 = 1$

https://younglinux.info/algorithm/fibonacci

In [54]:
# Реализация с помощью цикла while. Ищем n-е число Фибоначчи
fib1 = fib2 = 1 
n = 10
# первые два числа уже определили, поэтому на 2 итерации меньше
while n > 2:
    fib1, fib2 = fib2, fib1 + fib2
    n -= 1

print(fib2)

55


In [56]:
# Реализация с циклом for
fib1 = fib2 = 1 
n = 10
 
if n < 2:
    quit()

print(fib1, end=' ')
print(fib2, end=' ')
for i in range(2, n):
    fib1, fib2 = fib2, fib1 + fib2
    print(fib2, end=' ')

1 1 2 3 5 8 13 21 34 55 

In [43]:
# Рекурсивный поиск n-го числа Фибоначчи
def fibonacci(n):
    if n in (1, 2):
        return 1
    return fibonacci(n - 1) + fibonacci(n - 2)

for i in range(1, 11):
    print(fibonacci(i), end=' ')

1 1 2 3 5 8 13 21 34 55 

In [61]:
# Ищем номер числа Фибоначчи циклом
def get_fib_ind(n):
    ind = 0
    a, b = 0, 1
    while b <= n:
        ind += 1
        a, b = b, a+b
        if a == n:
            return ind
    return 'Число не является числом Фибоначчи'
    
print(get_fib_ind(50))

Число не является числом Фибоначчи


### 3. Алгоритм Евклида. Реализация через цикл и через рекурсию.

Суть: найти наибольший общий делитель двух чисел. Евклид предложил следующий алгоритм:

#### Алгоритм нахождения НОД делением

1) Большее число делим на меньшее.

2) Если делится без остатка, то меньшее число и есть НОД (следует выйти из цикла).

3) Если есть остаток, то большее число заменяем на остаток от деления.

4) Переходим к пункту 1.

#### Алгоритм нахождения НОД вычитанием

1) Из большего числа вычитаем меньшее.

2) Если получается 0, то значит, что числа равны друг другу и являются НОД (следует выйти из цикла).

3) Если результат вычитания не равен 0, то большее число заменяем на результат вычитания.

4) Переходим к пункту 1.

In [65]:
# НОД делением
# циклом
a = 50
b = 130 
while a != 0 and b != 0:
    if a > b:
        a = a % b
    else:
        b = b % a

print(a + b)

# рекурсией
def gcd(a, b):
    if b != 0:
        if a > b:
            return gcd(b, a % b)
        elif a < b:
            return gcd(a, b % a)
    return a
print(gcd(50, 130))

10
10


In [70]:
# НОД вычитанием
# циклом
a = 50
b = 130
 
while a != b:
    if a > b:
        a = a - b
    else:
        b = b - a
        
print(a)

# рекурсией
def gcd(a, b):
    if a == b:
        return a
    elif a > b:
        return gcd(a - b, b)
    else:
        return gcd(a, b - a)
print(gcd(130, 50))

10
10


### 4. Перевод из одной позиционной системы счисления в другую. Быстрое возведение в степень.

Задача на двоичную СС есть в тест-5 прошлого семестра. Позиционная СС - значение каждого числового знака (цифры) в записи числа зависит от его позиции (разряда).

Логика какая: мы пытаемся представить число в виде степеней основания СС. Напишем прогу для перевода из одной СС в другую:

In [71]:
# тут используются встроенные функции bin, oct, dec, hex. Они переводят число в указанную СС

#Функция выбора системы исчисления
def GetNumSystem():
    while True:
        numSystem = input('Выберите систему исчисления: BIN, OCT, DEC, HEX\n')
        if numSystem == 'BIN': 
            return 2
        elif numSystem == 'OCT':
            return 8
        elif numSystem == 'DEC':
            return 10
        elif numSystem == 'HEX':
            return 16
#Функция перевода из двоичной системы 
def ConvertFromBin(_value, _numSystem):
    if _numSystem == 2:
        return _value
    elif _numSystem == 8:
        return oct(int(_value, 2))
    elif _numSystem == 10:
        return int(_value, 2)
    elif _numSystem == 16:
        return hex(int(_value, 2))
    
#Функция перевода из восьмеричной системы 
def ConvertFromOct(_value, _numSystem):
    if _numSystem == 2:
        return bin(int(_value, 8))
    elif _numSystem == 8:
        return _value
    elif _numSystem == 10:
        return int(_value, 8)
    elif _numSystem == 16:
        return hex(int(_value, 8))
    
#Функция перевода из десятичной системы
def ConvertFromDec(_value, _numSystem):
    if _numSystem == 2:
        return bin(int(_value))
    elif _numSystem == 8:
        return oct(int(_value))
    elif _numSystem == 10:
        return int(_value)
    elif _numSystem == 16:
        return hex(int(_value))
    
#Функция перевода из шестнадцатиричной системы
def ConvertFromHex(_value, _numSystem):
    if _numSystem == 2:
        return bin(int(_value, 16))
    elif _numSystem == 8:
        return oct(int(_value, 16))
    elif _numSystem == 10:
        return int(_value, 16)
    elif _numSystem == 16:
        return _value
 
 
def main():
    print ('Исходная система исчисления:')
    fNumSystem = GetNumSystem() #Получаем исходную систему исчисления
    value = input('Введите значение: ') #Получаем исходное число
    print ('Система исчисления в которую необходимо перевести число:')
    sNumSystem = GetNumSystem() #Получаем систему исчисления в которую необходимо перевести
    if fNumSystem == 2:
        print (ConvertFromBin(value, sNumSystem))
    elif fNumSystem == 8:
        print (ConvertFromOct(value, sNumSystem))
    elif fNumSystem == 10:
        print (ConvertFromDec(value, sNumSystem))
    elif fNumSystem == 16:
        print (ConvertFromHex(value, sNumSystem))
    
        
main()

Исходная система исчисления:
Выберите систему исчисления: BIN, OCT, DEC, HEX
BIN
Введите значение: 1010101
Система исчисления в которую необходимо перевести число:
Выберите систему исчисления: BIN, OCT, DEC, HEX
DEC
85


In [74]:
# еще один вариант реализации
def conNS(x, si1 ,si2):
    he_max = ['','A','B','C','D','E','F']
    x = int(str(x), si1) # Преобразуем по основанию в 10-тичную систему
    b = ''
    if x%si2 > 9: # Для 16-тиричной
        b = he_max[x%si2-9] 
    while x >= si2: # Пока не закончится остаток
        x = x//si2 
        if x%si2 > 9: # Для 16-тиричной
            b += he_max[x%si2-9]
        b += str(x%si2) 
    return b[::-1] # Как при вычислении на бумаге начинаем с конца
conNS(10101011, 2, 10)

'17'

In [2]:
# быстрое возведение num в степень deg
def fast_exp(num, deg):
    if 0 == num:
        return 0
    if 0 == deg:
        return 1
    if deg % 2 == 0:
        return fast_exp(num, deg / 2) ** 2
    return num * fast_exp(num, deg - 1)

print(fast_exp(2, 10))

1024


### 5. Ханойская башни. (lab7)

Есть три стержня и 64 кольца, нанизанных на первый стержень. Все кольца имеют разный диаметр, и меньшие кольца лежат на больших (то есть образуют сужающуюся пирамиду). За ход разрешается взять верхний диск с любого стержня и надеть сверху на один из других стержней. При этом запрещается класть больший диск на меньший. Задача заключается в том, чтобы переместить всю пирамиду с первого стержня на второй.

#### Обоснование разрешимости

Доказательство того, что эта задача разрешима, основано на методе математической индукции. Индукция проводится по числу дисков. Для пирамиды из одного кольца всё очевидно — задача решается за один ход (база индукции). Пусть мы умеем перемещать $(n − 1)$ диск (предположение индукции).

Проведём шаг индукции. Пусть дана пирамида из n дисков. Для того, чтобы переместить пирамиду на второй стержень, нам требуется переместить самый нижний большой диск на второй стержень, а для этого необходимо, чтобы все остальные кольца были на третьем стержне. Значит, чтобы переместить n дисков, нам сначала нужно переместить столбик из верхних $(n − 1)$ дисков на третий стержень. По предположению индукции мы можем это сделать. Сделаем это, а затем переместим самый большой диск с первого на второй и, наконец, переместим столбик из $(n − 1)$ дисков с третьего стержня на второй. Таким образом, мы провели шаг индукции.

#### Алгоритм

В соответствии со схемой шага индукции, можно сконструировать алгоритм перемещения произвольного числа дисков с одного стержня на другой. У алгоритма есть три аргумента — число дисков, номер стержня, на котором они находятся, и номер стержня, на который их нужно переместить.

Если требуется переместить $n$ колец со стержня $x$ на стержень $y$, то 

1) перемещаем $(n-1)$ колец со стержня $x$ на стержень $z$,

2) перемещаем нижнее $n$-е кольцо со стержня $x$ на стержень $y$,

3) перемещаем $(n-1)$ колец со стержня $z$ на стержень $y$.

Значения x, y, z приведены в таблице внизу

| | <font size=3>x = $1$</font> | <font size=3>x = $2$</font> | <font size=3>x = $3$</font> |
| :---: | :---: | :---: | :---: |
| <font size=3>y = $1$</font> | <font size=3> </font> | <font size=3>z = $3$</font> | <font size=3>z = $2$</font> |
| <font size=3>y = $2$</font> | <font size=3>z = $3$</font> | <font size=3> </font> | <font size=3>z = $1$</font> |
| <font size=3>y = $3$</font> | <font size=3>z = $2$</font> | <font size=3>z = $1$</font> | <font size=3> </font> |

Легко видеть, что $z = 6 - x -y$.

#### Число перемещений

Посчитаем количество действий, необходимое для проведения всей процедуры перемещения. Пусть $f(n)$ — необходимое число действий, для переноса пирамиды из $n$ дисков. Для одного кольца ответ равен единице: $f(1) = 1$. Для $f(n)$ получим соотношение

$$f(n) = f(n-1) + 1 + f(n-1) = 2 f(n-1) + 1 = 2^n - 1.$$

**Не запускайте Ханойские башни для пирамиды с высотой, превышающей 20, если производится запись пемещений в файл (возможно заполнение всего дискового пространства).**



In [7]:
n=int(input())
# перемещаем n колец с шеста х на шест у
def f(n, x, y):
    if n==1:
        print(str(x)+str(y))
    else:
        z = 6-x-y
        f(n - 1, x, z)
        f(1, x, y)
        f(n - 1, z, y)

f(n, 1, 2)

2
13
12
32


### 6. Двоичный поиск в рекурсивном и нерекурсивном вариантах. Вывод формулы для асимптотики.

https://www.yuripetrov.ru/edu/python/ch_06_01.html - тут хорошо расписано

Бинарный поиск имеет сложность O(logN).

In [8]:
# нерекурсивный вариант
from random import random
N = 20
array = []
# заполнение массива 
for i in range(N):
    array.append(int(random()*100))
    
# сортировка массива
array.sort()

print(array)

# число, которое требуется найти
number = int(input())

# нижний (начальный) индекс
low = 0
# верхний (конечный) индекс
high = N-1
# как только нижний индекс станет больше на 1 верхнего 
# или верхний на 1 меньше нижнего цикл остановится
while low <= high:
    # находится индекс середины массива или отрезка массива
    mid = (low + high) // 2
    # Если искомое число меньше числа с индексом середины,
    if number < array[mid]:
        # то верхняя граница сдвигается к середине (но на 1 до нее, 
        # т. к. середина была уже проверена)
        high = mid - 1
    # Если искомое число больше числа с индексом середины,
    elif number > array[mid]:
        # то нижняя граница сдвигается за середину
        low = mid + 1
    # Все остальные случаи возникают, когда искомое число 
    # равно числу с индексом mid, т.е. оно есть в массиве и найдено
    else:
        print("ID =", mid)
        # прерывание цикла
        break
# ветка else сработает, если не было break и условие при while стало ложным, 
# т.е. тогда, когда нижняя граница станет больше верхней. Это значит, что 
# в массиве нет искомого числа. 
else:
    print("No the number")

[7, 13, 16, 21, 22, 25, 35, 35, 39, 44, 46, 46, 50, 54, 64, 67, 82, 86, 90, 96]
22
ID = 4


In [12]:
# рекурсивный вариант
def binarysearch(sequence, value):
    lo, hi = 0, len(sequence) - 1
    while lo <= hi:
        mid = (lo + hi) // 2
        if sequence[mid] < value:
            lo = mid + 1
        elif value < sequence[mid]:
            hi = mid - 1
        else:
            return mid
    return None
L = [7, 13, 16, 21, 22, 25, 35, 35, 39, 44, 46, 46, 50, 54, 64, 67, 82, 86, 90, 96]
c = 54
print(binarysearch(L, c))

# и еще один рекурсивный
A = [1,2,3,4,5,6,7,8,9,10]
low  = 0
hi = len(A)
v = 3 
def BS(A, low, hi,v):
    mid = round((hi+low)/2.0)
    if v == mid:
        print ("You have found dude!" + " " + "Index of v is ", A.index(v))
    elif v < mid:
        print ("Item is smaller than mid")
        hi = mid-1
        BS(A,low,hi,v)
    else :
        print ("Item is greater than mid")
        low = mid + 1
        BS(A,low,hi,v)
BS(A,low,hi,v)

13
Item is smaller than mid
Item is greater than mid
Item is smaller than mid
You have found dude! Index of v is  2


### 7. Устойчивость сортировки. Естественность поведения алгоритмов сортировки. Устойчивость сортировок выбором, пузырьком и вставками. Уметь доказывать устойчивость/неустойчивость.

`Устойчивая (стабильная) сортировка` — сортировка, которая не меняет относительный порядок сортируемых элементов, имеющих одинаковые ключи.

https://ru.wikipedia.org/wiki/Устойчивая_сортировка

https://foxford.ru/wiki/informatika/ustoychivost-sortirovok

При сортировке записей вида [фамилия, имя, отчество] по фамилии значения ключей для Иванов Сергей и Иванов Иван будут одинаковы, поэтому устойчивая сортировка не переставит Сергея и Ивана местами.

Примеры устойчивых сортировок: Сортировка слиянием с дополнительной памятью, Алгоритм Пратта

### <font color=violet>Естественность поведения</font>

Алгоритм принято называть естественным, если он эффективно работает на упорядоченных и частично упорядоченных массивах. Алгоритмы сортировки пузырьком и вставками эффективны на частично упорядоченных массивах, в то время как поведение быстрой сортировки и сортировки слиянием не естественно.



In [18]:
# https://younglinux.info/algorithm/sort_min
# Сортировка выбором. Здесь показан устойчивый вариант,
# так как одинаковые элементы не переставляются, а остаются на своих местах

# Заполняем список из 10 элементов
# случайными числами от 1 до 99 и
# выводим неотсортированный список на экран.
from random import randint
N = 10
arr = [1, 6, 3, 2, 1, 8, 5, 6, 9, 10]
# for i in range(N):
#     arr.append(randint(1, 99))
print(arr)
 

# В цикле переменная i хранит индекс ячейки,
# в которую записывается минимальный элемент.
# Сначала это будет первая ячейка.
i = 0
 
# N - 1, так как последний элемент
# обменивать уже не надо.
while i < N - 1:
 
    # ПОИСК МИНИМУМА
    # Сначала надо найти минимальное значение
    # на срезе от i до конца списка.
    # Переменная m будет хранить индекс ячейки
    # с минимальным значением.
    # Сначала предполагаем, что
    # в ячейке i содержится минимальный элемент.
    m = i
    # Поиск начинаем с ячейки следующей за i.
    j = i + 1
    # Пока не дойдем конца списка,
    while j < N:
        # будем сравнивать значение ячейки j,
        # со значением ячейки m.
        if arr[j] < arr[m]:
            # Если в j значение меньше, чем в m,
            # сохраним в m номер найденного
            # на данный момент минимума.
            m = j
        # Перейдем к следующей ячейке.
        j += 1
 
    # ОБМЕН ЗНАЧЕНИЙ
    # В ячейку i записывается найденный минимум,
    # а значение из ячейки i переносится
    # на старое место минимума.
    arr[i], arr[m] = arr[m], arr[i]
 
    # ПЕРЕХОД К СЛЕДУЮЩЕЙ НЕОБРАБОТАННОЙ ЯЧЕЙКЕ
    i += 1
 
 
# Вывод отсортированного списка
print(arr)

# Еще одна сортировка выбором, тоже устойчивая
def sel_sort(array):
    for i in range(len(array) - 1):
        m = i
        j = i + 1
        while j < len(array):
            if array[j] < array[m]:
                m = j
            j = j + 1
        array[i], array[m] = array[m], array[i]



# Сортировка пузырьком. Тут она тоже устойчивая, дабы одинаковые элементы не переставляются
# https://younglinux.info/algorithm/bubble

def bubble(array):
    for i in range(N-1):
        for j in range(N-i-1):
            if array[j] > array[j+1]:
                array[j], array[j+1] = array[j+1], array[j]
    return array
                
print(bubble(arr))


# Сортировка вставками. Тоже устойчивая, так как не меняются одинаковые элементы
# https://en.wikipedia.org/wiki/Insertion_sort
def insertion_sort_m(a):
    for i in range(len(a)):
        # зафиксировали текущий элемент
        tmp = a[i]
        j = i - 1
        # сравниваем с элементами слева и меняем при необходимости
        while j >= 0 and tmp < a[j]:
            a[j+1], a[j] = a[j], a[j+1]
            j -= 1
    return(a)
print(insertion_sort_m(arr))

[1, 6, 3, 2, 1, 8, 5, 6, 9, 10]
[1, 1, 2, 3, 5, 6, 6, 8, 9, 10]
[1, 1, 2, 3, 5, 6, 6, 8, 9, 10]
[1, 1, 2, 3, 5, 6, 6, 8, 9, 10]


### 8. Сортировки выбором, пузырьком, вставками. Реализация. В чем отличие между сортировками Шелла и расческой? почему у сортировки Шелла лучшая асимптотика?


Реализацию смотри выше.

Сортировка Шелла по сути улучшение сортировки вставками путем разбиения массива на подсписки, которые сортируются отдельно.

В сортировке расческой расстояние (инкремент) уменьшается в 1.2 раза на каждом последующем шаге.

Сортировка Шелла на каждом шаге полностью сортирует список, в то время как расческа причесвыает частично, но не полностью. 

У расчески асимптотика O(N*N), у Шелла O(N) в лучшем случае. Тут неизвестная оптимальная последовательность разбиений. Но что-то мне подсказывает, что из-за разбиения на подсписки и сортировку на каждой итерации, суммарно операция в Шелле получается меньше, чем в расческе, которая прогоняет весь список на каждой итерации. 

In [23]:
# Сортировка Шелла
# http://aliev.me/runestone/SortSearch/TheShellSort.html
def shellSort(array):
    increment = len(array) // 2
    while increment > 0:
        for startPosition in range(increment):
            gapInsertionSort(array, startPosition, increment)
        print("После инкрементации размера на", increment,"массив:", array)
        # так у нас сложность будет O(N*N)
        increment //= 2

def gapInsertionSort(array, low, gap):
    for i in range(low + gap, len(array), gap):
        currentvalue = array[i]
        position = i
        while position >= gap and array[position - gap] > currentvalue:
            array[position] = array[position - gap]
            position = position - gap
        array[position] = currentvalue
        
import random
L = [random.randint(1, 100) for i in range(10)]  
print(L)
print(shellSort(L))


# Сортировка расческой. Она неустойчивая.
def combsort(alist):
    alen = len(alist)
    gap = (alen * 10 // 13) if alen > 1 else 0
    while gap:
        if 8 < gap < 11:    ## variant "comb-11"
            gap = 11
        swapped = False
        for i in range(alen - gap):
            if alist[i + gap] < alist[i]:
                alist[i], alist[i + gap] = alist[i + gap], alist[i]
                swapped = True
        gap = (gap * 10 // 13) or swapped
    return alist

print(combsort(L))

[65, 8, 43, 73, 99, 38, 53, 79, 17, 66]
После инкрементации размера на 5 массив: [38, 8, 43, 17, 66, 65, 53, 79, 73, 99]
После инкрементации размера на 2 массив: [38, 8, 43, 17, 53, 65, 66, 79, 73, 99]
После инкрементации размера на 1 массив: [8, 17, 38, 43, 53, 65, 66, 73, 79, 99]
None
[8, 17, 38, 43, 53, 65, 66, 73, 79, 99]


### 9. Сортировка слиянием и быстрая сортировка, их сравнение. Реализация алгоритмов.

http://aliev.me/runestone/SortSearch/TheMergeSort.html

https://foxford.ru/wiki/informatika/bystraya-sortirovka-hoara-python

https://foxford.ru/wiki/informatika/sortirovka-sliyaniem

Сложность быстрой сортировки O(NlogN), как и у сортировки слиянием. В сортировке слиянием мы разбиваем весь список на маленькие и потом их объединяем. В быстрой сортировке мы раскидываем элементы на две группы по признаку "больше или меньше опорного элемента", после чего проделываем аналогичные махинации с новыми получившимися кучами.

In [30]:
import random

def merge_sort(a):
    n = len(a)
    if n < 2:
        # уже отсортировано
        return a
    # применяем к левой и правой половинам списка нашу функцию
    l = merge_sort(a[:n//2])
    r = merge_sort(a[n//2:n])
    i = j = 0
    res = []
    while i < len(l) or j < len(r):
        # если индекс i вылетел за длину l, то берем j и наоборот
        if not i < len(l):
            res.append(r[j])
            j += 1
        elif not j < len(r):
            res.append(l[i])
            i += 1
        elif l[i] < r[j]:
            res.append(l[i])
            i += 1
        else:
            res.append(r[j])
            j += 1
    return res

A = [random.randint(0, 10) for i in range(10)]
print(A)
A = merge_sort(A)
print(A)

# еще один вариант реализации, тут просто условие разбили на три цикла
def mergeSort(alist):
#     print("Splitting ",alist)
    if len(alist) > 1:
        mid = len(alist)//2
        lefthalf = alist[:mid]
        righthalf = alist[mid:]

        mergeSort(lefthalf)
        mergeSort(righthalf)

        i=0
        j=0
        k=0
        while i < len(lefthalf) and j < len(righthalf):
            if lefthalf[i] < righthalf[j]:
                alist[k] = lefthalf[i]
                i=i+1
            else:
                alist[k]=righthalf[j]
                j=j+1
            k=k+1

        while i < len(lefthalf):
            alist[k] = lefthalf[i]
            i=i+1
            k=k+1

        while j < len(righthalf):
            alist[k]=righthalf[j]
            j=j+1
            k=k+1
#     print("Merging ",alist)

alist = [54,26,93,17,77,31,44,55,20]
mergeSort(alist)
print(alist)

# и с фоксфорда
def merge(A, B):
    Res = []
    i = 0
    j = 0
    while i < len(A) and j < len(B):
    if A[i] <= B[j]:
    Res.append(A[i])
    i += 1
    else:
    Res.append(B[j])
    j += 1
    Res += A[i:] + B[j:]
    return Res


def MergeSort(A):
    if len(A) <= 1:
        return A
    else:
        L = A[:len(A) // 2]
        R = A[len(A) // 2:]
    return merge(MergeSort(L), MergeSort(R))


[1, 10, 9, 7, 6, 7, 1, 3, 3, 4]
[1, 1, 3, 3, 4, 6, 7, 7, 9, 10]
[17, 20, 26, 31, 44, 54, 55, 77, 93]


In [31]:
# быстрая сортировка Хоара
def QuickSort(A):
    if len(A) <= 1:
        return A
    else:
        q = random.choice(A)
        L = []
        M = []
        R = []
        for elem in A:
            if elem < q:
                L.append(elem) 
            elif elem > q: 
                R.append(elem) 
            else: 
                M.append(elem)
        return QuickSort(L) + M + QuickSort(R)
    
# тут не используется доп память
import random
def QuickSort(A, l, r):
    if l >= r:
        return
    else:
        q = random.choice(A[l:r + 1])
        i = l
        j = r
        while i <= j:
            while A[i] < q:
                i += 1

            while A[j] > q:
                j -= 1
            if i <= j: 
                A[i], A[j] = A[j], A[i]
                i += 1
                j -= 1 
                QuickSort(A, l, j)
                QuickSort(A, i, r)

### 10. Алгоритмы сортировки не использующие сравнение элементов друг с другом. Почему их асимптотика лучше. Сортировка подсчетом и блочная сортировка. Реализация. alg3-4

Блочная сортировка, поразрядная сортировка (Radix sort), Сортировка подсчетом (counting sort)

Если известно, что число различных элементов в массиве мало, то лучшим решением становится сортировка подсчетом.

1) Определить число элементов каждого вида в сортируемом массиве.

2) Определить порядок видов элементов.

3) Записать элементы массива в правильном порядке.

Если  𝑛  - размер массива, а  𝑘  - число видов элементов, то сортировка может быть выполнена в  2  прохода по массиву. 1 проход требуется для подсчета и еще один для записи элементов в правильном порядке.


Блочная соритровка (bucket sort)
Блочная сортировка может быть успешно применена, если известно, как распределены ключи. Если ключи равномерно распределены на интервале  [0,1) , то интервал можно разбить на  𝑘  равных промежутков (блоков или корзин), чтобы распределить по ним элементы сортируемого массива. Далее элементы в каждой из корзин сортируются с помощью другого алгоритма, чаще всего с помощью сортировки вставками. В конце корзины объединяются.

Блочную сортировку можно рассматривать, как обобщение сортировки подсчетом.

In [33]:
# сортировка подсчетом
import random
L = [random.randint(1, 5) for _ in range(100)]
D=dict()
for el in L:
    if el in D.keys():
        D[el]=D[el] + 1
    else:
        D[el]=1
print(D)
i=0
for x in sorted(D.items()):
    L[i:i+x[1]]=[x[0]]*x[1]
    i+=x[1]
print(L)

# блочная сортировка 
import random
import math
L = [random.uniform(0, 1) for _ in range(100)]
def ins_sort(A):
    i=0
    while i < len(A):
        j=i
        while j > 0 and A[j-1] > A[j]:
            A[j], A[j-1] = A[j-1], A[j]
            j = j - 1
        i = i + 1
def basket_sort(L, k):
    baskets=[[] for _ in range(k)]
    width = 1 / k
    for el in L:
        i=0
        j=0
        while True:
            if el <i+width:
                baskets[j].append(el)
                break
            i+=width
            j+=1
    for n in range(k):
        ins_sort(baskets[n])
    return baskets

k=10

print(basket_sort(L,k))

{3: 17, 1: 24, 5: 19, 4: 23, 2: 17}
[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5]
[[0.006675967861822563, 0.03829968419837393, 0.04597652000430452, 0.055887247396248396, 0.06261022442941933, 0.07572611676232621, 0.07609361110053547, 0.08064434645501983, 0.08519627421182374], [0.10845660950503422, 0.12005351272163622, 0.1351877134619185, 0.14079850710632225, 0.1584732071457483, 0.17388595689451036, 0.17688110106922061, 0.1817559028069532, 0.19428119121946597], [0.20811204536791883, 0.2148925628933479, 0.21935587649809507, 0.227305293349657, 0.23265023909445248, 0.2359698192279207, 0.24283314956326618, 0.24660753505525335, 0.2920011427686622, 0.298425526483997], [0.3577196293560998, 0.36526738142025794, 0.3654586173049249], [0.4355753360

### 11. Поразрядная сортировка. Чем отличаются LSD и MSD сортировки? Когда имеет смысл их использовать? alg3-4

Поразрядная сортировка (radix sort)
Поразрядная сортировка - это развитие идей сортировки подсчетом и быстрой сортировки. Пусть ключи, по которым осуществляется сортировка - целые числа. Тогда можно разделить массив на корзины по значениям старших разрядов ключей. Затем каждую из получившихся корзин разделить уже по значениям второго по старшинству разряда и так далее. Подход очень похож на быструю сортировку, однако на практике почти всегда под корзины выделяется дополнительная память, что обеспечивает сортировке стабильность.

Поразрядная сортировка есть в двух вариантах: по более значимым цифрам (most significant digit или MSD) и по менее значимым цифрам (least significant digit или LSD). Сверху описан алгоритм MSD.

Алгоритм LSD устроен следующим образом.

Выполняется устойчивая (т.е. равные элементы не переставляются) сортировка подсчетом по младшему разряду.

Корзины соединяются (конкатенируются) в один список.

Повторяется пункт 1, но сортировка выполняется по следующему по старшинству разряду.

### 12. Структуры данных список и очередь. Реализация методов для структуры данных список. alg5

Односвязный список - структура данных, состоящая из узлов, каждый из который содержит собственно данные и указатель на следующий элемент в списке.

Двусвязный список - структура данных, состоящая из узлов, каждый из который содержит собственно данные и указатели на предыдущий и следующий элементы в списке.

Список и массив схожи в том, что и тот и другой являются линейными структурами данных, однако есть и различия.

Массив - располагается в непрерывном участке памяти, а список может занимать много разрозненных участков.

Элементы массива однотипны (например, все являются целыми числами), а элементы списка могут относится к разным типам данных, например, нулевой элемент может числом, а первый - строкой.

Элементы массива занимают свой участок памяти по порядку, то есть в памяти записан нулевой элемент, вплотную за ним первый и так далее. Порядок элементов списка в общем случае не связан с тем, как они расположены в памяти.

In [None]:
# односвязный список
class Node:
    def __init__(self, data, next_node=None):
        self.data = data
        self.next_node = next_node

    def get_data(self):
        return self.data

    def set_data(self, val):
        self.data = val

    def get_next_node(self):
        return self.next_node


class SinglyLinkedList:
    def __init__(self):
        self.head = None
        self.size = 0

    def get_size(self):
        return self.size

    def add_node(self, data):
        new_node = Node(data, self.head)
        self.head = new_node
        self.size += 1
       
    def print_list(self):
        curr = self.head
        while curr:
            print(curr.data)
            curr = curr.get_next_node()

    def __str__(self):
        curr = self.head
        l=[]
        while curr:
            l.append(str(curr.data))
            curr = curr.get_next_node()
        return '[{}]'.format(', '.join(l))
    
    def insert(self, idx, data):
        if idx > self.size:
            raise IndexError("singly linked list index out of range")
        if idx == 0:
            self.add_node(data)
        else :
            curr = self.head
            i=0
            for _ in range(idx-1):
                curr = curr.get_next_node()
            new_node = Node(data, curr.get_next_node())
            curr.next_node = new_node
            
            

my_list = SinglyLinkedList()
print("Inserting")
my_list.add_node(5)
my_list.add_node(15)
my_list.add_node(25)
print("Printing")
my_list.print_list()
print("Size")
print(my_list.get_size())

print(my_list)
my_list.insert(2, 20)
print(my_list)

### 13. Стек. Проверка правильности скобочной последовательности. Обратная польская нотация. alg6

Стек - структура данных с порядком доступа "последний вошел - первый вышел" (LIFO - last in, first out). Стек можно представить, как колоду карт, лежащую на столе. С колоды можно снимать карты, а также можно класть их на нее. Со стеком можно выполнять операции push и pop. Первая кладет значение в стек, вторая - вынимает его из стека.

Упражнение 2. Распознавание правильных скобочных выражений
На вход подаются скобочные выражения, содержащие символы '(', ')', '[', ']', '{', '}'. Используя стек, определите является ли скобочное выражение правильным.



In [34]:
# стек на односвязном списке
class Empty(Exception):
    def __init__(self, message):
        super().__init__(message)


class StackNode:
    def __init__(self, data, next_node=None):
        self.data = data
        self.next_node = next_node

    def get_data(self):
        return self.data

    def get_next_node(self):
        return self.next_node


class ListBasedStack:
    def __init__(self):
        self.head = None
        self.size = 0

    def get_size(self):
        return self.size

    def push(self, data):
        new_node = StackNode(data, self.head)
        self.head = new_node
        self.size += 1
       
    def pop(self):
        if self.head is None:
            raise Empty("stack is empty")
        v = self.head.get_data()
        self.head = self.head.get_next_node()
        self.size -= 1
        return v


s = ListBasedStack()
s.push(0)
s.push(1)
s.push(2)
while True:
    print(s.pop())

# скобкоцил    
s=input()
stack=ArrayBasedStack()
dictionary={'[' : ']', '(' : ')', '{' : '}'}
flag = True
empty=False
for c in s:
    if c in '([{':
        stack.push(c)  
    else:
        try:
            v=stack.pop()
        except IndexError:
            flag=False
            break
        if c!=dictionary[v]:
            flag = False
            break
            
try:
    stack.pop()
except IndexError:
    empty=True
    
flag= flag and empty
print(flag)

2
1
0


Empty: stack is empty

In [38]:
# . Вычисления в обратной польской нотации. Для реализации калькулятора, работающего с 
# выражениями в постфиксной нотации очень удобно использовать стек.
# Числа помещаются в стек.
# Как только встречается бинарный оператор, из стека извлекаются два верхних элемента и к ним применяется операция.
# Результат вычислений помещается в стек.

class ArrayBasedStack:
    def __init__(self):
        self.values=[]
        
    def push(self, v):
        self.values.append(v)
        
    def pop(self):
        return self.values.pop()

digit=ArrayBasedStack()
char=[]
def apply_op(op1, op2, operator):
    op2=int(op2)
    op1=int(op1)
    if operator=='+':
        return op1+op2
    if operator=='-':
        return op1-op2
    if operator=='/':
        return op1//op2
    if operator=='*':
        return op1*op2

s=input().split()
for el in s:
    if el not in {'+', '-', '/', '*'}:
        digit.push(el)
    elif el in {'+', '-', '/', '*'}:
        char.append(el)
for el in char:
    op2=digit.pop()
    op1=digit.pop()
    res=apply_op(op1, op2, el)
    digit.push(res)

2358×−/


### 14. Деревья в математике и информатике, основная терминология. Двоичное дерево поиска. Итеративный и рекурсивный алгоритмы поиска элемента в дереве. Обход дерева. alg6-7

Деревья - широко применяемая структура данных, которая используется в том числе для:

управления иерархией данных,
ускорения поиска информации,
управления сортированными данными,
сортировки.


Математика

Граф — абстрактный математический объект, представляющий собой множество вершин графа и набор рёбер, то есть соединений между парами вершин. Например, за множество вершин можно взять множество аэропортов, обслуживаемых некоторой авиакомпанией, а за множество рёбер взять регулярные рейсы этой авиакомпании между городами.

Ориентированный граф или орграф - граф, ребрам которого присвоены направления.

Связный граф - граф, любые две вершины которого соединены ребром.

Дерево в математике (теория графов) - неориентированный связный граф, не содержащий циклов.

Ориентированное (корневое) дерево (теория графов) - дерево, у которого выбран корень. Корневое дерево можно считать ориентированным, так в нем определен очевидный порядок: ребра направлены от корня.

Упрядоченное дерево (теория графов) - корневое дерево, у которого дети каждого узла упорядочены между собой.

Информатика

Дерево (структура данных) - имитирующая корневое дерево. Узлы в информатике не только являются частями корневого дерева, но и содержат некоторые данные data. В data может входить ключ key, который будет использоваться для сравнения данных из разных узлов.

Для реализации ребер в каждом узле должны быть указатели на его детей, кроме того в некоторых случаях в узлах присутствуют указатели на родителей.

В дальнейшим термином дерево будет обозначаться структура данных дерево.

Для частей дерева можно ввести несколько определений

Концевой узел или лист - узел, соединенный только с одной вершиной, а в случае ориентированного дерева, - узел, в который ведет только одна дуга.

Узел ветвления или внутренний узел - неконцевой узел.

Уровень узла - длина пути от корня до узла.

Родитель узла  𝑁  - это соединенный с  𝑁  узел, уровень которого на 1 меньше уровня  𝑁 .

Ребенок узла  𝑁  - это соединенный с  𝑁  узел, уровень которого на 1 больше уровня  𝑁 .

Предок узла  𝑁  - это любой узел, в который можно попасть из  𝑁 , двигаясь от ребенка к его родителю.

Потомок узла  𝑁  - это любой узел, в который можно попасть из  𝑁 , двигаясь от родителя к его ребенку.

Поддерево - часть дерева, включающая некоторый узел  𝑁  и всех его потомков. Узел  𝑁  является корнем поддерева. Это определение отличается от даваемого в теории графов!

Высота узла - число ребер, соединяющих узел с его самым удаленным потомком.

Высота дерева - высота корня дерева.

Двоичное дерево - дерево, в котором каждый узел имеет не более 2-х детей.

Двоичное дерево поиска - это упорядоченное двоичное дерево, обладающее следующими свойствами:

левое и правое поддеревья - двоичные деревья поиска,

у всех узлов левого поддерева значения ключей меньше ( < ) значения ключа корня дерева,

у всех узлов правого поддерева значения ключей больше либо равны ( ≥ ) значения ключа корня.


In [None]:
class BSTNode:
    def __init__(self, key, value, left=None, right=None):
        self.value = value
        self.key = key
        self.left = left
        self.right = right
        
        
class BST:
    def __init__(self):
        self.root = None
        
    def _insert(self, key, value, root):
        if key == root.key:
            root.value = value
        elif key < root.key:
            if root.left is None:
                root.left = BSTNode(key, value)
            else:
                self._insert(key, value, root.left)
        else:
            if root.right is None:
                root.right = BSTNode(key, value)
            else:
                self._insert(key, value, root.right)
        
    def insert(self, key, value):
        if self.root is None:
            self.root = BSTNode(key, value)
        else:
            self._insert(key, value, self.root)
            
    def _find(self, key, root):
        if root is None:
            return None
        if key == root.key:
            return root.value
        elif key < root.key:
            return self._find(key, root.left)
        else:
            return self._find(key, root.right)
            
    def find(self, key):
        return self._find(key, self.root)
    
bst = BST()
bst.insert(5, 'Vasya')
print(bst.find(5))
bst.insert(5, 'Petya')
bst.insert(7, 'Dmitriy')
bst.insert(4, 'Egor')
bst.insert(8, 'Veronica')
print()
for i in range(10):
    print(i, bst.find(i))

In [None]:
# alg8 нерекурсивный
class BSTNode:
    def __init__(self, key, value, left=None, right=None, parent=None):
        self.value = value
        self.key = key
        self.left = left
        self.right = right
        self.parent = parent
        
class BST:
    def __init__(self):
        self.root = None
        
    def _insert(self, key, value, root):
        if key == root.key:
            root.value = value
        elif key < root.key:
            if root.left is None:
                root.left = BSTNode(key, value, parent=root)
            else:
                self._insert(key, value, root.left)
        else:
            if root.right is None:
                root.right = BSTNode(key, value, parent=root)
            else:
                self._insert(key, value, root.right)
    
    def find_iteratively(self, key):
        root=self.root
        while True:
            if root is None or root.key==key:
                return root
            root=[root.left, root.right][root.key < key]
        
    def insert(self, key, value):
        if self.root is None:
            self.root = BSTNode(key, value)
        else:
            self._insert(key, value, self.root)
            
    def _find(self, key, root):
        if root is None:
            return None
        if key == root.key:
            return root.value
        elif key < root.key:
            return self._find(key, root.left)
        else:
            return self._find(key, root.right)
            
    def find(self, key):
        return self._find(key, self.root)
    
    def _traverse(self, root):
        if root is None:
            return
        self._traverse(root.left)
        print(root.value)
        self._traverse(root.right)
        print(root.parent)
    
    def traverse(self):
        self._traverse(self.root)
        
bst = BST()
bst.insert(5, 'Vasya')
print(bst.find(5))
bst.insert(5, 'Petya')
bst.insert(7, 'Dmitriy')
bst.insert(4, 'Egor')
bst.insert(8, 'Veronica')
print()
for i in range(10):
    print(i, bst.find_iteratively(i))
print()    
bst.traverse()

### 15. Вставка узла в двоичное дерево поиска и удаление узла из дерева.



### 16. Сбалансированность двоичного дерева поиска. Вращения (с реализацией).



### 17. АВЛ-дерево. Вставка и удаление узла. Преимущества и недостатки красно-черного и АВЛ-деревьев.



### 18. Красно-черное дерево. Вставка и удаление узла. Преимущества и недостатки красно-черного и АВЛ-деревьев.



### 19. Двоичная куча. Когда применяется двоичная куча? Построение кучи методами снизу вверх и свеху вниз.

# ООП

1. Зачем нужен модуль `sys`? Управление потоками ввода вывода (oophw1).

- Модули и пакеты. Импортирование модулей и пакетов. Как происходит поиск импортируемого модуля или пакета? Настройка переменной окружения `PYTHONPATH`.

- Классы. Что такое `self`? Атрибуты объекта. Перегрузка операторов.

- Наследование. Доступ к методfм родительских классов с помощью функции `super()`. Ромб смерти.

- Что такое PEP 8? Инкапсуляция. Разница между protected и private? Как сделать атрибут приватным и как работает искажение имен? Что такое интерфейс и реализация?

- Методы и поля класса. Метод `__new__()`. Статические методы.

- Парадигмы и принципы ООП. Паттерны проектирования.

- Паттерн проектирования декоратор (с реализацией).

- Декораторы (синтаксис). Уметь реализовывать. Декораторы, принимающие на вход аргументы.

- Паттерн проектирования адаптер.

- Итераторы и генераторы.

- Структурное программирование.

- Контрактное программирование.

- Разработка через тестирование.

- Применение `git`. 

По перечисленным вопросам могут быть маленькие задачки, в том числе из дз.