# Алгоритмы. Задание 6
### Удовин Илья, 874

Дано n слов длины k, состоящих из маленьких букв латинского алфавита. Предложить эффективный алгоритм их сортировки в лексикографическом (словарном) порядке.

Можно посчитать количество каждой из первых букв, затем пройти по массиву и ставить каждое слово в новый массив на заранее выделенное для него место (_Radix Sort_). Так мы отсортируем слова только по первой букве. Далее применим тот же алгоритм для каждого подмассива из слов с одинаковой первой буквой, но сортировать будем уже по второй и так далее пока не останется подмассивов длины больше 2 или алгоритм не дойдет до конца слова. Асимптотика по времени &mdash; $O(n\cdot k)$ (алгоритм перебирает каждую букву конечное число раз), по памяти &mdash; $O(n\cdot k)$.

In [1]:
def word_sort(a, letter, start, end):
    
    count_letters = [0 for _ in range(26)]
    for i in range(start, end):
        count_letters[ord(a[i][letter]) - ord('a')] += 1
    
    index = [0 for _ in range(26)]
    s = start
    for i in range(len(count_letters)):
        if count_letters[i] > 0:
            index[i] = s
            s += count_letters[i]
            
    b = [None for _ in range(start, end)]
    print('b:', start, end)
    for word in a[start:end]:
        print('%s -> %s' % (word, index[ord(word[0]) - ord('a')] - start))
        print(' ' * 4, index[ord(word[0]) - ord('a')] - start)
        b[index[ord(word[0]) - ord('a')]] = word
        index[ord(word[0]) - ord('a')] += 1
        
    for i in range(start, end):
        a[i] = b[i - start]
        
    letter += 1
    if letter >= k:
        return
    
    s = 0; sub_not_found = True
    for i in range(start + 1, end):
        if a[i][letter - 1] == a[i - 1][letter - 1]:
            if sub_not_found:
                sub_not_found = False
            if s == 0:
                new_start = i
            s += 1
        elif s > 0:
            word_sort(a, letter, new_start - 1, new_start + s)
            s = 0
    if s > 0:
        word_sort(a, letter, new_start - 1, new_start + s)
    if sub_not_found:
        return

Имеется $n$ монет, среди которых одна фальшивая, и чашечные весы. Настоящие монеты все имеют одинаковый вес, а фальшивая легче. На каждую чашку весов можно класть произвольное количество монет. Докажите, что фальшивую монету можно найти за $\log_3 n + c$ взвешиваний.

$\blacktriangle\hspace{10pt}$ Будем каджый раз делить набор монет на три равномощных набора: Если исходное количество монет не делится на 3, *ровно одна* монета будет лежать сразу в двух наборах. Поочередно взвесим эти три набора. Если два из них оказались одинаковыми по весу, а третий легче или тяжелее, то либо монета, которая имеет отличный от остальных вес &mdash; это та монета, которая была сразу в двух из первых наборов (будем считать, что мы ее запомнили), либо искомая монета лежит в третьем наборе. В первом случае достаточно сравнить взятую монету с любой другой: если веса различаются, то мы нашли нужную монету, иначе выполним тот же алгоритм рекуррентно на третьем наборе.
    
В результате формула для рекурренты: $$T(n) = T\left( \frac{n}{3} \right) + 1 =$$
    
$$= T\left(\frac{n}{3}\right) + T\left(\frac{n}{9}\right) + T\left(\frac{n}{27}\right) + \dots + 1 + \log_3 n = \log_3n + c. \hspace{20pt}\blacksquare$$

Докажите, что в условиях предыдущей задачи для нахождения фальшивой монеты необходимо $log_3 n + c$ взвешиваний.

$\blacktriangle\hspace{10pt}$ В худшем случае фальшивая монета будет каждый раз находиться в третьем массиве, и тогда рекуррента опустится до $T(3)$, т. е. сравнения трех монет. До этого выход из алгоритма не произойдет. $\hspace{10pt}\blacksquare$

Даны два отсортированных массива длины $n$. Предложите как можно более эффективный алгоритм поиска медианы в массиве, состоящем из всех данных $2n$ элементов. Можно считать, что все элементы различные. Докажите корректность алгоритма и оцените его сложность (количество сравнений). В этой задаче обращения к элементам массива выполняются за $O(1)$, читать оба массива целиком не требуется, считайте, что они уже лежат в памяти.

Нам нужна $n$-я порядковая статистика в массиве из $2n$ элементов. Чтобы найти $n$-й по величине элемент, можно по очереди "доставать" минимальный (или максимальный) верхний элемент из массивов. В результате алгоритм пройдет $n$ элементов. Асимптотика &mdash; $\Theta(n)$.

In [2]:
from random import randint as ri

n = 10; a1 = []; a2 = []

for _ in range(n):
    a1.append(ri(1, 40))
    a2.append(ri(1, 40))
    
a1.sort()
a2.sort()

print(*a1)
print(*a2)

c = 0; i1 = 0; i2 = 0
last_in_a1 = True
while c < n:
    if a1[i1] < a2[i2]:
        i1 += 1
        last_in_a1 = True
    else:
        i2 += 1
        last_in_a1 = False
    c += 1
print(min(a1[i1 - 1], a2[i2]) if last_in_a1 else min(a1[i1], a2[i2 - 1]))

1 2 6 15 25 27 29 33 39 40
5 6 10 11 17 21 22 28 29 33
21
