## Сортировка подсчетом

Сортируем $N$ чисел, каждое из которых от $0$ до $K$. Если $K$ (кол-во возможных значений) небольшое, то можно использовать сортировку подсчетом. Для этого создаем массив длины $K$ и заполняем его нулями (для этого тратим $O(K)$ памяти и $O(K)$ времени, так как заполнение массива нулями тоже требует времени). Затем каждое число из $N$ - это индекс в получившемся массиве, а значение в массиве - это сколько раз число встретилось в исходной последовательности. Получая заполненный массив, можем пройтись по нему и выписать каждый индекс столько раз, сколько лежит в массиве (это еще $O(N)$ по времени). Итоговая сложность по времени $O(N+K)$ и $O(K)$ по памяти

_Пример:_

$[5,4,5,3,2,1,5] \Rightarrow [0,1,1,1,1,3] \Rightarrow [1,2,3,4,5,5,5]$ 

In [1]:
def countsort(seq):
    minval = min(seq)
    maxval = max(seq)
    k = (maxval - minval + 1)
    count = [0] * k 
    for now in seq:
        count[now - minval] += 1 
    nowpos = 0 
    for val in range(0,k):
        for i in range(count[val]):
            seq[nowpos] = val + minval
            nowpos += 1

### Задача №1

Дано два числа $X$ и $Y$ без ведущих нулей. Необходимо проверить, можно ли получить первое из второго перестановкой цифр.  

_Пример:_ 
$X = 123; Y = 321 \Rightarrow True$

`Решение:`

Посчитаем кол-во вхождений каждой цифры в каждое из чисел и сравним

In [None]:
def two_numbers(number1, number2):
    def count_digits(number):
        l = [0] * 10
        while number > 0:
            digit = number % 10
            l[digit] += 1
            number //= 10
        return l
    l1 = count_digits(number1)
    l2 = count_digits(number2)
    for digit in range(10):
        if l1[digit] != l2[digit]:
            return False
    return True 

`Сложность по времени:` $O(N)$  
`Сложность по памяти:` $O(K)$  

## Словари

* Словарь он как множество, но к каждому ключу приписано значение
* Поиск происходит по ключу, который должен быть неизменяемым объектом
* Константа в сложности словарей заметно больше, чем у массивов, поэтому где можно (когда значений немного ($N$ мало) + числа с одним и тем же значением встречаются довольно часто ($N > K$)) - лучше использовать сортировку подсчетом. Константа в словарях больше, так как поиск по индексу в массиве быстрее, чем расширение словарей по хешам ключа и т.д.
* Сортировку подсчетом неразумно использовать, если данные разреженные

### Задача №2 

На шахматной доске $N$ на $N$ находятся $M$ ладей (ладья бьет клетки на той же горизонтали или вертикали до ближайшей занятой). Определите сколько пар ладей бьют друг друга. Ладьи задаются прой чисел $I$ и $J$, обозначающих координаты клетки. $1 \le N \le 10^9$, $0 \le M \le 2\cdot10^5$  

`Решение:` 

Для каждой занятой горизонтали и вертикали будем хранить кол-во ладей на них. Кол-во пар в горизонтали (вертикали) равно кол-во ладей минус 1. Суммируем это кол-во пар для всех горизонталей и вертикалей. Список здесь будет очень разреженный и очень большой (так как $1 \le N \le 10^9$), а ладей самих не так много ($0 \le M \le 2\cdot10^5$ ), поэтому воспользуемся словарем. 

In [2]:
def count_pairs(coords):
    def write_pairs_in_dict(d, value):
        if value not in d:
            d[value] = 0
        else: 
            d[value] += 1
    
    def count_pairs_local(d):
        pairs = 0
        for key in d:
            pairs += d[key]
        return pairs
            
    d_row = {}
    d_col = {}
    
    for col, row in coords:
        write_pairs_in_dict(d_row, row)
        write_pairs_in_dict(d_col, col)
        
    return count_pairs_local(d_row) + count_pairs_local(d_col)

`Сложность по времени:` $O(N)$  

Если заменить ладьи на ферзи, то нужно добавить еще возможность пар на диагонали (row+col) и обратной диагонали (row-col)

In [3]:
def count_pairs(coords):
    def write_pairs_in_dict(d, value):
        if value not in d:
            d[value] = 0
        else: 
            d[value] += 1
    
    def count_pairs_local(d):
        pairs = 0
        for key in d:
            pairs += d[key]
        return pairs
            
    d_row = {}
    d_col = {}
    d_diag = {}
    d_rev_diag = {}
    
    for col, row in coords:
        write_pairs_in_dict(d_row, row)
        write_pairs_in_dict(d_col, col)
        write_pairs_in_dict(d_diag, row+col)
        write_pairs_in_dict(d_rev_diag, row-col)
        
    return count_pairs_local(d_row) + count_pairs_local(d_col) + \
            count_pairs_local(d_diag) + count_pairs_local(d_rev_diag)

`Сложность по времени:` $O(N)$  

### Задача №3

Дана строка S, нужно вывести гистограмму символов в строке (символы отсортированы) 

In [4]:
def hist_of_string(s):
    d = {}
    max_count = 0

    for symbol in s:
        if symbol not in d:
            d[symbol] = 0 
        d[symbol] += 1 

        if d[symbol] > max_count:
            max_count = d[symbol]

        ordered_symbols = sorted(d.keys())

    for i in range(max_count, 0, -1):
        for symb in ordered_symbols:
            if d[symb] < i:
                print(' ', end='')
            else:
                print('#', end='')
        print()
    print(''.join(ordered_symbols))

In [5]:
hist_of_string('Hello, world!')

      #   
      ##  
##########
 !,Hdelorw


`Сложность по времени:` $O(N)$  

### Задача №4

Сгруппировать слова по общим буквам. 

_Пример:_ 

$['eat', 'ate', 'tea', 'tan', 'nat', 'bat'] \Rightarrow [['ate', 'eat', 'tea'], ['tan', 'nat'], ['bat']]$

`Решение:`

Можем отсортировать каждое слово посимвольно - это и будет ключом в словаре. А значением словаря - список из слов

In [6]:
def groupwords(words):
    d = {}
    for word in words: 
        sorted_word = ''.join(sorted(word))
        if sorted_word not in d:
            d[sorted_word] = []
        d[sorted_word].append(word)
    
    ans = []
    for key in d:
        ans.append(d[key])
    
    return ans 

In [7]:
groupwords(['eat', 'ate', 'tea', 'tan', 'nat', 'bat'])

[['eat', 'ate', 'tea'], ['tan', 'nat'], ['bat']]

`Сложность по времени:` $O(N)$  