# Теория: Сортировка подсчетом (Counting Sort)

**Сортировка подсчетом** — это особый метод сортировки, который эффективно работает в случае, когда необходимо отсортировать массив чисел, каждое из которых принадлежит ограниченному диапазону. Основная идея заключается в подсчете количества вхождений каждого элемента массива и последующей упорядоченной записи этих элементов.

# Основные идеи и принцип работы:

1. **Ограниченный диапазон значений:**
   - Сортировка подсчетом эффективна, если известен диапазон значений элементов, которые нужно отсортировать. Пусть диапазон значений элементов лежит между `min_value` и `max_value`.

2. **Шаги алгоритма:**

   - **Шаг 1: Подсчет частоты элементов**
     - Создаем дополнительный массив (или список) `count` длиной `(max_value - min_value + 1)`, инициализированный нулями.
     - Проходим по исходному массиву и увеличиваем соответствующий элемент `count` на единицу для каждого элемента входного массива.

   - **Шаг 2: Построение отсортированного массива**
     - Итерируемся по массиву `count` и для каждого индекса `i` записываем число `i + min_value` столько раз, сколько раз оно встречается в исходном массиве.

3. **Вычислительная сложность и дополнительная память:**
   - Временная сложность сортировки подсчетом составляет \( O(N + K) \), где `N` — количество элементов в исходном массиве, а `K` — разница между максимальным и минимальным значением в массиве.
   - Дополнительно требуется память для массива `count` размером `K + 1`, что делает этот алгоритм памятьзатратным по сравнению с некоторыми другими методами сортировки.

# Задачи

### Условие задачи

Дан массив целых чисел `seq`. Требуется отсортировать этот массив с использованием сортировки подсчетом.

### Описание алгоритма

**Сортировка подсчетом (Counting Sort)** — это алгоритм сортировки, который эффективен в случае, когда известен ограниченный диапазон значений элементов массива. Основная идея заключается в подсчете количества каждого элемента и последующей упорядоченной записи этих элементов.

1. **Определение минимального и максимального значения:**
   - Находим минимальное (`minval`) и максимальное (`maxval`) значения в массиве `seq`.

2. **Инициализация и заполнение массива для подсчета:**
   - Вычисляем длину массива `count` как `k = maxval - minval + 1`.
   - Создаем массив `count` длиной `k`, заполненный нулями, который будет использоваться для подсчета количества каждого элемента.

3. **Подсчет количества элементов:**
   - Проходим по массиву `seq`. Для каждого элемента `now` вычисляем его индекс в массиве `count` как `now - minval` и увеличиваем соответствующий элемент массива `count` на единицу.

4. **Построение отсортированного массива:**
   - Используем массив `count` для построения отсортированного массива `seq`.
   - Итерируемся по индексам массива `count`. Для каждого индекса `val` и его значения в массиве `count[val]`, добавляем число `val + minval` в массив `seq` столько раз, сколько указано в `count[val]`.

5. **Возврат отсортированного массива:**
   - В итоге `seq` становится отсортированным массивом.


In [4]:
def countsort(seq):
    minval = min(seq)
    maxval = max(seq)
    k = maxval - minval + 1

    # Инициализация массива для подсчета
    count = [0] * k

    # Подсчет количества каждого элемента
    for now in seq:
        count[now - minval] += 1

    # Построение отсортированного массива
    nowpos = 0
    for val in range(k):
        for i in range(count[val]):
            seq[nowpos] = val + minval
            nowpos += 1

    return seq

# Пример использования
arr = [4, 2, 2, 8, 3, 3, 1]
sorted_arr = countsort(arr)
print("Исходный массив:", arr)
print("Отсортированный массив:", sorted_arr)

Исходный массив: [1, 2, 2, 3, 3, 4, 8]
Отсортированный массив: [1, 2, 2, 3, 3, 4, 8]


### Условие задачи

Даны два целых числа `x` и `y`. Необходимо определить, являются ли они перестановками друг друга, то есть содержат ли они одни и те же цифры в одинаковых количествах.

### Описание алгоритма

1. **Подсчет цифр в числе:**
   - Напишем функцию `count_digits(num)`, которая будет считать количество каждой цифры в числе `num`.
   - Используем массив `digitcount` длиной 10 (для цифр от 0 до 9), где индекс массива соответствует цифре, а значение — количество ее вхождений в число `num`.
   - Проходим по числу `num`, извлекая каждую цифру справа (по модулю 10) и увеличивая соответствующий элемент массива `digitcount`.

2. **Сравнение количеств цифр:**
   - Для двух чисел `x` и `y` вызываем функцию `count_digits` и получаем массивы `digitsx` и `digitsy`.
   - Сравниваем каждый элемент массивов `digitsx` и `digitsy`. Если хотя бы один элемент не совпадает, возвращаем `False` (числа не являются перестановками).
   - Если все элементы совпадают, возвращаем `True` (числа являются перестановками).


In [5]:
def is_digit_permutation(x, y):
    def count_digits(num):
        digitcount = [0] * 10
        while num > 0:
            lastdigit = num % 10
            digitcount[lastdigit] += 1
            num //= 10
        return digitcount

    digitsx = count_digits(x)
    digitsy = count_digits(y)

    for digit in range(10):
        if digitsx[digit] != digitsy[digit]:
            return False

    return True

# Пример использования
x = 12345
y = 54321
result = is_digit_permutation(x, y)
print(f"Числа {x} и {y} являются перестановками: {result}")  # Вывод: Числа 12345 и 54321 являются перестановками: True

Числа 12345 и 54321 являются перестановками: True


# Теория: Словари в программировании

**Словарь** (или ассоциативный массив) — это структура данных, предназначенная для хранения коллекции пар ключ-значение. Каждый элемент в словаре состоит из ключа и соответствующего ему значения. Ключи должны быть уникальными, то есть в словаре не может быть двух элементов с одинаковым ключом.

# Основные характеристики словарей:

1. **Структура данных:**
   - Словарь представляет собой коллекцию пар (ключ, значение), где каждый ключ связан с определенным значением.

2. **Операции с словарями:**
   - **Добавление элемента:** Вставка новой пары ключ-значение в словарь.
   - **Изменение элемента:** Обновление значения по существующему ключу.
   - **Удаление элемента:** Удаление пары ключ-значение из словаря по ключу.
   - **Поиск элемента по ключу:** Операция, которая выполняется за константное время в среднем случае (O(1)).
   - **Поиск по значению:** В большинстве реализаций нельзя искать по значению напрямую, так как словари не предназначены для таких операций.

3. **Сложность операций:**
   - В среднем случае операции добавления, изменения и удаления элемента в словаре выполняются за O(1) времени.
   - Однако, в некоторых случаях (например, при коллизиях в хеш-таблицах), эти операции могут занимать O(n) времени, где n — количество элементов в словаре.
   - Итерация по всем элементам словаря занимает O(n) времени.

4. **Использование словарей:**
   - Словари часто используются для эффективного доступа к данным по ключу.
   - Они предоставляют возможность хранить и организовывать данные в виде пар ключ-значение, что полезно при организации и обработке данных различных типов.

5. **Применение и сценарии использования:**
   - Использование словарей особенно полезно, когда требуется быстрый доступ к данным по ключу.
   - Они часто используются для хранения конфигураций, кешей, индексации данных и в других случаях, где ключевой доступ к данным является критически важным.


# Задачи

### Условие задачи

На шахматной доске размером N x N расставлены ладьи в определенных позициях. Ладья бьет все клетки, находящиеся на ее горизонтали или вертикали. Необходимо посчитать количество пар ладей, которые могут "бить" друг друга.

### Описание алгоритма

1. **Идея решения:**
   - Для каждой занятой горизонтали и вертикали подсчитываем количество ладей.
   - Количество возможных пар ладей на одной горизонтали (или вертикали) равно количеству ладей минус 1.
   - Суммируем количество пар для всех горизонталей и вертикалей.

2. **Реализация:**
   - Создаем два словаря `rooksinrow` и `rooksincol`, где ключами будут номера строк и столбцов соответственно, а значениями — количество ладей на этих строках и столбцах.
   - Функция `add_rook(row_or_col, key)` увеличивает счетчик ладей на заданной строке или столбце.
   - Функция `count_pairs(row_or_col)` вычисляет количество пар ладей на одной горизонтали или вертикали.
   - После подсчета пар для всех строк и столбцов, суммируем результаты и возвращаем общее количество пар ладей.


In [6]:
def count_beating_rooks(rook_coords):
    def add_rook(row_or_col, key):
        if key not in row_or_col:
            row_or_col[key] = 0
        row_or_col[key] += 1

    def count_pairs(row_or_col):
        pairs = 0
        for key in row_or_col:
            pairs += row_or_col[key] - 1
        return pairs

    rooksinrow = {}
    rooksincol = {}

    for row, col in rook_coords:
        add_rook(rooksinrow, row)
        add_rook(rooksincol, col)

    total_pairs = count_pairs(rooksinrow) + count_pairs(rooksincol)

    return total_pairs

# Пример использования
rook_coordinates = [(0, 0), (0, 2), (1, 1), (2, 0), (2, 2)]
result = count_beating_rooks(rook_coordinates)
print("Количество пар ладей, которые могут 'бить' друг друга:", result)  # Вывод: 4

Количество пар ладей, которые могут 'бить' друг друга: 4



**Объяснение примера**

- В примере заданы позиции ладей на шахматной доске: `(0, 0)`, `(0, 2)`, `(1, 1)`, `(2, 0)`, `(2, 2)`.
- Функция `count_beating_rooks` подсчитывает количество пар ладей, которые могут "бить" друг друга.
- В данном случае, ладьи находятся на следующих строках и столбцах:
  - Строки: 0, 0, 1, 2, 2
  - Столбцы: 0, 2, 1, 0, 2
- Подсчитывая пары для строк и столбцов, получаем общее количество пар равное 4.

Этот алгоритм эффективно решает задачу подсчета пар ладей на шахматной доске, используя словари для подсчета и суммирования количества ладей на каждой горизонтали и вертикали.

### Условие задачи

Дана строка `s`, содержащая различные символы. Необходимо вывести вертикальную гистограмму, показывающую частоту встречаемости каждого символа в строке, а также вывести список уникальных символов, отсортированный по алфавиту.

### Описание алгоритма

1. **Идея решения:**
   - Создаем словарь `symcount` для подсчета количества каждого символа в строке `s`.
   - Находим максимальное количество вхождений одного символа в `maxsymcount`.
   - Сортируем уникальные символы `sorteduniqsyms` по алфавиту.
   - Выводим гистограмму: для каждого уровня (от `maxsymcount` до 1) проверяем, сколько символов имеют частоту встречаемости не меньше текущего уровня, и выводим `#` или пробел соответственно.




In [12]:
def print_chart(s):
    symcount = {}
    maxsymcount = 0

    # Подсчет количества каждого символа в строке s
    for sym in s:
        if sym not in symcount:
            symcount[sym] = 0
        symcount[sym] += 1
        maxsymcount = max(maxsymcount, symcount[sym])

    # Сортировка уникальных символов по алфавиту
    sorteduniqsyms = sorted(symcount.keys())

    # Вывод гистограммы и списка уникальных символов
    for row in range(maxsymcount, 0, -1):
        for sym in sorteduniqsyms:
            if symcount[sym] >= row:
                print('#', end='')
            else:
                print(' ', end='')
        print()  # Переход на новую строку после каждой гистограммы

    # Вывод списка уникальных символов
    print(''.join(sorteduniqsyms))

# Пример использования
s = "abracadabra"
print("Строка:", s)
print("Вертикальная гистограмма и список уникальных символов:")
print_chart(s)

Строка: abracadabra
Вертикальная гистограмма и список уникальных символов:
#    
#    
#    
##  #
#####
abcdr


**Объяснение примера**

- В примере задана строка `s = "abracadabra"`.
- Функция `print_chart` подсчитывает количество каждого символа в строке, находит максимальное количество вхождений символа и сортирует уникальные символы по алфавиту.
- Затем она выводит вертикальную гистограмму, где каждый ряд показывает количество символов для текущего уровня, начиная с максимального количества вхождений и заканчивая 1.
- После гистограммы выводится отсортированный список уникальных символов.


### Условие задачи

Дан массив строк `words`. Необходимо сгруппировать слова таким образом, чтобы все анаграммы находились в одной группе. Анаграммы - это слова, образованные путем перестановки букв друг друга.

### Описание алгоритма

1. **Идея решения:**
   - Создаем словарь `groups`, где ключами будут отсортированные кортежи букв (анаграммы), а значениями — списки слов, которые являются анаграммами.
   - Для каждого слова из массива `words`:
     - Сортируем его буквы.
     - Используем отсортированные буквы в качестве ключа в словаре `groups`.
     - Добавляем текущее слово в список, соответствующий ключу в словаре `groups`.
   - Возвращаем список значений словаря `groups`, который содержит группы анаграмм.


In [16]:
def group_words(words):
    groups = {}

    for word in words:
        sorted_word = ''.join(sorted(word))
        if sorted_word not in groups:
            groups[sorted_word] = []
        groups[sorted_word].append(word)

    return list(groups.values())

# Пример использования
words = ["eat", "tea", "tan", "ate", "nat", "bat"]
result = group_words(words)
print("Группы анаграмм:")
for group in result:
    print(group)

Группы анаграмм:
['eat', 'tea', 'ate']
['tan', 'nat']
['bat']
