# В поисках O(n*log(n))

## Почему так не получится?

Я подозреваю, что быстрее чем за квадрат решить задачу не получится. Вот мои доводы:

**1. Предельный случай**

Допустим, у нас есть предельный случай, когда каждая строка равна каждой колонке. Например, grid = [[1, 1], [1, 1]]. Тогда, кол-во пар = n^2. Наш алгоритм должен найти все пары, значит он так или иначе сделает перебор в количестве n^2.

**2. Колонки**

Также я подозреваю, что сформировать колонки быстрее чем за квадрат не получится. Ведь матрица задана строками, а чтобы получить колонку, нужно из каждой строки (т.е. n раз) взять i-ый элемент (где 0 <= i < n). Таким образом получаем n^2, который перекроет любую оставшуюся часть алгоритма, даже если она будет быстрее.

Я попробовала придумать арифметическую штуку, чтобы вычислять нужный индекс в рамках одного цикла, но цикл-то все равно сделает n^2 итераций, так что она бесмысленна :)

In [4]:
# бессмысленная арифметическая штука
for i in range(n*n):
    k = i - (i // n)*n
    l = i // n

## А может все-таки получится?

Ниже описаны те идеи, которые приходили мне на ум при попытке свести решение к O(n*log(n)), и опровержение этих идей 🥲

Вообще, все описанное ниже не имеет особого смысла, т.к. эти решения предполагают, что я буду сравнивать колонки со строками, а заполучить колонки у меня получается за n^2 только :( 

### Сортировки

**со сложностью O(nlog(n))**

Когда я вижу nlog(n), то сразу думаю:
- о сортировках, которые отработают за O(nlog(n)) 
- и о том, как после сортировки буду искать n колонок бинарным поиском (log(n)), т.е. снова O(nlog(n))

Но! Сортировка списков в лексикографическом порядке даст дополнительную n, которая вылазит при сравнении списков, поэтому сортировки со сложностью O(nlog(n)) дадут в итоге сложность O((n^2)log(n)).

**radix sort**

Я вспомнила про radix sort, которая вроде как может отработать линейно. Попробовала адаптировать ее к кейсу с сортировкой списков:
- n - длина входного массива, т.е. кол-во строк в grid;
- d - длина строки в grid/кол-во колонок в grid, в нашем случае d=n;
- b - кол-во чисел, которые могут встретиться в grid. Теоретически их значения варьируются от 0 до 10^5, но на практике мы можем рассматривать только уникальные числа в grid, которых в худшем случае будет n^2 штук.

Посчитаем сложность: O(d(n+b)) = O(n(n+n^2)) = O(n^2 + n^3) = O(n^3) 🥲🥲🥲

Кстати, если вспомогательный массив заменить хэш-таблицей, то кажется можно получить такую сложность: O(dn) = O(n^2). Одним плачущим эмоджи меньше 🥲🥲

### Деревья

Близко к сортировкам лежит идея дерева поиска, типа бинарного или b tree и т.д. В таких деревьях я буду искать все колонки за O(nlog(n)), но опять-таки все сводиться к O((n^2)log(n)) из-за сравнения списков.

### Сравнение по хэшу

Сортировки и деревья упираются в сравнение списков за O(n). Тогда можно было бы сравнивать их хэши за O(1). Но высчитывание хэша от списка - O(n). И так нужно сделать для всех списокв n. Таким образом мы снова получим O(n^2) на этапе подготовки хэшей для сравнения списков :(

## Вывод

Если получится, то не у меня :D