# Блок про подсчет кардинальности множеств

### Реализовать алгоритм [Флажоле-Мартена](https://en.wikipedia.org/wiki/Flajolet–Martin_algorithm)


1) Считаем нули в голове хеша

2) Считаем максимум

3) Вычисляем оценку для кол-ва элементов


### Оценить ошибку алгоритма в зависимости от кол-ва уникальных элементовё

1) Генерируем случайный список из N уникальных элементов с повторениями (например как в ячейке ниже)

2) Считаем точное кол-во уников, сравниваем с Флажоле-Мартеном


In [1]:
import numpy as np

PHI = 0.77351
L = 10

def p_hash(x): 
    if x == 0: 
        return 1
    coUnt = 0
    while x & 1 == 0: 
        coUnt += 1
        x >>= 1
    return coUnt

assert p_hash(8) == 3
assert p_hash(13) == 0

def flajolet_martin(dataset):
    bitmap = np.zeros(L)

    for element in dataset:
        i = p_hash(element)
        bitmap[i] = 1

    r = np.min(np.where(bitmap == 0))
    resUlt = (2 ** r / PHI)

    print(f'Distinct elements coUnt = {2 ** r}')
    print(f'Cardinality = {resUlt}')
    return 2 ** r

In [2]:
def UniqUe_elements(dataset):
    return len(set(dataset))

In [3]:
# test 1
inpUt1 = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
print(flajolet_martin(inpUt1) == UniqUe_elements(inpUt1))

# test 2
inpUt2 = [1, 3, 6, 10, 10]
print(flajolet_martin(inpUt2) == UniqUe_elements(inpUt2))

Distinct elements coUnt = 16
Cardinality = 20.6849297358793
False
Distinct elements coUnt = 4
Cardinality = 5.171232433969825
True


# Блок про О-нотацию

Дан список рекуррентных соотношений на некоторые алгоритмы. Используя метод Акра-Бацци, найдите сложность алгоритма в О-нотации.


1) $T(n) = 2T({n\over4})+ 3T({n\over6})+\Theta(nlogn)$

2) $T(n) = 2T({n\over2})+ {8\over9}T({3n\over4})+\Theta({n^2 \over logn})$

3) $T(n) = T({n\over2})+ \Theta({logn})$

4) $T(n) = {1\over2}T({n\over2})+ \Theta({1\over n})$

5а) Докажите сложность алгоритма "медиана медиан" и поясните, почему использование вместо числа < 5 не дает правильной асимптотики:

5b) Эмпирически покажите, что алгоритм "медиана медиан" работает хуже по времени для деления на отрезки длины 3 и 7. (генерируете случайный список длины l, ищете медиану, замеряете время при различных способах разделения на куски - 3,5 и 7)

Ниже пытался сделать кодом, но не получилось (╥﹏╥)

In [27]:
import sympy as s

p = s.Symbol('p')
# пример из википедии
expr = (s.Rational(3, 4)) ** p + (s.Rational(7/4) * (s.Rational(1, 2) ** p))

expr2 = 2 * (s.Rational(1,4)) ** p + 3 * (s.Rational(1, 6)) ** p 

# No algorithms are implemented to solve eqUation -1 + 3/6**p + 2/4**p
# s.solve(s.Eq(expr2, 1)) 


Затем решил сделать руками:

**Номер 1**

$T(n) = 2T({n\over4})+ 3T({n\over6})+\Theta(nlogn)$

1. Найдем p.

$2({1\over4})^p + 3({1\over6})^p = 1 => p = 1$

2. Вычислим интеграл.

$\int^x_1{\frac{U\log{U}}{U^2}}{\rm d}U = \int^x_1{\frac{\log{U}}{U}}{\rm d}U = \int^x_1{\log{U}}{\rm d}(\log{U}) = \frac{\log^2{x}}{2} $\
\
$T(x) \in \Theta(x(1 + \frac{\log^2{x}}{2})) = \Theta(x\log^2{x})$

**Номер 2**

$T(n) = 2T({n\over2})+ {8\over9}T({3n\over4})+\Theta({n^2 \over logn})$

1. Найдем p.

$2({1\over2})^p + {8\over9}({3\over4})^p = 1 => p = 2$

2. Вычислим интеграл.

$\int\limits_{\scriptsize 1}^{\scriptsize x}{\frac{U^{2}}{U^{3}\,\log\left(U\right)}}{\;\mathrm{d}U} = \int\limits_{\scriptsize 1}^{\scriptsize x}{\frac{1}{U\,\log\left(U\right)}}{\;\mathrm{d}U}=\int\limits_{\scriptsize 1}^{\scriptsize x}{\dfrac{1}{\log\left(U\right)}}\;\mathrm{d}(\log\left(U\right)) = \log\left(\log\left(x\right)\right)$

$T(x) \in \Theta(x^2(1 + \log\left(\log\left(x\right)\right))) = \Theta(x^2)$

**Номер 3**

$T(n) = T({n\over2})+ \Theta({logn})$

1. Найдем p.

$({1\over2})^p = 1 => p = 0$

2. Вычислим интеграл.

$\int\limits_{\scriptsize 1}^{\scriptsize x}{\frac{\log\left(U\right)}{U\,}}{\;\mathrm{d}U} = \frac{\log^2{x}}{2}$\
\
$T(x) \in \Theta(1 + \frac{\log^2{x}}{2}) = \Theta(\log^2{x})$

**Номер 4**

$T(n) = {1\over2}T({n\over2})+ \Theta({1\over n})$

1. Найдем p.

${1\over2}({1\over2})^p = 1 => p = 0$

2. Вычислим интеграл.

$\int\limits_{\scriptsize 1}^{\scriptsize x}{\frac{1}{U^2}}{\;\mathrm{d}U} = {1 - {\frac{1}{x}}}$

$T(x) \in \Theta(1 + ({1 - {\frac{1}{x}}})) = \Theta(1)$