# Жадные алгоритмы: теория и задачи

## Введение

### Покрытие точек отрезками

**Вход**: множество $n$ точек на прямой $x_1, \dots, x_n \in R$.

**Выход** минимальное количество отрезков единичной длины, которыми можно
покрыть все точки.

### Надежный шаг

Существует оптимальное покрытие, в котором самая левая точка покрыта левым
концом первого отрезка.

Поэтому можно сразу добавить в решение отрезок, левый конец которого совпадает
с самой левой точкой.

### Алгоритм

```
def PointCover(x1, ..., xn):
    S = [x1, ..., xn]
    while S is not empty:
        xm = min(S)
        add to solution [l, r] = [xm, xm + 1]
        drop from S all covered points by [l, r]
    return solution
```

Время работы $O(n^2)$.

### Улучшенный алгоритм

```
def PointsCover(x1, ..., xn):
    x1, ..., xn = sort(x1, ..., xn)
    i = 1
    while i <= n:
        add to solution [l, r] = [xi, xi + 1]
        i += 1
        while i <= n and xi <= r:
            i += 1
    return solution
```

Время работы: $T(\text{sort}) + O(n) = O(n\log{n})$

### Задача о выборе заявок

**Вход**: множество $n$ отрезков на прямой.

**Вывод**: максимальное количество попарно не пересекающихся отрезков.

Выбирая в первую очередь более короткие отрезки, можно получить неоптимальное
решение.

### Надежный шаг

Существует оптимальное решение, содержащее отрезок, правый конец которого
минимален.

Можно сразу добавить в решение отрезок, правый конец которого минимален.

### Алгоритм

```
def ActSel(l1, r1, ..., ln, rn):
    S = [(l1, r1), ..., (ln, rn)]
    while S:
        (lm, rm) = section from S with min right point
        add (lm, rm) to solution
        drop from S any sections crossing (lm, rm)
    return solution
```

Время работы: $O(n^2)$.

### Улучшенный алгоритм

```
def ActSel(l1, r1, ..., ln, rn):
    sort all section by r
    for all section in sorted list:
        if current section doesn't cross latest added:
            add it to solution
    return solution
```

Время работы: $T(\text{sort})+O(n)=O(n\log{n})$

### Планирование вечеринки в компании

**Вход**: дерево.

**Выход**: независимое множество (множество не соединенных друг с другом
вершин) максимального размера.

### Надежный шаг

Существует оптимальное решение, содержащее каждый лист дерева.

### Алгоритм

```
def MaxIndependentSet(T):
    while T:
        get all leafs into the solution
        drop them and their parents from T
    return solution
```

Время работы: $O(|T|)$

### Задача о непрерывном рюкзаке

**Вход**: веса $w_1$, ..., $w_n$ и стоимости $c_1$, ..., $c_n$ данных $n$
предметов; вместимость рюкзака $W$.

**Вывод**: максимальная стоимость частей предметов суммарного веса не более
$W$.

### Надежный шаг

Существует оптимальное решение, содержащее максимально возможную часть
предмета, стоимость которого за килограмм максимальна.

### Алгоритм

```
def Knapsack(w1, c1, ..., wn, cn):
    sort all items by c/w
    for all sorted items:
        take the max current item
    return solution
```

Время работы: $T(\text{sort}) + O(n) = O(n\log{n})$

### Основные идеи

**Надежный шаг** - существует оптимальное решение, согласованное с локальным
жадным шагом.

**Оптимальность подзадач** - задача, остающаяся после жадного шага, имеет тот
же тип.

## Коды Хаффмана

### Сжатие данных

**Вход**: строка $s$.

**Выход**: бинарный код символов строки $s$, обеспечивающий кратчайшее
представление $s$.

### Пример

$s = \text{abacabad}$

Коды символов: $a = 00$, $b = 01$, $c = 10$, $d = 11$.

Закодированная строка: $0001001000010011$, 16 бит.

### Коды переменной длины

Естественная идея: присвоить более короткие коды более частым символам.

Например: $s = abacabad$.

Коды символов: $a = 0$, $b = 10$, $c = 110$, $d = 111$.

Закодированная строка: $01001100100111$, 14 бит.

Код называется **беспрефиксным**, если никакой другой код символа не является
префиксом другого кода символа.
