## Введение в структуры данных

### Список [динамический массив]

![alt text](static/array.JPG "Array")

<p><b>Особенности:</b><p>
    <li>Элементы массива хранятся в памяти последовательно, что обеспечивает быстрый доступ к элементу</li>
    <li>Свойство "емкость" (capacity) хранит в себе максимальную вместимость нашего существующего массива</li>
    <li>Свойство "размер" (size) хранит в себе количество добавленных нами объектов</li>
    <li>В момент превышения "размера" над "емкостью" мы создаем новый массив большей вместимости, куда и переносим объекты</li>

<p><b>Достоинства:</b></p>
    <li>быстрый доступ к элементу [O(1)]</li>
    <li>Изменение размера и элементов</li>
    <li>Сохраняет порядок добавления элементов</li>
    <li>В Python позволяет хранить объекты разных типов</li>
    
<p><b>Недостатки:</b></p>
    <li>Заранее выделяет память под "вместимость"</li>
    <li>Дорогая операция вставки и удаления [O(n)]</li>
    <li>Дорогая операция поиска элемента[O(n)]</li>
    
<p><b>Уточнения:</b></p>
    <li>Питоновский список увеличивается так: 0, 4, 8, 16, 25, 35, 46, 58, 72, 88, ...</li>
    <li>Иногда лучше заранее объявить конечный размер массива и избежать операций увеличения размера</li>

<p><b>Задача:</b></p>
    <li>Реализуйте концептуально динамический массив на питоне, пусть в классе будет два списка, один с элементами
    которые мы хотим хранить, в то время как другой должен быть размера вместимости. При добавлении нового элемента мы
    сравниваем размеры двух списков, и в случае превышения размера хранения, делаем новый список большего размера с
    добавленными элементами и нулями для пустыющих значений 
</li>

## Связанные списки

<p><b>Односвязный список</b></p>

![alt text](static/single_list.png "Array")

<p><b>Двусвязный список</b></p>

![alt text](static/doubly_linked.png "Array")

<p><b>Особенности:</b><p>
    <li>Узлы списка хранят в себе указатель на следующий элемент (head) и ,в случае двусвязного списка, указатель на предыдущий элемент (tail)</li>

<p><b>Достоинства:</b></p>
    <li>Легко вставить элемент в любое место, просто переопределив указатели (одного-двух элементов) [O(1)]</li>
    <li>Хранит только добавленные нами элементы в любых доступных в памяти местах</li>
    <li>Легко отдает первый и последний элемент</li>
    <li>Легко удаляет элементы</li>

<p><b>Недостатки:</b></p>
    <li>Дорогая операция обращение к элементу, для нахождения конкретного элемента надо пройти всю цепочку [O(n)]</li>

<p><b>Задача:</b></p>
    <li>Реализуйте концептуально связанный список на питоне 
</li>

<p><b>Задача на использование:</b></p>
    <li>Для последовательности строк (например из файла) мы хотим проверять на совпадение некоторому шаблону строки и выводить предыдущие 5 строк. Реализуйте логику с помощью списка (list) и очереди (deque) 
</li>

## Хэш-таблицы

<img src="static/hash.png" alt="hash" width="500"/>

<p>В хэш-таблице обработка новых индексов производится при помощи ключей. А элементы, связанные с этим ключом, сохраняются в индексе. Этот процесс называется хэшированием. Пусть k — ключ, а h(x) — хэш-функция.Тогда h(k) в результате даст индекс, в котором мы будем хранить элемент, связанный с k.</p>

<p><b>Пример</b></p>
    <li>Наши элементы K = [2, 6, 8, 12, 20]</li>
    <li>Функция хэширования $h(k) = xmod7$</li>
    <li>Для 6 и 20 функция вернет 6, возникает коллизия</li>

<p><b>Вероятность отсутствия коллизии для данного случая:</b></p>
$P = \large\frac{len!}{len^n(len-n)!} = \small 0.15$

<p><b>Для борьбы с коллизиями:</b><p>
    <ul><b>Метод цепочек:</b> Суть этого метода проста: если хэш-функция выделяет один индекс сразу двум элементам, то храниться они будут в одном и том же индексе, но уже с помощью двусвязного списка. </ul>
    <ul><b>Открытая адресация:</b> Алгоритм вставки элемента проверяет ячейки массива H в некотором порядке до тех пор, пока не будет найдена первая свободная ячейка, в которую и будет записан новый элемент
    <li><b>Линейное зондирование</b> решает проблему коллизий с помощью проверки следующей ячейки.
        $h(k, i) = (h′(k) + i) mod m$, если коллизия происходит в h(k, 0), тогда проверяется h(k, 1). То есть, значение i увеличивается линейно.</li>
    <li><b>Квадратичное зондирование</b>Работает оно так же, как и линейное — но есть отличие. Оно заключается в том, что расстояние между соседними ячейками больше (больше одного). Это возможно благодаря следующему отношению: $h(k, i) = (h′(k) + c_1i + c_2i^2) mod m$</li>
    </ul>
    <ul><b>Подбор подходящей хэш-функции:</b> «Хорошие» хэш-функции не уберегут вас от коллизий, но, по крайней мере, сократят их количество.</ul>
        
<p><b>Особенности:</b><p>
    <li>Ожидаемые сложности вставки, удаления, поиска составляет O(1)</li>
    <li>В худших случаях множественных коллизий сложность составляет O(n)</li>

<p><b>Уточнения:</b></p>
    <li>Множества и словари в питоне основаны на хэш-таблицах</li>
    <li>В питоне словарь хэш-таблица меняет размер, когда количество свободных ячеек составляет менее трети</li>

<p><b>Задача на использование:</b></p>
    <li>Напишите функцию, использующую множество, для удаления дубликатов с сохранением исходного порядка элементов
</li>