## Что такое CAP-теорема

В любой реализации распределенных вычислений возможно обеспечить не более двух из трех следующих свойств:

1.    согласованность данных (англ. consistency);
2.   доступность (англ. availability);
3.   устойчивость к разделению (англ. partition tolerance).


![image.png](attachment:image.png)

<b>Согласованность данных</b> означает, что во всех вычислительных узлах в один момент времени данные не должны противоречить друг другу.

<b>Доступность</b> требует, чтобы любой запрос к распределенной системе завершается корректным откликом. Однако без гарантии, что ответы всех узлов системы совпадают.

<b>Устойчивость</b> к разделению означает, что расщепление распределенной системы на несколько изолированных секций не приводит к некорректности отклика от каждой из секций.

Этот принцип (CAP-теорема) был предложен профессором Калифорнийского университета в Беркли Эриком Брюером в июле 2000 года и позже получил широкую популярность и признание в среде специалистов по распределенным вычислениям.

«Согласованность» в смысле теоремы CAP соотнесена с выполнением первых двух требований ACID. Остановимся подробнее на ACID.

<div style="background-color: #e0fff3; padding: 15px; color: black; width: 80%;">  <b>ACID (от англ. atomicity, consistency, isolation, durability)</b> — набор требований к транзакционной системе, обеспечивающий наиболее надежную и предсказуемую ее работу.

Это следующие требования:

-    Атомарность.
-    Согласованность.
-    Изоляция.
-    Устойчивость.


## Нормализация БД

<div style="background-color: #e0fff3; padding: 15px; color: black; width: 80%;">  <b>Нормализация БД</b> — это процесс организации данных определенным образом и рекомендации по проектированию.</div>

К чему приводит:

-    упрощается процесс выборки;
-    обеспечивается целостность данных;
-    улучшается масштабируемость;
-    отсутствует избыточность (data redundancy);
-    отсутствуют несогласованные зависимости.

Всего существует 6 нормальных форм, но чаще всего используются первые 3 нормальные формы.

#### Для приведения БД к нормальной форме необходимо:


1.    Объединить имеющиеся данные в группы.
2.    Выяснить логические связи между группами. Связываемые поля должны иметь один тип для того, чтобы обеспечить правильность связей.
3.    При нормализации предполагается использование нормальных форм по отношению к структуре имеющихся данных.


## Первая нормальная форма (1НФ)

Для того чтобы таблица была в 1НФ все атрибуты в таблице должны быть простыми, все сохраняемые данные на пересечении столбцов и строк — содержать лишь скалярные значения.

![image.png](attachment:image.png)

## Вторая нормальная форма (2НФ)

Отношения будут соответствовать 2НФ, если сама БД находится в 1НФ, а каждый столбец, который не является ключом, зависит от первичного ключа.

![image.png](attachment:image.png)

## Третья нормальная форма (3НФ)

Таблица должна находиться во 2НФ, плюс любой столбец, который не является ключом, должен зависеть лишь от первичного ключа.

Рассмотрим пример, изображенный на рисунке ниже.

В таблице ниже у нас есть связи:

-    «Модель → Телефон».
-    «Магазин → Телефон».
-    «Модель → Магазин».


Зависимость «Модель → Телефон» — транзитивна (!), поэтому таблица не находится в 3НФ.

Кроме описанных нормальных форм, существует четвертая нормальная форма, которую также называют нормальной формой Бойса-Кодда (BCNF), пятая и шестая нормальные формы, но на практике они применяются редко. 

Итоги занятия:

-    При проектировании распределенных систем нужно помнить про CAP-теорему, согласно которой при реализации распределенных вычислений возможно обеспечить не более двух из трех свойств: согласованность данных, доступность, устойчивость к разделению.
-    Существует 6 нормальных форм. На практике для большей части приложений вполне достаточно нормализовать БД до третьей нормальной формы.
