## Что такое БД и каких типов они бывают

В последнее время данные сравнивают с нефтью, тем самым подчеркивая их важность. С ростом объемов данных возникает вопрос, а как их лучше хранить? В связи с этим разработан целый ряд систем для хранения данных, которые называются базами данных.

<div style="background-color: #e0fff3; padding: 15px; color: black; width: 80%;">  <b>База данных (далее — БД)</b> — совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных.</div>

Казалось бы, к БД можно отнести бумажный каталог в книжной библиотеке. Однако, нет, это не будет базой данных, т. к. данные в этом случае хранятся на бумажном носителе.

Для того чтобы система хранения данных являлась БД, должны быть выполнены следующие условия:

Для того чтобы система хранения данных являлась БД, должны быть выполнены следующие условия:

-    Данные хранятся и обрабатываются в вычислительной системе.
-    Информация в БД логически структурирована для обеспечения эффективного поиска и обработки данных в вычислительной системе.
-    Необходимо наличие схемы, которая описывает логическую структуру БД.

БД позволяют хранить большой объем данных и при этом обеспечивают эффективное использование и изменение данных. За счет системы авторизации пользователей обеспечивается безопасность сведений, которые хранятся в БД. Помимо этого, есть возможность предоставления доступа к данным большому числу пользователей.

## Классификация БД

БД можно классифицировать по различным критериям. Чаще всего БД классифицируют по модели данных. Перед тем как перейти к классификации БД по типу модели данных, рассмотрим это понятие. 

<div style="background-color: #e0fff3; padding: 15px; color: black; width: 80%;">  <b>Модель данных</b> — это совокупность структур данных и операций их обработки.</div>

Например, на рисунке представлена модель данных для реляционной БД.

<img src='../static/img/module_1_1.png'>

## Классификация БД по модели данных:

-    Иерархические.
-    Сетевые.
-    Документные базы данных.
-    БД «ключ-значение».
-    Колоночные.
-    Реляционные.

## Иерархические базы данных

Базы данных с иерархической моделью одни из самых старых. Примеры таких БД — Information Management System (IMS) и System 2000, которые разрабатывались в 1950–1960-х.

Информация в иерархической базе организована по принципу древовидной структуры, в виде отношений «предок-потомок»:

<img src='../static/img/module_1_2.png'>

Каждая запись может иметь не более одной родительской записи и несколько подчиненных. Таким образом, БД представляется в виде древовидной (иерархической) структуры, которая состоит из объектов (данных) различных уровней.

Среди преимуществ иерархических БД следует отметить эффективное использование памяти и быстрое выполнение операций над данными — таких как добавление записи, изменение, удаление и извлечение. Однако, этот тип БД подходит только для хранения данных с иерархической структурой.

Иерархические БД применяются в файловых системах, DNS, LDAP и т.д.

## Сетевые базы данных

В отличие от иерархической БД в сетевых БД запись может иметь более одного «родителя», что позволяет моделировать сложные отношения.

![image.png](attachment:image.png)

Среди преимуществ сетевых БД стоит отметить возможность реализации множественных связей между объектами, низкие затраты памяти и оперативность доступа к данным. Однако после ввода данных нельзя изменить структуру БД, и это недостаток сетевых БД.

Сетевые БД — подходящий вариант для хранения данных, представимых в виде графов (т. е. набора связанных узлов, связанных между собой ребрами).

К основным понятиям сетевой модели базы данных относятся уровень, элемент (узел), связь.

<div style="background-color: #e0fff3; padding: 15px; color: black; width: 80%;">  <b>Узел</b> — это набор атрибутов данных, описывающих некоторый объект, хранимый в БД. Узлы на схеме иерархической БД представляются вершинами графа. </div>

Примеры сетевых БД:

-    IDS (Integrated Data Store) компании General Electric — самая первая сетевая СУБД, разработанная Чарльзом Бахманом в 1960 году.
-    DBMS.
-    IDMS.
-    db_VISTA III.
-    КОМПАС.


## Документные базы данных

Документная БД — это нереляционная база данных, предназначенная для хранения и запроса данных в виде документов в формате, подобном JSON. 

![image.png](attachment:image.png)

Документные БД (документоориентированные БД, хранилища документов) используют ключ для уникальной идентификации данных. Разница между хранилищами «ключ-значение» и документными БД заключается в том, что вместо хранения blob-объектов, документоориентированные базы хранят данные в структурированных форматах — JSON, BSON или XML.

Среди преимуществ этого типа БД стоит отметить возможность хранения неструктурированных данных. Минусы — отсутствие хорошей аналитической поддержки и поддержки транзакций, а также сложности с масштабированием.

Применяется этот тип БД в каталогах, пользовательских профилях, издательском деле, системах управления контентом и т. д.

Примеры документных БД:

-    CouchDB — используется во многих программных продуктах и на множестве веб-сайтов. Например, на UbuntuOne, Firefox, TomBoy, Akonadi, Evolution — для синхронизации адресов, заметок и закладок; в BBC — для динамического контента; Credit Suisse — для внутреннего использования в отделе товаров; Meebo — для социальной платформы.
-    Couchbase.
-    MongoDB — применяется для регистрации и хранение информации о событиях в системах управления документами и контентом, электронной коммерции, играх и мобильных приложениях. А также в хранилище операционных данных веб-страниц. Например, для хранения комментариев, рейтингов, профилей пользователей, сеансов пользователей.


## БД на основе пар «ключ‑значение»



Базы данных «ключ‑значение», как и документные БД, относятся к нереляционным БД. В них для хранения данных применяется простой метод «ключ‑значение».

К плюсам данного типа БД можно отнести возможность горизонтального масштабирования. Минусы — низкая производительность и отсутствие единого стандарта.

Применяются при создании интернет-магазинов, для реализации кэшей, брокеров сообщений, хранилищ сессий и т. д.

Наиболее известные примеры таких БД — Redis и Amazon DynamoDB.

Redis (от англ. remote dictionary server) представляет собой резидентную систему управления БД, которая работает со структурами данных типа «ключ-значение». Данные Redis хранит в виде словаря, т. е. в виде пар «ключ-значение». Одно из ключевых отличий Redis от других хранилищ данных в том, что значения этих ключей не ограничиваются строками. Поддерживаются следующие абстрактные типы данных: строки, списки, множества, хеш-таблицы, упорядоченные множества.

DynamoDB — система управления базами данных класса NoSQL в формате «ключ-значение», предлагается как часть пакета Amazon Web Services. Доступна только как платформенная служба из публичного облака Amazon.

## Колоночные базы данных

Колоночные базы данных (нереляционные колоночные хранилища или базы данных с широкими столбцами) являются NoSQL БД, но внешне похожи на реляционные БД. Сходство заключается в том, что как и в реляционных БД, данные в колоночных БД хранятся в строках и столбцах, но связь реализована иным образом.

![image.png](attachment:image.png)

В колоночных базах для хранения информации используются так называемые колоночные семейства. Семейства содержат строки, каждая из которых определяет собственный формат. Строка состоит из уникального идентификатора, используемого для поиска, за которым следуют наборы имен и значений столбцов.

Организация данных в колоночных БД позволяет довольно быстро изменять структуру больших таблиц, эффективно использовать сжатие данных, а также выполнять сложные выборки на больших таблицах. Кроме этого, поддерживается возможность масштабирования системы и аналитики данных.

Однако, колоночные БД не стоит использовать в выборках по ключу и известными структурами запросов.

Применяется этот тип БД в событийных таблицах (например, добавление товаров в корзину в интернет-магазине), таблицах со статистикой добавления товаров в корзину по дням и т. д.

Примеры колоночных БД — Clickhouse и Vertica.

## Реляционные базы данных

Данные хранятся в связанных между собой таблицах. В каждом столбце таблицы хранится определенный тип данных, в каждой ячейке — значение атрибута.

Такой формат представления данных удобен и привычен для пользователя, а также позволяет создавать языки манипулирования данными непроцедурного типа.

Среди недостатков реляционных БД следует отметить медленный доступ к данным и трудоемкость разработки.

Реляционные БД находят применение в электронном документообороте, биллинговых системах, при хранении данных о пользователях, в адресных книгах, справочниках и т. д.

## Другие классификации БД

Классифицировать БД можно не только по модели данных, но и по среде хранения:

-    БД, в которых данные хранятся во вторичной памяти («традиционные», англ. conventional database).
-    Резидентные — хранение данных в оперативной памяти.
-    Третичные (англ. tertiary database) — данные хранятся на магнитных лентах или оптических дисках.


По содержимому:

-    научные;
-    географические;
-    исторические;
-    мультимедийные.

По степени распределенности:

-    централизованные (сосредоточенные; англ. centralized database);
-    распределенные (англ. distributed database).


###  Итоги занятия:

-    БД — это удобный способ хранения больших объемов данных.
-    Реляционные БД — наиболее популярный тип БД. В них данные представимы в виде связанных таблиц.
-    Для неструктурированных данных (например, документов) лучше использовать документную (документоориентированную) БД.
-    Если запросы нужно делать к столбцам, то лучше выбрать колоночную БД.
