# Database (DB) vs. Database management system (DBMS)

**База данных** — совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных.

**Схема базы данных** включает в себя описание содержания, структуры и ограничений целостности, используемые для создания и поддержки базы данных.

**Система управления базами данных, СУБД (Database Management System, DBMS)** — совокупность программных и лингвистических средств общего или специального назначения, обеспечивающих управление созданием и использованием баз данных.

--- 

**База данных** – это логически смоделированный кластер информации (данных), который обычно хранится на компьютере или другом оборудовании, к которому легко получить доступ различными способами.  

**Система управления базой данных** – это компьютерная программа или другое программное обеспечение, которое позволяет получать доступ к базе данных, взаимодействовать с ней и манипулировать ею.

# Data model / Модель данных

В классической теории баз данных, **модель данных** есть формальная теория представления и обработки данных в системе управления базами данных (СУБД), которая включает, по меньшей мере, три аспекта:
- Аспект **структуры**: методы описания типов и логических структур данных в базе данных; определяет, что из себя логически представляет база данных.
- Аспект **манипуляции**: методы манипулирования данными; определяет способы перехода между состояниями базы данных (то есть способы модификации данных) и способы извлечения данных из базы данных.
- Аспект **целостности**: методы описания и поддержки целостности базы данных; определяет средства описаний корректных состояний базы данных.

**Модель данных** — это абстрактное, самодостаточное, логическое определение объектов, операторов и прочих элементов, в совокупности составляющих абстрактную машину доступа к данным, с которой взаимодействует пользователь. Эти объекты позволяют моделировать структуру данных, а операторы — поведение данных.

**Каждая БД и СУБД строится на основе некоторой явной или неявной модели данных**. Все СУБД, построенные на одной и той же модели данных, относят к одному типу. Например, основой реляционных СУБД является реляционная модель данных, сетевых СУБД — сетевая модель данных, иерархических СУБД — иерархическая модель данных и т. д.

[DBMS popularity broken down by database model](https://db-engines.com/en/ranking_categories)

# Виды баз данных

Существует огромное количество разновидностей баз данных, различающихся по различным критериям. Например, в "Энциклопедии технологий баз данных", определяются свыше 50 видов БД.

[Рейтинг БД (по видам)](https://db-engines.com/en/ranking)

<img src='https://raw.githubusercontent.com/ryndovaira-org/data_science_notes/main/diagrams/data_models.drawio.svg'/>

<img src='https://raw.githubusercontent.com/ryndovaira-org/data_science_notes/main/diagrams/multi_model_dbms.drawio.svg'/>

# Create-Read-Update-Delete (CRUD)

CRUD — акроним, обозначающий четыре базовые функции, используемые при работе с базами данных: 
- создание (create)
- чтение (read)
- модификация (update)
- удаление (delete). 

Введён Джеймсом Мартином (англ. James Martin) в **1983** году как стандартная классификация функций по манипуляции данными.

Например, в SQL этим функциям, операциям соответствуют операторы 
- Insert (создание записей)
- Select (чтение записей)
- Update (редактирование записей)
- Delete (удаление записей). 

В некоторых CASE-средствах использовались специализированные CRUD-матрицы или CRUD-диаграммы, в которых для каждой сущности указывалось, какие базовые функции с этой сущностью выполняет тот или иной процесс или та или иная роль. В системах, реализующих доступ к базе данных через API в стиле REST, эти функции реализуются зачастую (но не обязательно) через HTTP-методы PUT, POST, GET, PATCH, DELETE.

Хотя традиционно оперирование в стиле CRUD применяется к базам данных, такой подход может быть распространён на любые хранимые вычислительные сущности (файлы, структуры в памяти, объекты). Шаблон проектирования ActiveRecord обеспечивает соответствие функций CRUD объектно-ориентированному подходу, и широко используется в различных фреймворках для доступа к базам данных из объектно-ориентированных языков программирования.

# Теорема CAP (теорема Брюера)

# Horizontal (scale out) and vertical scaling (scale up)

<center><img src="https://raw.githubusercontent.com/ryndovaira-org/data_science_notes/main/images/linear_nonlinear_scal.png"/></center>

**Масштабируемость (англ. scalability)** — в электронике и информатике означает способность системы, сети или процесса справляться с увеличением рабочей нагрузки (увеличивать свою производительность) при добавлении ресурсов (обычно аппаратных). Масштабируемость можно оценить через отношение прироста производительности системы к приросту используемых ресурсов. Чем ближе это отношение к единице, тем лучше.

# Data warehouse (DW or DWH) or Enterprise data warehouse (EDW)

# Transactions

**Транзакция (англ. transaction)** — группа последовательных операций с базой данных, которая представляет собой логическую единицу работы с данными. Транзакция может быть выполнена либо целиком и успешно, соблюдая целостность данных и независимо от параллельно идущих других транзакций, либо не выполнена вообще, и тогда она не должна произвести никакого эффекта. 

# Online analytical processing (OLAP)

# Online transaction processing (OLTP)

**OLTP (англ. Online Transaction Processing)**, **транзакционная система** — обработка транзакций в реальном времени. Способ организации БД, при котором система работает с небольшими по размерам транзакциями, но идущими большим потоком, и при этом клиенту требуется от системы минимальное время отклика.

# Подсистема хранения (Database engine / Storage engine)

- Подсистема хранения (англ. database engine, storage engine) — компонент СУБД, управляющий механизмами хранения баз данных, или библиотека, подключаемая к программам и дающая им функции СУБД.

- Отвечает за размещение баз данных (как правило, в файлах) и организацию конкурентного доступа к ним. Обычно СУБД позволяют манипулировать данными и структурами БД с помощью языка SQL, при этом интерпретатор языка SQL обычно является компонентом СУБД, а не подсистемы хранения.

- Библиотека позволяет программе использовать определённый формат файлов баз данных для манипулирования данными. В более сложном случае, она позволяет нескольким программам работать с общими файлами баз данных одновременно, используя те или иные механизмы блокировок.

- В некоторых СУБД подсистема хранения неотделима от неё самой, но ряд подсистем могут встраиваться или подключаться к разным СУБД.

- Существуют СУБД, которые позволяют одновременно использовать несколько подключаемых подсистем хранения, таковы, например, системы семейства **MySQL (MariaDB, Percona Server)**, в которых можно подключить 
    - **InnoDB** (В MySQL 5.6 InnoDB является механизмом хранения по умолчанию. Если вы не настроили другой механизм хранения по умолчанию, выполнение оператора `CREATE TABLE` без предложения `ENGINE =` создает таблицу InnoDB.)
    - MyISAM
    - XtraDB
    - Falcon
    - Aria
    - TokuDB
    - MyRocks
    - ...
- Подключённая подсистема хранения определяет функциональные возможности СУБД в целом, например, XtraDB и InnoDB в сравнении с MyISAM добавляют поддержку транзакций по принципам ACID и внешних ключей, а NDB Cluster — распределение хранимых данных по нескольким узлам.

# References

[Теорема CAP](https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D0%BE%D1%80%D0%B5%D0%BC%D0%B0_CAP)

[CRUD](https://ru.wikipedia.org/wiki/CRUD)

[База данных](https://ru.wikipedia.org/wiki/%D0%91%D0%B0%D0%B7%D0%B0_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85)

[Модель данных](https://ru.wikipedia.org/wiki/%D0%9C%D0%BE%D0%B4%D0%B5%D0%BB%D1%8C_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85)

[Система управления базами данных](https://ru.wikipedia.org/wiki/%D0%A1%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0_%D1%83%D0%BF%D1%80%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D1%8F_%D0%B1%D0%B0%D0%B7%D0%B0%D0%BC%D0%B8_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85)

[Когаловский Энциклопедии технологий баз данных](http://www.ipr-ras.ru/old_site/articles/encycl2.htm)

[Модель данных](https://ru.wikipedia.org/wiki/%D0%9C%D0%BE%D0%B4%D0%B5%D0%BB%D1%8C_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85)

[Data model](https://en.wikipedia.org/wiki/Data_model)

[Database](https://en.wikipedia.org/wiki/Database)

[NewSQL](https://en.wikipedia.org/wiki/NewSQL)

[NewSQL Ru](https://ru.wikipedia.org/wiki/NewSQL)

[]()

[]()

[]()

[]()

[]()

[]()

[]()

[]()

[]()