# Relational DB & RDBMS (Реляционная БД & СУБД)

Использование реляционных баз данных было предложено доктором Коддом из компании **IBM в 1970 году**.

**Реляционная система управления базами данных / Felational database management system** (РСУБД / RDBMS), реже — система управления реляционными базами данных (СУРБД) — СУБД, управляющая реляционными базами данных.

**Реляционная база данных** — база данных, основанная на реляционной модели данных.

Понятие "реляционный" основано на англ. relation ("отношение, зависимость, связь").

**Реляционная база данных** — это связанная информация, представленная в виде двумерных таблиц. 
**Реляционные базы данных** используют набор таблиц, представляющих простые данные.
Дополнительная или связанная информация хранится в других таблицах.
Часто для хранения одного объекта в реляционной базе данных используется несколько таблиц - это, в свою очередь, требует применения операции *JOIN* для получения всей информации, относящейся к объекту, для её обработки.

Многие системы реляционных баз данных оснащены возможностью использования **SQL (язык структурированных запросов)** для запросов и обновления базы данных.

<center><img src="https://raw.githubusercontent.com/ryndovaira-org/data_science_notes/main/images/my_sql_schema_example.png" alt="my_sql_schema_example" /></center>

# Relational model (Реляционная модель данных)

**Relational model / Реляционная модель данных (RM / РМД)** включает следующие компоненты:
- Аспект **структуры**:  — данные в базе данных представляют собой набор отношений.
- Аспект **манипуляции**: поддерживает операторы манипулирования отношениями (реляционная алгебра, реляционное исчисление).
- Аспект **целостности**: — отношения отвечают определенным условиям целостности. РМД поддерживает декларативные ограничения целостности уровня домена (типа данных), уровня отношения и уровня базы данных.

- *Кроме того, в состав реляционной модели данных включают теорию нормализации*.

# Нормальная форма

**Нормальная форма — свойство отношения в реляционной модели данных**, характеризующее его с точки зрения избыточности, потенциально приводящей к логически ошибочным результатам выборки или изменения данных. 
- Нормальная форма определяется как **совокупность требований, которым должно удовлетворять отношение**.
- Нормализация предназначена для приведения структуры БД к виду, обеспечивающему **минимальную логическую избыточность, и не имеет целью уменьшение или увеличение производительности работы или же уменьшение или увеличение физического объёма базы данных**. 
- Конечной целью нормализации является **уменьшение потенциальной противоречивости** хранимой в базе данных информации. 

Как отмечает К. Дейт, общее назначение процесса нормализации заключается в следующем:
- исключение некоторых типов избыточности;
- устранение некоторых аномалий обновления;
- разработка проекта базы данных, который является достаточно "качественным" представлением реального мира, интуитивно понятен и может служить хорошей основой для последующего расширения;
- упрощение процедуры применения необходимых ограничений целостности.

Устранение избыточности производится, как правило, за счёт декомпозиции отношений таким образом, чтобы в каждом отношении хранились только первичные факты (то есть факты, не выводимые из других хранимых фактов).

При том, что идеи нормализации весьма полезны для проектирования баз данных, они отнюдь **не являются универсальным или исчерпывающим средством повышения качества проекта БД**. Это связано с тем, что существует слишком большое разнообразие возможных ошибок и недостатков в структуре БД, которые нормализацией не устраняются. 

Несмотря на эти рассуждения, теория нормализации является очень ценным достижением реляционной теории и практики, поскольку она даёт **научно строгие и обоснованные критерии качества проекта БД и формальные методы для усовершенствования этого качества**.

Нормализацию иногда упрекают на том основании, что "это просто здравый смысл", а любой компетентный профессионал и сам "естественным образом" спроектирует полностью нормализованную БД без необходимости применять теорию зависимостей. Однако, как указывает Кристофер Дейт, нормализация в точности и является теми принципами здравого смысла, которыми руководствуется в своём сознании зрелый проектировщик, то есть принципы нормализации — это **формализованный здравый смысл**. Между тем, идентифицировать и формализовать принципы здравого смысла — весьма трудная задача, и успех в её решении является существенным достижением.

# 12 правил Кодда (Codd's 12 rules)


# ACID

Традиционные СУБД ориентируются на требования **ACID** к транзакционной системе: 
- **атомарность (англ. atomicity)**
- **согласованность (англ. consistency)**
- **изолированность (англ. isolation)**
- **надёжность (англ. durability)**


*Требования ACID были в основном сформулированы в конце 70-х годов Джимом Греем.*


**OLTP (англ. Online Transaction Processing)**, **транзакционная система** — обработка транзакций в реальном времени. Способ организации БД, при котором система работает с небольшими по размерам транзакциями, но идущими большим потоком, и при этом клиенту требуется от системы минимальное время отклика.


**Транзакция (англ. transaction)** — группа последовательных операций с базой данных, которая представляет собой логическую единицу работы с данными. Транзакция может быть выполнена либо целиком и успешно, соблюдая целостность данных и независимо от параллельно идущих других транзакций, либо не выполнена вообще, и тогда она не должна произвести никакого эффекта. 

**ACID**:
* **Атомарность (Atomicity)**
Гарантирует, что никакая транзакция не будет зафиксирована в системе частично. Будут либо выполнены все её подоперации, либо не выполнено ни одной. Поскольку на практике невозможно одновременно и атомарно выполнить всю последовательность операций внутри транзакции, вводится понятие "отката" (rollback): если транзакцию не удаётся полностью завершить, результаты всех её до сих пор произведённых действий будут отменены и система вернётся во "внешне исходное" состояние — со стороны будет казаться, что транзакции и не было. (Естественно, счётчики, индексы и другие внутренние структуры могут измениться, но, если СУБД запрограммирована без ошибок, это не повлияет на внешнее ее поведение.)

* **Согласованность (Consistency)**
Транзакция, достигающая своего нормального завершения (EOT — end of transaction, завершение транзакции) и, тем самым, фиксирующая свои результаты, сохраняет согласованность базы данных. Другими словами, каждая успешная транзакция по определению фиксирует только допустимые результаты. Это условие является необходимым для поддержки свойства Durability — Стойкость.

* **Изолированность (Isolation)**
Во время выполнения транзакции параллельные транзакции не должны оказывать влияния на её результат. Изолированность — требование дорогое, поэтому в реальных БД существуют режимы, не полностью изолирующие транзакцию.

* **Стойкость (Durability)**
Независимо от проблем на нижних уровнях (к примеру, обесточивание системы или сбои в оборудовании) изменения, сделанные успешно завершённой транзакцией, должны остаться сохраненными после возвращения системы в работу. Другими словами, если пользователь получил подтверждение от системы, что транзакция выполнена, он может быть уверен, что сделанные им изменения не будут отменены из-за какого-либо сбоя.

# Constructs

## Row

## Column

## Table

## View or result set

# Universal relation assumption

# Database normalization

# Keys

Связь между двумя таблицами задается через соответствие **PK** в одной из таблиц **FK** во второй. Если для таблицы **PK** задан в определенном поле, то в этом поле не может содержаться двух записей с одинаковыми значениями.

## Primary key (PK)

**PRIMARY KEY (Первичный ключ)** представляет собой один из примеров уникальных индексов и применяется для уникальной идентификации записей таблицы. Никакие из двух записей таблицы не могут иметь одинаковых значений первичного ключа. Первичный ключ обычно сокращенно обозначают как **PK (primary key)**. В реляционных базах данных практически всегда разные таблицы логически связаны друг с другом. Первичные ключи как раз используются для однозначной организации такой связи.
<center><img src="https://raw.githubusercontent.com/ryndovaira-org/data_science_notes/main/images/sql_fk_pk.jpg"/></center>

## Foreign key (FK)

**FOREIGN KEY (Внешний ключ)** - это ключ, используемый для объединения двух таблиц. Иногда его также называют ссылочным ключом. Внешний ключ — это столбец или комбинация столбцов, значения которых соответствуют **PK** в другой таблице.

# Relationships

## One-to-one

## One-to-many relationship

# Index

# Relational database management systems (RDBMS)

* **MySQL**
* Oracle
* PostgreSQL
* IBM DB2
* MariaDB
* ...

# References

[12 правил Кодда](https://ru.wikipedia.org/wiki/12_%D0%BF%D1%80%D0%B0%D0%B2%D0%B8%D0%BB_%D0%9A%D0%BE%D0%B4%D0%B4%D0%B0)

[Реляционная СУБД](https://ru.wikipedia.org/wiki/%D0%A0%D0%B5%D0%BB%D1%8F%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D0%B0%D1%8F_%D0%A1%D0%A3%D0%91%D0%94)

[Relational database](https://en.wikipedia.org/wiki/Relational_database#RDBMS)

[Нормальная форма](https://ru.wikipedia.org/wiki/%D0%9D%D0%BE%D1%80%D0%BC%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D1%84%D0%BE%D1%80%D0%BC%D0%B0)

[Database normalization](https://en.wikipedia.org/wiki/Database_normalization)

[Реляционная база данных](https://ru.wikipedia.org/wiki/%D0%A0%D0%B5%D0%BB%D1%8F%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D0%B0%D1%8F_%D0%A1%D0%A3%D0%91%D0%94)

[]()

[]()

[]()

[]()

[]()

[]()

[]()