#  Транзакции в базах данных

## Введение
Транзакции играют ключевую роль в системах управления базами данных (СУБД), обеспечивая целостность и согласованность данных при их обработке. В этой лекции мы рассмотрим, что такое транзакции, их основные требования, журнал транзакций, механизм MVCC, уровни изоляции и проблемы совместного доступа к данным.

---

## 1. Что такое транзакция?
Транзакция — это последовательность операций над базой данных, которая выполняется как единое целое. Она либо выполняется полностью, либо не выполняется вовсе (атомарность). Транзакции используются для обеспечения согласованности данных в многопользовательских системах.

Примеры транзакций:
- Перевод денег между счетами в банке (снятие со счета A и зачисление на счет B).
- Добавление заказа в интернет-магазине (обновление информации о клиенте, продуктах, наличии на складе).

---

## 2. Требования к транзакциям (ACID)
Для обеспечения надежности и предсказуемости выполнения транзакций в СУБД используются принципы ACID:

1. **Атомарность (Atomicity)** — транзакция либо выполняется целиком, либо не выполняется вовсе. Если одна из операций не удалась, все изменения отменяются.
2. **Согласованность (Consistency)** — после выполнения транзакции данные остаются в согласованном состоянии.
3. **Изолированность (Isolation)** — параллельные транзакции не должны мешать друг другу.
4. **Долговечность (Durability)** — после фиксации транзакции изменения сохраняются в базе данных даже в случае сбоя системы.

---

## 3. Журнал транзакций (Transaction Log)
Журнал транзакций — это специальный файл в СУБД, в котором фиксируются все изменения данных. Он используется для восстановления базы данных в случае сбоев и для реализации механизма отмены (ROLLBACK) и фиксации (COMMIT) изменений.

Формат записей в журнале включает:
- Начало транзакции.
- Изменения данных (до и после изменений).
- Завершение транзакции (COMMIT) или её отмену (ROLLBACK).

Пример работы журнала:
1. `BEGIN TRANSACTION`
2. Изменение значения `balance = balance - 100`
3. Запись в журнал транзакций
4. `COMMIT` (фиксирует изменения) или `ROLLBACK` (отменяет изменения)

---

## 4. Механизм обеспечения изолированности и атомарности (MVCC)
**MVCC (Multi-Version Concurrency Control)** — это механизм управления конкурентным доступом к данным, который позволяет разным транзакциям видеть разные версии одной и той же строки.

Как работает MVCC:
- Вместо блокировки данных создаются версии строк.
- Читающие транзакции работают с "снимком" данных (snapshot), избегая блокировок.
- Изменения записываются в новые версии строк, а старые версии остаются доступными до завершения транзакции.

Преимущества MVCC:
- Повышенная производительность при чтении данных.
- Уменьшение блокировок между транзакциями.
- Читающие транзакции не блокируют записывающие.

СУБД, использующие MVCC: PostgreSQL, MySQL (InnoDB), Oracle.

---

## 5. Уровни изоляции транзакций
СУБД предоставляет несколько уровней изоляции транзакций для балансировки между производительностью и безопасностью данных.

### Уровни изоляции (по стандарту SQL):
1. **Read Uncommitted (Чтение неподтвержденных данных)**
   - Транзакция может читать данные, которые не были зафиксированы.
   - Возможна проблема "грязного чтения" (dirty read).
2. **Read Committed (Чтение подтвержденных данных)**
   - Чтение только зафиксированных изменений.
   - Грязное чтение невозможно, но возможны "неповторяющиеся чтения" (non-repeatable read).
3. **Repeatable Read (Повторяющееся чтение)**
   - Одна и та же транзакция всегда видит неизменённые данные в ходе выполнения.
   - Предотвращает "неповторяющееся чтение", но возможны "фантомные чтения" (phantom read).
4. **Serializable (Сериализуемость)**
   - Самый строгий уровень.
   - Обеспечивает полную изолированность транзакций, но снижает производительность.

---

## 6. Проблемы совместного доступа к данным
При параллельной работе транзакций возможны следующие проблемы:

1. **Грязное чтение (Dirty Read)**
   - Транзакция читает данные, которые не были зафиксированы другой транзакцией.
   - Решение: Использование уровня Read Committed или выше.

2. **Неповторяющееся чтение (Non-Repeatable Read)**
   - Данные, прочитанные в одной транзакции, могут измениться другой транзакцией до её завершения.
   - Решение: Использование уровня Repeatable Read или выше.

3. **Фантомное чтение (Phantom Read)**
   - Одна транзакция видит изменения, добавленные другой транзакцией, даже если они не должны были быть видимыми.
   - Решение: Использование уровня Serializable.

---

## Заключение
Транзакции — это фундаментальный механизм управления данными в СУБД. Они гарантируют целостность и согласованность данных, обеспечивают конкурентный доступ и защищают от ошибок. 

Ключевые моменты:
- ACID- свойства обеспечивают надежность работы транзакций.
- Журнал транзакций помогает восстановить данные при сбоях.
- MVCC улучшает параллельный доступ к данным без блокировок.
- Различные уровни изоляции помогают балансировать между безопасностью и производительностью.

Грамотное управление транзакциями — важный навык при проектировании высоконагруженных систем и баз данных.