<a href="https://colab.research.google.com/github/CodeHunterOfficial/AI_DataMining/blob/main/%D0%9E%D0%BF%D0%B5%D1%80%D0%B0%D1%86%D0%B8%D0%B8_JOIN_%D0%B2_%D0%B1%D0%B0%D0%B7%D0%B0%D1%85_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85_%D0%9C%D0%B0%D1%82%D0%B5%D0%BC%D0%B0%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B5_%D0%BE%D0%BF%D0%B8%D1%81%D0%B0%D0%BD%D0%B8%D0%B5_%D0%B8_%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%D1%8B.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Операции JOIN в базах данных: Математическое описание и примеры

Таблицы в базах данных можно рассматривать как множества строк, а операции JOIN становятся операциями над множествами с определенными правилами.

Пусть:
- $A$ — множество строк из таблицы **Students**.
- $B$ — множество строк из таблицы **Courses**.
- Пусть также $A_i \in A$ и $B_j \in B$ — строки из таблиц **Students** и **Courses**, и $f(A_i) = B_j$ обозначает соответствие по ключу (например, по **CourseID**), когда строки $A_i$ и $B_j$ связаны.

### 1. INNER JOIN (Пересечение множеств)
**Математическое описание:**
$$
A \cap B = \{ (A_i, B_j) \mid f(A_i) = B_j \}
$$
**Объяснение:**
**INNER JOIN** возвращает только те пары строк, для которых существует соответствие по ключу. В математическом смысле это пересечение двух множеств, ограниченное совпадающими значениями ключей.

### 2. LEFT JOIN (Левостороннее объединение)
**Математическое описание:**
$$
A \text{ LEFT JOIN } B = \{ (A_i, B_j) \mid f(A_i) = B_j \} \cup \{ (A_i, \text{NULL}) \mid \forall B_j \not= f(A_i) \}
$$
**Объяснение:**
**LEFT JOIN** возвращает **все элементы множества $A$**. Если для строки из $A$ не нашлось пары в $B$, результат дополняется **NULL** вместо строки $B_j$. Это объединение всех строк из $A$ с пересечением тех строк из $B$, которые совпадают по ключу.

### 3. RIGHT JOIN (Правостороннее объединение)
**Математическое описание:**
$$
A \text{ RIGHT JOIN } B = \{ (A_i, B_j) \mid f(A_i) = B_j \} \cup \{ (\text{NULL}, B_j) \mid \forall A_i \not= f(B_j) \}
$$
**Объяснение:**
**RIGHT JOIN** возвращает **все элементы множества $B$**. Если для строки из $B$ не нашлось пары в $A$, результат дополняется **NULL** вместо строки $A_i$. Это объединение всех строк из $B$ с пересечением строк из $A$, которые совпадают по ключу.

### 4. FULL OUTER JOIN (Полное объединение)
**Математическое описание:**
$$
A \text{ FULL OUTER JOIN } B = \{ (A_i, B_j) \mid f(A_i) = B_j \} \cup \{ (A_i, \text{NULL}) \mid \forall B_j \not= f(A_i) \} \cup \{ (\text{NULL}, B_j) \mid \forall A_i \not= f(B_j) \}
$$
**Объяснение:**
**FULL OUTER JOIN** возвращает **все элементы обоих множеств** — и $A$, и $B$. Если соответствий нет, добавляется **NULL** для тех элементов, которым не нашлось пары. Это объединение всех элементов из $A$ и $B$ с пересечением совпадающих элементов.

### 5. CROSS JOIN (Декартово произведение)
**Математическое описание:**
$$
A \times B = \{ (A_i, B_j) \mid A_i \in A \text{ и } B_j \in B \}
$$
**Объяснение:**
**CROSS JOIN** возвращает все возможные пары строк из $A$ и $B$. Это соответствует **декартовому произведению** двух множеств, где каждая строка из $A$ соединяется с каждой строкой из $B$.

### 6. SELF JOIN (Пересечение множества с самим собой)
**Математическое описание:**
$$
A \text{ SELF JOIN } = \{ (A_i, A_j) \mid g(A_i) = g(A_j) \text{ и } i \neq j \}
$$
где $g$ — это условие соединения, например, равенство возрастов студентов.

**Объяснение:**
**SELF JOIN** — это соединение множества с самим собой, при котором строки сопоставляются по определенному условию, например, совпадению значений в одном из столбцов.

## Примеры с числовыми множествами

Рассмотрим два множества с числовыми значениями и применим различные операции JOIN к ним.

### Определим множества:

Пусть:

- Множество $A$ (Students):
  \[
  A = \{ 1, 2, 3, 4, 5 \} \quad \text{(представляет идентификаторы студентов)}
  $$

- Множество $B$ (Courses):
  \[
  B = \{ 3, 4, 5, 6, 7 \} \quad \text{(представляет идентификаторы курсов)}
  $$

### 1. INNER JOIN (Пересечение множеств)
**Математическое описание:**
$$
A \cap B = \{ x \mid x \in A \text{ и } x \in B \}
$$

**Решение:**
$$
A \cap B = \{ 3, 4, 5 \}
$$

### 2. LEFT JOIN (Левостороннее объединение)
**Математическое описание:**
$$
A \text{ LEFT JOIN } B = \{ (A_i, B_j) \mid A_i \in A, \, B_j \in B, \text{ если } f(A_i) = B_j \} \cup \{ (A_i, \text{NULL}) \mid A_i \in A \text{ и } \forall B_j \not= f(A_i) \}
$$

**Решение:**
- Студенты из $A$:
  - $1$ — NULL (нет соответствия)
  - $2$ — NULL (нет соответствия)
  - $3$ — $3$ (соответствие)
  - $4$ — $4$ (соответствие)
  - $5$ — $5$ (соответствие)

**Результат LEFT JOIN:**
$$
\{ (1, \text{NULL}), (2, \text{NULL}), (3, 3), (4, 4), (5, 5) \}
$$

### 3. RIGHT JOIN (Правостороннее объединение)
**Математическое описание:**
$$
A \text{ RIGHT JOIN } B = \{ (A_i, B_j) \mid A_i \in A, \, B_j \in B, \text{ если } f(A_i) = B_j \} \cup \{ (\text{NULL}, B_j) \mid B_j \in B \text{ и } \forall A_i \not= f(B_j) \}
$$

**Решение:**
- Курсы из $B$:
  - $3$ — $3$ (соответствие)
  - $4$ — $4$ (соответствие)
  - $5$ — $5$ (соответствие)
  - $6$ — NULL (нет соответствия)
  - $7$ — NULL (нет соответствия)

**Результат RIGHT JOIN:**
$$
\{ (3, 3), (4, 4), (5, 5), (\text{NULL}, 6), (\text{NULL}, 7) \}
$$

### 4. FULL OUTER JOIN (Полное объединение)
**Математическое описание:**
$$
A \text{ FULL OUTER JOIN } B = \{ (A_i, B_j) \mid f(A_i) = B_j \} \cup \{ (A_i, \text{NULL}) \mid A_i \in A \text{ и } \forall B_j \not= f(A_i) \} \cup \{ (\text{NULL}, B_j) \mid B_j \in B \text{ и } \forall A_i \not= f(B_j) \}
$$

**Решение:**
- Из LEFT JOIN:
  $$
  \{ (1, \text{NULL}), (2, \text{NULL}), (3, 3), (4, 4), (5, 5) \}
  $$
- Из RIGHT JOIN:
  $$
  \{ (3, 3), (4, 4), (5, 5), (\text{NULL}, 6), (\text{NULL}, 7) \}
  $$

**Результат FULL OUTER JOIN:**
$$
\{ (1, \text{NULL}), (2, \text{NULL}), (3, 3), (4, 4), (5, 5), (\text{NULL}, 6), (\text{NULL}, 7) \}
$$

### 5. CROSS JOIN (Декартово произведение)
**Математическое описание:**
$$
A \times B = \{ (A_i, B_j) \mid A_i \in A \text{ и } B_j \in B \}
$$

**Решение:**
Перечислим все пары:
$$
\{ (1, 3), (1, 4), (1, 5), (1, 6), (1, 7), (2, 3), (2, 4), (2, 5), (2, 6), (2, 7), (3, 3), (3, 4), (3, 5), (3, 6), (3, 7), (4, 3), (4, 4), (4, 5), (4, 6), (4, 7), (5, 3), (5, 4), (5, 5), (5, 6), (5, 7) \}
$$

### 6. SELF JOIN (Пересечение множества с самим собой)
**Математическое описание:**
$$
A \text{ SELF JOIN } = \{ (A_i, A_j) \mid g(A_i) = g(A_j) \text{ и } i \neq j \}
$$

**Решение:**
Поскольку мы работаем с множеством идентификаторов, **SELF JOIN** не даст результата, если нет дубликатов.

**Результат SELF JOIN:**
$$
\text{Пустое множество } \{\}
$$

### Итоговые результаты:

1. **INNER JOIN:** $\{3, 4, 5\}$
2. **LEFT JOIN:** $\{(1, NULL), (2, NULL), (3, 3), (4, 4), (5, 5)\}$
3. **RIGHT JOIN:** $\{(3, 3), (4, 4), (5, 5), (NULL, 6), (NULL, 7)\}$
4. **FULL OUTER JOIN:** $\{(1, NULL), (2, NULL), (3, 3), (4, 4), (5, 5), (NULL, 6), (NULL, 7)\}$
5. **CROSS JOIN:** 20 пар из $A$ и $B$
6. **SELF JOIN:** Пустое множество




Давайте реализуем операции JOIN для двух множеств с помощью Python. Я создам функции для каждого типа JOIN (INNER, LEFT, RIGHT, FULL OUTER, CROSS и SELF) и продемонстрирую их работу на примере идентификаторов студентов и курсов.

Вот как это может выглядеть:

In [10]:
# Определяем множества
A = {1, 2, 3, 4, 5}  # Студенты
B = {3, 4, 5, 6, 7}  # Курсы

# 1. INNER JOIN (Пересечение множеств)
inner_join = A.intersection(B)
print("INNER JOIN:", inner_join)

# 2. LEFT JOIN (Левостороннее объединение)
left_join = [(a, b) if a in B else (a, None) for a in A for b in B if a == b] + [(a, None) for a in A if a not in B]
print("LEFT JOIN:", left_join)

# 3. RIGHT JOIN (Правостороннее объединение)
right_join = [(a, b) if a in B else (None, b) for a in A for b in B if a == b] + [(None, b) for b in B if b not in A]
print("RIGHT JOIN:", right_join)

# 4. FULL OUTER JOIN (Полное объединение)
full_outer_join = left_join + [(None, b) for b in B if b not in A]
print("FULL OUTER JOIN:", full_outer_join)

# 5. CROSS JOIN (Декартово произведение)
cross_join = [(a, b) for a in A for b in B]
print("CROSS JOIN:", cross_join)

# 6. SELF JOIN (Пересечение множества с самим собой)
self_join = [(a, a) for a in A]  # Пары элементов из A
print("SELF JOIN:", self_join)

INNER JOIN: {3, 4, 5}
LEFT JOIN: [(3, 3), (4, 4), (5, 5), (1, None), (2, None)]
RIGHT JOIN: [(3, 3), (4, 4), (5, 5), (None, 6), (None, 7)]
FULL OUTER JOIN: [(3, 3), (4, 4), (5, 5), (1, None), (2, None), (None, 6), (None, 7)]
CROSS JOIN: [(1, 3), (1, 4), (1, 5), (1, 6), (1, 7), (2, 3), (2, 4), (2, 5), (2, 6), (2, 7), (3, 3), (3, 4), (3, 5), (3, 6), (3, 7), (4, 3), (4, 4), (4, 5), (4, 6), (4, 7), (5, 3), (5, 4), (5, 5), (5, 6), (5, 7)]
SELF JOIN: [(1, 1), (2, 2), (3, 3), (4, 4), (5, 5)]
