# Элиминация

Эта часть конспекта является весьма техничной, в том смысле, что посвящена приёмам решения задач. Как и при освоении любой другой техники, здесь важно регулярно практиковаться выполняя соответствующие упражнения. Часто встречающиеся разделение заданий на «задачи» и «упражнения» действительно актуально: задачи зачастую интереснее, а упражнения позволяют отработать навыки и прийти к автоматизму в применении различных приёмов. Однако без хорошего усвоения технической стороны придётся постоянно спотыкаться об одни и те же грабли, поэтому лучше уделить время детальной проработке методов и впоследствии свободно двигаться вперёд, не возвращаясь к базовым нюансам.

Решение системы уравнений можно выполнять последовательной подстановкой: сначала выражаем одну неизвестную через другие, затем подставляем это выражение в остальные уравнения. Однако такой метод становится крайне трудоёмким даже для систем из четырёх уравнений. Есть другой, более изящный способ, который основывается на двух простых приёмах:
- Если умножить обе части уравнения на одно и то же число, равенство сохраняется.  
- Если сложить два уравнения (левую часть с левой, а правую часть с правой), равенство также сохраняется.

В случае с системой из двух уравнений можно поступить следующим образом:

$$
\text{До} \quad
\begin{cases} 
   x & - & 2y & = & 1 & (\text{Умножим первое уравнение на } -3)\\
   3x & + & 2y & = & 11 & (\text{и сложим его со вторым}) 
\end{cases}
$$

$$
\text{После}
\quad
\begin{cases} 
   x & - & 2y & = & 1,  \\
   &  & 8y & = & 8
\end{cases}
$$
  
Очевидно, что мы также можем менять уравнения местами — это не повлияет на решение системы. Найдя $y$, легко вычислить $x$.

Всё это можно выполнять в матричной форме.

**Расширенная матрица** записывается следующим образом: коэффициенты при неизвестных размещаются слева, а свободные члены справа, разделённые чертой. Для системы

$$
\begin{cases}
x &- 2y& = &1,\\
3x &+ 2y& = &11
\end{cases}
$$

соответствующая расширенная матрица выглядит так:

$$
\left[
\begin{array}{cc|c}
1 & -2 & 1\\
3 &  2 & 11
\end{array}
\right]
$$

- Первый столбец представляет коэффициенты при $x$,  
- Второй столбец — коэффициенты при $y$,  
- Справа за чертой указаны свободные члены $1$ и $11$.

Теперь применим те же действия (умножение строки на число, сложение или вычитание строк) к строкам матрицы. Например, умножим первую строку на $-3$ и прибавим ко второй строке:

$$
\text{Первая строка} \times (-3) \colon 
\begin{pmatrix}
1 & -2 & | & 1
\end{pmatrix}
\,\longrightarrow\,
\begin{pmatrix}
-3 & 6 & | & -3
\end{pmatrix}.
$$

Сложим эту строку со второй строкой:

$$
\begin{pmatrix}
3 & 2 & | & 11
\end{pmatrix}
+
\begin{pmatrix}
-3 & 6 & | & -3
\end{pmatrix}
=
\begin{pmatrix}
0 & 8 & | & 8
\end{pmatrix}.
$$

Теперь заменяем вторую строку на результат. Расширенная матрица принимает вид:

$$
\left[
\begin{array}{cc|c}
1 & -2 & 1\\
0 & 8  & 8
\end{array}
\right]
$$

Из второй строки сразу следует, что $8y = 8$, то есть $y = 1$. Подставляем это значение $y = 1$ в первую строку $(x - 2y = 1)$ и находим:

$$
x - 2 \cdot 1 = 1 \quad \Rightarrow \quad x = 3.
$$

Таким образом, операции, которые мы выполняем с уравнениями (умножение на число, сложение уравнений и перестановка строк), легко применяются к строкам **расширенной матрицы**. Это и есть матричный способ элиминации. Он позволяет решать системы линейных уравнений значительно эффективнее.

## Эллиминация $\rightarrow$ Метод Гаусса

Такой способ исключения неизвестных называется **Метод Гаусса** (или метод последовательного исключения неизвестных) — это один из основных алгоритмов решения систем линейных уравнений. Он основан на выполнении элементарных операций над строками (или столбцами) матрицы системы с целью привести систему к треугольному виду, а затем найти решение «обратным ходом. Выше я уже показал как это работает, но этот прием можно обощить системы любой размерности.

---

### 1. Основные идеи и формулировки

Рассмотрим систему линейных уравнений из $n$ уравнений с $n$ неизвестными:

$$
\begin{cases}
a_{11} x_1 + a_{12} x_2 + \dots + a_{1n} x_n = b_1, \\
a_{21} x_1 + a_{22} x_2 + \dots + a_{2n} x_n = b_2, \\
\quad \vdots \\
a_{n1} x_1 + a_{n2} x_2 + \dots + a_{nn} x_n = b_n.
\end{cases}
$$


Можно записать это в матричной форме как:

$$
\mathbf{A} \mathbf{x} = \mathbf{b},
$$

где

$$
\mathbf{A} = 
\begin{bmatrix}
a_{11} & a_{12} & \dots & a_{1n} \\
a_{21} & a_{22} & \dots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{n1} & a_{n2} & \dots & a_{nn}
\end{bmatrix},
\quad
\mathbf{x} = 
\begin{bmatrix}
x_1 \\
x_2 \\
\vdots \\
x_n
\end{bmatrix},
\quad
\mathbf{b} = 
\begin{bmatrix}
b_1 \\
b_2 \\
\vdots \\
b_n
\end{bmatrix}.
$$

$a_{ij}$ - это элемент матрицы в $i$-ой строке $j$-ом столбце.


Для удобства выполнения вычислений создадим **расширенную матрицу** $\left[ \begin{array}{c|c} \mathbf{A} & \mathbf{b} \end{array} \right]$ :

$$
\left[ \begin{array}{c|c} \mathbf{A} & \mathbf{b} \end{array} \right] = 
\left[
\begin{array}{cccc|c}
a_{11} & a_{12} & \dots & a_{1n} &  b_1 \\
a_{21} & a_{22} & \dots & a_{2n} &  b_2 \\
\vdots & \vdots & \ddots & \vdots & \vdots \\
a_{n1} & a_{n2} & \dots & a_{nn} &  b_n
\end{array}
\right].
$$

Метод Гаусса заключается в том, чтобы с помощью элементарных преобразований строк привести эту расширенную матрицу к **треугольному (ступенчатому) виду**, а затем найти решение.

---

### 2. Элементарные операции над строками

Для преобразования системы можно выполнять три вида элементарных операций над строками (уравнениями) расширенной матрицы:

1. **Перестановка строк** (менять местами $i$ -ю и $j$ -ю строки).
2. **Умножение строки на ненулевое число**.
3. **Прибавление к одной строке другой строки, умноженной на некоторое число**.

Эти операции не меняют решения системы или меняют их предсказуемым образом (например, умножение строки на коэффициент  $\neq 0$ не меняет решение, а перестановка строк просто меняет порядок уравнений).

---

### 3. Прямой ход (приведение к верхнетреугольному виду)

Предположим, что мы хотим получить систему в виде, где первые $k$ строк уже преобразованы, а в $(k+1)$-й строке мы хотим обнулить все элементы левее диагонального:

1. **Выбираем опорный элемент** $k$-й строке. Обычно это элемент на главной диагонали — $a_{kk}$ .  
   - Если $a_{kk} = 0$ , то нужно поменять строку $k$ с какой-то нижней строкой $m$ $m > k$, у которой элемент в том же столбце $(m, k)$ не равен нулю. Если таких строк нет, значит, в этом столбце все элементы ниже диагонали равны нулю, и нужно двигаться дальше по диагонали (либо система может оказаться вырожденной, если вся матрица в каком-то моменте обнуляется).

2. **Нормируем $k$ -ю строку** (по желанию, если удобно в вычислениях): делим всю $k$ -ю строку на $a_{kk}$ , чтобы сделать опорный элемент равным 1. Это упростит дальнейшие вычисления.

3. **Обнуляем элементы ниже ведущего**: для всех строк $i$ от $k+1$ до $n$:
   - Вычисляем коэффициент $ \alpha = \dfrac{a_{ik}}{a_{kk}} $ (если $a_{kk} \neq 0$) .
   - Заменяем $ i $-ю строку на $ (\text{строка } i) - \alpha \times (\text{строка } k)$ .  
   В результате в столбце $k$ в строках ниже $k$ -й появятся нули.

4. **Переходим к следующему опорному элементу по диагонали**  $(k \leftarrow k+1)$ и повторяем процесс до тех пор, пока не достигнем последней строки.

В итоге после прямого хода расширенная матрица (и сама система) приобретёт **верхнетреугольный (ступенчатый)** вид:

$$
\left[
\begin{array}{ccccc|c}
* & * & * & \dots & * &  * \\
0 & * & * & \dots & * &  * \\
0 & 0 & * & \dots & * &  * \\
\vdots & \vdots & \vdots & \ddots & \vdots &  \vdots \\
0 & 0 & 0 & \dots & * & *
\end{array}
\right]
$$

---

### 4. Обратный ход (нахождение решения)

После того как мы получили матрицу в верхнетреугольном виде, можно последовательно найти все неизвестные, двигаясь снизу вверх. 

Пусть итоговая (верхнетреугольная) система выглядит так:

$$
\begin{cases}
u_{11} x_1 + u_{12} x_2 + \dots + u_{1n} x_n = d_1, \\
0 \cdot x_1 + u_{22} x_2 + \dots + u_{2n} x_n = d_2, \\
\quad \quad \vdots \\
0 \cdot x_1 + 0 \cdot x_2 + \dots + u_{nn} x_n = d_n.
\end{cases}
$$

где $u_{kk} \neq 0$ (или хотя бы большинство из них в невырожденном случае).

1. Сначала находим $x_n$ из последнего уравнения:

   $$
   u_{nn} x_n = d_n \quad \Longrightarrow \quad x_n = \frac{d_n}{u_{nn}}.
   $$

2. Подставляем найденное $x_n$ в предпоследнее уравнение и решаем относительно $x_{n-1}$ .  
   То есть:

   $$
   u_{(n-1)(n-1)} x_{n-1} + u_{(n-1)n} x_n = d_{n-1},
   $$

   где $x_n$ уже известно. Находим $x_{n-1}$ :

   $$
   x_{n-1} = \frac{d_{n-1} - u_{(n-1)n} x_n}{u_{(n-1)(n-1)}}.
   $$

3. Аналогично продолжаем, пока не найдём все переменные $x_{n-2}, x_{n-3}, \dots, x_1$.

В результате получаем полный набор решений $\mathbf{x}$.

---

### 5. Пример

Пусть у нас система из 3 уравнений:

$$
\begin{cases}
2x + y +  z = 1, \\
4x - 6y = -2, \\
-2x + 7y + 2z = 3.
\end{cases}
$$

Чтобы не загромождать пример, предполагаем, что переменных три: $x, y, z$.

### Шаг 1. Составим расширенную матрицу

$$
\left[
\begin{array}{ccc|c}
2 & 1 & 1 & 1 \\
4 & -6 & 0 & -2 \\
-2 & 7 & 2 & 3
\end{array}
\right].
$$

### Шаг 2. Прямой ход

1. **Работаем с первой строкой**:
   - Опорный элемент $a_{11} = 2$. При желании нормируем её: делим каждую ячейку первой строки на 2, чтобы опорный элемент стал $1$ (не обязательно, но упростит расчёты):
  
     $$
     \left[
     \begin{array}{ccc|c}
     1 & 0.5 & 0.5 & 0.5 \\
     4 & -6 & 0 & -2 \\
     -2 & 7 & 2 & 3
     \end{array}
     \right].
     $$

   - Теперь обнулим элементы в первом столбце ниже первой строки:
     - Для второй строки: коэффициент $4$.  
       $\text{Новая вторая строка} = \text{вторая строка} - 4 \times \text{первая строка}:$

       $$
         \bigl(4,\,-6,\,0,\,-2\bigr)
         \;-\;
         4 \times \bigl(1,\,0.5,\,0.5,\,0.5\bigr)
         =
         \bigl(4 - 4,\;-6 - 2,\;0 - 2,\;-2 - 2\bigr)
         =
         \bigl(0,\;-8,\;-2,\;-4\bigr).
       $$

     - Для третьей строки: коэффициент $-2$.  
       $\text{Новая третья строка} = \text{третья строка} - (-2) \times \text{первая строка}$:

       $$
         \bigl(-2,\,7,\,2,\,3\bigr)
         \;+\;
         2 \times \bigl(1,\,0.5,\,0.5,\,0.5\bigr)
         =
         \bigl(-2 + 2,\;7 + 1,\;2 + 1,\;3 + 1\bigr)
         =
         \bigl(0,\;8,\;3,\;4\bigr).
       $$

   - Итоговая матрица:
  
     $$
     \left[
     \begin{array}{ccc|c}
     1 & 0.5 & 0.5 & 0.5 \\
     0 & -8 & -2 & -4 \\
     0 & 8 & 3 & 4
     \end{array}
     \right].
     $$

2. **Работаем со второй строкой** (теперь опорный элемент $a_{22} = -8$):
   - При желании нормируем вторую строку, разделив на $-8$:
    
     $$
     \left[
     \begin{array}{ccc|c}
     1 & 0.5 & 0.5 & 0.5 \\
     0 & 1 & 0.25 & 0.5 \\
     0 & 8 & 3 & 4
     \end{array}
     \right].
     $$

   - Обнулим элемент в третьей строке (второй столбец):
     - Коэффициент $8$.  
       $\text{Новая третья строка} = \text{третья строка} - 8 \times \text{вторая строка}$:

       $$
         (0,\,8,\,3,\,4)
         \;-\;
         8 \times (0,\,1,\,0.25,\,0.5)
         =
         (0,\,8 - 8,\,3 - 2,\,4 - 4)
         =
         (0,\,0,\,1,\,0).
       $$

   - Итоговая матрица:
    
     $$
     \left[
     \begin{array}{ccc|c}
     1 & 0.5 & 0.5 & 0.5 \\
     0 & 1 & 0.25 & 0.5 \\
     0 & 0 & 1 & 0
     \end{array}
     \right].
     $$

На этом прямой ход закончен — матрица в верхнетреугольном (ступенчатом) виде.

### Шаг 3. Обратный ход

Теперь по этой форме легко найти $x, y, z$.

1. Из третьей строки: $1 \cdot z = 0 \;\Rightarrow\; z = 0$
2. Из второй строки: $y + 0.25 z = 0.5.$ Но $z = 0$, значит $y = 0.5.$
3. Из первой строки: $x + 0.5y + 0.5z = 0.5.$ Подставляем $y = 0.5$ и $z = 0$:

Итого решение:

$$
x = 0.25, \quad y = 0.5, \quad z = 0.
$$


In [1]:
# Функции реализующие элементарные операции над матрицами.

import numpy as np

def row_swap(A: np.ndarray, k: int, l: int) -> np.ndarray:
    """
    Swap two rows in a NumPy array.

    Parameters
    ----------
    A : ndarray
        A NumPy array of shape (m, n), where `m` is the number of rows 
        and `n` is the number of columns.
    k : int
        The index of the first row to be swapped (0-based indexing).
    l : int
        The index of the second row to be swapped (0-based indexing).

    Returns
    -------
    B : ndarray
        A new NumPy array with rows `k` and `l` swapped. The input array `A` 
        remains unchanged.

    Notes
    -----
    The operation is performed by creating a copy of the input array to 
    ensure the original array is not modified.

    Examples
    --------
    >>> import numpy as np
    >>> A = np.array([[1, 2], [3, 4]])
    >>> row_swap(A, 0, 1)
    array([[3., 4.],
           [1., 2.]])
    """
    m = A.shape[0]  # m is the number of rows in A
    n = A.shape[1]  # n is the number of columns in A
    
    B = np.copy(A).astype('float64')
        
    for j in range(n):
        temp = B[k][j]
        B[k][j] = B[l][j]
        B[l][j] = temp
        
    return B


def row_scale(A: np.ndarray, k: int, scale: float) -> np.ndarray:
    """
    Scale a row of a NumPy array by a given factor.

    Parameters
    ----------
    A : ndarray
        A NumPy array of shape (m, n), where `m` is the number of rows 
        and `n` is the number of columns.
    k : int
        The index of the row to be scaled (0-based indexing).
    scale : float
        The factor by which to scale the entries of row `k`.

    Returns
    -------
    B : ndarray
        A new NumPy array with row `k` scaled by `scale`. The input array `A` 
        remains unchanged.

    Notes
    -----
    The operation is performed by creating a copy of the input array to 
    ensure the original array is not modified.

    Examples
    --------
    >>> import numpy as np
    >>> A = np.array([[1, 2], [3, 4]])
    >>> row_scale(A, 1, 2)
    array([[ 1.,  2.],
           [ 6.,  8.]])
    """
    m = A.shape[0]  # m is the number of rows in A
    n = A.shape[1]  # n is the number of columns in A
    
    B = np.copy(A).astype('float64')

    for j in range(n):
        B[k][j] *= scale
        
    return B


def row_add(A: np.ndarray, k: int, l: int, scale: float) -> np.ndarray:
    """
    Add a scaled version of one row to another in a NumPy array.

    Parameters
    ----------
    A : ndarray
        A NumPy array of shape (m, n), where `m` is the number of rows 
        and `n` is the number of columns.
    k : int
        The index of the row to be scaled and added (0-based indexing).
    l : int
        The index of the row to be modified (0-based indexing).
    scale : float
        The factor by which to scale the entries of row `k` before adding 
        them to row `l`.

    Returns
    -------
    B : ndarray
        A new NumPy array with row `l` modified. The values of row `l` 
        will be updated by adding the values of row `k`, scaled by `scale`. 
        The input array `A` remains unchanged.

    Notes
    -----
    The operation is performed by creating a copy of the input array to 
    ensure the original array is not modified.

    Examples
    --------
    >>> import numpy as np
    >>> A = np.array([[1, 2], [3, 4]])
    >>> row_add(A, 0, 1, 2)
    array([[ 1.,  2.],
           [ 5.,  8.]])
    """
    m = A.shape[0]  # m is the number of rows in A
    n = A.shape[1]  # n is the number of columns in A
    
    B = np.copy(A).astype('float64')
        
    for j in range(n):
        B[l][j] += B[k][j] * scale
        
    return B
