# Лекция №9: NumPy: Векторные вычисления и линейная алгебра

### Цели лекции:
1.  **Понять преимущества NumPy:** Осознать, почему NumPy является стандартом для числовых вычислений в Python, сравнив его производительность со стандартными списками.
2.  **Освоить основы `ndarray`:** Научиться создавать массивы, понимать их атрибуты, выполнять индексацию и срезы.
3.  **Изучить векторизацию и вещание:** Понять, как NumPy выполняет операции над массивами целиком (векторизация) и как он работает с массивами разной формы (вещание).
4.  **Применить NumPy для линейной алгебры:** Научиться решать системы линейных алгебраических уравнений (СЛАУ) и выполнять основные матричные операции.

## Часть 1. Основы NumPy

**NumPy** (Numerical Python) — это фундаментальная библиотека для научных вычислений в Python. Ее основной объект — мощный N-мерный массив `ndarray`.

### 1.1. Почему NumPy, а не списки? Производительность

Массивы NumPy хранят данные одного типа и написаны на C, что делает их чрезвычайно быстрыми и эффективными по памяти.

In [None]:
import numpy as np
import time

size = 1_000_000

# Операции со списками Python
list1 = range(size)
list2 = range(size)
start_time = time.time()
result_list = [(a * b) for a, b in zip(list1, list2)]
end_time = time.time()
print(f"Время выполнения для списков: {end_time - start_time:.6f} секунд")

# Операции с массивами NumPy
arr1 = np.arange(size)
arr2 = np.arange(size)
start_time = time.time()
result_arr = arr1 * arr2
end_time = time.time()
print(f"Время выполнения для NumPy:   {end_time - start_time:.6f} секунд")

### 1.2. Создание массивов

Способов создать массив множество. Рассмотрим основные.

- `np.array(list)`: из списка Python.
- `np.arange(start, stop, step)`: аналог `range` для создания последовательностей.
- `np.linspace(start, stop, num)`: `num` равноудаленных точек в диапазоне.
- `np.zeros(shape)`, `np.ones(shape)`: массивы, заполненные нулями или единицами.
- `np.full(shape, fill_value)`: массив, заполненный значением `fill_value`.
- `np.eye(N)`: единичная матрица NxN (единицы на главной диагонали).
- `np.diag([v1, v2, ...])`: диагональная матрица с заданными значениями на диагонали.
- `np.random.randint(low, high, size)`: массив случайных целых чисел.

In [None]:
# Создание из списка
my_list = [[1, 2], [3, 4]]
matrix_from_list = np.array(my_list)
print(f"Матрица из списка:\n{matrix_from_list}")

In [None]:
# Создание диагональной матрицы
diag_matrix = np.diag([5, 10, 15])
print(f"\nДиагональная матрица:\n{diag_matrix}")

In [None]:
# Создание матрицы, заполненной одним числом
full_matrix = np.full((2, 3), 7)
print(f"\nМатрица, заполненная числом 7:\n{full_matrix}")

### 1.3. Атрибуты массива

Каждый массив NumPy имеет важные атрибуты, которые описывают его структуру:
-   `.shape`: кортеж, описывающий размер массива по каждой оси (измерению). Например, `(3, 4)` для матрицы из 3 строк и 4 столбцов.
-   `.ndim`: целое число, количество осей (измерений) массива. Для вектора — 1, для матрицы — 2.
-   `.size`: общее количество элементов в массиве.
-   `.dtype`: тип данных элементов, хранящихся в массиве (например, `int64`, `float64`).

In [None]:
matrix = np.arange(0, 12).reshape(3, 4)
print(f"Матрица:\n{matrix}")

print(f"Форма (shape): {matrix.shape}")
print(f"Размерность (ndim): {matrix.ndim}")
print(f"Количество элементов (size): {matrix.size}")
print(f"Тип данных (dtype): {matrix.dtype}")

### 1.4. Индексация и срезы

Работает похоже на списки, но с возможностью индексировать по нескольким осям одновременно.

In [None]:
data = np.arange(1, 26).reshape(5, 5)
print(f"Исходная матрица:\n{data}\n")

# Элемент в 3-й строке (индекс 2), 5-м столбце (индекс 4)
element = data[2, 4]
print(f"Элемент [2, 4]: {element}\n")

# Подматрица: строки с 0 по 1, столбцы с 3 по 4
submatrix = data[0:2, 3:5]
print(f"Подматрица [0:2, 3:5]:\n{submatrix}")

### 1.5. Поэлементные операции и вещание (Broadcasting)

**Векторизация** — это выполнение операций над массивами целиком, без циклов. Все стандартные арифметические операторы (`+`, `-`, `*`, `/`) работают поэлементно. 

In [None]:
# Операции между массивами одинаковой формы
A = np.array([[1, 2], [3, 4]])
B = np.array([[10, 20], [30, 40]])

print(f"A + B:\n{A + B}\n")
print(f"A * B:\n{A * B}")

**Вещание (Broadcasting)** — это механизм, который позволяет NumPy выполнять операции над массивами разной формы. Меньший массив "растягивается" (без реального копирования в памяти), чтобы соответствовать форме большего.

#### Случай 1: Массив и скаляр

In [None]:
matrix = np.arange(1, 10).reshape(3, 3)
print(f"Исходная матрица:\n{matrix}\n")

# Скаляр (число 100) "растягивается" до формы 3x3 и прибавляется к каждому элементу
result = matrix + 100
print(f"Матрица + 100:\n{result}")

#### Случай 2: Матрица и вектор

In [None]:
matrix = np.arange(1, 10).reshape(3, 3)
vector = np.array([100, 200, 300])
print(f"Исходная матрица:\n{matrix}\n")
print(f"Вектор: {vector}\n")

# Вектор формы (3,) прибавляется к матрице формы (3, 3).
# NumPy 'растягивает' вектор, как если бы он был скопирован для каждой строки.
result = matrix + vector
print(f"Матрица + вектор:\n{result}")

### 1.6. Условный выбор (Boolean Indexing)

**Аналогия:** Представьте, что у вас есть трафарет (маска) с отверстиями. Накладывая его на массив, вы видите только те элементы, которые находятся под отверстиями. В NumPy таким трафаретом является массив из булевых значений `True` и `False`.

**Процесс:**
1.  Создается условие (например, `data > 50`).
2.  NumPy применяет это условие к каждому элементу и создает новый массив (маску), состоящий из `True` (где условие выполнилось) и `False` (где не выполнилось).
3.  Эта маска используется в квадратных скобках для выбора только тех элементов исходного массива, которые соответствуют `True`.

In [None]:
data = np.array([[10, 60], [80, 40]])
print(f"Исходный массив:\n{data}\n")

# 1. Создаем условие
condition = data > 50
print(f"Маска (результат условия):\n{condition}\n")

# 2. Применяем маску
filtered_data = data[condition]
print(f"Отфильтрованные данные: {filtered_data}")

# Комбинирование условий: & (И), | (ИЛИ)
combined_mask = (data > 20) & (data < 70)
print(f"\nЭлементы > 20 И < 70: {data[combined_mask]}")

## Часть 2. Линейная алгебра с NumPy

NumPy — это мощный инструмент для решения задач линейной алгебры. Большинство функций для этого находится в подмодуле `np.linalg`.

### 2.1. Матричное умножение

**Важно!** Оператор `*` выполняет **поэлементное** умножение. Для **матричного** умножения по правилам линейной алгебры существует три способа:

1.  **Оператор `@`**: Современный и предпочтительный способ.
2.  **Функция `np.dot()`**: Классический способ.
3.  **Метод `.dot()`**: Метод самого объекта `ndarray`.

In [None]:
A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])

# Способ 1: @
result1 = A @ B
print(f"Результат (A @ B):\n{result1}\n")

# Способ 2: np.dot()
result2 = np.dot(A, B)
print(f"Результат (np.dot(A, B)):\n{result2}\n")

# Способ 3: .dot()
result3 = A.dot(B)
print(f"Результат (A.dot(B)):\n{result3}")

### 2.2. Решение систем линейных алгебраических уравнений (СЛАУ)

Любую СЛАУ можно представить в матричном виде **Ax = B**, где:
-   **A** — матрица коэффициентов при неизвестных.
-   **x** — вектор-столбец неизвестных.
-   **B** — вектор-столбец свободных членов.

**Пример:** Решим систему:
```
2x + 3y = 8
4x + 1y = 6
```

#### Способ 1: `np.linalg.solve()` (Рекомендуемый)

Это самый быстрый и численно стабильный способ для решения невырожденных квадратных систем.

In [None]:
# 1. Создаем матрицу коэффициентов A
A = np.array([[2, 3], 
              [4, 1]])

# 2. Создаем вектор свободных членов B
B = np.array([8, 6])

# 3. Решаем систему
solution = np.linalg.solve(A, B)
print(f"Решение (x, y) через solve: {solution}")

# 4. Проверка
check = A @ solution
print(f"Проверка (A @ x): {check}")
print(f"Решение верное: {np.allclose(check, B)}")

#### Способ 2: Через обратную матрицу (Не рекомендуется)

Математически, если `Ax = B`, то `x = A⁻¹B`. Этот способ можно реализовать, но он менее эффективен и может приводить к большим ошибкам в вычислениях, особенно для плохо обусловленных матриц.

In [None]:
# 1. Находим обратную матрицу A⁻¹
A_inv = np.linalg.inv(A)

# 2. Умножаем на B
solution_inv = A_inv @ B
print(f"Решение (x, y) через inv: {solution_inv}")
print(f"Решения совпадают: {np.allclose(solution, solution_inv)}")

## Итог

NumPy — это основа для всех числовых вычислений в Python. Умение эффективно работать с `ndarray`, понимать векторизацию и применять функции из `np.linalg` является обязательным навыком для любого специалиста в области анализа данных и машинного обучения.