# Введение в NumPy и Matplotlib
## Кому

Этот ноутбук был сделан для студентов первого курса ФКН ВШЭ ПМИ, у которых не было курса по Python или которые не имеют представления о том, как работать с такими фундаментальными и нужными для последующих лабораторных работ и всего анализа данных библиотеками как Numpy и Matplotlib, поэтому если вы не очень разбираетесь в том, как работать с этими библиотеками, рекомендуем пройти этот Introduction ноутбук, это сильно пригодится при выполнении наших лабораторных и потом в анализе данных
## Мотивация

Современная математика и машинное обучение тесно связаны с работой с данными.  
- В математике нужно уметь работать с векторами, матрицами, функциями и проводить вычислительные эксперименты.  
- В анализе данных мы имеем дело с большими наборами чисел: результаты экспериментов, статистика, изображения, временные ряды.  

Чтобы эффективно решать такие задачи, в Python используются две ключевые библиотеки:  

### NumPy
- Основной инструмент для научных вычислений.  
- Позволяет работать с векторами и матрицами, выполнять операции линейной алгебры, статистики, генерации случайных чисел.  
- Работает быстрее и удобнее, чем стандартные структуры Python.  
- Можно думать о NumPy как о «математическом калькуляторе», который умеет работать сразу с большими массивами данных.  

### Matplotlib
- Основной инструмент для визуализации данных.  
- Данные сами по себе — это числа, и их трудно понять «на глаз».  
- Графики позволяют увидеть закономерности, форму функции, динамику процесса.  
- Matplotlib делает математику и данные наглядными.  

---

### В целом
NumPy и Matplotlib образуют базовый набор инструментов:  
- **NumPy** отвечает за вычисления;  
- **Matplotlib** — за визуализацию;  
- в связке они позволяют моделировать, анализировать и понимать задачи математики и машинного обучения.  

**Примеры применения в реальности**:  
- Физики — моделирование процессов и построение графиков экспериментов.  
- Экономисты — анализ временных рядов и прогнозирование.  
- Машинное обучение — NumPy лежит в основе PyTorch и TensorFlow, а Matplotlib используется для анализа распределений данных и результатов моделей.  

In [None]:
import numpy as np
from matplotlib import pyplot as plt

## Часть 1. NumPy

NumPy — это быстрая C-обёртка для работы с массивами и матрицами в Python.  
Вместо обычных списков, которые медленные и неудобные для математики,  
NumPy хранит данные компактно и позволяет применять операции сразу ко всему массиву.

Эта библиотека используется везде, где есть числа:  
- в математике — для работы с векторами, матрицами, вычисления интегралов и решений систем уравнений;  
- в анализе данных — для обработки и фильтрации больших наборов чисел;  
- в машинном обучении — как фундамент для всех современных библиотек (sklearn, PyTorch, TensorFlow).

Проще говоря: NumPy — это язык математики в Python, позволяющий быстро считать то, что на бумаге выглядит как формулы.

**P. S.**  
Мы понимаем, что в этом ноутбуке мы не сможем охватить все возможности и методы NumPy.  
Здесь мы даём только базовые приёмы, которые покрывают 70-80% задач, встречающихся в математике и машинном обучении.  

 Для более глубокого изучения всегда стоит обращаться к официальной документации:  
- [NumPy Documentation](https://numpy.org/doc/stable/)  
- [NumPy Quickstart Tutorial](https://numpy.org/doc/stable/user/quickstart.html)  


## 1. Создание массивов в NumPy

**Интуиция:**  
В математике мы работаем с последовательностями, векторами и матрицами.  
В чистом Python можно использовать списки (`[1,2,3]`), но они **медленные и неудобные для математики**.  
NumPy вводит структуру **ndarray** – быстрый и компактный массив, который поддерживает математические операции напрямую.  

Представьте так:  
- `list` — это «мешок элементов» → гибкий, но не предназначен для линейной алгебры.  
- `numpy.array` — это «математический объект» → ведёт себя как векторы и матрицы в математике.  


In [None]:
# 1. From a Python list
arr = np.array([1, 2, 3, 4, 5])
print("Array:", arr)  # [1 2 3 4 5]
print("Type:", type(arr))  # <class 'numpy.ndarray'>

# 2. Arrays filled with zeros and ones
zeros = np.zeros((2, 3))  # 2x3 matrix of zeros
ones = np.ones((2, 3))  # 2x3 matrix of ones
print("Zeros:\n", zeros)
print("Ones:\n", ones)

# 3. Ranges of numbers
arange_arr = np.arange(0, 10, 2)  # start=0, stop<10, step=2
linspace_arr = np.linspace(0, 1, 5)  # 5 points evenly spaced from 0 to 1
print("Arange:", arange_arr)
print("Linspace:", linspace_arr)


### Минимальное задание
1. Создайте массив NumPy с числами от 5 до 15 (включительно).  
2. Создайте матрицу 3x3, заполненную единицами.  
3. Выведите оба массива.  


In [None]:
# Waiting for implement (。-ω-)zzz

## 2. Размерность, форма и типы данных

**Интуиция:**  
В математике важно понимать, что у вектора или матрицы есть размерность.  
В NumPy каждый массив имеет:  
- **shape** — форму (например, 2 строки × 3 столбца),  
- **ndim** — количество измерений (ось X, Y, Z и т.д.),  
- **dtype** — тип элементов (целые, числа с плавающей точкой и т.п.).  

Эти свойства особенно важны в машинном обучении:  
например, данные изображения могут храниться в массиве вида `[batch, channels, height, width]`.  


In [None]:
# Example: 2D array (matrix)
a = np.array([[1, 2, 3], [4, 5, 6]])

print("Array:\n", a)

print("Shape:", a.shape)  # (2, 3) → 2 rows, 3 columns
print("Dimensions:", a.ndim)  # 2D array
print("Data type:", a.dtype)  # usually int64 or float64
print("Number of elements:", a.size)  # total elements


### Минимальное задание
1. Создайте массив `arr` размером 4×5, заполненный нулями.  
2. Выведите его форму (`shape`), количество измерений (`ndim`) и тип данных (`dtype`).  


In [None]:
# Waiting for implement (。-ω-)zzz

## 3. Индексация и срезы

**Интуиция:**  
Чтобы работать с векторами и матрицами, нужно уметь обращаться к отдельным элементам, строкам и столбцам.  
В NumPy это делается через индексы и срезы, как в обычных списках, но для многомерных массивов это особенно удобно.  

- Одномерный массив: `arr[2]` — элемент с индексом 2.  
- Срезы: `arr[2:5]` — элементы с 2 по 4.  
- Двумерный массив: `matrix[1, 2]` — элемент на 2-й строке и 3-м столбце.  
- Срезы в матрицах: `matrix[:, 0]` — первый столбец, `matrix[0, :]` — первая строка.  

Эти операции важны в ML, потому что данные (например, изображения) часто хранятся в многомерных массивах, и мы выбираем отдельные каналы или части batch’а.  


In [None]:
# 1D example
arr = np.arange(10)
print("Array:", arr)
print("Element at index 3:", arr[3])  # single element
print("Slice 2:6:", arr[2:6])  # slice of elements
print("Every second element:", arr[::2])  # step slicing

# 2D example
matrix = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

print("\nMatrix:\n", matrix)
print("Element (1,2):", matrix[1, 2])  # row 1, col 2
print("First column:", matrix[:, 0])  # all rows, col 0
print("Second row:", matrix[1, :])  # row 1, all columns


### Минимальное задание
1. Создайте массив чисел от 0 до 20.  
2. Возьмите из него:  
   - срез с 5-го по 10-й элемент,  
   - каждый третий элемент,  
   - последний элемент массива.  
3. Создайте матрицу 4×4 из чисел 1–16 и выведите её главную диагональ.  


In [None]:
# Waiting for implement (。-ω-)zzz

## 4. Изменение формы массива

**Интуиция:**  
В машинном обучении данные почти всегда хранятся в многомерных массивах (тензорах).  
Например, изображение может иметь форму `[height, width, channels]`, а набор изображений — `[batch, height, width, channels]`.  

Иногда нужно «переупаковать» данные:  
- **reshape** — меняем форму массива без изменения данных;  
- **ravel / flatten** — делаем массив одномерным;  
- **expand_dims / squeeze** — добавляем или убираем измерения (например, превращаем в batch).  

Это ключевой навык: например, без `reshape` невозможно реализовать ни полносвязный слой, ни свёртку в ML, которые используется в архитектуре сверточных нейронных сетей


In [None]:
# Example array
arr = np.arange(12)
print("Original:", arr)

# Reshape: change form to 3x4
reshaped = arr.reshape(3, 4)
print("\nReshaped to 3x4:\n", reshaped)

# Flatten: make it 1D again
flat = reshaped.flatten()  # copy
print("\nFlattened:", flat)

# Ravel: also make it 1D but as a view (not copy)
ravelled = reshaped.ravel()
print("\nRavelled:", ravelled)

# Expand dimensions (like adding batch axis)
expanded = np.expand_dims(arr, axis=0)
print("\nExpanded shape:", expanded.shape)  # (1, 12)

# Squeeze: remove dimensions of size 1
squeezed = np.squeeze(expanded)
print("Squeezed shape:", squeezed.shape)  # (12,)

### Минимальное задание
1. Создайте массив чисел от 1 до 24.  
2. Преобразуйте его в матрицу размера 4×6.  
3. Преобразуйте матрицу в тензор формы (2, 3, 4).  
4. Добавьте в этот тензор фиктивную размерность «batch» спереди.  


In [None]:
# Waiting for implement (。-ω-)zzz

## 5. Broadcasting

**Интуиция:**  
Broadcasting — это правило, по которому NumPy выполняет операции с массивами разной формы.  
Идея простая: если размеры не совпадают, NumPy пытается «растянуть» (broadcast) меньший массив до нужной формы, не создавая копий данных.  

Примеры:  
- Вектор + скаляр → каждый элемент вектора увеличивается на число.  
- Матрица + вектор → вектор «растягивается» по строкам или столбцам.  

В ML это используется постоянно:  
- прибавление bias-вектора ко всем объектам в batch,  
- нормализация признаков,  
- операции над каналами изображения.


In [None]:
# Example 1: vector + scalar
x = np.array([1, 2, 3])
print("x + 10 =", x + 10)  # each element increased by 10

# Example 2: matrix + vector
M = np.ones((3, 3))
v = np.array([1, 2, 3])
print("\nMatrix:\n", M)
print("Vector:", v)
print("M + v =\n", M + v)  # vector broadcasted along rows

# Example 3: 2D + 1D along another axis
col_vec = np.array([[1], [2], [3]])  # shape (3,1)
print("\nM + col_vec =\n", M + col_vec)  # broadcasted along columns


### Минимальное задание
1. Создайте матрицу 4×4 из единиц.  
2. Создайте вектор длины 4: `[1, 2, 3, 4]`.  
3. Прибавьте этот вектор к каждой строке матрицы (с помощью broadcasting).  


In [None]:
# Waiting for implement (。-ω-)zzz

## 6. Арифметические операции

**Интуиция:**  
NumPy позволяет выполнять арифметику сразу со всем массивом, без циклов.  
Это называется **векторизация**: операции применяются покомпонентно (element-wise).  

Что умеем:  
- сложение, вычитание, умножение, деление, возведение в степень;  
- сравнения (`>`, `<`, `==`) → возвращают булев массив.  

В ML это очень важно:  
- умножение весов на входные данные,  
- вычисление функций активации,  
- быстрая фильтрация данных.


In [None]:
x = np.array([1, 2, 3, 4])
y = np.array([10, 20, 30, 40])

# Arithmetic operations
print("x + y =", x + y)  # element-wise addition
print("x * y =", x * y)  # element-wise multiplication
print("x ** 2 =", x**2)  # element-wise power
print("y / x =", y / x)  # element-wise division

# Comparisons
print("y > 15:", y > 15)  # boolean array
print("x == 2:", x == 2)  # True at index where x equals 2


### Минимальное задание
1. Создайте массив из чисел `[2, 4, 6, 8]`.  
2. Возведите каждый элемент в квадрат.  
3. Проверьте, какие элементы больше 20 (результат должен быть булев массив).  


In [None]:
# Waiting for implement (。-ω-)zzz

## 7. Агрегации

**Интуиция:**  
Агрегация — это свёртка массива в одно число или в массив меньшей размерности.  
Мы можем суммировать, находить максимум, среднее и т.д.  

Главное: у агрегаций есть параметр `axis`.  
- Если не указывать `axis` → сворачивается весь массив.  
- Если указать `axis=0` → операция вдоль строк (по столбцам).  
- Если `axis=1` → операция вдоль столбцов (по строкам).  

В ML агрегации применяются постоянно:  
- усреднение по batch (`np.mean(..., axis=0)`),  
- нахождение максимального значения (например, предсказанного класса).  


In [None]:
M = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

print("Matrix:\n", M)

# Aggregations without axis
print("Sum:", np.sum(M))  # all elements
print("Mean:", np.mean(M))  # average of all
print("Max:", np.max(M))  # maximum element
print("Argmax:", np.argmax(M))  # index in flattened array

# Aggregations with axis
print("\nSum along axis=0 (per column):", np.sum(M, axis=0))
print("Sum along axis=1 (per row):", np.sum(M, axis=1))


### Минимальное задание
1. Создайте матрицу 4×4 из чисел 1–16.  
2. Найдите сумму всех элементов.  
3. Найдите среднее по каждой строке (используйте `axis`).  
4. Найдите максимум по каждому столбцу.  


In [None]:
# Waiting for implement (。-ω-)zzz

## 8. Универсальные функции (ufuncs)

**Интуиция:**  
В NumPy многие математические функции реализованы как **ufuncs** (universal functions).  
Они работают покомпонентно на всём массиве, без циклов.  

Примеры:  
- `np.sin`, `np.cos`, `np.exp`, `np.log`, `np.sqrt`.  
- Эти функции особенно важны в ML:  
  - экспонента и логарифм в softmax,  
  - сигмоида через `1 / (1 + np.exp(-x))`,  
  - квадратный корень для нормализации.


In [None]:
x = np.linspace(-2, 2, 5)  # 5 points between -2 and 2
print("x:", x)

print("sin(x):", np.sin(x))  # element-wise sine
print("exp(x):", np.exp(x))  # element-wise exponential
print("log(x+3):", np.log(x + 3))  # shifted log to avoid negatives
print("sqrt(x+2):", np.sqrt(x + 2))  # sqrt, works on arrays


### Минимальное задание
1. Создайте массив из чисел `[-1, 0, 1, 2]`.  
2. Вычислите для него экспоненту.  
3. Вычислите сигмоиду:  
   $$
   \sigma(x) = \frac{1}{1 + e^{-x}}
   $$ 


In [None]:
# Waiting for implement (。-ω-)zzz

## 9. Матричные операции

**Интуиция:**  
В NumPy есть разница между покомпонентным умножением (`*`) и матричным (`@` или `np.dot`).  

- **Element-wise** (`*`) — умножает элементы по индексам.  
- **Matrix multiplication** (`@` или `np.dot`) — выполняет линейное преобразование, как в математике.  

Эти операции — фундамент линейной алгебры.  
В ML они нужны для:  
- линейных (fully connected) слоёв: `y = X @ W + b`,  
- свёрток (частично реализуются через матричное умножение),  
- вычисления скалярных произведений.


In [None]:
# Example arrays
A = np.array([[1, 2], [3, 4]])

B = np.array([[5, 6], [7, 8]])

v = np.array([1, 2])

print("Matrix A:\n", A)
print("Matrix B:\n", B)

# Element-wise multiplication
print("\nA * B =\n", A * B)

# Matrix multiplication
print("\nA @ B =\n", A @ B)

# Dot product (vector inner product)
print("\nDot(v, v):", np.dot(v, v))

# Matrix-vector multiplication
print("\nA @ v =", A @ v)


### Минимальное задание
1. Создайте матрицу 2×3 и матрицу 3×2.  
2. Перемножьте их как матрицы (`@`).  
3. Создайте два вектора длины 3 и найдите их скалярное произведение.  


In [None]:
# Waiting for implement (。-ω-)zzz

## 10. Транспонирование и перестановка осей

**Интуиция:**  
Когда мы работаем с многомерными массивами (тензорами), часто нужно менять местами измерения.  
- Для матриц это обычное **транспонирование** (`.T`).  
- Для тензоров (3D, 4D и выше) используем `transpose`, `swapaxes`, `moveaxis`.  

В ML это критически важно:  
- изображение может храниться как `[batch, height, width, channels]` (TensorFlow)  
  или `[batch, channels, height, width]` (PyTorch).  
- При свёртке или при передаче данных между библиотеками нужно уметь менять порядок осей.


In [None]:
# Example: 2D transpose
A = np.array([[1, 2, 3], [4, 5, 6]])
print("Original A:\n", A)
print("Transposed A.T:\n", A.T)

# Example: 3D array
tensor = np.arange(24).reshape(2, 3, 4)
print("\nTensor shape:", tensor.shape)  # (2,3,4)

# Transpose: reorder dimensions
transposed = np.transpose(tensor, (1, 0, 2))
print("Transposed shape:", transposed.shape)  # (3,2,4)

# Swap two axes
swapped = np.swapaxes(tensor, 0, 1)
print("Swapaxes shape:", swapped.shape)  # (3,2,4)

# Move one axis to another position
moved = np.moveaxis(tensor, 0, -1)
print("Moveaxis shape:", moved.shape)  # (3,4,2)


### Минимальное задание
1. Создайте матрицу 3×2 и транспонируйте её.  
2. Создайте тензор формы (2, 4, 3).  
3. Поменяйте местами первую и последнюю ось.  


In [None]:
# Waiting for implement (。-ω-)zzz

## 11. Линейная алгебра

**Интуиция:**  
NumPy реализует основные методы линейной алгебры через модуль `np.linalg`.  
Это операции над матрицами и векторами, которые мы встречаем в математике и ML.  

Ключевые операции:  
- `np.linalg.norm` — длина (норма) вектора, «расстояние до нуля».  
- `np.linalg.inv` — обратная матрица.  
- `np.linalg.det` — определитель матрицы.  
- `np.linalg.solve` — решение системы линейных уравнений.  

### Где используется:  
- **Математика:** проверка обратимости матрицы, решение систем уравнений.  
- **ML (CV):** нормализация признаков (деление на норму).  
- **ML (NLP):** работа с матрицами эмбеддингов.  
- **Экономика/финансы:** системы линейных уравнений для моделей равновесия.  


In [None]:
# Example vector
v = np.array([3, 4])
print("Vector v:", v)
print("Norm of v:", np.linalg.norm(v))  # length = 5

# Example matrix
A = np.array([[2, 1], [1, 3]])

print("\nMatrix A:\n", A)
print("Determinant:", np.linalg.det(A))
print("Inverse:\n", np.linalg.inv(A))

# Solve linear system: Ax = b
b = np.array([5, 7])
x = np.linalg.solve(A, b)
print("\nSolution x:", x)

# Check result
print("Check A @ x =", A @ x)


### Минимальное задание
1. Создайте вектор `[1, -2, 2]` и найдите его норму.  
2. Создайте матрицу 7×7 (произвольную) и найдите её определитель.  
3. Решите систему уравнений:  
$$
\begin{cases}
3x + y = 7 \\
x - 2y = -1
\end{cases}
$$


In [None]:
# Waiting for implement (。-ω-)zzz

## 12. Генерация случайных чисел

**Интуиция:**  
Многие задачи в математике, науке и ML требуют генерации случайных чисел.  
NumPy предоставляет модуль `np.random` для этого.  

Примеры распределений:  
- `np.random.rand` — равномерное распределение на [0, 1).  
- `np.random.randn` — нормальное распределение (mean=0, std=1).  
- `np.random.randint` — случайные целые числа.  

### Где используется:  
- **ML:** инициализация весов, стохастический градиентный спуск (SGD).  
- **Статистика:** моделирование случайных процессов.  
- **Финансы:** Монте-Карло для оценки рисков.  
- **Физика:** моделирование траекторий частиц.  


In [None]:
# Uniform distribution [0,1)
print("Uniform [0,1):\n", np.random.rand(2, 3))

# Normal distribution mean=0, std=1
print("\nNormal distribution:\n", np.random.randn(2, 3))

# Random integers between 0 and 9
print("\nRandom integers:\n", np.random.randint(0, 10, (2, 3)))


### Минимальное задание
1. Сгенерируйте массив 5×5 случайных чисел из равномерного распределения [0,1).  
2. Сгенерируйте вектор длины 10 из нормального распределения.  
3. Сгенерируйте матрицу 3×4 из случайных целых чисел от 1 до 100.  

In [None]:
# Waiting for implement (。-ω-)zzz

## 13. Stacking и конкатенация

**Интуиция:**  
Иногда нужно объединить несколько массивов в один.  
NumPy предоставляет разные функции для этого:  

- `np.concatenate` — соединяет массивы вдоль выбранной оси.  
- `np.vstack`, `np.hstack` — вертикальная и горизонтальная склейка.  
- `np.stack` — объединяет массивы в новый измерение.  

### Где используется:  
- **ML (CV):** объединение изображений в batch.  
- **NLP:** сборка предложений в batch.  
- **Математика:** формирование блочных матриц.  
- **Практика:** объединение результатов экспериментов.  


In [None]:
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

# Concatenate 1D
print("Concatenate:", np.concatenate([a, b]))

# Vertical stack (make 2D)
print("\nVstack:\n", np.vstack([a, b]))

# Horizontal stack
print("\nHstack:", np.hstack([a, b]))

# Stack along new axis
print("\nStack (axis=0):\n", np.stack([a, b], axis=0))
print("Shape:", np.stack([a, b], axis=0).shape)


### Минимальное задание
1. Создайте два массива `[1,2,3]` и `[10,20,30]`.  
2. Объедините их в один массив через `concatenate`.  
3. Постройте матрицу 2×3, используя `vstack`.  
4. Объедините массивы в 2D массив формы (2,3) через `stack`.  


In [None]:
# Waiting for implement (。-ω-)zzz

## 14. Padding и slicing вручную

**Интуиция:**  
Иногда нужно обрезать или дополнить массив нулями/константой.  
В NumPy для этого есть:  

- **Slicing** — берём подмассив (например, обрезаем изображение).  
- **np.pad** — добавляем «рамку» вокруг массива.  

### Где используется:  
- **ML (CV):** паддинг при свёртках, чтобы сохранялся размер изображения.  
- **ML (NLP):** дополнение предложений до одинаковой длины.  
- **Математика:** работа с краевыми условиями в численных методах.  
- **Физика:** моделирование сетки с «фиктивными узлами» по краям.  


In [None]:
# Example: slicing (crop)
M = np.arange(1, 17).reshape(4, 4)
print("Original matrix:\n", M)

cropped = M[1:3, 1:3]  # take center 2x2
print("\nCropped 2x2:\n", cropped)

# Example: padding
padded = np.pad(M, pad_width=1, mode="constant", constant_values=0)
print("\nPadded matrix (zeros around):\n", padded)

# Example: padding with another value
padded_5 = np.pad(M, pad_width=2, mode="constant", constant_values=5)
print("\nPadded with 5:\n", padded_5)


### Минимальное задание
1. Создайте матрицу 5×5 из чисел 1–25.  
2. Вырежьте из неё центральную матрицу 3×3.  
3. Добавьте к этой 3×3 матрице рамку из нулей шириной 1.  


In [None]:
# Waiting for implement (。-ω-)zzz

## Часть 2. Matplotlib

Matplotlib — это главная библиотека для построения графиков и визуализации данных в Python.  
Если NumPy позволяет «посчитать» формулы и массивы чисел, то Matplotlib даёт возможность эти числа **увидеть**.  

Эта библиотека применяется в самых разных областях:  
- в математике — для построения графиков функций и визуализации решений;  
- в анализе данных — для наглядного представления распределений, статистик, трендов;  
- в машинном обучении — для контроля обучения моделей (графики ошибки и точности), а также для визуализации изображений, эмбеддингов и результатов работы нейросетей.  

Проще говоря: Matplotlib — это глаза математика и исследователя, позволяющие превратить набор чисел в картину.  

**P. S.**  
Мы понимаем, что в этом ноутбуке мы не охватим все возможности и стили Matplotlib.  
Здесь мы разберём базовые приёмы, которые покрывают 70–80% практических задач, встречающихся в математике, науке и машинном обучении.  

Для более глубокого изучения всегда стоит обращаться к официальной документации:  
- [Matplotlib Documentation](https://matplotlib.org/stable/contents.html)  
- [Matplotlib Pyplot Tutorial](https://matplotlib.org/stable/tutorials/introductory/pyplot.html)  


## 1. Базовый график

**Интуиция:**  
Самая простая визуализация в Matplotlib — это линейный график.  
Обычно мы задаём точки по оси `x` и по оси `y`, а библиотека соединяет их линией.  

Важно уметь подписывать оси, давать заголовок и добавлять легенду —  
тогда графики будут не только красивыми, но и понятными.  

### Где используется:  
- **Математика:** графики функций (например, $y = sin(x)$).  
- **Наука/инженерия:** рост значения по времени, графики экспериментов.  
- **ML:** кривые обучения — как меняется ошибка и точность на каждой эпохе.  


In [None]:
# Data
x = np.linspace(-5, 5, 100)  # 100 points from -5 to 5
y = x**2  # y = x^2

# Basic plot
plt.plot(x, y, label="y = x^2")

# Add labels and title
plt.xlabel("x")
plt.ylabel("y")
plt.title("Basic function plot")
plt.legend()

# Show the plot
plt.show()


### Минимальное задание
1. Постройте график функции y = sin(x) на отрезке [-2π, 2π].  
2. Подпишите оси и добавьте заголовок.  
3. Добавьте легенду с подписью `"y = sin(x)"`.  


In [None]:
# Waiting for implement (。-ω-)zzz

## 2. Стиль и оформление

**Интуиция:**  
График становится понятнее, если выделить разные линии цветами, маркерами и типами линий.  
В Matplotlib это можно сделать прямо в функции `plot` с помощью параметров.  

Полезные параметры:  
- `color` или короткая запись `'r'`, `'g'`, `'b'` и т.п.  
- `linestyle` или короткая запись `'--'`, `'-.'`, `':'`.  
- `marker` для точек: `'o'`, `'^'`, `'s'`.  
- `linewidth` для толщины линии.  
- `plt.grid(True)` — включить сетку.  

### Где используется:  
- **Математика:** сравнение нескольких функций на одном графике.  
- **ML:** отображение сразу train loss и val loss.  
- **Инженерия:** разные кривые экспериментов на одном рисунке.  


In [None]:
x = np.linspace(0, 10, 50)

y1 = np.sin(x)
y2 = np.cos(x)

plt.plot(x, y1, color="red", linestyle="--", marker="o", label="sin(x)")
plt.plot(x, y2, color="blue", linestyle="-.", marker="s", label="cos(x)")

plt.xlabel("x")
plt.ylabel("y")
plt.title("Styled plots: sin vs cos")
plt.grid(True)
plt.legend()
plt.show()


### Минимальное задание
1. Постройте график функций `y = x` и `y = x^2` на отрезке [0, 5].  
2. Нарисуйте их разными цветами и стилями линий.  
3. Добавьте маркеры на каждую точку для графика `y = x`.  
4. Включите сетку на графике.  


In [None]:
# Waiting for implement (。-ω-)zzz

## 3. Scatter plot (облако точек)

**Интуиция:**  
`plt.scatter` используется для отображения набора точек.  
Каждая точка задаётся координатами `(x, y)`.  
Можно управлять цветом, размером и прозрачностью точек.  

### Где используется:  
- **Математика:** визуализация набора решений, точек на плоскости.  
- **Статистика:** диаграмма рассеяния для проверки зависимости между признаками.  
- **ML:** визуализация данных в 2D (например, PCA или t-SNE для эмбеддингов).  


In [None]:
# Generate random points
x = np.random.randn(100)  # normal distribution
y = np.random.randn(100)

plt.scatter(x, y, color="purple", alpha=0.6, marker="o", label="points")

plt.xlabel("X axis")
plt.ylabel("Y axis")
plt.title("Scatter plot of random points")
plt.legend()
plt.show()


### Минимальное задание
1. Сгенерируйте 200 случайных точек с помощью `np.random.randn`.  
2. Нарисуйте scatter plot этих точек.  
3. Попробуйте изменить размер и цвет точек (параметры `s` и `c`).  


In [None]:
# Waiting for implement (。-ω-)zzz

## 4. Bar chart (столбчатая диаграмма)

**Интуиция:**  
Столбчатая диаграмма (`plt.bar`) используется для отображения категориальных данных.  
Каждой категории соответствует столбец, высота которого равна значению.  

### Где используется:  
- **Математика:** частоты появления элементов или распределение значений.  
- **Статистика/анализ данных:** сравнение категорий (например, число студентов на разных факультетах).  
- **ML:** анализ важности признаков (feature importance), распределения классов.  


In [None]:
# Categories and values
categories = ["A", "B", "C", "D"]
values = [10, 24, 36, 18]

plt.bar(categories, values, color="orange")

plt.xlabel("Categories")
plt.ylabel("Values")
plt.title("Basic bar chart")
plt.show()


### Минимальное задание
1. Постройте bar chart для категорий: `"Cat", "Dog", "Bird"` со значениями `[12, 30, 7]`.  
2. Подпишите оси и добавьте заголовок.  
3. Попробуйте изменить цвет столбцов.  


In [None]:
# Waiting for implement (。-ω-)zzz

## 5. Histogram (гистограмма распределения)

**Интуиция:**  
Гистограмма показывает, как распределены данные:  
ось X делится на интервалы (bins), и для каждого интервала строится столбец,  
высота которого равна количеству элементов, попавших в этот интервал.  

### Где используется:  
- **Математика/статистика:** визуализация распределения случайных величин.  
- **ML:** проверка нормальности признаков, распределения ошибок модели.  
- **Финансы:** распределение доходностей акций.  


In [None]:
# Generate normal distribution
data = np.random.randn(1000)  # 1000 samples

plt.hist(data, bins=30, color="skyblue", edgecolor="black", alpha=0.7)

plt.xlabel("Value")
plt.ylabel("Frequency")
plt.title("Histogram of normal distribution")
plt.show()


### Минимальное задание
1. Сгенерируйте 500 случайных чисел из равномерного распределения [0,1).  
2. Постройте гистограмму с 20 корзинами (`bins=20`).  
3. Измените цвет и добавьте рамку (`edgecolor`).  


In [None]:
# Waiting for implement (。-ω-)zzz

## 6. Subplots (несколько графиков на одном рисунке)

**Интуиция:**  
Иногда нужно сравнить несколько графиков рядом.  
Для этого используются **subplots** — сетка из нескольких областей для рисования.  

Варианты:  
- `plt.subplot(rows, cols, index)` — быстрый способ.  
- `plt.subplots(rows, cols)` — более удобный вариант, возвращает фигуру и массив осей.  

### Где используется:  
- **Математика:** сравнение разных функций на одном интервале.  
- **ML:** отображение train loss и val loss рядом.  
- **Наука/инженерия:** разные экспериментальные графики на одном рисунке.  


In [None]:
x = np.linspace(0, 10, 100)
y1 = np.sin(x)
y2 = np.cos(x)

fig, axes = plt.subplots(1, 2, figsize=(10, 4))

# First subplot
axes[0].plot(x, y1, color="red")
axes[0].set_title("sin(x)")
axes[0].set_xlabel("x")
axes[0].set_ylabel("y")

# Second subplot
axes[1].plot(x, y2, color="blue")
axes[1].set_title("cos(x)")
axes[1].set_xlabel("x")
axes[1].set_ylabel("y")

plt.tight_layout()
plt.show()


### Минимальное задание
1. Создайте массив `x` от 0 до 5 с шагом 0.1.  
2. Постройте два графика рядом:  
   - первый — `y = x`,  
   - второй — `y = x^2`.  
3. Подпишите заголовки и оси у каждого графика.  


In [None]:
# Waiting for implement (。-ω-)zzz

## 7. Изображения (imshow)

**Интуиция:**  
Функция `plt.imshow` используется для отображения двумерных массивов как картинок.  
Значения массива интерпретируются как интенсивности (цвета).  

### Где используется:  
- **Математика:** визуализация матриц и тепловых карт.  
- **ML (CV):** отображение изображений (например, из датасета MNIST).  
- **Наука/инженерия:** тепловые карты, спектры, распределения по сетке.  


In [None]:
# Example: simple matrix
mat = np.arange(1, 17).reshape(4, 4)

plt.imshow(mat, cmap="viridis")
plt.colorbar(label="Value")  # add color scale
plt.title("Matrix visualization with imshow")
plt.show()


### Минимальное задание
1. Создайте матрицу 10×10 из случайных чисел (np.random.rand).  
2. Отобразите её с помощью `imshow`.  
3. Попробуйте разные цветовые карты (`cmap="gray"`, `"plasma"`).  


In [None]:
# Waiting for implement (。-ω-)zzz

## 8. Сохранение графиков (savefig)

**Интуиция:**  
Иногда график нужно не только показать на экране, но и сохранить для отчёта или статьи.  
В Matplotlib это делается с помощью функции `plt.savefig("имя_файла.png")`.  

Поддерживаются разные форматы: PNG, JPG, PDF, SVG и другие.  
Качество можно регулировать параметром `dpi`.  

### Где используется:  
- **Учёба:** вставка графиков в лабораторные отчёты.  
- **Наука:** подготовка картинок для публикаций.  
- **ML/инженерия:** сохранение графиков обучения моделей.  


In [None]:
x = np.linspace(0, 2 * np.pi, 100)
y = np.sin(x)

plt.plot(x, y, label="sin(x)")
plt.xlabel("x")
plt.ylabel("y")
plt.title("Saving a plot example")
plt.legend()

# Save to file
plt.savefig("sine_plot.png", dpi=150)
plt.show()


### Минимальное задание
1. Постройте график `y = cos(x)` на интервале [0, 2π].  
2. Добавьте подписи осей, заголовок и легенду.  
3. Сохраните график в файл `"cosine_plot.png"`.  


In [None]:
# Waiting for implement (。-ω-)zzz