# Семинар 1: знакомство с NumPy


## Немного про Jupyter notebook

Полная документация: https://devpractice.ru/python-lesson-6-work-in-jupyter-notebook/

---
В Jupyter Notebook есть два режима работы: режим _команд_ и режим _редактирования_

_Командный_ режим нужен для того, чтобы взаимодействовать и управлять ячейками (добавлять, удалять, запускать, копировать, ...)

В режиме _редактирования_ вы меняете содержимое ячейки.

Ячейки бывают двух основных типов, _код_ и _разметка_

### Полезные команды

(находясь в командном режиме)

- `a` - добавить пустую ячейку сверху

- `b` - добавить пустую ячейку снизу
- `c` - скопировать текущую ячейку
- `v` - вставить скопированную ячейку
- `d` - удалить текущую ячейку
- `x` - вырезать (удалить и скопировать) текущую ячейку
- `m` - изменить тип выбранной ячейки на "разметка"
- `y` - изменить тип выбранной ячейки на "код"
- `z` - отменить последнее действие


- `Enter` - начать редактировать выбранную ячейку

(будучи в режим редактирования ячейки)
- `esc` - вернуться в командный режим

(будучи в любом режиме)

- `Ctrl + Enter` - запустить выбранную ячейку
- `Shift + Enter` - запустить выбранную ячейку и выбрать следующую

In [None]:
# ячейка с кодом, при выполнении которой появится output
2 + 2

4

*А это ячейка с неразмеченным текстом (markdown формат)*

In [None]:
# your code

[Здесь](https://athena.brynmawr.edu/jupyter/hub/dblank/public/Jupyter%20Notebook%20Users%20Manual.ipynb) находится <s>не</s>большая заметка о используемом языке разметки Markdown. Он позволяет:

0. Составлять упорядоченные списки
1. Выделять *текст* <s>при</s> **необходимости**
2. Добавлять [ссылки](http://imgs.xkcd.com/comics/the_universal_label.png)


* Составлять неупорядоченные списки

Делать вставки с помощью LaTex:
    
$
\left\{
\begin{array}{ll}
x = 16 \sin^3 (t) \\
y = 13 \cos (t) - 5 \cos (2t) - 2 \cos (3t) - \cos (4t) \\
t \in [0, 2 \pi]
\end{array}
\right.$

In [None]:
2 + 2

4

## Numpy

- документация: http://www.numpy.org/

### Python list vs numpy 1d array

Библиотека numpy является удобным инструментом для работы с многомерными массивами с возможностью векторизации вычислений. Рассмотрим базовые вещи, которые можно делать с помощью нее.

In [None]:
# pip install numpy==[version]

In [None]:
import numpy as np

In [None]:
a = [x for x in range(10)]
a # list

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

Что изменится, если перевести обычный list в numpy array?

In [None]:
vec = np.array(a) # nupmy 1d array -> vector
vec

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [None]:
type(vec)

numpy.ndarray

In [None]:
vec.shape # a.shape: 'list' object has no attribute 'shape'

(10,)

In [None]:
vec.ndim # одномерный массив

1

Что еще умеем?

In [None]:
vec > 0 # для python-массива получили бы ошибку 'TypeError': '>' not supported between instances of 'list' and 'int'

array([False,  True,  True,  True,  True,  True,  True,  True,  True,
        True])

Умножение:

In [None]:
# 1d numpy вектор
vec * 2

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18])

In [None]:
# python list
a * 2

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

Сложение:

In [None]:
print(vec)
vec + 10

[0 1 2 3 4 5 6 7 8 9]


array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19])

In [None]:
print(a)
a + 10 # TypeError: can only concatenate list (not "int") to list

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


TypeError: can only concatenate list (not "int") to list

Такое поведение справедливо и для других привычных нам операций.  
Из векторов можно собирать матрицы...

### Матрицы в Numpy

In [None]:
mat = np.array([[1, 2], [3, 4], [5, 6]])
mat

array([[1, 2],
       [3, 4],
       [5, 6]])

In [None]:
mat.shape # размер матрицы (строки x столбцы)

(3, 2)

In [None]:
mat.ndim # число осей

2

При этом тип объекта такой же:

In [None]:
type(mat)

numpy.ndarray

In [None]:
mat.dtype

dtype('int64')

У некоторых функций бывает параметр `axis`, который позволяет применить эту функцию по разным осям - в данном случае, по строкам или столбцам:

<img src="https://i.sstatic.net/70IaS.gif" width="50%">

In [None]:
mat

array([[1, 2],
       [3, 4],
       [5, 6]])

In [None]:
np.sum(mat) # просуммировали все значения в матрице

np.int64(21)

In [None]:
np.sum(mat, axis=0)

array([ 9, 12])

In [None]:
np.sum(mat, axis=1)

array([ 3,  7, 11])

Транспонируем матрицу:

In [None]:
mat.T

array([[1, 3, 5],
       [2, 4, 6]])

In [None]:
mat.transpose()

array([[1, 3, 5],
       [2, 4, 6]])

Размеры массивов можно менять:

In [None]:
mat # исходная матрица

array([[1, 2],
       [3, 4],
       [5, 6]])

In [None]:
mat.reshape(2, 3)

array([[1, 2, 3],
       [4, 5, 6]])

In [None]:
mat.reshape(-1, 3)

array([[1, 2, 3],
       [4, 5, 6]])

In [None]:
mat.reshape(2, -1)

array([[1, 2, 3],
       [4, 5, 6]])

Индексирование:

In [None]:
mat # исходня матрица

array([[1, 2],
       [3, 4],
       [5, 6]])

In [None]:
mat[:, 1]

array([2, 4, 6])

In [None]:
mat[2, :]

array([5, 6])

In [None]:
mat[1:2, 0]

array([3])

In [None]:
mat[::2, :]

array([[1, 2],
       [5, 6]])

#### Арифметические операции:

In [None]:
mat

array([[1, 2],
       [3, 4],
       [5, 6]])

In [None]:
mat + 1

array([[2, 3],
       [4, 5],
       [6, 7]])

In [None]:
mat * 2

array([[ 2,  4],
       [ 6,  8],
       [10, 12]])

In [None]:
mat**2

array([[ 1,  4],
       [ 9, 16],
       [25, 36]])

In [None]:
mat + mat**2

array([[ 2,  6],
       [12, 20],
       [30, 42]])

In [None]:
mat * mat**2

array([[  1,   8],
       [ 27,  64],
       [125, 216]])

In [None]:
np.sin(mat)

array([[ 0.84147098,  0.90929743],
       [ 0.14112001, -0.7568025 ],
       [-0.95892427, -0.2794155 ]])

In [None]:
np.log(mat) # натуральный логарифм

array([[0.        , 0.69314718],
       [1.09861229, 1.38629436],
       [1.60943791, 1.79175947]])

#### Матричное умножение:

<img src="https://madewithml.com/static/images/foundations/numpy/dot.gif">

https://madewithml.com/courses/foundations/numpy/

In [None]:
mat.dot((mat**2).T)

array([[  9,  41,  97],
       [ 19,  91, 219],
       [ 29, 141, 341]])

In [None]:
mat @ (mat**2).T

array([[  9,  41,  97],
       [ 19,  91, 219],
       [ 29, 141, 341]])

In [None]:
# mat.dot(mat**2) # ValueError: shapes (3,2) and (3,2) not aligned: 2 (dim 1) != 3 (dim 0)

#### Broadcasting

https://numpy.org/doc/stable/user/basics.broadcasting.html

Broadcasting — это механизм NumPy, который позволяет выполнять операции над массивами разных размеров, автоматически «растягивая» меньший массив до нужного shape без копирования данных

Зачем это нужно:
- Проще код: меньше ручного reshape и циклов.
- Быстрее: вычисления векторизованы, работают на уровне C.
- Практично в ML: нормализация признаков, вычисление расстояний, сдвиг/масштабирование батчей и т.д.

Пример:

```
X = np.array([[1, 2, 3],
              [4, 5, 6]])   # shape (2, 3)

b = np.array([10, 20, 30])  # shape (3,)

X + b
# b "растягивается" до (2, 3):
# [[11, 22, 33],
#  [14, 25, 36]]

```

In [None]:
mat

array([[1, 2],
       [3, 4],
       [5, 6]])

In [None]:
mat + 1

array([[2, 3],
       [4, 5],
       [6, 7]])

In [None]:
np.arange(3).reshape(3, 1)

array([[0],
       [1],
       [2]])

In [None]:
mat

array([[1, 2],
       [3, 4],
       [5, 6]])

In [None]:
mat + np.arange(3).reshape(3, 1)

array([[1, 2],
       [4, 5],
       [7, 8]])

Булевы массивы:

In [None]:
is_even = mat % 2 == 0
print(is_even)

[[False  True]
 [False  True]
 [False  True]]


In [None]:
np.sum(is_even)

np.int64(3)

Булевы массивы позволяют вытаскивать элементы с True из массива того-же размера

In [None]:
mat[mat % 2 == 0]

array([2, 4, 6])

Иногда бывает полезно создавать специфичные массивы. Массив из нулей:

In [None]:
np.zeros((2, 3))

array([[0., 0., 0.],
       [0., 0., 0.]])

Массив из единиц:

In [None]:
np.ones((3, 2))

array([[1., 1.],
       [1., 1.],
       [1., 1.]])

Единичная матрица:

In [None]:
np.identity(5)

array([[1., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0.],
       [0., 0., 1., 0., 0.],
       [0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 1.]])

Массивы можно объединять:

In [None]:
mat

array([[1, 2],
       [3, 4],
       [5, 6]])

In [None]:
np.hstack((mat, np.zeros(mat.shape)))

array([[1., 2., 0., 0.],
       [3., 4., 0., 0.],
       [5., 6., 0., 0.]])

In [None]:
np.vstack((mat, np.zeros(mat.shape)))

array([[1., 2.],
       [3., 4.],
       [5., 6.],
       [0., 0.],
       [0., 0.],
       [0., 0.]])

Генерация случайных чисел:

In [None]:
np.__version__

'2.0.2'



> In NumPy, the recommended way to generate random numbers is to use the numpy.random.default_rng() function, which creates an instance of the Generator class. This modern approach offers better performance, statistical properties, and reproducibility compared to the legacy methods блок с цитатой



В последних версиях NumPy рекомендует использовать `np.random.default_rng(...)` и `Generator.integers(...)` вместо привычных многим `np.random.randint`. Старый RandomState‑API оставлен для совместимости, не удалён и не объявлен deprecated

[old version]

In [None]:
np.random.rand(2, 3)

array([[0.90448733, 0.94349222, 0.70339235],
       [0.84629795, 0.92799464, 0.81936188]])

In [None]:
np.random.seed(42)
np.random.rand(2, 3)

array([[0.37454012, 0.95071431, 0.73199394],
       [0.59865848, 0.15601864, 0.15599452]])

In [None]:
np.random.randn(3, 2)

array([[ 1.57921282,  0.76743473],
       [-0.46947439,  0.54256004],
       [-0.46341769, -0.46572975]])

In [None]:
np.random.normal(2, 1, size=3)

array([2.24196227, 0.08671976, 0.27508217])

In [None]:
np.random.normal(2, 1, size=(3,2))

array([[1.43771247, 2.291034  ],
       [1.36444026, 0.97844781],
       [1.83824461, 1.4663512 ]])

In [None]:
?np.random.normal

In [None]:
np.random.randint(5, 10, size=3)

array([6, 5, 6])

[new version]

In [None]:
import numpy as np

rng = np.random.default_rng(2019)

rng.random((2, 3))

array([[0.14469964, 0.4422136 , 0.34029253],
       [0.96873942, 0.20012979, 0.43073434]])

In [None]:
rng.normal(size=(3, 2))

array([[ 0.04461158,  0.5822251 ],
       [ 0.11277448, -0.00645087],
       [ 0.4958696 , -0.29761426]])

In [None]:
rng.normal(2, 1, size=3)

array([2.76287746, 2.29365607, 0.16833985])

In [None]:
rng.integers(5, 10, size=3)

array([8, 5, 8])

Почему вообще используют `numpy`?

In [None]:
n = 300
A = np.random.rand(n, n)
B = np.random.rand(n, n)

In [None]:
A

array([[0.9093204 , 0.25877998, 0.66252228, ..., 0.49161588, 0.47347177,
        0.17320187],
       [0.43385165, 0.39850473, 0.6158501 , ..., 0.0200712 , 0.32207917,
        0.21144801],
       [0.32749735, 0.11976213, 0.89052728, ..., 0.27405522, 0.554178  ,
        0.65142039],
       ...,
       [0.72653905, 0.65660348, 0.44478608, ..., 0.19541358, 0.20369656,
        0.1810304 ],
       [0.60744308, 0.02895094, 0.58762132, ..., 0.55491792, 0.87105109,
        0.03091169],
       [0.91124284, 0.22654741, 0.31050422, ..., 0.25152817, 0.43642653,
        0.547523  ]])

In [None]:
B

array([[0.61150177, 0.21982567, 0.7278434 , ..., 0.93726166, 0.94201929,
        0.82109242],
       [0.73561457, 0.23183871, 0.44173021, ..., 0.27911702, 0.03819243,
        0.76704078],
       [0.95102482, 0.5001701 , 0.55816595, ..., 0.45938465, 0.37756773,
        0.69119531],
       ...,
       [0.55945568, 0.34705563, 0.551033  , ..., 0.72586168, 0.43760629,
        0.40196811],
       [0.70102516, 0.20721217, 0.49015697, ..., 0.63141482, 0.23960536,
        0.78667417],
       [0.15241771, 0.9880359 , 0.73621999, ..., 0.88272911, 0.88651723,
        0.23381585]])

In [None]:
%%time
C = np.zeros((n, n))
for i in range(n):
    for j in range(n):
        for k in range(n):
            C[i, j] += A[i, k] * B[k, j]

CPU times: user 25.6 s, sys: 5.08 ms, total: 25.6 s
Wall time: 25.9 s


In [None]:
%%time
C = A @ B

CPU times: user 15.1 ms, sys: 2.86 ms, total: 17.9 ms
Wall time: 21.9 ms


### Задания для самостоятельного решения

1. Развернуть одномерный массив (сделать так, чтобы его элементы шли в обратном порядке).

In [None]:
# your code here

2. Найти максимальный нечетный элемент в массиве.

In [None]:
# your code here

3. Замените все нечетные элементы массива на ваше любимое число.

In [None]:
# your code here

4. Создайте массив первых n нечетных чисел, записанных в порядке убывания. Например, если `n=5`, то ответом будет `array([9, 7, 5, 3, 1])`. *Функции, которые могут пригодиться при решении: `.arange()`*

In [None]:
# your code here

5. Вычислите самое близкое и самое дальнее числа к данному в рассматриваемом массиве чисел. Например, если на вход поступают массив `array([0, 1, 2, 3, 4])` и число 1.33, то ответом будет `(1, 4)`. _Функции, которые могут пригодиться при решении: `.abs()`, `.argmax()`, `.argmin()`_

In [None]:
# your code here

6. Вычисляющую первообразную заданного полинома (в качестве константы возьмите ваше любимое число). Например, если на вход поступает массив коэффициентов `array([4, 6, 0, 1])`, что соответствует полиному $4x^3 + 6x^2 + 1$, на выходе получается массив коэффициентов `array([1, 2, 0, 1, -2])`, соответствующий полиному $x^4 + 2x^3 + x - 2$. _Функции, которые могут пригодиться при решении: `.append()`_

In [None]:
# your code here

7. Пользуясь пунктом 6, посчитайте первую производную для заданного полинома в заданной точке.

In [None]:
# your code here