# NumPy
[(**Num**eric **Py**thon)](http://www.numpy.org/)

## Содержание
 - Особенности Numpy
 - Некоторые функции
 - Массивы ndarray и операции с ними
 - Cпособы создания массива
 - Индексация
 - Операции с матрицами и векторами
 - Полезные функций и методы
 - Вычисление статистик

# <a id="Особенности Numpy"><span style="color:green">Особенности</span></a>

**NumPy** - это open-source модуль для Python, который предоставляет общие математические и числовые операции в виде пре-скомпилированных, быстрых функций (использует типы из C, которые существенно быстрее чем Python типы). Они обеспечивают функционал, который можно сравнить с функционалом MatLab.  

Возможности:
   - поддержка многомерных массивов (включая матрицы);
   - поддержка высокоуровневых математических функций, предназначенных для работы с многомерными массивами.  

**Типы данных в NumPy**

В `Python` к числовым типам относятся:
   - int
   - float
   - bool
   - complex   
   
В `numpy` имеются эти типы, а также обёртки над этими типами, которые **используют реализацию типов на C**, например, `int8`, `int16`, `int32`, `int64` (подробнее о типах данных `numpy` можно прочитать [здесь](https://www.numpy.org/devdocs/user/basics.types.html)). За счёт того, что используются типы данных из C, numpy получает ускорение операций.

In [None]:
import numpy as np
from tqdm import tqdm_notebook # посмотрите, что делает tqdm_notebook

# <a id="Некоторые функции"><span style="color:green">Некоторые функции</span></a>

В numpy реализовано огромное число функций.
Вот некоторые из них:

- np.log(x) - натуральный логарифм x
- np.log10(x) - десятичный логарифм x
- np.log2(x)
- np.sqrt(x) - квадратный корень из x
- np.power(x, n) - возведение x в степень n
- np.abs(x) - модуль x
- np.round(x, n) - математическое округление x
- np.floor(x) - округление вниз
- np.ceil(x) - округление вверх
- np.int(x) - округление к нулю
- sin(x) - синус
- cos(x) - косинус
- ... и т. д..

**Примеры**

Все аргументы, описание функций легко найти:

In [None]:
# справка
np.log?

Также используйте сочетаия клавиш `Shift + Tab` для получения короткой справки (Работает только в Jupyter Notebook)

In [None]:
np.log(10, dtype=np.float64)

2.302585092994046

In [None]:
np.log(0.)

  """Entry point for launching an IPython kernel.


-inf

In [None]:
0 == 0.

True

In [None]:
1.

1.0

In [None]:
print(np.log10(10))
print(np.log10(100))

1.0
2.0


In [None]:
np.round(4.5), np.floor(4.5), np.ceil(4.5), np.int(4.5)

(4.0, 4.0, 5.0, 4)

In [None]:
np.round(-4.5), np.floor(-4.5), np.ceil(-4.5), np.int(-4.5)

(-4.0, -5.0, -4.0, -4)

In [None]:
# переполнение!
np.power(2, 1000), type(np.power(2, 1000))

(0, numpy.int64)

То же самое но с помощью Python-типа int

In [None]:
2 ** 1000, type(2 ** 1000) # питоновское возведение в степень

(10715086071862673209484250490600018105614048117055336074437503883703510511249361224931983788156958581275946729175531468251871452856923140435984577574698574803934567774824230985421074605062371141877954182153046474983581941267398767559165543946077062914571196477686542167660429831652624386837205668069376,
 int)

In [None]:
np.cos(np.pi)

-1.0

In [None]:
np.e

2.718281828459045

# <a id="Массивы ndarray и операции с ними"><span style="color:green">Массивы ndarray и операции с ними</span></a>

Основным объектом `NumPy` является *однородный* многомерный массив, в numpy он реализован через объект `ndarray`. Массивы (`ndarray`) похожи на списки (`list`), но могут хранить только элементы одного типа. Производить вычисления с массивами гораздо быстрее и эффективнее чем со списками.

Наиболее важные атрибуты объектов ndarray:
1. **`ndarray.ndim`** - число измерений (чаще их называют "оси") массива.
  
2. **`ndarray.shape`** - размеры массива, его форма. Это кортеж натуральных чисел, показывающий длину массива по каждой оси. Для матрицы из n строк и m столбов, shape будет (n,m). Число элементов кортежа shape равно ndim.
3. **`ndarray.size`** - количество элементов массива. Очевидно, равно произведению всех элементов атрибута shape.
4. **`ndarray.dtype`** - объект, описывающий тип элементов массива. Можно определить dtype, используя стандартные типы данных Python. Можно хранить и numpy типы, например: bool, int16, int32, int64, float16, float32, float64, complex64
5. **`ndarray.itemsize`** - размер каждого элемента массива в байтах.
6. **`ndarray.data`** - буфер, содержащий фактические элементы массива. Обычно не нужно использовать этот атрибут, так как обращаться к элементам массива проще всего с помощью индексов.

Одномерный массив

In [None]:
# создание массива из списка
a = np.array([1, 2, 3, 1, 0])
type(a)

numpy.ndarray

In [None]:
np.array?

In [None]:
print(a)
print("a.shape = ", a.shape)
print("a.ndim =", a.ndim)
print("a.size =", a.size)
print("a.dtype =", a.dtype)
print("Размер каждого элемента массива в байтах a.itemsize =", a.itemsize)
print("Обращение к элементу a[0] =", a[0])

Двумерный массив

In [None]:
b = np.array([[1, 8, 3], 
              [3, 2, 1], 
              [3, 5, 6]])

In [None]:
print(b)
print("a.shape = ", b.shape)
print("a.ndim =", b.ndim)
print("a.size =", b.size)
print("a.dtype =", b.dtype)
print("Размер каждого элемента массива в байтах a.itemsize =", b.itemsize)
print("Нулевая строка b[0] =", b[0])
print("Обращение к элементу b[строка][столбец]: b[0][1] =", b[0][1])
print("Обращение к элементу b[строка, столбец]: b[0, 1] =", b[0, 1])

[[1 8 3]
 [3 2 1]
 [3 5 6]]
a.shape =  (3, 3)
a.ndim = 2
a.size = 9
a.dtype = int64
Размер каждого элемента массива в байтах a.itemsize = 8
Нулевая строка b[0] = [1 8 3]
Обращение к элементу b[строка][столбец]: b[0][1] = 8
Обращение к элементу b[строка, столбец]: b[0, 1] = 8


Индексация n-мерных массивов такая же как и для n-мерных списоков.

## <a id="Cпособы создания массива"><span style="color:green">Cпособы создания массива</span></a>

- Из списка

In [None]:
# из списка
m = np.array([[1, 8, 3], 
              [3, 2, 1], 
              [3, 5, 6]])
print(m)

[[1 8 3]
 [3 2 1]
 [3 5 6]]


- Создание единичной матрицы

In [None]:
# создание единичной матрицы
m = np.eye(3)
print(m)

[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]


In [None]:
m = np.eye(N=3, M=4) 
# m = np.eye(3, 4) # аналог первой строчки
# m = np.eye(M=4, N=3) # аналог первой строчки
print(m)

[[1. 0. 0. 0.]
 [0. 1. 0. 0.]
 [0. 0. 1. 0.]]


In [None]:
np.eye?

- Создание матрицы из единиц

In [None]:
np.ones?

In [None]:
# создание матрицы из единиц
# m = np.ones(5, 4) # ошибка 
m = np.ones((5, 4))
print(m)

[[1. 1. 1. 1.]
 [1. 1. 1. 1.]
 [1. 1. 1. 1.]
 [1. 1. 1. 1.]
 [1. 1. 1. 1.]]


In [None]:
m = np.ones(5)
print(m)
print(m.shape)
print(type(m[1]))

[1. 1. 1. 1. 1.]
(5,)
<class 'numpy.float64'>


- Создание матрицы из нулей

In [None]:
# создание матрицы из нулей
m = np.zeros((4, 1))
print(m)
print(m.shape)
print(m.ndim)

[[0.]
 [0.]
 [0.]
 [0.]]
(4, 1)
2


In [None]:
# создание вектора из нулей
v = np.zeros(4)
print(v)

[0. 0. 0. 0.]


- **Создание массива из диапазона**

   - создание массива из диапазона значений [start, end)

In [None]:
# np.arrange(start=0, stop, step=1)
m = np.arange(0, 10, 2)
print(m)
m = np.arange(10)
print(m)

[0 2 4 6 8]
[0 1 2 3 4 5 6 7 8 9]


<span style="color:blue">Создайте матрицу 5x5 со значениями строк в диапазоне от 0 до 4</span>

In [None]:
m = np.zeros((5, 5))
m

array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

In [None]:
np.arange(5)

array([0, 1, 2, 3, 4])

In [None]:
m = np.zeros((5, 5))
m += np.arange(5)
print(m)

[[0. 1. 2. 3. 4.]
 [0. 1. 2. 3. 4.]
 [0. 1. 2. 3. 4.]
 [0. 1. 2. 3. 4.]
 [0. 1. 2. 3. 4.]]


- создание массива из диапазона значений [start, stop] с заданием кол-ва точек

In [None]:
m = np.linspace(0, 3, 4)
print(m)

[0. 1. 2. 3.]


In [None]:
np.linspace?

- создание массива из диапазона [$base^{start}$, $base^{end}$]

In [None]:
# np.logspace(start, end, num=50, base=10)
m = np.logspace(2.0, 5.0, num=4, base=2.0)
print(m)

[ 4.  8. 16. 32.]


- **Создание массива из случайных чисел**

In [None]:
np.random.seed(42)

В `numpy` есть аналог модуля `random` - `numpy.random`. Используя типизацию из C, он как и свой аналог генерирует случайные данные.

In [None]:
# массив чисел из равномерного (uniform) распределения в диапазоне [0, 1)
# np.random.rand(d0, d1, d3, ...) d0, d1,... - pазмеры возвращаемого массива
print(np.random.rand(2, 2))
print(np.random.rand(2, 2).shape)

[[0.37454012 0.95071431]
 [0.73199394 0.59865848]]
(2, 2)


In [None]:
np.random.rand?

In [None]:
# массив чисел из стандартного нормального (norm) распределения
# нормальное распределение в заданном shape
np.random.randn(2, 3, 2)

array([[[-0.90802408, -1.4123037 ],
        [ 1.46564877, -0.2257763 ],
        [ 0.0675282 , -1.42474819]],

       [[-0.54438272,  0.11092259],
        [-1.15099358,  0.37569802],
        [-0.60063869, -0.29169375]]])

In [None]:
# массив из случайно выбранных чисел
# size - размер возвращаемого массива, reaplce=False без замещения
np.random.choice(a=np.arange(20), size=10, replace=False)

array([17, 18,  1,  5,  3, 15,  7, 11, 16,  8])

In [None]:
np.random.choice?

In [None]:
np.random.choice(a=np.arange(20), size=(5, 3), replace=True)

array([[ 6, 12, 14],
       [10,  3, 12],
       [ 6, 18,  1],
       [ 9, 12,  5],
       [11, 11, 19]])

**А что со временем?**

In [None]:
import numpy as np

In [None]:
%%time
a = list(range(10 ** 8))
#  %%time - выводит время выполнения ячейки

CPU times: user 1.34 s, sys: 2.14 s, total: 3.48 s
Wall time: 3.45 s


In [None]:
%%time
a_numpy = np.arange(10 ** 8)

CPU times: user 73 ms, sys: 245 ms, total: 318 ms
Wall time: 319 ms


In [None]:
type(a_numpy)

numpy.ndarray

In [None]:
%%time
for idx, elem in enumerate(a):
    a[idx] = elem * 2

CPU times: user 18.5 s, sys: 0 ns, total: 18.5 s
Wall time: 18.5 s


In [None]:
%%time
b = np.arange(1, 10 ** 8 + 1, dtype=np.float64)
b = b * 2

CPU times: user 230 ms, sys: 420 ms, total: 649 ms
Wall time: 648 ms


In [None]:
a = list(range(10))
a * 2

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

**Вывод:** старайтесь использовать векторизированные вычисления!

## <a id="Индексация"> <span style="color:green">Индексация</span></a>

In [None]:
m = np.array([[1, 8, 3], 
              [3, 2, 1], 
              [3, 5, 6]])
print(m)

[[1 8 3]
 [3 2 1]
 [3 5 6]]


In [None]:
# третья строка (вторая если считать с 0)
m[2]

array([3, 5, 6])

In [None]:
# третья строка (вторая если считать с 0)
m[2, :]

array([3, 5, 6])

In [None]:
# второй столбец
m[:, 1]

array([8, 2, 5])

In [None]:
# как было со списками
a[:]

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [None]:
a = [[i for i in range(10)] for i in range(5)]
a

[[0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]]

In [None]:
a[1, :]

TypeError: ignored

In [None]:
a_np = np.array(a)
a_np

array([[0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
       [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
       [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
       [0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
       [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]])

In [None]:
a_np[:3, 2:7:2]

array([[2, 4, 6],
       [2, 4, 6],
       [2, 4, 6]])

Выделение "подматрицы"

In [None]:
m

array([[1, 8, 3],
       [3, 2, 1],
       [3, 5, 6]])

In [None]:
# возьмем только нулевую и вторую строки в 0 столбце
# m [список строк, список столбцов]
m[[0, 2], [0]]

array([1, 3])

In [None]:
m[[0, 2], [0, 1, 2]]

IndexError: ignored

In [None]:
m

array([[1, 8, 3],
       [3, 2, 1],
       [3, 5, 6]])

In [None]:
np.ix_([0, 2], [0, 2])

(array([[0],
        [2]]), array([[0, 2]]))

In [None]:
m_dop = m[np.ix_([0, 2], [0, 2])]

In [None]:
m_dop

array([[1, 3],
       [3, 6]])

## <a id="Операции с матрицами и векторами"><span style="color:green">Операции с матрицами и векторами</span></a>

В NumPy двумерный массив можно рассматривать и как матрицу, то есть для него определены все матричные операции. Одномерный массив также можно рассматривать как вектор.

**Транспонирование**

Транспонированной матрицей $A^{T}$ называется матрица, полученная из исходной матрицы $A$ путем замены строк на столбцы.

In [None]:
m = np.array([[1, 12, 3, 4], 
              [3, 2, 10, 2], 
              [3, 56, 6, 11]])
print(m)
print()
print(m.T)

[[ 1 12  3  4]
 [ 3  2 10  2]
 [ 3 56  6 11]]

[[ 1  3  3]
 [12  2 56]
 [ 3 10  6]
 [ 4  2 11]]


**Скалярное произведение векторов**

Рассмотрим два вектора $a$ и $b$ в n-мерном пространстве  
$a = (a_1, a_2, a_3, \dots a_n)$   
$b = (b_1, b_2, b_3, \dots b_n)$   
Скалярное произведение векторов $a$ и $b$ определяется следующим образом:  
$$\langle a, b \rangle = a_1 b_1 + a_2 b_2 + a_3 b_3 \dots + a_n b_n = \sum_{i = 1}^{n} a_i b_i$$

In [None]:
lst = list()
lst.append(1)
print(lst)

[1]


In [None]:
a = np.array([3, 1, 5, 2])
b = np.array([2, 5, 2, 4])
# <a, b> = 3*1 + 1*5 + 5*2 + 2*4
print(a @ b)    # python 3 style
print(a.dot(b)) 
print(np.dot(a, b))

29
29
29


**Умножение матриц**  
  
Операция умножения определена для двух матриц, таких что число столбцов первой равно числу строк второй. 

Пусть матрицы $A$ и $B$ таковы, что $A \in \mathbb{R}^{n \times k}$ и $B \in \mathbb{R}^{k \times m}$.    
__Произведением__ матриц $A$ и $B$ называется матрица $C$, такая что 
$$c_{ij} = \sum_{r=1}^{k} a_{ir}b_{rj}$$, 
где  $c_{ij}$ — элемент матрицы $C$, стоящий на пересечении строки с номером $i$ и столбца с номером $j$.

In [None]:
a = np.array([[1, 2], [0, 1]])
b = np.array([[4, 1], [2, 2]])
print(a @ b)    # python 3 style
print(a.dot(b)) 
print(np.dot(a, b))

[[8 5]
 [2 2]]
[[8 5]
 [2 2]]
[[8 5]
 [2 2]]


Также доступно *ПОКООРДИНАТНОЕ* умножение, не путать с матричным!

In [None]:
print(a * b)

[[4 2]
 [0 2]]


**Умножение матриц и векторов**

In [None]:
m = np.array([[1, 2], [0, 1], [2, 4]])
print(m)
v = np.array([2, 5])
print("v = ", v)

[[1 2]
 [0 1]
 [2 4]]
v =  [2 5]


In [None]:
m @ v

array([12,  5, 24])

#### Broadcasting (Расширение/адаптация размерностей)
Мощный механизм, позволяющий NumPy работать с массивами различной формы при выполнении арифметических операций. Часто у нас есть меньший массив и больший массив, и мы хотим использовать меньший массив несколько раз, чтобы выполнить некоторую операцию над большим массивом

[Наглядный туториал](https://scipy.github.io/old-wiki/pages/EricsBroadcastingDoc)

In [None]:
# прибавление вектора ко всем строкам матрицы

In [None]:
# без broadcasting
x = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]])
v = np.array([3, 4, 5])
# empty like создает пустую матрицу такого же размера как x
y = np.empty_like(x) # создаем пустую структуру, в нее мы будем складывать ответ

print(x)
print(v)
print(f'y: \n{y}')

for i in range(4):
  y[i, :] = x[i, :] + v

print(y)

[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]]
[3 4 5]
y: 
[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]]
[[ 4  6  8]
 [ 7  9 11]
 [10 12 14]
 [13 15 17]]


`np.tile` повторяет массив v (n,m,...) n раз по 0-ой оси и m раз по 1-ой итд, получается новый массив

In [None]:
v

array([3, 4, 5])

In [None]:
vv = np.tile(v, (4, 1))
vv # получилась матрица такой же размерности как и матрица x

array([[3, 4, 5],
       [3, 4, 5],
       [3, 4, 5],
       [3, 4, 5]])

In [None]:
x

array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])

In [None]:
y = x + vv
print(y)

[[ 4  6  8]
 [ 7  9 11]
 [10 12 14]
 [13 15 17]]


In [None]:
v

array([3, 4, 5])

In [None]:
x + v

array([[ 4,  6,  8],
       [ 7,  9, 11],
       [10, 12, 14],
       [13, 15, 17]])

Бродкастинг двух массивов работает следующим образом:
*   Если массивы не имеют одинаковый ранг (кол-во размерностей), нужно выровнять кол-во размерностей, добавлением дополнительных "единичных" размерностей массиву меньшего ранга
*   Говорят, что два массива *совместимы* в i-ой размерности, если они имеют одинаковый по величине набор значений в этой размерности, или если один из массивов имеет ровно 1 элемент в этом измерении.
*   Массивы **broadcastable**, если они совместимы во всех размерностях.
*   После адаптации каждый массив ведет себя так, как будто он имеет форму, равную поэлементному максимуму форм двух входных массивов.
*   В любом измерении, где один массив имел размер 1, а другой массив имел размер больше 1, первый массив ведет себя так, как если бы он был скопирован "вдоль" этого измерения

Прибавим теперь не по строкам, а по столбцам

In [None]:
v

array([3, 4, 5])

Для этого нужно добавить "дополнительную" размерность 1.

Обратите внимание, что (4,) и (4,1) это разные numpy массивы по форме. Первое интерпретируется как строка матрицы, а второе как столбец. Проведите над этим утверждением пару минут.

In [None]:
np.arange(1, 5).reshape(4, 1)

array([[1],
       [2],
       [3],
       [4]])

In [None]:
x

array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])

In [None]:
np.arange(1,5).reshape(4,1).shape

(4, 1)

In [None]:
x + np.arange(1,5).reshape(4,1) # у нас происходит сложение по столбцам

array([[ 2,  3,  4],
       [ 6,  7,  8],
       [10, 11, 12],
       [14, 15, 16]])

In [None]:
vv = np.tile(v, (4, 2))
x + vv

ValueError: ignored

In [None]:
vv = np.tile(v, (4, 2))
vv + x

ValueError: ignored

## <a id="Полезные функции и методы"><span style="color:green">Полезные функций и методы</span></a>

Все функции описанные в предыдущем разделе можно применять к массивам!

In [None]:
print(a, b, sep='\n')

[[1 2]
 [0 1]]
[[4 1]
 [2 2]]


In [None]:
np.log(b)

array([[1.38629436, 0.        ],
       [0.69314718, 0.69314718]])

In [None]:
np.log(b).shape == b.shape

True

In [None]:
np.sin(a)

array([[0.84147098, 0.90929743],
       [0.        , 0.84147098]])

Кроме математических функций есть также полезные функции для работы с массивами.

In [None]:
a = np.random.choice(a=np.linspace(1, 50, 50) + 100, size=10, replace=False)
print(a)

[112. 140. 149. 141. 113. 130. 115. 114. 110. 123.]


- Замена элементов по индексу

In [None]:
np.put(a, ind=[0, 2], v=[-44, -55, -66])
a

array([-44., 140., -55., 141., 113., 130., 115., 114., 110., 123.])

- Выделение элементов по условию

In [None]:
np.where(a < 0, -1, 1)

array([-1,  1, -1,  1,  1,  1,  1,  1,  1,  1])

In [None]:
a < 0

array([ True, False,  True, False, False, False, False, False, False,
       False])

In [None]:
a[np.where(a < 0)]

array([-44., -55.])

- Сортировка

In [None]:
a[a < 0]

array([-44., -55.])

In [None]:
a

array([-44., 140., -55., 141., 113., 130., 115., 114., 110., 123.])

In [None]:
np.sort(a)

array([-55., -44., 110., 113., 114., 115., 123., 130., 140., 141.])

Индексы сортированного массива

In [None]:
np.argsort(a)

array([2, 0, 8, 4, 7, 6, 9, 5, 1, 3])

In [None]:
# создание матрицы для демонстрации примеров
m = np.round(np.random.rand(4, 5) * 10, 3)
print(m)

[[1.75  9.822 5.166 2.608 9.963]
 [9.654 5.583 8.826 1.887 2.789]
 [7.004 8.467 8.563 4.045 8.878]
 [8.509 9.356 7.853 6.69  5.807]]


In [None]:
# сортировка по столбцам
np.sort(m, axis=0)

array([[1.75 , 5.583, 5.166, 1.887, 2.789],
       [7.004, 8.467, 7.853, 2.608, 5.807],
       [8.509, 9.356, 8.563, 4.045, 8.878],
       [9.654, 9.822, 8.826, 6.69 , 9.963]])

In [None]:
# сортировка по строкам
np.sort(m, axis=1)

array([[1.75 , 2.608, 5.166, 9.822, 9.963],
       [1.887, 2.789, 5.583, 8.826, 9.654],
       [4.045, 7.004, 8.467, 8.563, 8.878],
       [5.807, 6.69 , 7.853, 8.509, 9.356]])

<span style="color:blue">Отсортируйте все столбцы по первому столбцу:</span>

In [None]:
np.random.seed(42)
a = np.random.randint(0, 10, (5, 3))
print(a)
print()
print(a[a[:, 1].argsort()])

[[6 3 7]
 [4 6 9]
 [2 6 7]
 [4 3 7]
 [7 2 5]]

[[7 2 5]
 [6 3 7]
 [4 3 7]
 [4 6 9]
 [2 6 7]]


In [None]:
a[:, 1].argsort()

array([4, 0, 3, 1, 2])

In [None]:
print(a[np.array([4, 0, 3, 1, 2])])

[[7 2 5]
 [6 3 7]
 [4 3 7]
 [4 6 9]
 [2 6 7]]


- **newaxis**

Добавление нового измерения

In [None]:
a = np.linspace(1, 10, 10)
print(a)
print(a.shape)

[ 1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]
(10,)


In [None]:
print(a[:, np.newaxis])
print("New shape ", a[:, np.newaxis].shape)

[[ 1.]
 [ 2.]
 [ 3.]
 [ 4.]
 [ 5.]
 [ 6.]
 [ 7.]
 [ 8.]
 [ 9.]
 [10.]]
New shape  (10, 1)


In [None]:
print(a[np.newaxis, :])
print("New shape ", a[np.newaxis, :].shape)

[[ 1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]]
New shape  (1, 10)


In [None]:
m = np.random.randint(0, 10, (5, 10))
m

array([[9, 3, 7, 6, 8, 7, 4, 1, 4, 7],
       [9, 8, 8, 0, 8, 6, 8, 7, 0, 7],
       [7, 2, 0, 7, 2, 2, 0, 4, 9, 6],
       [9, 8, 6, 8, 7, 1, 0, 6, 6, 7],
       [4, 2, 7, 5, 2, 0, 2, 4, 2, 0]])

In [None]:
m @ a

array([284., 307., 234., 288., 123.])

In [None]:
b = a[:, np.newaxis]

In [None]:
m @ b

ValueError: ignored

In [None]:
m @ a[:, np.newaxis]

array([[284.],
       [307.],
       [234.],
       [288.],
       [123.]])

In [None]:
a

array([ 1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10.])

In [None]:
m = a.reshape((5, 2, 1, 1))
print(m)
print(m.shape)
print('------------------------')
print(m[..., np.newaxis, np.newaxis].shape)
print('------------------------')
# print(m[:, np.newaxis, np.newaxis])
print("New shape ", m[:, np.newaxis, np.newaxis].shape)

[[[[ 1.]]

  [[ 2.]]]


 [[[ 3.]]

  [[ 4.]]]


 [[[ 5.]]

  [[ 6.]]]


 [[[ 7.]]

  [[ 8.]]]


 [[[ 9.]]

  [[10.]]]]
(5, 2, 1, 1)
------------------------
(5, 2, 1, 1, 1, 1)
------------------------
New shape  (5, 1, 1, 2, 1, 1)


- **any all**

`Any` возвращает True, если хотя бы один элемент `True`   
`All` возвращает True, если все эедементы `True`

In [None]:
any([True, True, False, True, False, False, False])

True

In [None]:
all([True, True, False, True, False, False, False])

False

In [None]:
np.array([1, 1, 0, 2]) == np.array([1, 1, 0, 2])

array([ True,  True,  True,  True])

In [None]:
# сравнение векторов
all(np.array([1, 1, 0, 2]) == np.array([1, 1, 0, 2]))

True

In [None]:
all(np.array([1, 1, 0, 0]) == np.array([1, 1, 0, 2]))

False

In [None]:
any(np.array([1, 1, 0, 0]) == np.array([1, 1, 0, 2]))

True

- Методы all и any

In [None]:
np.array([1, 1, 0, 8, 1, 5, 1, 1]) == np.array([1, 1, 3, 2, 1, 5, 1, 1])

array([ True,  True, False, False,  True,  True,  True,  True])

In [None]:
a = (np.array([1, 1, 0, 8, 1, 5, 1, 1]) == np.array([1, 1, 3, 2, 1, 5, 1, 1])).reshape((2, 4))
print(a)

[[ True  True False False]
 [ True  True  True  True]]


In [None]:
# any по строкам
a.any(axis=1)

array([ True,  True])

In [None]:
# any по столбцам
a.any(axis=0)

array([ True,  True,  True,  True])

In [None]:
# По строкам и столбцам
a.all((0, 1)) # берем элементы по осям исходной подматрицы с индексами 0 и 1

False

In [None]:
a.all?

- diff   
out[n] = a[n+1] - a[n]

In [None]:
a = np.array([1, 2, 4, 7, 0])
print(a)
print(np.diff(a))

[1 2 4 7 0]
[ 1  2  3 -7]


- split (забиение на части)

In [None]:
a = np.arange(10)
print(a)

[0 1 2 3 4 5 6 7 8 9]


In [None]:
np.split(a, [2, 7]) # разбивает по элементам 2 и 7

[array([0, 1]), array([2, 3, 4, 5, 6]), array([7, 8, 9])]

## <a id="Вычисление статистик"><span style="color:green">Вычисление статистик</span></a>

In [None]:
a = np.random.randint(-10, 70, (5, 4))
print(a)

[[-6  3 16 -2]
 [68  4 31 66]
 [40 52 41 -7]
 [12  4 32 18]
 [25  2 21 60]]


- среднее

In [None]:
a.mean()

24.0

In [None]:
# среднее по столбцам
a.mean(axis=0)

array([27.8, 13. , 28.2, 27. ])

In [None]:
# среднее по строкам
a.mean(axis=1)

array([ 2.75, 42.25, 31.5 , 16.5 , 27.  ])

- медиана

In [None]:
print(np.median(a))
print(np.median(a, axis=0))
print(np.median(a, axis=1))

19.5
[25.  4. 31. 18.]
[ 0.5 48.5 40.5 15.  23. ]


- максимум и минимум

In [None]:
print(a)

[[-6  3 16 -2]
 [68  4 31 66]
 [40 52 41 -7]
 [12  4 32 18]
 [25  2 21 60]]


In [None]:
print(a.max())              # максимальный элемент
print(a.max(axis=0))        # максимумы по столбцам
print(a.argmax(axis=0))     # индексы строк максимумов по столбцам
print(a.max(axis=1))        # максимумы по строкам
print(a.argmax(axis=1))     # индексы столбцов максимумов по строкам

68
[68 52 41 66]
[1 2 2 1]
[16 68 52 32 60]
[2 0 1 2 3]


- счетчик

In [None]:
np.bincount(np.arange(5))
# np.arange(5) == array([0, 1, 2, 3, 4])
# [0, 1, 2, 3, 4]

array([1, 1, 1, 1, 1])

In [None]:
np.bincount(np.array([0, 1, 1, 3, 2, 1, 7]))
# [0, 1, 2, 3, 4, 5, 6, 7]

array([1, 3, 1, 1, 0, 0, 0, 1])

Как это получилось? Получили массив соответсвующий диапазону от 0 до max. И посчитали кол-во попаданий в 0, 1, 2, ... max.

In [None]:
# с помощью аргумента weights можно посчитать сумму части эелемента массива
sub_sums = np.bincount(np.array([2, 0, 2, 1, 0, 0, 2, 2, 0, 1]), 
                        weights=[4, 4, 2, 3, 5, 1, 6, 1, 7, 5])
# [0, 1, 2]
# 0 -> 4 + 5 + 1 + 7 = 17
# 1 -> 3 + 5 = 8
# 2 -> 4 + 2 + 6 + 1 = 13
print(sub_sums)

[17.  8. 13.]


<span style="color:blue">Как найти наиболее частое значение в массиве?</span>

In [None]:
z = np.random.randint(0, 10, 50)
print(z)
print(np.bincount(z).argmax())

[2 5 1 9 8 4 5 3 9 6 8 6 0 0 8 8 3 8 2 6 5 7 8 4 0 2 9 7 5 7 8 3 0 0 9 3 6
 1 2 0 4 0 7 0 0 1 1 5 6 4]
0


In [None]:
np.bincount(z)

array([9, 4, 4, 4, 4, 5, 5, 4, 7, 4])

In [None]:
# Задачи

Создайте массив из 100 элементов (от 1 до 100), переформатируйте в формат (10 * 10), сделайте слайсинг с шагом 2 по каждой оси.

In [None]:
z = np.random.randint(0, 100, 100) 
z

array([32, 13, 20, 47, 19,  7,  6, 66, 16, 32, 47, 75, 58, 85, 21, 29, 37,
       50, 53,  7, 26, 26, 97, 20, 29, 96, 27, 63, 96, 68, 60, 47, 18,  3,
       34, 63, 48, 16, 43, 91, 29, 92, 45,  5, 98, 36, 23, 92, 45, 52, 94,
       98, 59, 96, 62, 84, 31, 86, 32, 66, 17, 24, 94, 53, 57, 66, 45, 23,
       31, 46, 85, 22, 65, 26,  1, 89, 16, 32,  8, 42, 47, 38, 92, 41, 25,
       98, 49, 24, 23, 12, 59,  6, 56, 35, 44, 19, 64,  7, 15, 13])

In [None]:
arr = np.arange(1, 101)
arr

array([  1,   2,   3,   4,   5,   6,   7,   8,   9,  10,  11,  12,  13,
        14,  15,  16,  17,  18,  19,  20,  21,  22,  23,  24,  25,  26,
        27,  28,  29,  30,  31,  32,  33,  34,  35,  36,  37,  38,  39,
        40,  41,  42,  43,  44,  45,  46,  47,  48,  49,  50,  51,  52,
        53,  54,  55,  56,  57,  58,  59,  60,  61,  62,  63,  64,  65,
        66,  67,  68,  69,  70,  71,  72,  73,  74,  75,  76,  77,  78,
        79,  80,  81,  82,  83,  84,  85,  86,  87,  88,  89,  90,  91,
        92,  93,  94,  95,  96,  97,  98,  99, 100])

In [None]:
arr = np.arange(1, 101, 1).reshape((10, 10))
arr

array([[  1,   2,   3,   4,   5,   6,   7,   8,   9,  10],
       [ 11,  12,  13,  14,  15,  16,  17,  18,  19,  20],
       [ 21,  22,  23,  24,  25,  26,  27,  28,  29,  30],
       [ 31,  32,  33,  34,  35,  36,  37,  38,  39,  40],
       [ 41,  42,  43,  44,  45,  46,  47,  48,  49,  50],
       [ 51,  52,  53,  54,  55,  56,  57,  58,  59,  60],
       [ 61,  62,  63,  64,  65,  66,  67,  68,  69,  70],
       [ 71,  72,  73,  74,  75,  76,  77,  78,  79,  80],
       [ 81,  82,  83,  84,  85,  86,  87,  88,  89,  90],
       [ 91,  92,  93,  94,  95,  96,  97,  98,  99, 100]])

In [None]:
arr = np.arange(1, 101, 1).reshape((10, 10))[::2, ::2] 
arr

array([[ 1,  3,  5,  7,  9],
       [21, 23, 25, 27, 29],
       [41, 43, 45, 47, 49],
       [61, 63, 65, 67, 69],
       [81, 83, 85, 87, 89]])