In [387]:
import numpy as np

np.__version__

'1.17.2'

In [388]:
import scipy

scipy.__version__

'1.3.1'

`numpy` – библиотека для векторизованных вычислений. Написана на Си.

`scipy` – библиотека для научных вычислений. Написана на Си, C++ и Fortran.

## За что не любят Python и любят C/C++?

In [391]:
%pdb

a = list(range(1_000_000))

%%timeit

[e * e for e in a]

Automatic pdb calling has been turned OFF


UsageError: Line magic function `%%timeit` not found.


In [None]:
a = np.arange(1_000_000)

In [392]:
%%timeit

a * a

TypeError: can't multiply sequence by non-int of type 'list'

Самое медленное место в языке – циклы.

In [398]:
rows, cols = 1_000, 1_000

a = [list(range(i, i + cols)) for i in range(0, rows)]
b = [[0 for j in range(cols)] for i in range(rows)]

UsageError: Line magic function `%%timeit` not found.


In [394]:
%%timeit

for i in range(rows):
    for j in range(cols):
        b[i][j] = 2 * a[i][j]

125 ms ± 663 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [None]:
a = np.asarray(a)

In [None]:
%%timeit

2 * a

## Создание массивов

In [None]:
a = np.array([1, 2, 3, 4, 5])
a

In [None]:
a = np.array([1, 2, 3, 4, 5], dtype=np.float64)
a

In [None]:
a = np.array([[1, 2, 3, 4, 5],
              [6, 7, 8, 9, 0]], dtype=float)
a

In [None]:
a.shape

In [None]:
a.ndim

In [None]:
a.dtype

In [None]:
a.astype(int)

## Размерность массивов

<img src="files/data.png" width="450px">

In [380]:
a

array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24, 25, 26, 27, 28, 29]])

In [None]:
a.dtype

In [None]:
a.dtype.itemsize   # sizeof(float64)

In [None]:
a.shape

In [None]:
a.strides

In [None]:
b = a.reshape(5, 2)
b

In [None]:
b.shape

In [None]:
b.strides

In [None]:
a.reshape(-1, 2)

In [None]:
b = a.reshape(5, -1)   # same memory

a[0, 1] = -10
b

In [None]:
b = a.flatten()   # copy
a[0, 1] = -20

b

In [None]:
b = a.ravel()     # view (same memory)
a[0, 1] = -30

b

In [None]:
c = a.transpose()           # view (same memory)   # same as a.transpose()
a[0, 1] = -40

c

In [None]:
c.strides, a.strides

Фиктивная ось – ось с размерностью 1.

In [379]:
b = np.arange(10)
b

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [None]:
b[np.newaxis, :]   # same as b.reshape(1, *b.shape)

In [None]:
np.expand_dims(b, axis=0)

In [None]:
b[:, np.newaxis]   # same as b.reshape(*b.shape, 1)

In [None]:
b[np.newaxis, :, np.newaxis].shape

### Создание массивов с особыми свойствами

In [None]:
np.zeros(shape=(3, 2))

In [None]:
np.zeros_like(a)

In [None]:
np.ones(5)   # same as np.ones(shape=(5, ))

In [None]:
np.eye(4)

In [None]:
np.arange(1, 10)

In [None]:
np.arange(1, 10, 2)

In [None]:
np.arange(1, 10, 0.5)

In [None]:
np.linspace(0, 1, 5, endpoint=True)

### Избегаем ненужного копирования

In [None]:
a = np.array([1, 2, 3, 4, 5], dtype=np.float32)
b = np.asarray(a)
c = np.array(a)

b, c

In [None]:
a[0] = 0
b, c

In [None]:
a = np.array([1, 2, 3, 4, 5], dtype=np.float32)
b = np.asarray(a, dtype=np.int32)
c = np.array(a)

a, b, c

In [None]:
a[0] = 0
a, b, c

In [None]:
d = [1, 2, 3, 4, 5]
a = np.asarray(d)

d[0] = 0
a

## Поэлементные операции над массивами

### Операции со скалярами и унарные операции

In [None]:
a = np.arange(10).reshape(2, -1)
a

In [None]:
a ** 3   # same as np.power(a, 3)

In [None]:
a + 2    # same as np.add(a, 2)

In [None]:
2 * a    # same as np.multiply(2, a)

In [None]:
2 ** a   # same as np.power(2, a)

In [None]:
np.sqrt(a)

In [None]:
np.exp(a)

In [None]:
np.log(1 + a)

In [None]:
np.log2(1 + a)

In [None]:
np.sin(a)

In [None]:
a > 0   # same as np.greater(a, 0)

### Агрегирующие операции

In [None]:
np.random.seed(5656)
a = np.random.randint(0, 10, size=(7, ))
a[3] = 10
a

In [None]:
a.min(), a.max(), a.argmax(), a.sum(), a.prod(), a.mean()

In [None]:
np.min(a), np.max(a), np.argmax(a), np.sum(a), np.prod(a), np.mean(a)

In [None]:
# крайне не рекомендуемый вариант

min(a), max(a), sum(a)   # только для одномерных массивов 

<img src="files/axis.png" width="350px">

`a.agg(axis=axis)` – агрегирующая операция вдоль оси `axis`:
* выполняет редукцию (агрегирующую операцию) по оси `axis`;
* удаляет ось `axis` из исходного массива.

In [None]:
np.random.seed(5555)

a = np.random.randint(0, 10, size=(3, 7))
a[1, 3] = 15

a

In [None]:
a.max(axis=0)   # редукция вдоль оси axis=0 или редукция по столбцу

In [None]:
a.sum(axis=1)   # редукция вдоль оси axis=1 или редукция по строке

In [None]:
a

In [None]:
a.argmax()

In [None]:
a.ravel()[a.argmax()]

In [None]:
i = np.argmax(a)
i, j = i // a.shape[1], i % a.shape[1]

print("value =", a[i, j])
print("index =", (i, j))

In [None]:
np.unravel_index(np.argmax(a), a.shape)

Что быстрее?

In [None]:
b = np.random.randint(0, 10, size=(1_000, 1_000))
b[36, 42] = 20
b = b.ravel()

In [None]:
%%timeit

b.max()

In [None]:
%%timeit

max(b)

### Унарные операции над булевыми массивами

In [None]:
a = np.asarray([True, True, False, False, True])
a

In [None]:
a.any(), np.any(a), any(a)   # последний вариант крайне не рекомендуется

In [None]:
a.all(), np.all(a), all(a)   # последний вариант крайне не рекомендуется

In [None]:
a = np.asarray([[True, True,  False, False, True ],
                [True, False, False, True,  False]])
a

In [None]:
a.any(axis=0)

In [None]:
a.all(axis=1)

In [None]:
np.logical_not(a)

In [None]:
~a   # bitwise ; same as np.bitwise_not(a)

### Бинарные операции

In [None]:
a = a.astype(int)
a

In [None]:
np.random.seed(4968)

b = np.random.randint(0, 10, size=a.shape)
b

In [None]:
a * b   # same as np.multiply(a, b)

In [None]:
a + b   # same as np.add(a, b)

In [None]:
a

In [None]:
b

In [None]:
np.fmax(a, b)   # element-wise maximum

In [None]:
a > b   # same as np.greater(a, b)

Что еще умеют бинарные `ufunc`: https://jakevdp.github.io/PythonDataScienceHandbook/02.03-computation-on-arrays-ufuncs.html

In [377]:
np.random.seed(4987)

a = np.random.random(size=(2, 5))
b = a + np.random.random(size=(2, 5)) * 1e-5

In [None]:
a

In [None]:
b

In [None]:
np.isclose(a, b)

In [None]:
np.allclose(a, b)     # same as np.isclose(a, b).all()

In [None]:
# np.anyclose(a, b)   # doesn't exist
np.isclose(a, b).any()

In [None]:
np.random.seed(4987)

a = (np.random.random(size=(5, )) - 0.5) * 1e-7
np.isclose(a, 0, atol=1e-6)

### Бинарные операции над булевыми массивами

In [None]:
a = np.asarray([True, True,  False, False, True ])
b = np.asarray([True, False, False, True,  False])

a, b

In [None]:
np.logical_and(a, b), np.logical_or(a, b), np.logical_xor(a, b)

In [None]:
a & b, a | b, a ^ b   # bitwise

In [None]:
np.bitwise_and(a, b), np.bitwise_or(a, b), np.bitwise_xor(a, b)

### Более хитрые примеры бинарных операций 😏

In [378]:
a = np.arange(30).reshape(3, -1)
a

array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24, 25, 26, 27, 28, 29]])

In [None]:
b = np.arange(a.shape[1])
b

In [None]:
print("a.shape =", a.shape)
print("b.shape =", b.shape)

In [None]:
a + b

In [None]:
b = np.arange(a.shape[0])
b

In [None]:
print("a.shape =", a.shape)
print("b.shape =", b.shape)

In [None]:
# Ooops!

a + b

In [None]:
b = np.arange(a.shape[0])[:, np.newaxis]
b

In [None]:
print("a.shape =", a.shape)
print("b.shape =", b.shape)

In [None]:
a + b

### И еще более хитрые примеры бинарных операций 🤯

In [None]:
a = np.arange(5).reshape(1, -1)
a

In [None]:
b = a.reshape(-1, 1)
b

In [None]:
print("a.shape =", a.shape)
print("b.shape =", b.shape)

In [None]:
a + b

In [None]:
a >= b

Поэтому, как говорили на уроках физики,
<center><h3>Не забывай следить за размерностью!</h3></center>

**Правило приведения размерностей (broadcasting):**
1. Предположим, что `a.shape = (a_1, a_2, ..., a_n)` и `b.shape = (b_1, b_2, ..., b_n)`. Над `a` и `b` можно произвести поэлементую бинарную операцию, если $\forall \; i \in \overline{1..n}$ выполнено хотя бы одно из условий:
    * `a_i == b_i`;
    * `a_i == 1`;
    * `b_i == 1`.


2. Если размерности не совпадают, то к массиву меньшей размерности добавляются ведущие фиктивные размерности. 

Документация: https://docs.scipy.org/doc/numpy/user/basics.broadcasting.html

Пункт `a_i == b_i` означает, что размерность в точности совпадает.

In [None]:
a = np.arange(20).reshape(4, -1)
a

In [None]:
np.random.seed(1987)

b = np.random.randint(-1, 2, size=(4, 5))
b

In [None]:
a * b

Пункты `a_i == 1` или `b_i == 1` означает, что массив по этой оси можно повторить нужное число раз, и свести задачу к предыдущему пункту.

In [None]:
a

In [None]:
np.random.seed(7892)

b = np.random.randint(-1, 2, size=(4, 1))
b

In [None]:
print("a.shape =", a.shape)
print("b.shape =", b.shape)

In [None]:
a * b

In [None]:
c = np.repeat(b, a.shape[1], axis=1)
c

In [None]:
print("a.shape =", a.shape)
print("c.shape =", c.shape)

In [None]:
a * c

Если размерности не совпадают, то добавляются ведущие фиктивные размерности.

In [None]:
a = np.arange(20).reshape(-1, 5)
a

In [None]:
np.random.seed(6579)

b = np.random.randint(0, 2, size=5)
b

In [None]:
print("a.shape =", a.shape)
print("b.shape =", b.shape)

In [None]:
a * b

In [None]:
c = b[np.newaxis, :]
c

In [None]:
print("a.shape =", a.shape)
print("c.shape =", c.shape)

In [None]:
print(b,b.shape)
print(a,a.shape)
b* a

## Матричные операции над массивами

In [None]:
av = np.arange(1, 5).reshape(-1, 2)
av

In [None]:
bv = np.array([[1, 2], [-2, 1]])
bv

In [None]:
av * bv

In [None]:
np.matmul(av, bv)

In [None]:
np.dot(av, bv)

In [None]:
# no copy, pls

am = np.asmatrix(av)
bm = np.asmatrix(bv)

am

In [None]:
am * bm

In [None]:
av ** 2

In [None]:
am ** 2

Все самое важное для линейной алгебры:

https://docs.scipy.org/doc/numpy/reference/routines.linalg.html

## Индексация в одномерных массивах

**Замечание:** индексация может быть использована не только для получения значений, но и для их присвоения.

In [None]:
a = np.arange(15)
a

In [None]:
a[0], a[5], a[len(a) - 1]

### Отрицательные индексы

In [None]:
a[len(a) - 1], a[-1]

In [None]:
a[len(a) - 5], a[-5]

### Срезы (slice)

**Общее правило:** `массив[первый индекс:последний индекс:шаг]`.

Значения по-умолчанию:
    * первый индекс = 0; 
    * последний индекс = len(массив);
    * шаг = 1;
    
`последний индекс` не включается.

In [143]:
a = np.arange(15)
a

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])

Взять первые 5 элементов.

In [142]:
variants = [ a[0:5:1], a[0:5], a[:5] ]

print(*map(repr, variants), sep='\n')

[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4]


In [None]:
variants = [ a[slice(0, 5, 1)], a[slice(0, 5)], a[slice(5)] ]

print(*map(repr, variants), sep='\n')

Взять все элементы, стоящих на четных позициях.

In [144]:
variants = [ a[0:len(a):2], a[0::2], a[::2] ]

print(*map(repr, variants), sep='\n')

array([ 0,  2,  4,  6,  8, 10, 12, 14])
array([ 0,  2,  4,  6,  8, 10, 12, 14])
array([ 0,  2,  4,  6,  8, 10, 12, 14])


Взять все элементы, стоящие на нечетных позициях.

In [145]:
variants = [ a[1:len(a):2], a[1::2] ]

print(*map(repr, variants), sep='\n')

array([ 1,  3,  5,  7,  9, 11, 13])
array([ 1,  3,  5,  7,  9, 11, 13])


Взять все элементы с 3 по 12 (не включительно) с шагом 3.

In [None]:
variants = [ a[3:12:3], a[3:-3:3] ]

print(*map(repr, variants), sep='\n')

Взять все элементы с 3 по 12 (включительно) с шагом 3 в обратном порядке.

In [None]:
variants = [ a[3:13:3][::-1], a[12:2:-3], a[-3:2:-3] ]

print(*map(repr, variants), sep='\n')

### Булева индексация (маски)

In [146]:
np.random.seed(1234)

a = np.random.randint(-2, 7, 34)
a

array([ 1,  4,  3,  2,  6, -1,  5,  4,  6, -2,  3, -2,  4,  0, -2,  3,  0,
        4,  1,  5, -2, -2,  1,  0,  1, -1,  1, -1,  1,  5, -1,  5,  2, -2])

Найти все отрицательные элементы.

In [147]:
a < 0

array([False, False, False, False, False,  True, False, False, False,
        True, False,  True, False, False,  True, False, False, False,
       False, False,  True,  True, False, False, False,  True, False,
        True, False, False,  True, False, False,  True])

In [148]:
a[a < 0]

array([-1, -2, -2, -2, -2, -2, -1, -1, -1, -2])

Найти все элементы, кратные 3-м.

In [149]:
variants = [ a[a % 3 == 0], a[np.logical_not(a % 3)], a[~((a % 3).astype(bool))] ]

print(*map(repr, variants), sep='\n')

array([3, 6, 6, 3, 0, 3, 0, 0])
array([3, 6, 6, 3, 0, 3, 0, 0])
array([3, 6, 6, 3, 0, 3, 0, 0])


In [None]:
np.random.seed(1234)

a = np.random.randint(0, 9, 23)
a

Найти все элементы, кратные или 3, или 5.

In [150]:
mask_3 = a % 3 == 0
mask_5 = a % 5 == 0

variants = [ a[np.logical_or(mask_3, mask_5)], a[mask_3 | mask_5] ]

print(*map(repr, variants), sep='\n')

array([3, 6, 5, 6, 3, 0, 3, 0, 5, 0, 5, 5])
array([3, 6, 5, 6, 3, 0, 3, 0, 5, 0, 5, 5])


Найти все элементы, кратные и 2, и 3.

In [None]:
mask_2 = a % 2 == 0
mask_3 = a % 3 == 0

variants = [ a[np.logical_and(mask_2, mask_3)], a[mask_2 & mask_3], a[a % 6 == 0] ]

print(*map(repr, variants), sep='\n')

## Индексация в многомерных массивах

In [152]:
a = np.arange(30).reshape(5, -1)
a

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29]])

In [153]:
# плохой способ, мы работаем с numpy-массивами, а не со списками

a[0][0], a[0][2], a[1][1], a[-1][-2]

(0, 2, 7, 28)

In [154]:
# хороший способ

a[0,0], a[0,2], a[1,1], a[-1,-2]

(0, 2, 7, 28)

Получить строку с индексом 2.

In [155]:
variants = [ a[2], a[2,:] ]

print(*map(repr, variants), sep='\n')

array([12, 13, 14, 15, 16, 17])
array([12, 13, 14, 15, 16, 17])


Получить столбец с индексом 3.

In [166]:
a[:,3]

array([ 3,  9, 15, 21, 27])

Получить все элементы, стоящие в четных столбцах.

In [158]:
a[:,::2]

array([[ 0,  2,  4],
       [ 6,  8, 10],
       [12, 14, 16],
       [18, 20, 22],
       [24, 26, 28]])

Получить все элементы, стоящие в первой (0-й) строке и нечетных стоблцах.

In [167]:
a[0,1::2]

array([1, 3, 5])

Получить все элементы `a[i,j]`, такие что:
    * i – нечетные;
    * j – дающие остаток 2 при делении на 3;
индексация по строкам, должна быть обратной.

In [168]:
a[1::2,2::3][::-1]

array([[20, 23],
       [ 8, 11]])

In [195]:
np.random.seed(2238)

a = np.random.randint(-5, 5, size=(5, 5))
a

array([[ 3,  2, -1, -3,  4],
       [ 3, -2, -2, -2, -5],
       [ 3,  2, -1,  1,  1],
       [ 2,  0,  4, -2,  0],
       [ 0,  4,  1,  2,  4]])

Получите строки, в которых есть хотя бы один 0.

In [172]:
a[(a == 0).any(axis=1)]

array([[ 2,  0,  4, -2,  0],
       [ 0,  4,  1,  2,  4]])

Получите столбцы, в которых число положительных элементов больше числа отрицательных.

In [173]:
a[:, (a > 0).sum(axis=0) > (a < 0).sum(axis=0)]

array([[ 3,  2,  4],
       [ 3, -2, -5],
       [ 3,  2,  1],
       [ 2,  0,  0],
       [ 0,  4,  4]])

Получить положительные элементы.

In [174]:
a[a > 0]

array([3, 2, 4, 3, 3, 2, 1, 1, 2, 4, 4, 1, 2, 4])

Получить индексы положительных элементов.

In [175]:
np.where(a > 0)

(array([0, 0, 0, 1, 2, 2, 2, 2, 3, 3, 4, 4, 4, 4]),
 array([0, 1, 4, 0, 0, 1, 3, 4, 0, 2, 1, 2, 3, 4]))

In [176]:
a[np.where(a > 0)]

array([3, 2, 4, 3, 3, 2, 1, 1, 2, 4, 4, 1, 2, 4])

In [177]:
np.vstack(np.where(a > 0)).T

array([[0, 0],
       [0, 1],
       [0, 4],
       [1, 0],
       [2, 0],
       [2, 1],
       [2, 3],
       [2, 4],
       [3, 0],
       [3, 2],
       [4, 1],
       [4, 2],
       [4, 3],
       [4, 4]])

### Fancy Indexing

In [194]:
a

array([[100,   2, 100, 100,   4],
       [100,  -2, 100, 100,  -5],
       [  3,   2,  -1,   1,   1],
       [  2,   0,   4,  -2,   0],
       [  0,   4,   1,   2,   4]])

Получить 2, 4 и 3 строки.

In [179]:
a[[2, 4, 3]]

array([[ 3,  2, -1,  1,  1],
       [ 0,  4,  1,  2,  4],
       [ 2,  0,  4, -2,  0]])

Получить элементы 2, 4, 3 строках и в 0-м и последнем столбце. 

In [183]:
# Ooops!

a[[2, 4, 3], [0, -1]]

IndexError: shape mismatch: indexing arrays could not be broadcast together with shapes (3,) (2,) 

In [140]:
a

[0,
 1,
 2,
 3,
 4,
 5,
 6,
 7,
 8,
 9,
 10,
 11,
 12,
 13,
 14,
 15,
 16,
 17,
 18,
 19,
 20,
 21,
 22,
 23,
 24,
 25,
 26,
 27,
 28,
 29,
 30,
 31,
 32,
 33,
 34,
 35,
 36,
 37,
 38,
 39,
 40,
 41,
 42,
 43,
 44,
 45,
 46,
 47,
 48,
 49,
 50,
 51,
 52,
 53,
 54,
 55,
 56,
 57,
 58,
 59,
 60,
 61,
 62,
 63,
 64,
 65,
 66,
 67,
 68,
 69,
 70,
 71,
 72,
 73,
 74,
 75,
 76,
 77,
 78,
 79,
 80,
 81,
 82,
 83,
 84,
 85,
 86,
 87,
 88,
 89,
 90,
 91,
 92,
 93,
 94,
 95,
 96,
 97,
 98,
 99,
 100,
 101,
 102,
 103,
 104,
 105,
 106,
 107,
 108,
 109,
 110,
 111,
 112,
 113,
 114,
 115,
 116,
 117,
 118,
 119,
 120,
 121,
 122,
 123,
 124,
 125,
 126,
 127,
 128,
 129,
 130,
 131,
 132,
 133,
 134,
 135,
 136,
 137,
 138,
 139,
 140,
 141,
 142,
 143,
 144,
 145,
 146,
 147,
 148,
 149,
 150,
 151,
 152,
 153,
 154,
 155,
 156,
 157,
 158,
 159,
 160,
 161,
 162,
 163,
 164,
 165,
 166,
 167,
 168,
 169,
 170,
 171,
 172,
 173,
 174,
 175,
 176,
 177,
 178,
 179,
 180,
 181,
 182,
 183,
 184,


In [141]:
# Хммм... Такая же логика, как с np.where

a[[2, 4, 3],[0, -1, 2]]

TypeError: list indices must be integers or slices, not tuple

In [184]:
# решим все же изначальную проблему

a[[2, 4, 3]][:,[0, -1]]

array([[3, 1],
       [0, 4],
       [2, 0]])

In [197]:
a[np.ix_([2, 4, 3], [0, -1])]
# a[np.ix_([0,1], [0,3,2])] = 100
print(a)

[[ 3  2 -1 -3  4]
 [ 3 -2 -2 -2 -5]
 [ 3  2 -1  1  1]
 [ 2  0  4 -2  0]
 [ 0  4  1  2  4]]


А в чем разница?

In [198]:
a = np.arange(15).reshape(3, -1)
a

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

In [210]:
# copy

a[[0, 1],:][:,[0, 3, 2]] = 100
a

array([[99,  1, 99, 99,  4],
       [99,  6, 99, 99,  9],
       [10, 11, 12, 13, 14]])

In [209]:
# view

a[np.ix_([0, 1], [0, 3, 2])] = 99

a

array([[99,  1, 99, 99,  4],
       [99,  6, 99, 99,  9],
       [10, 11, 12, 13, 14]])

Разница между view и copy:

https://www.jessicayung.com/numpy-views-vs-copies-avoiding-costly-mistakes/

### Сокращенная индексация

In [215]:
a = np.arange(24).reshape(2, 3, 4)
a

array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])

In [212]:
a[..., 0]

array([[ 0,  4,  8],
       [12, 16, 20]])

In [213]:
a[0, ...]

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

In [214]:
a[..., 0, :]

array([[ 0,  1,  2,  3],
       [12, 13, 14, 15]])

## Что ещё полезного есть в numpy и scipy?

### Генерация случайных чисел

In [297]:
np.random.rand(10)

array([0.91952693, 0.92334767, 0.79279976, 0.25032157, 0.95887715,
       0.21999185, 0.98575544, 0.43035143, 0.35063763, 0.54364504])

In [310]:
np.random.randint(0, 10, 10)

1

In [320]:
np.random.permutation(10)

array([4, 1, 2, 5, 7, 8, 3, 0, 9, 6])

In [345]:
np.random.choice(10, size=10)

array([7, 6, 7, 2, 4, 3, 1, 9, 4, 9])

### Сортировка

In [355]:
np.random.seed(4445)

a = np.random.choice(10, size=(3, 10))
a

array([[6, 0, 3, 1, 5, 3, 1, 6, 6, 4],
       [5, 3, 7, 1, 3, 0, 5, 5, 3, 6],
       [4, 1, 1, 0, 4, 3, 3, 3, 2, 1]])

In [None]:
np.sort(a.ravel())   # returns sorted copy

In [351]:
a.sort(axis=0)       # inplace sort
a

array([[0, 1, 1, 1, 2, 3, 3, 3, 4, 4],
       [0, 1, 1, 3, 3, 4, 5, 5, 6, 6],
       [0, 1, 3, 3, 3, 5, 5, 6, 6, 7]])

In [357]:
# a.sort(axis=1)
a.sort()
a

array([[0, 1, 1, 3, 3, 4, 5, 6, 6, 6],
       [0, 1, 3, 3, 3, 5, 5, 5, 6, 7],
       [0, 1, 1, 1, 2, 3, 3, 3, 4, 4]])

In [358]:
np.random.seed(4445)

a = np.random.choice(10, size=(3, 10))
a

array([[6, 0, 3, 1, 5, 3, 1, 6, 6, 4],
       [5, 3, 7, 1, 3, 0, 5, 5, 3, 6],
       [4, 1, 1, 0, 4, 3, 3, 3, 2, 1]])

In [359]:
a.argsort(axis=0)

array([[2, 0, 2, 2, 1, 1, 0, 2, 2, 2],
       [1, 2, 0, 0, 2, 0, 2, 1, 1, 0],
       [0, 1, 1, 1, 0, 2, 1, 0, 0, 1]])

In [None]:
a.argsort(axis=1)

### Получение уникальных элементов

In [360]:
np.unique(a)

array([0, 1, 2, 3, 4, 5, 6, 7])

### Объединение массивов

In [None]:
from itertools import chain, zip_longest

def print_as_columns(*args, sep='\t'):
    """
    print arrays as columns
    """
    args = list(map(lambda s: s.split('\n'), args))
    width = max(map(len, chain.from_iterable(args)))
    
    fill = lambda s: '{:<{width}s}'.format(s, width=width)
    fillvalue = fill('')
    
    args = map(lambda e: map(fill, e), args)
    args = map(sep.join, zip_longest(*args, fillvalue=fillvalue))
    print(*args, sep='\n')

In [363]:
np.random.seed(1398)

c = np.random.permutation(np.arange(0, 12))
i = c.shape[0] // 2

a, b = c[:i], c[i:]
a, b = a.reshape(3, 2), b.reshape(3, 2)

In [364]:
print_as_columns(repr(a), repr(b))
np.vstack((a, b))

NameError: name 'print_as_columns' is not defined

In [365]:
np.concatenate((a, b), axis=0)

array([[ 8,  4],
       [ 0,  3],
       [ 7,  6],
       [ 1,  2],
       [11,  5],
       [ 9, 10]])

In [366]:
print_as_columns(repr(a), repr(b))
np.hstack((a, b))

NameError: name 'print_as_columns' is not defined

In [367]:
np.concatenate((a, b), axis=1)

array([[ 8,  4,  1,  2],
       [ 0,  3, 11,  5],
       [ 7,  6,  9, 10]])

### Подсчет расстояний между точками

In [370]:
from scipy.spatial.distance import pdist, squareform

In [371]:
np.random.seed(9872)

X = np.random.random(size=(5, 2)) * 10
X

array([[0.33823417, 2.08502959],
       [1.20627581, 5.15557834],
       [4.34896139, 2.34885034],
       [9.38091212, 0.89160899],
       [5.77386694, 4.41725834]])

In [372]:
d = pdist(X)
d

array([3.19088795, 4.01939476, 9.1210897 , 5.91484527, 4.21357267,
       9.219876  , 4.62687855, 5.23870982, 2.51170609, 5.04390507])

In [373]:
squareform(d)

array([[0.        , 3.19088795, 4.01939476, 9.1210897 , 5.91484527],
       [3.19088795, 0.        , 4.21357267, 9.219876  , 4.62687855],
       [4.01939476, 4.21357267, 0.        , 5.23870982, 2.51170609],
       [9.1210897 , 9.219876  , 5.23870982, 0.        , 5.04390507],
       [5.91484527, 4.62687855, 2.51170609, 5.04390507, 0.        ]])

In [374]:
norm = np.linalg.norm(X, ord=2, axis=1)
norm

array([2.11228567, 5.29481722, 4.9427283 , 9.42318836, 7.26978064])

In [375]:
squareform(pdist(X / norm[:, np.newaxis]))

array([[0.        , 0.06900716, 0.88320724, 1.22245132, 0.73897735],
       [0.06900716, 0.        , 0.82076742, 1.16710728, 0.67441346],
       [0.88320724, 0.82076742, 0.        , 0.39777586, 0.15768922],
       [1.22245132, 1.16710728, 0.39777586, 0.        , 0.55107649],
       [0.73897735, 0.67441346, 0.15768922, 0.55107649, 0.        ]])

In [376]:
pdist(X, metric='cosine')

array([0.00238099, 0.39002751, 0.74719361, 0.27304377, 0.33682958,
       0.6810697 , 0.22741676, 0.07911282, 0.01243295, 0.15184265])

Последний совет на сегодня:
<center><h3>Не забываем читать документацию и пользоваться поиском</h3></center>