## NumPy basics

**Numpy** - это библиотека Python для вычислительно эффективных операций с многомерными массивами, предназначенная в основном для научных вычислений.

In [1]:
# отключим предупреждения
import warnings

warnings.simplefilter("ignore")

import numpy as np

In [2]:
a = np.array([0, 1, 2, 3])
a

array([0, 1, 2, 3])

В NumPy базове операции выполняются достаточно эффективно


In [3]:
L = range(1000)
L

range(0, 1000)

In [4]:
%timeit [i**2 for i in L]

932 µs ± 406 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [None]:
a = np.arange(1000)

In [None]:
%timeit a**2

## Создание массивов

* **1-D**:


In [None]:
a = np.array([0, 1, 2, 3])
a

In [None]:
a.ndim

In [None]:
a.shape

In [None]:
len(a)

* **2-D, 3-D, ...**:


In [None]:
b = np.array([[0, 1, 2], [3, 4, 5]])  # 2 x 3 array
b

In [None]:
b.ndim

In [None]:
b.shape

In [None]:
len(b)  # длина по первому измерению (строкам)

In [None]:
c = np.array([[[1], [2]], [[3], [4]]])
c

In [None]:
c.shape

## Методы для создания массивов

На практике мы редко добавляем элементы по одному


- Равномерно распределенные элементы:


In [None]:
a = np.arange(10)  # 0 .. n-1  (!)
a

In [None]:
b = np.arange(1, 10, 2)  # начало, конец (включительно), шаг
b

- по числу элементов:


In [None]:
c = np.linspace(0, 1, 6)  # start, end, num-points
c

In [None]:
d = np.linspace(0, 1, 5, endpoint=False)
d

- Часто встречающиеся массивы:


In [None]:
a = np.ones((3, 3)) 
a

In [None]:
b = np.zeros((2, 2))
b

In [None]:
c = np.eye(3)
c

In [None]:
d = np.diag(np.array([1, 2, 3, 4]))
d

* `np.random` генерация случайных чисел (Mersenne Twister PRNG):

In [None]:
a = np.random.rand(4)  # uniform in [0, 1]
a

In [None]:
b = np.random.randn(4)  # Gaussian
b

In [None]:
np.random.seed(1234)  # Setting the random seed

## Основные типы данных NumPy

In [None]:
a = np.array([1, 2, 3])
a.dtype

In [None]:
b = np.array([1.0, 2.0, 3.0])
b.dtype

Можно задать тип данных явно. По умолчанию - `float64`

In [None]:
c = np.array([1, 2, 3], dtype=float)
c.dtype

In [None]:
a = np.ones((3, 3))
a.dtype

Прочие типы данных:

- Комплексные числа


In [None]:
d = np.array([1 + 2j, 3 + 4j, 5 + 6 * 1j])
d.dtype

 - Bool


In [None]:
e = np.array([True, False, False, True])
e.dtype

- Строки

На строки память выделяется "жадно" - по максимальному числу литер в строке. 
В этом примере на каждую строку выделяется по 7 литер, и тип данных - 'S7'

In [None]:
f = np.array(["Bonjour", "Hello", "Hallo",])
f.dtype  # <--- strings containing max. 7 letters

## Индексирование массивов и срезы

In [None]:
a = np.arange(10)
a

In [None]:
a[0], a[2], a[-1]

Работает и популярный в Python способ отражения массива:


In [None]:
a[::-1]

Для многомерных массивов индексы - это кортежи целых чисел


In [None]:
a = np.diag(np.arange(3))
a

In [None]:
a[1, 2]

In [None]:
a[2, 1] = 10  
a

In [None]:
a[1]

**Срезы**

In [None]:
a = np.arange(10)
a

In [None]:
a[2:9:3]  # [начало:конец:шаг]

Последний индекс не включается

In [None]:
a[:4]

По умолчанию \`start\` -  0,
\`end\` - индекс последнего элемента, \`step\` - 1:


In [None]:
a[1:3]

In [None]:
a[::2]

In [None]:
a[3:]

Можно совмещать присваивание и срез:


In [None]:
a = np.arange(10)
a[5:] = 10
a

In [None]:
b = np.arange(5)
a[5:] = b[::-1]
a