In [None]:
import numpy as np

# NumPy
Матрицы - частный случай n-мерного массива. Такие массивы предоставляет пакет *NumPy*, (`np` – традиционный псведоним для импорта). Они гораздо быстрее питоновских списков, потому что размещают элементы массива подряд в непрерывной области памяти. Все элементы одного объекта np.array имеют один и тот же тип `dtype`. 

In [None]:
# Пример — матрица 2x3
A = np.array([[3,1,2], [4,0,2]])
A

In [None]:
A[1,2]

In [None]:
# явно укажем тип данных
A = np.array([[3,1,2], [4,0,2]], dtype=np.float32)
A

### Изменение формы
Форму и размерность массива можно менять, не изменяя данные

In [None]:
A.shape

In [None]:
A.reshape((3,2))

In [None]:
w = np.array([3,2,1])
w

In [None]:
w.shape

In [None]:
u = np.array([3,2,1]).reshape((3,1))
u

In [None]:
v = np.array([4,2,-4]).reshape((1,3))
v

### Произведения

In [None]:
v*u

In [None]:
v.dot(u)

In [None]:
v.dot(w)

In [None]:
A.dot(w)

In [None]:
A.dot(u)

### Разница в производительности
Векторизованные через NumPy операции гораздо быстрее, чем вычисления в цикле в питоне, так как данные numpy-массива расположены линейно в памяти, и используется только один питоновский вызов к эффективному алгоритму на Си.

Рассмотрим пример: подсчитаем среднее арифметическое значения 3x+5y для N пар (x,y). Измерим время выполнения в реализациях на чистом Питоне и при помощи NumPy.

In [None]:
from random import randint
N = 1000000
A = [(randint(1,99), randint(1,99)) for i in range(N)]
A

In [None]:
S = 0
for x,y in A:
    S += 3*x+5*y
S/N

Для измерения времени используем функцию %timeit из IPython, которая выполняет заданный оператор несколько раз, а затем показывает среднее время. Но у нас несколько действий, а не одно, поэтому завернем вычисление в функцию и будем замерять по таймеру вызов этой функции.

In [None]:
def avg3x5y(A):
    S = 0
    for x,y in A:
        S += 3*x+5*y
    return S/N

%timeit avg3x5y(A)

Для numpy, вычислим матрицу скалярных произведения строк A  на константный вектор (3,5), и найдем среднее ее элементов. Проверим совпадение результатов:

In [None]:
A_ = np.array(A)
u = np.array([3,5])
A_.dot(u).mean()

In [None]:
%timeit A_.dot(u).mean()