## NumPy

Основным объектом NumPy является однородный многомерный массив (в numpy называется numpy.ndarray).
Это многомерный массив элементов (обычно чисел), одного типа.


Наиболее важные атрибуты объектов ndarray:

   $ndarray.ndim$ - число измерений (чаще их называют "оси") массива.

   $ndarray.shape$ - размеры массива, его форма. Это кортеж натуральных чисел, показывающий длину массива по каждой оси. 

   $ndarray.dtype$ - объект, описывающий тип элементов массива. 



#### Создание массива:

    
   $numpy.array()$ - создает массив из обычных списков или кортежей Python

   $numpy.zeros()$ - создает массив из нулей, в скобках необходимо указать размер массива.
   
   $numpy.onec()$ - создает массив из единиц, в скобках необходимо указать размер массива.
   
   $numpy.empty()$ - создает пустой массив ( значения массива какой-то мусор), в скобках необходимо указать размер массива.

### Примеры

Для начала необходимо подключить пакет NumPy. 

In [None]:
# Можно делать так
import numpy

In [None]:
numpy.sum(a)

In [2]:
# Так делать не нужно
from numpy import *

In [None]:
sum(a)

In [2]:
# Так делать удобнее
import numpy as np

In [None]:
np.sum(a)

Иногда бывает полезно быстро обратиться к документации функции, чтобы посмотреть параметры, которые она принимает на вход. Для этого в ipython-notebook встроен удобный интерфейс, а именно следующая команда

In [3]:
?np.array

Еще один способ узнать параметры shift+tab

In [None]:
np.array()

##### np.array

In [42]:
mas_1 = np.array((1, 2, 3))
mas_1

array([1, 2, 3])

In [69]:
L = [1, 2, 3]
mas_2 = np.array(L)
mas_2

array([1, 2, 3])

In [16]:
mas_3 = np.array(range(1,4))
mas_3

array([1, 2, 3])

##### np.zeros

In [17]:
Z = np.zeros((5,2))
Z

array([[ 0.,  0.],
       [ 0.,  0.],
       [ 0.,  0.],
       [ 0.,  0.],
       [ 0.,  0.]])

In [22]:
Z.dtype

dtype('float64')

##### np.ones

In [19]:
O = np.ones((2,5))
O

array([[ 1.,  1.,  1.,  1.,  1.],
       [ 1.,  1.,  1.,  1.,  1.]])

In [21]:
O.shape

(2, 5)

##### np.empty

In [20]:
E = np.empty(5)
E

array([  0.00000000e+00,   0.00000000e+00,   1.54674219e-75,
         1.15393392e-71,   0.00000000e+00])

In [23]:
E.ndim

1

### Базовые операции над массивами

Математические операции над массивами выполняются поэлементно. Создается новый массив, который заполняется результатами действия оператора. 
Операнды должны иметь один и тот же размер

In [26]:
print('mas_1: ', mas_1)
print('mas_2: ', mas_2)

mas_1:  [1 2 3]
mas_2:  [1 2 3]


In [44]:
mas_1 == mas_2


array([ True,  True,  True], dtype=bool)

In [24]:
mas_1 + mas_2

array([2, 4, 6])

In [27]:
mas_1 - mas_2

array([0, 0, 0])

In [28]:
mas_1 * mas_2

array([1, 4, 9])

In [36]:
mas_1**mas_2

array([ 1,  4, 27])

In [38]:
mas_1 % 3  # При взятии остатка от деления на 0 возвращается 0


array([1, 2, 0])

In [29]:
mas_1 / (mas_1 - mas_1) 



array([ inf,  inf,  inf])

### Некоторые функции и методы numpy

In [39]:
np.cos(mas_1) 

array([ 0.54030231, -0.41614684, -0.9899925 ])

In [41]:
np.sin(np.array([np.pi, 0, -np.pi]))

array([  1.22464680e-16,   0.00000000e+00,  -1.22464680e-16])

In [45]:
array = np.array([[1, 2, 3],[10, 1, 7]])
array

array([[ 1,  2,  3],
       [10,  1,  7]])

In [73]:
array.sum()

24

In [46]:
array.sum(axis = 0)

array([11,  3, 10])

In [47]:
array.max(axis = 1)

array([ 3, 10])

In [48]:
array.min()

1

In [33]:
np.prod(mas_1)

6

###  Некоторые функции из линейной алгебры

$np.dot()$ - матричное умножение

In [80]:
A = np.array([[1,2], [1,3]])
B = np.array([[1,1], [1,2]])
np.dot(A, B)

array([[3, 5],
       [4, 7]])

$np.linalg.det()$ - отпределитель матрицы

In [84]:
np.linalg.det(A)

1.0

### Время работы

In [49]:
def my_dot(A, B):
    RES = np.zeros((A.shape[0], B.shape[1]))
    for i in range(A.shape[0]):
        for q in range(B.shape[1]):
            for j in range(B.shape[0]):
                RES[i][q] += A[i][j]*B[j][q]
    
    return RES


Сравним время работы np.dot() и функции my_dot()

In [50]:
import time
A = np.random.randint(1, 3, (100, 100))
B = np.random.randint(1, 3, (100, 100))
start = time.time()
my_dot(A, B)
print ('my_dot work:', time.time() -  start)

my_dot work: 1.0984649658203125


In [51]:
start = time.time()
A.dot(B)
print ('numpy dot work', time.time() -  start)

numpy dot work 0.002323150634765625


Проверим, что np.dot() работает так же как и my_dot

In [54]:
np.sum(my_dot(A, B) == A.dot(B))

10000

In [55]:
%time my_dot(A, B)

CPU times: user 1.06 s, sys: 6.22 ms, total: 1.06 s
Wall time: 1.06 s


array([[ 232.,  234.,  235., ...,  244.,  227.,  236.],
       [ 233.,  240.,  242., ...,  250.,  234.,  237.],
       [ 216.,  219.,  222., ...,  224.,  216.,  221.],
       ..., 
       [ 214.,  223.,  223., ...,  232.,  211.,  220.],
       [ 231.,  240.,  240., ...,  248.,  235.,  237.],
       [ 213.,  216.,  212., ...,  225.,  212.,  214.]])

In [56]:
%time A.dot(B)

CPU times: user 1.48 ms, sys: 564 µs, total: 2.05 ms
Wall time: 1.1 ms


array([[232, 234, 235, ..., 244, 227, 236],
       [233, 240, 242, ..., 250, 234, 237],
       [216, 219, 222, ..., 224, 216, 221],
       ..., 
       [214, 223, 223, ..., 232, 211, 220],
       [231, 240, 240, ..., 248, 235, 237],
       [213, 216, 212, ..., 225, 212, 214]])

### Numba

In [66]:
from numba import jit
@jit('f8[:,:](f8[:,:],f8[:,:])')
def my_dot_jit(A, B):
    RES = np.zeros((A.shape[0], B.shape[1]))
    for i in range(A.shape[0]):
        for q in range(B.shape[1]):
            for j in range(B.shape[0]):
                RES[i][q] += A[i][j]*B[j][q]
    
    return RES


In [69]:
A = np.random.rand(100, 100)
B = np.random.rand(100, 100)
%time my_dot_jit(A, B)

CPU times: user 2.95 ms, sys: 14 µs, total: 2.96 ms
Wall time: 2.99 ms


array([[ 26.72255514,  21.99298792,  26.92953766, ...,  24.22261275,
         24.2592003 ,  25.11279743],
       [ 25.67793747,  21.83374013,  26.50490539, ...,  23.0215172 ,
         22.47398475,  23.78105953],
       [ 24.35605785,  23.50288585,  26.43782425, ...,  25.51780998,
         24.27200478,  23.64296573],
       ..., 
       [ 21.91520919,  21.74380267,  23.88243171, ...,  21.98975265,
         21.08083847,  21.06732872],
       [ 27.15436497,  24.9790003 ,  27.9339635 , ...,  25.51546891,
         24.8437802 ,  24.60586862],
       [ 22.59788472,  21.12268311,  23.42131676, ...,  22.29186952,
         21.54177733,  22.30491796]])

Большой выйгрыш по времени осуществляется благодаря явной подтановке типов. Каждая компиляция производится для конкретного набора типов аргументов.

### Индексы и срезы

Одномерные массивы осуществляют операции индексирования и срезов очень схожим образом с обычными списками.

In [80]:
array = np.array([[1, 2, 3],[10, 1, 7]])
array

array([[ 1,  2,  3],
       [10,  1,  7]])

In [55]:
array[0]

array([1, 2, 3])

In [54]:
array[0, 2]

3

In [63]:
array[1, -1]

7

In [58]:
array[1, 1:3]

array([1, 7])

In [61]:
array > 5

array([[False, False, False],
       [ True, False,  True]], dtype=bool)

In [75]:
array

array([[ 1,  2,  3],
       [10,  1,  7]])

In [62]:
array[array > 5]

array([10,  7])

In [64]:
array[array == 1]

array([1, 1])

### Объединение массивов

In [25]:
q = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
e = np.array([4, 5, 6])
np.vstack([q,e])

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9],
       [4, 5, 6]])

In [32]:
np.hstack([q,e.reshape(3, 1)])

array([[1, 2, 3, 4],
       [4, 5, 6, 5],
       [7, 8, 9, 6]])

In [30]:
np.concatenate([q, e.reshape(3, 1)], axis = 1)

array([[1, 2, 3, 4],
       [4, 5, 6, 5],
       [7, 8, 9, 6]])

### Изменение формы

$ndarray.reshape()$ - возвращает аргумент с измененной формой

$ndarray.resize()$ - изменяет форму массива

$ndarray.ravel()$ - делает массив плоским

$ndarray.transpose()$ - транспонирование

$np.newaxis()$ - добавляет фиктивную ось

In [66]:
array.reshape(6, 1)

array([[ 1],
       [ 2],
       [ 3],
       [10],
       [ 1],
       [ 7]])

In [67]:
array.shape = (6, 1)
array

array([[ 1],
       [ 2],
       [ 3],
       [10],
       [ 1],
       [ 7]])

In [69]:
array.resize(2,3)
array

array([[ 1,  2,  3],
       [10,  1,  7]])

In [65]:
array.ravel()  

array([ 1,  2,  3, 10,  1,  7])

In [70]:
array.transpose()

array([[ 1, 10],
       [ 2,  1],
       [ 3,  7]])

In [46]:
array[:,np.newaxis]

array([[[ 1,  2,  3]],

       [[10,  1,  7]]])

In [76]:
array.shape

(2, 3)

In [48]:
array[:,np.newaxis].shape

(2, 1, 3)

In [49]:
array[:, :, np.newaxis].shape

(2, 3, 1)

In [82]:
a = np.ones((6,3))
b =  np.ones(6)*3
#a+b
a+b[:, np.newaxis]

array([[ 4.,  4.,  4.],
       [ 4.,  4.,  4.],
       [ 4.,  4.,  4.],
       [ 4.,  4.,  4.],
       [ 4.,  4.,  4.],
       [ 4.,  4.,  4.]])

#### np.broadcast

In [63]:
x = np.array([[1], [2], [3]])
y = np.array([4, 5, 6])
b = np.broadcast(x, y)
b

<numpy.broadcast at 0x7f8a72aeb110>

In [64]:
[(u,v) for (u,v) in b]

[(1, 4), (1, 5), (1, 6), (2, 4), (2, 5), (2, 6), (3, 4), (3, 5), (3, 6)]

### Копии

При работе с массивами их данные иногда необходимо копировать в другой массив. 
Это часто является источником путаницы, так как простое присваивание не создает ни копии массива, ни копии его данных.

In [72]:
new_array = array


In [73]:
new_array[0,0] = -1
new_array

array([[-1,  2,  3],
       [10,  1,  7]])

In [74]:
array

array([[-1,  2,  3],
       [10,  1,  7]])

чтобы не сталкиваться с такой проблемой, необходимо использовать функцию $np.copy()$

In [86]:
copy_array = np.copy(array)
copy_array

array([[-1,  2,  3],
       [10,  1,  7]])

In [77]:
copy_array[0,0] = 1
copy_array

array([[ 1,  2,  3],
       [10,  1,  7]])

In [78]:
array

array([[-1,  2,  3],
       [10,  1,  7]])

In [1]:
import numpy as np

### Задачи по numpy на семинаре:

1. Дан ndarray объект, найти четный максимальный элемент.

2. Найти максимальный элемент в векторе x среди элементов, после которых стоит нулевой. 
Для x = np.array([6, 2, 0, 3, 0, 0, 5, 7, 0]) ответ 7.

3. Реализуйте функцию, которая принимает на вход numpy-массив целых чисел a, и генерирует массив, в котором число i встречается a[i] раз.
Обратите внимание на функцию np.repeat

4. Дан numpy-вектор и действительное число x. Вектор длины n+1 задает полином степени n. Найти производную полинома в точке x. (Например, вектор  [3, 4, 7] соответствует полиному $3 + 4x + 7x^2$) 

5. Дан двумерный массив размера m x n. Определить, одинакова ли сумма элементов во всех строках и столбцах.

6. Даны матрица $А=(a)_{i,j}$ и матрица $В=(b)_{i,j}$
 размера n x n. Найти матрицу $С=(c)_{i,j}$
 такую, что ее элементы $c_{i,j}=a_{2i,j}∗b_{j,i}+a_{i,i}∗b_{j,j}$

