# NumPy (продолжение)

## Напоминание

* Знакомство с array
* Методы создания
* Арифметические операции и универсальные функции
* Способы индексации (стандартный, списки индексов, логическая)

In [1]:
import numpy as np
import time

## Трюки с размерностями

In [3]:
A = np.arange(15).reshape(3, 5)
print(A)

[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]]


* Транспонирование матрицы:

In [4]:
print(A.T)

[[ 0  5 10]
 [ 1  6 11]
 [ 2  7 12]
 [ 3  8 13]
 [ 4  9 14]]


* Конкатенация таблиц по горизонтали и вертикали (соответствующие размерности должны совпадать!):

In [5]:
B = np.arange(6).reshape(2, 3)
print(B)

[[0 1 2]
 [3 4 5]]


In [6]:
print(np.concatenate((A.T, B), axis = 0)) # можно конкатенировать любое кол-во матриц

[[ 0  5 10]
 [ 1  6 11]
 [ 2  7 12]
 [ 3  8 13]
 [ 4  9 14]
 [ 0  1  2]
 [ 3  4  5]]


In [7]:
print(np.vstack((A.T, B))) # по вертикали (vertical stack)

[[ 0  5 10]
 [ 1  6 11]
 [ 2  7 12]
 [ 3  8 13]
 [ 4  9 14]
 [ 0  1  2]
 [ 3  4  5]]


In [8]:
print(np.hstack((A, B.T))) # по горизонтали (horizontal stack)

[[ 0  1  2  3  4  0  3]
 [ 5  6  7  8  9  1  4]
 [10 11 12 13 14  2  5]]


* Изменение размеров матрицы (общее количество элементов должно оставаться прежним!):

In [9]:
A = np.arange(0, 15).reshape(3, 5)
print(A)

[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]]


In [10]:
A = np.arange(0, 15).reshape(-1, 5) # один из параметров может быть равен -1
print(A)                            # в этом случае его расчет будет произведен автоматически

[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]]


* «Вытягивание» в вектор:

In [85]:
A.ravel()

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])

In [87]:
np.ravel(A, order = 'F')

array([ 0,  5, 10,  1,  6, 11,  2,  7, 12,  3,  8, 13,  4,  9, 14])

## Ещё несколько полезных вещей


In [11]:
A = np.arange(0, 25).reshape(5, 5)
A

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24]])

In [12]:
A[A > 10]

array([11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24])

In [15]:
A[np.logical_and(A < 15, A > 10)] # аналогично для and и xor

array([11, 12, 13, 14])

In [33]:
A.nonzero() # списки индексов ненулевых элементов

(array([0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4,
        4], dtype=int64),
 array([1, 2, 3, 4, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 0, 1, 2, 3, 4, 0, 1, 2, 3,
        4], dtype=int64))

## Matrix

Ещё один тип данных в NumPy — matrix. Является производным классом от ndarray, в связи с чем можно использовать все методы и функции, применимые к array. Однако:
* matrix — строго 2мерные;
* матричное умножение осуществляется через * (в отличие от dot для array)

In [16]:
A = np.arange(0, 4).reshape(2, 2)
B = np.arange(3, 7).reshape(2, 2)
print(A)
print(B)

[[0 1]
 [2 3]]
[[3 4]
 [5 6]]


In [17]:
A * B

array([[ 0,  4],
       [10, 18]])

In [19]:
A_mat = np.matrix(A)
B_mat = np.matrix('3 4; 5 6') # ещё один способ создания matrix
print(A_mat)
print(B_mat)

[[0 1]
 [2 3]]
[[3 4]
 [5 6]]


In [20]:
A_mat * B_mat

matrix([[ 5,  6],
        [21, 26]])

## Цель

**Зачем** нам нужен NumPy, если есть вложенные списки/кортежи и циклы?

Причина заключается в скорости работы:

In [22]:
A_quick_arr = np.random.normal(size = (100000,))
B_quick_arr = np.random.normal(size = (100000,))

A_slow_list, B_slow_list = list(A_quick_arr), list(B_quick_arr)

In [23]:
start = time.clock()
ans = 0
for i in range(100000):
    ans += A_slow_list[i] * B_slow_list[i]
print(time.clock() - start) # время выполнения в секундах

0.04287815281478754


In [25]:
start = time.clock()
ans = sum([A_slow_list[i] * B_slow_list[i] for i in range(100000)])
print(time.clock() - start)

0.038185521652687626


In [30]:
start = time.clock()
ans = np.sum(A_quick_arr * B_quick_arr)
print(time.clock() - start)

0.0005627907235350449


## Итоги

Основной объект NumPy — array:
* Арифметические операции
* Математические операции
* Различные способы индексации
* Изменение размеров
* Быстро