# AI Community @ Семинар  №2
## Пример использования numpy 

Numpy - библиотека для Python, позволяющая совершать операции с многомерными матрицами (тензорами) эффективно и удобно

# Базовая алгебра в numpy

In [None]:
import numpy as np
import numpy.linalg as nplg
from scipy import linalg

In [None]:
A = np.array([[1, 2], [3, 4], [5, 6]])
b = np.array([3, 5])
print('A:\n{}, \nb:\n{}'.format(A, b))

In [None]:
print('Размер A:{}, размер b:{}'.format(A.shape, b.shape))

## Умножение матрицы на вектор

In [None]:
c = A.dot(b)
print('c:\n{}'.format(c))

In [None]:
B = np.array([[1, 7], [4, 9]])

## Умножение матрицы на матрицу

In [None]:
C = A.dot(B)
print('C:\n{}'.format(C))

## Поэлементное перемножение двух матриц

In [None]:
print(A, '\n')
print(C, '\n')

print(A * C)

## Транспонирование

In [None]:
C

In [None]:
C.T

## Обратная матрица
#### Обратная матрица определена только для квадратных матриц
#### Мы поговорим про это на следующих занятиях

In [None]:
print(linalg.inv(B), '\n')
print(nplg.inv(B))

## Эксперимент с производительностью вычислений

In [None]:
np.random.seed(23)
np.random.randint(0, 9, size=(5, 5))

Создание двух больших матриц с помощью numpy

In [None]:
M, N, K = 2000, 1000, 4000

In [None]:
Big_A = np.random.random(size=(M, N))
Big_B = np.random.random(size=(N, K))

In [None]:
import time

Проверим время перемножения двух больших матриц с помощью numpy

In [None]:
start_time = time.time()
C_Big = Big_A.dot(Big_B)
numpy_calc_time = time.time() - start_time
print('Numpy multiplication time: {}'.format(numpy_calc_time))

In [None]:
import random as rnd

Напишем свои простейшие реализации создания и перемножения двух матриц

In [None]:
def create_random_matrix(shape):
    A = []
    for i in range(shape[0]):
        A_row = [rnd.random() for _ in range(shape[1])]
        A.append(A_row)
    return A

In [None]:
My_Big_A = create_random_matrix(shape=(M, N))
My_Big_B = create_random_matrix(shape=(N, K))

In [None]:
def multiply_matrices(A, B):
    m, n, k = len(A), len(A[0]), len(B[0])
    
    C = []
    for i in range(m):
        row_sum = 0.
        C.append([])
        for j in range(k):
            for p in range(n):
                row_sum += A[i][p] * B[p][j]
            C[i].append(row_sum)
    
    return C

Замерим время перемножения матриц нашим алгоритмом

In [None]:
start_time = time.time()
My_Big_C = multiply_matrices(My_Big_A, My_Big_B)
my_calc_time = time.time() - start_time
print('My multiplication time: {}'.format(my_calc_time))

Если вы не меняли размерность матриц, то можете заметить, что время, затрачиваемое на выполнение этой задачи на читом python превосходит все мысленные гранницы. В дальнейшем вам часто придётся с этим сталкиваться с такой ситуацией, поэтому нужно использовать логгер, который будет выводить статус процесса. Для этого очень часто используют tqdm

In [None]:
!pip install tqdm
from tqdm import tqdm_notebook, tqdm

In [None]:
def multiply_matrices_tqdm(A, B):
    m, n, k = len(A), len(A[0]), len(B[0])
    
    C = []
    # оборачиваем итератор функцией tqdm_notebook
    for i in tqdm_notebook(range(m)):
        row_sum = 0.
        C.append([])
        for j in range(k):
            for p in range(n):
                row_sum += A[i][p] * B[p][j]
            C[i].append(row_sum)
    
    return C

In [None]:
start_time = time.time()
My_Big_C = multiply_matrices_tqdm(My_Big_A, My_Big_B)
my_calc_time = time.time() - start_time
print('My multiplication time: {}'.format(my_calc_time))

Сравним время работы

In [None]:
print('Speed up: {}'.format(my_calc_time / numpy_calc_time))

Мы потратили 20 минут на собственную реализацию, которая при том еще и работает в тысячу с лишним раз медленнее, чем реализация `numpy`. Теперь вы понимаете, как вам может пригодиться `numpy` в реальных задачах.

## Создание матриц

#### Матрица из единиц размером 2х3

In [None]:
np.ones((2, 3))

#### Матрица из нулей размером 2х3

In [None]:
np.zeros(shape=(2, 3))

#### Единичная матрица размера 5x5

In [None]:
a = np.eye(5, 5)
a

#### Можно задавать тип элементов внутри матрицы

In [None]:
a = np.eye(5, 5, dtype='int')
print(a)

In [None]:
print(np.ones_like(a), '\n')
print(np.zeros_like(a))

### Индексация и срезы

In [None]:
# !pip install matplotlib
# !pip install skimage

from skimage.io import imread, imshow
import matplotlib.pyplot as plt
%matplotlib inline

In [None]:
def plot_images(imgs, names=None):        
    fig, axs = plt.subplots(ncols=len(imgs), figsize=(16, 8))
    for i, ax in enumerate(axs):
        ax.imshow(imgs[i])
        if names and i < len(names):
            ax.set_title(names[i], fontsize=15)
    plt.show()

Изображение представляется той же матрицей, или ее обобщением, называемым тензором. Для более ясного преставления дальнеших операций, будем работать с изображениями.

In [None]:
img = imread('data/lemur.jpg')

In [None]:
type(img)

In [None]:
img.shape

In [None]:
imshow(img)

#### Выполняем различные срезы по изображению

In [None]:
imshow(img[150:650, 1100:1600, :])

In [None]:
imshow(img[150:650, :])

#### Посмотрим на цветовые компоненты изображения (RGB)

In [None]:
plot_images([img[:, :, 0], img[:, :, 1], img[:, :, -1]])
# Аналогичная операция
plot_images([img[..., 0], img[..., 1], img[..., -1]])

#### Применение масок к изображению

In [None]:
dst = img.copy()

white_mask = img > 128
# white_mask = ~white_mask
white_mask = white_mask.all(axis=2)

dst[white_mask] = [255, 100, 80]
imshow(dst);

In [None]:
from skimage import draw

In [None]:
dst = img.copy()
rr, cc = draw.circle(r=350, c=500, radius=250)
dst[rr, cc] = [255, 0, 255] 
imshow(dst)

### Еще немного numpy

#### Создадим вектор из 16 элементов [0; 16)

In [None]:
a = np.arange(16)
a

#### Поменяем его shape

In [None]:
b = a.reshape((4, 4))
b

#### Выпрямим его обратно

In [None]:
b.flatten()

#### Можем сохранять и загружать матрицы numpy

In [None]:
np.save('data/lemur_processed', dst)

In [None]:
lemur_loaded = np.load('data/lemur_processed.npy')
imshow(lemur_loaded)