In [None]:
import numpy as np # Как правило импортируют именно так
import matplotlib.pyplot as plt
import os
from numpy import pi

from utils import *
from answers import *

__NumPy__ - open-source модуль, который предостовляет эффективную работу с массивами и однородными данными (~MATLAB), очень прост и удобен в использовании. 

__NumPy array__ - многомерный массив объектов одинакового типа. В памяти представлен как блок памяти + метка говорящая о типе данных + кол-во размерностей + размерности векторов ``[n * m *...]``.

Обычные массивы в питоне в принципе хороши т.к. имеют в себе удобный `list comprehension` и могут хранить данные разных типов. Но они не поддерживают векторизацию, должны хранить информацию о типе для каждого элемента и для выполнения каких-либо операций нужен будет `dispatching`. Да __NumPy array__ этого не поддерживает, зато он эффективен и многое уже написано для удобного использования.

Класс представлющий массивы в NumPy - __ndarray__ (экземпляр можно получить, например с помощью `np.array(...)`)

__Пример 1:__ Двумерный массив [2 * 5], где каждый элемент занимает 4 байта

In [None]:
x = np.array([[0, 1, 2, 3, 4],
              [5, 6, 7, 8, 9]], dtype=np.int32)
print(x) # np.darray умеет выводится в человеческом виде
print("Количество размерностей (numpy называет rank):", x.ndim)
print("Сами размерности(axes):", x.shape)
print("Тип данных:", x.dtype)

__Представление (view)__ - конкретный взгляд на ndarray, например мы можем иметь просто матрицу, а после сделать из нее `view` в виде транспонированной за O(1), или из массива 15 элементов, сделать `view` - матрицу 3 * 5 (еще примеры будут ниже).

In [None]:
a = np.arange(15)     # создают ndarray([0..15]) тип определяет сам (int64, float64)
b = a.reshape((3, 5)) # создает новое представление (view) и возвращает его, 
                      # (если возможно, то данные не копируются)
c = b.T               # создает новое представление транспонированной матрицы

print(a)
print(b)
print(c)

c.reshape(15) # здесь он будет вынужден копировать данные, 
              # т.к. `c` - это представление транспонированной матрицы, 
              # мы не сможем просто так ее превратить в одномерный массив

Функции для создания масивов, тип по умолчанию - `float64`:

In [None]:
z = np.zeros((3, 4)) # Создаст матрицу 3 * 4, заполненную нулями с типом float64
o = np.ones((2, 3, 4), dtype=np.int16) # 2 * 3 * 4, int16
e = np.empty((2, 3)) # создаст матрицу 2 * 3, не инициализрованную, 
                     # значаения зависят от состояния памяти текущего
print("zeros:", os.linesep, z)
print("ones:" , os.linesep, o)
print("empty:", os.linesep, e)

__numpy.arange([start, ]stop, [step, ]dtype=None)__ - генерирует ndarray, аналог `range`

In [None]:
i = np.arange(10, 30, 5)
f = np.arange(0, 2, 0.3) # создаст массив 0..2, с шагом 0.3

print("i = ", i)
print("f = ", f)

Если использовать шаг как вещественное число, 
то в общем случае нельзя определить точное кол-во елементов (из-за лимитированной точности даблов).
Для этого есть __np.linspace(from, to, count)__:

In [None]:
print(np.linspace(0, 2, 9))
x = np.linspace(0, 2 * pi, 5)
print("x =", x)

"""
    В numpy можно менять формат вывод на экран, printoptions - функция из utils.py
    после выхода из блока with, все настройки формата вывода сбросятся
    precision - задает точность вывода
    supress - выводит в челевеко читаемом виде, убирает exp, округляет маленькие значения
"""
with printoptions(precision=3, suppress=True): 
    print("sin =", np.sin(x)) # Возьмет sin от каждого элемента массива

Еще есть __np.logspace(from, to, count, endpoint, base)__ - возвращает числа в диапозоне `[base ** from, base ** to)` равномерно распределенные в логарифмической шкале.<br/>
```python
np.logspace(from, to, count, True, 10) == 10 ** np.linspace(from, to, count)
np.log10(np.logspace(from, to, count, True, 10)) == np.linspace(from, to, count)
```

In [None]:
xs = np.linspace(0.02, 2, 10)
lnsp = xs
lgsp = np.logspace(0.02, 2, 10)

plt.subplots_adjust(hspace=0.4)

# В линейной шкале
plt.subplot(221)
plt.title('lin scale')
plt.grid(True)

plt.plot(xs, lnsp, 'o')
plt.plot(xs, lgsp, 'b')

# В логарифмической шкале
plt.subplot(222)
plt.title('log scale')
plt.grid(True)
plt.yscale('log')

plt.plot(xs, lnsp, 'o')
plt.plot(xs, lgsp, 'b')

plt.show()


In [None]:
# По умолчанию NumPy умеет понимать, что элементов очень много(>1000) и выводит только начало и конец
print(np.arange(1001))

# чтобы вывести все используйте опцию форматирование threshold = np.inf
with printoptions(threshold=np.inf):
    print(np.arange(1001))

## Базовые операции

Арифметические операции выполняются поэлементно. 
Создается новый массив и заполняется соответствующими значениями

In [None]:
a = np.array([20, 30, 40, 50])
b = np.arange(4)

In [None]:
print("a: ", a)
print("b: ", b)
print()

print("a - b     : ", a - b)
print("a * b     : ", a * b)
print("2 * b ** 2: ", 2 * b ** 2)
print("a < 35    : ", a < 35)

In [None]:
A = np.array( [[1,1],
               [0,1]] )

B = np.array( [[2,0],
               [3,4]] )

print(A * B)    # поэлементное перемножение
print()
print(A.dot(B)) # привычное перемножение матриц, или = np.dot(A, B)


При выполнении операция над массивами разных типов, происходит __upcast__ - т.е. тип липо сохраняется, либо берется наиболее общий

Выполнение унарных операций над масивом, реализуются как методы класса __ndarray__ (max, min etc)

In [None]:
a = np.random.random((2, 3)) # возвращает ndarray заполненный рандомом [0..1], c shape = (2, 3)
print(a)
print(a.sum())
print(a.min())
print(a.max())
print(a.argmax()) # возвращает индекс максимаального элемента

__Задание 1:__ Найти угол в градусах, __кратный 10__, такой что, __ln(|sin(a) * cos(a)|)__ максимален (при помощи numpy естественно)

In [None]:
def task1():
    """
    This function should return angle
    """
    return 10

check_task1(task1)

Одномерные мыссивы NumPy позволяют итерирование, взятие срезки и обращение по индексу, также как и обычные массивы (даже чуть больше)

In [None]:
a = np.arange(10) ** 3
print("a =", a)

print(a[2])
print(a[2:5])

a[:6:2] = 7      # a[0:6:2]; всем эллементам на позициях [0, 6) с шагом 2 присвоить 7
print(a)

print(a[ : :-1]) # перевернутый a

for i in a:
    print(i ** (1 / 3.))

Обращаться к элементам многомерного массива можно перечисляя нужные индексы через запятую, примеры: 

In [None]:
def f(x,y):
    return 10*x+y

b = np.fromfunction(f, (5, 4), dtype=int) # Создать ndarray размерностью 5 * 4 и генератор для элементов - f
print(b)

print(b[2, 3])    # = b[2][3]

print(b[0:5, 1])  # = b[ :, 1], взять всю вторую колонку матрицы b

print()
print(b[1:3, : ]) # взять строчки с [1, 3) = 1, 2
print()

print(b[-1])      # взять последнюю строку, когда индексов меньше, то они заменяются на дефолтные значения - `:`

Можно вставллять __троеточие (...)___, вставляет нужное кол-во (:), когда их не хватает <br/>
Примеры: пусть `x` имеет ранк(размерности) 5, тогда: <br/>

```text
x[1,2,...]   = x[1,2,:,:,:],
x[...,3]     = x[:,:,:,:,3], 
x[4,...,5,:] = x[4,:,:,5,:].
```

In [None]:
a = np.floor(10 * np.random.random((3, 4)))
b = a.ravel()        # вернет одномерный массив из 12 (3 * 4) элементов
c = a.reshape(3, -1) # -1 в reshape - значит этот параметр посчитается автоматически

print(a)
print(b)
print(c)

Два __ndarray__ могут быть сконкатинированны, горизонтально или вертикально. 

In [None]:
a = np.floor(10 * np.random.random((2, 2)))
print(a, os.linesep) 
 
b = np.floor(10 * np.random.random((2, 2)))
print(b)

abv = np.vstack((a,b)) # сконкатинировать по вертикали
abh = np.hstack((a,b)) # по горизонтали
print()
print("ver:", os.linesep, abv)

print()
print("hor:", os.linesep, abh)

Либо разбиты по горизонтали или вертикали.

In [None]:
vab = np.vsplit(abv, 2)
print()
print("split ver:", os.linesep, vab[0], os.linesep, vab[1])

hab = np.hsplit(abh, 2)
print()
print("split hor:", os.linesep, hab[0], os.linesep, hab[1])

Делая срезку массива, транспонирование и другие функции создающие `view` не делают копии данных. <br/>
Чтобы сделать копию используй метод __ndarray.copy()__ 

__Несколько примеров продвинутой индексации:__

In [None]:
a = np.arange(12) ** 2
print(a, os.linesep)

i = np.array([1,1,3,8,5]) # массив индексов
print(a[i])               # создаст новый ndarray, взяв элементы из `a` с индексами перечисленными в `i`

print()

j = np.array([ [3, 4], [9, 7] ]) # двумерный индексы
print(a[j])                      # создаст ndarray, у которого `shape` == j.shape, 
                                 # и заполнит его элементами на соответствующих позициях

In [None]:
# Пример двумерных индексов

a = np.arange(12).reshape(3,4)

i = np.array([[0, 1],  # Индексы по первой координате
              [1, 2]])
 
j = np.array([[2, 1],  # Индексы по второй координате
              [3, 3]])

print(a)

print(os.linesep, "a[i, j]")
print(a[i, j])         # i и j должны иметь одинаковый `shape`, создаст матрицу беря элементы с индексами [i, j]

print(os.linesep, "a[i, 2]") # возьмет второй столбец `a`, и создаст из нее массив shape = i.shape, 
                             # и элементы соответствуют индексам в данном столбце
print(a[i, 2])

print(os.linesep, "a[:, j]") # выполнит для каждой строки создание матрицы, 
print(a[:, j])               # заполнит элементами с индексами `j` в соответствующей строке


In [None]:
a = np.arange(5)

# Можно присваивать новые значения соответствующему индексу =) 
a[[1,3,4]] = 536
a

In [None]:
a = np.arange(5)

# Если индекс повторяется, то присвоится последнее значение
a[[0,0,2]] = [1,2,3]
a

In [None]:
a = np.arange(5)

# Пример может сделать не то что ты ожидаешь, из-за ограничений питона, что a += 1 <=> a = a + 1
a[[0,0,2]] += 1
a

Еще очень полезная фича - __Булевская индексация__. Применима для фильтрации значений, подходящих под определенное условие

In [None]:
a = np.arange(10)
cond = a % 3 == 0 # создаст массив shape = a.shape, dtype = bool, в правильных позициях будет стоять True

good_a = a[cond]
bad_a  = a[~cond]

print(a, os.linesep)
print(good_a)  # = a[a % 3 == 0]
print(bad_a)

__Задание 2:__ Thresholding изображения, вам передают изображение (двумерный массив оттенков серого [0, 255)), и __threshold (t)__, вы должны вернуть изображение, в котором, все значения меньшие данного __t__ обнулить, а значения большие __t__ заменить на 255

In [None]:
def task2(img, t):
    """
        Returns new thresholding image 
    """
    return img

test_task2(task2)