L2-1
==
Индексация, начало работы с матрицами
-
1) **Сортировка, изменение массивов**

Функция sort возвращает отсортированную копию, метод sort сортирует на месте.


In [2]:
import numpy as np

In [3]:
b = np.array([6, 4, 10])
print(np.sort(b)) 
print(b) 
b.sort()
print(b)


[ 4  6 10]
[ 6  4 10]
[ 4  6 10]


Функции delete, insert и append не меняют массив на месте, а возвращают новый массив, в котором удалены, вставлены в середину или добавлены в конец какие-то элементы.
delete удаляет по индексу, а не по значению!


In [6]:
a = np.arange(1,7)
print(a)
a = np.delete(a, 5)
print(a)

a = np.insert(a, 2, [0, 0])
print(a)

a = np.append(a, [1, 2, 3])
print(a)



[1 2 3 4 5 6]
[1 2 3 4 5]
[1 2 0 0 3 4 5]
[1 2 0 0 3 4 5 1 2 3]


insert принимает индекс, начиная с которого нужно вставить элемент/элементы и собственно элементы.


2) **Индексация для доступа к данным:**

Индексация в NumPy - это способ доступа к элементам массива. В многомерных массивах для адресации используются индексы для каждого измерения.
Если мы хотим получить значение по индексам в многомерном массиве, нужно указывать индексы через запятую внутри квадратных скобок


In [7]:
one_d_array = np.array([1, 2, 3])
print(one_d_array[0]) 
two_d_array = np.array([[1, 2, 3], [4, 5, 6]])
print(two_d_array[1]) 
print(two_d_array[1, 2])  
print(two_d_array[1][2])


1
[4 5 6]
6
6


Массивы являются изменяемыми объектами!


In [13]:
int_array = np.array([1, 2, 3])
int_array[2] = 5 
print(int_array)


[1 2 5]


Срезы работают почти как в списках (с точки зрения синтаксиса). Для многомерных массивов срез работает по соответствующей размерности.


In [18]:
int_array[0:2] = [5,6]
int_array

array([5, 6, 5])

In [14]:
print(one_d_array[0:2])
print(two_d_array[0:2])  
print(two_d_array[0:2, 0:2]) 


NameError: name 'one_d_array' is not defined

Если мы хотим взять, например, все элементы из списка a, то мы напишем a[:]. Здесь аналогично можно делать по размерностям.


In [10]:
print(two_d_array[0, :]) 
print(two_d_array[:, 1])


[1 2 3]
[2 5]


In [11]:
two_d_array

array([[1, 2, 3],
       [4, 5, 6]])

*Замечание.* Обратите внимание, что, по сути, записи two_d_array[0, :] и two_d_array[0] абсолютно эквивалентны. 0 говорит, что мы хотим взять конкретный номер по какой-то размерности. Если в two_d_array[0] мы не указываем, что именно мы хотим оставить по второй размерности, то это означает, что оставляем всё.

Но есть и **ощутимое** отличие.


In [12]:
x = np.array([1.1, 2.2, 3.3, 4.4, 5.5])
s = x[1:3:1]
print(s)

s[0] = 101
print(s)



[2.2 3.3]
[101.    3.3]


Пока всё идёт как обычно. Как вы думаете, что произойдет с исходным массивом x?


In [14]:
print(x)

[  1.1 101.    3.3   4.4   5.5]


Если вам всё-таки нужно сделать копию массива, нужно использовать метод copy().


In [15]:
y = x.copy()


In [16]:
x = [1.1, 2.2, 3.3, 4.4, 5.5]
s = x[1:3:1]
print(s)

s[0] = 101
print(s)

print(x)



[2.2, 3.3]
[101, 3.3]
[1.1, 2.2, 3.3, 4.4, 5.5]


Да, в списках ничего не изменялось


*Задание для закрепления.
Что выведет следующий код*


In [3]:
cube = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
print(cube)
print(cube[1, 0, 1])
print(cube[:, 1, 0])
print(cube[:, 1])


[[[1 2]
  [3 4]]

 [[5 6]
  [7 8]]]
6
[3 7]
[[3 4]
 [7 8]]


3) **Двумерные массивы и изменение размерности**


In [24]:
b = np.linspace(0, 3, 4)
print(b)

print(b.shape)

b.shape = 2, 2
print(b)


[0. 1. 2. 3.]
(4,)
[[0. 1.]
 [2. 3.]]


Атрибуту shape можно присвоить новое значение — кортеж размеров по всем координатам. Получится новый заголовок массива, его данные не изменятся.
Можно сделать то же самое с помощью функции reshape:


In [25]:
print(np.linspace(0, 3, 4).reshape((2, 2)))


[[0. 1.]
 [2. 3.]]


Можно растянуть многомерный массив в одномерный массив с помощью функций ravel или flatten


In [26]:
# возвращет вид
print(b.ravel())

# возвращает копию
print(b.flatten())



[0. 1. 2. 3.]
[0. 1. 2. 3.]


Транспонированная матрица
--

In [27]:
print(b)
print(b.T)


[[0. 1.]
 [2. 3.]]
[[0. 2.]
 [1. 3.]]


4) **Умножение матриц**


In [37]:
a = np.array([1,2,3])
b = np.array([11])
print(a*b)

[11 22 33]


In [38]:
a = np.array([1,2,3])
b = np.array([[11]])
print(a*b)

[[11 22 33]]


In [34]:
a = np.array([1, 2, 3])
b = np.array([[11], [12], [13]])
print(a * b)


[[11 22 33]
 [12 24 36]
 [13 26 39]]


Еще одна операция для такой пары векторов обозначается @ – посмотрим, какой результат она дает:


In [31]:
a = np.array([1, 2, 3])
b = np.array([[11], [12], [13]])
print(a @ b)


[74]


А что будет, если массив a будет иметь не одну строку, а две? Тогда каждая строка массива a отдельно будет участвовать в этой операции:


In [35]:
a = np.array([[1, 2, 3], [4, 0, 5]])
b = np.array([[11], [12], [13]])
print(a @ b)


[[ 74]
 [109]]


In [36]:
a = np.array([[1, 2, 3], [4, 0, 5]])
b = np.array([[11, 100], [12, 200], [13, 300]])
print(a @ b)


[[  74 1400]
 [ 109 1900]]


*Упражнение: умножить матрицу b из примера выше на матрицу a самостоятельно.*
В NumPy это будет реализовано следующим образом:


In [39]:
a = np.array([[1, 2, 3], [4, 0, 5]])
b = np.array([[11, 100], [12, 200], [13, 300]])
print(b @ a)


[[ 411   22  533]
 [ 812   24 1036]
 [1213   26 1539]]


In [40]:
a = np.array([[0.0, 1.0], [-1.0, 0.0]])
b = np.array([[0.0, 1.0], [2.0, 3.0]])
print(a @ b)
print(b @ a)

[[ 2.  3.]
 [ 0. -1.]]
[[-1.  0.]
 [-3.  2.]]


1. Что будет выведено в следующих случаях и почему


In [50]:
cube = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
#print(cube)
#print(cube[:, 0])
#print(cube[1, :, 0])
s = cube[:, 1]
s *= 10
print(s)
print(cube)


[[30 40]
 [70 80]]
[[[ 1  2]
  [30 40]]

 [[ 5  6]
  [70 80]]]


L2-2
==
Продолжение работы с матрицами. Многомерные массивы
--
1) **Единичная матрица, операции над матрицами**


In [51]:
I = np.eye(4)
print(I)


[[1. 0. 0. 0.]
 [0. 1. 0. 0.]
 [0. 0. 1. 0.]
 [0. 0. 0. 1.]]


Проверка умножением.


In [52]:
a = np.arange(16).reshape(4,4)
print(a)
print(a @ I)


[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]]
[[ 0.  1.  2.  3.]
 [ 4.  5.  6.  7.]
 [ 8.  9. 10. 11.]
 [12. 13. 14. 15.]]


Можно построить двумерный массив из функции.
Функция fromfunction() применяет заданную функцию ко всем комбинациям индексов. Количество аргументов функции должно совпадать с размерностью желаемого массива.



In [56]:
def f(i, j):
    return 10 * i + j

print(np.fromfunction(f, (3, 4), dtype=np.int64))


[[0 0 0 0]
 [1 1 1 1]
 [2 2 2 2]]
[[0 1 2 3]
 [0 1 2 3]
 [0 1 2 3]]
[[ 0  1  2  3]
 [10 11 12 13]
 [20 21 22 23]]


Объединение массивов (доступно для многомерных случаев тоже)
У функций ниже префикс h означает horizontal, то есть то, что операции выполняются по горизонтали. 


In [57]:
a = np.array([1, 3, 2])
b = np.array([4, 5, 6])
a = np.hstack((a, b))
print(a)


[1 3 2 4 5 6]


Расщепление массива в позициях 3 и 6.


In [58]:
print(np.hsplit(a, [3, 6]))


[array([1, 3, 2]), array([4, 5, 6]), array([], dtype=int64)]


Соединение матриц по горизонтали и по вертикали.
Функция hstack соединяет два массива в один. При этом у них должно быть одинаковое число строк, иначе выбрасывается ValueError.
Аналогично, vstack соединяет два массива по вертикали, если у них одинаковое число столбцов.


In [70]:
a = np.array([[0, 1], [2, 3]])
b = np.array([[4, 5, 6], [7, 8, 9]])
c = np.array([[4, 5], [6, 7], [8, 9]])
print(a)
print(b)
print(c)


[[0 1]
 [2 3]]
[[4 5 6]
 [7 8 9]]
[[4 5]
 [6 7]
 [8 9]]


По горизонтали:


In [71]:
print(np.hstack((a, b)))


[[0 1 4 5 6]
 [2 3 7 8 9]]


По вертикали:


In [72]:
print(np.vstack((a, c)))


[[0 1]
 [2 3]
 [4 5]
 [6 7]
 [8 9]]


Сумма всех элементов; суммы столбцов; суммы строк.


In [73]:
print(b)
print(b.sum())
print(b.sum(axis=0))
print(b.sum(axis=1))


[[4 5 6]
 [7 8 9]]
39
[11 13 15]
[15 24]


In [74]:
print(b.sum(axis=(0,1)))

39


In [63]:
print(b.max())
print(b.max(axis=0))
print(b.min(axis=1))


9
[7 8 9]
[4 7]


След матрицы – сумма диагональных элементов.


In [64]:
print(np.trace(b))


12


2) **Тензоры (многомерные массивы)**
Многомерный массив называется тензором.


In [65]:
X = np.arange(24).reshape(2, 3, 4)
print(X)


[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]


Суммирование (аналогично остальные операции). Опишем тут же работу с осями, обобщив на многомерный случай. Для индексации будем использовать тройку (i, j, k)


In [67]:
print(X.sum(axis=0))


[[12 14 16 18]
 [20 22 24 26]
 [28 30 32 34]]


In [68]:
print(X.sum(axis=(1, 2)))


[ 66 210]


Тоже самое, что и

In [75]:
res = list()
for i in range(len(X)):
    res.append(X[i].sum())
print(res)

[66, 210]


3) **Broadcasting**

Выше при арифметических операциях с массивами, например, при сложении и умножении, мы перемножали массивы одинаковой формы. В самом простом случае операндами были одномерные массивы одинаковой длины.


In [76]:
a = np.array([1, 2, 3])
b = np.array([2, 2, 2])
print(a * b)


[2 4 6]


Произошло поэлементное умножение, все элементы массива a умножились на 2. Но мы знаем, что это можно сделать проще, просто умножив массив на 2.


In [79]:
print(a * 2)


[2 4 6]


На самом деле поведение будет аналогичным, если умножить одномерный массив на массив длины 1. Здесь мы сталкиваемся с умножением массивов разных длин!

В этом случае работает так называемый broadcasting. Один массив "растягивается", чтобы повторить форму другого.


In [80]:
a = np.array([[ 0,  0,  0],
              [10, 10, 10],
              [20, 20, 20],
              [30, 30, 30]])

b = np.array([0, 1, 2])
print(a + b)


[[ 0  1  2]
 [10 11 12]
 [20 21 22]
 [30 31 32]]


In [83]:
a = np.ones((4, 1, 3))
b = np.ones((12, 1))

mul_shape = (a * b).shape
print(mul_shape)


(4, 12, 3)


4) **Добавление размерностей**


Часто при работе с массивами NumPy требуется добавлять новые оси измерений и удалять существующие. В NumPy добавлять новые оси иногда удобнее с помощью специального объекта newaxis. Например, пусть у нас есть одномерный массив:


In [84]:
a = np.array([1,2,3,4,5,6,7,8,9,10])
print(a)

[ 1  2  3  4  5  6  7  8  9 10]


In [85]:
b = a[np.newaxis, :]
print(b)

[[ 1  2  3  4  5  6  7  8  9 10]]


In [86]:
c = a[np.newaxis, :, np.newaxis]
print(c)

[[[ 1]
  [ 2]
  [ 3]
  [ 4]
  [ 5]
  [ 6]
  [ 7]
  [ 8]
  [ 9]
  [10]]]


5) Решение задач
1. Что будет выведено в следующем случае и почему


In [87]:
a = np.array([[0, 0, 0],
              [10, 10, 10],
              [20, 20, 20],
              [30, 30, 30]])
b = np.array([0, 1, 2])
result = a / (b + 1) # [1,2,3]
 

In [88]:
print(result)

[[ 0.          0.          0.        ]
 [10.          5.          3.33333333]
 [20.         10.          6.66666667]
 [30.         15.         10.        ]]


2. Работа с тензорами:

Создайте два массива: первый - двумерный массив (матрица) размером 6x4, заполненный числами от 10 до 33; второй - одномерный массив длины 4 с числами от 15 до 18. Выполните поэлементное деление матрицы на одномерный массив, используя правила Broadcasting, и вычислите след результирующей матрицы.

Создайте двумерный массив размером 3x8, заполненный числами от 1 до 24. Выполните суммирование по первой оси (axis=0), посчитайте среднее значение по второй оси. Выведите полученный результат.



In [92]:
a = np.arange(10,34).reshape(6,4)

b = np.arange(15,19)

c = a/b
print(c.trace())

4.169526143790849


In [93]:
a = np.arange(1,25).reshape(3,8)
print(a.sum(axis=0))
print(a.mean(axis=1))

[27 30 33 36 39 42 45 48]
[ 4.5 12.5 20.5]


In [94]:
print(a)

[[ 1  2  3  4  5  6  7  8]
 [ 9 10 11 12 13 14 15 16]
 [17 18 19 20 21 22 23 24]]
