## What is NumPy?

[NumPy](https://numpy.org/doc/stable/index.html) означає числовий Python. Це основа всіх видів наукових і чисельних обчислень у Python.

А оскільки машинне навчання полягає в тому, щоб перетворювати дані в числа, а потім з’ясовувати закономірності, NumPy часто вступає в гру.

## Why NumPy?

Ви можете виконувати числові обчислення за допомогою чистого Python. На початку ви можете подумати, що Python швидкий, але коли ваші дані стануть великими, ви почнете помічати сповільнення.

Однією з головних причин, чому ви використовуєте NumPy, є те, що він швидкий. За лаштунками код було оптимізовано для роботи на C. Це ще одна мова програмування, яка може робити щось набагато швидше, ніж Python.

Перевагою цього є те, що вам не потрібно знати C, щоб скористатися цим. Ви можете записувати чисельні обчислення на Python за допомогою NumPy і отримати додаткові переваги швидкості.

Якщо вам цікаво, що спричиняє цю перевагу швидкості, це процес, який називається векторизацією. [Векторизація (Vectorization)](https://en.wikipedia.org/wiki/Vectorization) прагне виконувати обчислення, уникаючи циклів, оскільки цикли можуть створювати потенційні вузькі місця.

## 0. Importing NumPy

Щоб почати використовувати NumPy, спершу встановіть та імпортуйте його.

Найпоширеніший спосіб (і метод, який ви повинні використовувати) — імпортувати NumPy як абревіатуру `np`.

Якщо ви бачите букви `np`, які використовуються десь у машинному навчанні чи науці про дані, це, ймовірно, стосується бібліотеки NumPy.

In [1]:
import numpy as np

# Check the version``
print(np.__version__)

1.24.3


## 1. DataTypes and attributes

> **Note:** Важливо пам’ятати, що основним типом у NumPy є ndarray. Це означає, що операція, яку ви виконуєте з одним масивом, працюватиме й з іншим.

In [13]:
# 1-dimensonal array, also referred to as a vector
a1 = np.array([1, 2, 3])

# 2-dimensional array, also referred to as matrix
a2 = np.array([[1, 2.0, 3.3],
               [4, 5, 6.5]])

# 3-dimensional array, also referred to as a matrix
a3 = np.array([[[1, 2, 3],
                [4, 5, 6],
                [7, 8, 9]],
                [[10, 11, 12],
                 [13, 14, 15],
                 [16, 17, 18]]])

In [14]:
a1

array([1, 2, 3])

In [15]:
a2

array([[1. , 2. , 3.3],
       [4. , 5. , 6.5]])

In [16]:
a3

array([[[ 1,  2,  3],
        [ 4,  5,  6],
        [ 7,  8,  9]],

       [[10, 11, 12],
        [13, 14, 15],
        [16, 17, 18]]])

In [17]:
a1.shape, a1.ndim, a1.dtype, a1.size, type(a1)

((3,), 1, dtype('int64'), 3, numpy.ndarray)

In [18]:
a2.shape, a2.ndim, a2.dtype, a2.size, type(a2)

((2, 3), 2, dtype('float64'), 6, numpy.ndarray)

In [19]:
a3.shape, a3.ndim, a3.dtype, a3.size, type(a3)

((2, 3, 3), 3, dtype('int64'), 18, numpy.ndarray)

### Anatomy of an array

<img src="assets/numpy_01.png" alt="anatomy of a numpy array"/>

Key terms:
* **Array** - Список чисел може бути багатовимірним.
* **Scalar** - Одне число (наприклад, `7`).
* **Vector** - Список чисел з 1-вимірністю (наприклад, `np.array([1, 2, 3])`).
* **Matrix** - (Зазвичай) багатовимірний список чисел (наприклад, `np.array([[1, 2, 3], [4, 5, 6]])`).

## 2. Creating arrays

* `np.array()`
* `np.ones()`
* `np.zeros()`
* `np.random.rand(5, 3)`
* `np.random.randint(10, size=5)`
* `np.random.seed()` - псевдовипадкові числа

In [22]:
# Create a simple array
simple_array = np.array([1, 2, 3])
simple_array

array([1, 2, 3])

In [23]:
simple_array = np.array((1, 2, 3))
simple_array, simple_array.dtype

(array([1, 2, 3]), dtype('int64'))

In [26]:
# Create an array of ones
ones = np.ones((10, 2))
ones # 1.0 -> 1. | 0.78 -> .78

array([[1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.]])

In [27]:
# The default datatype is 'float64'
ones.dtype

dtype('float64')

In [28]:
# You can change the datatype with .astype()
ones.astype(int)

array([[1, 1],
       [1, 1],
       [1, 1],
       [1, 1],
       [1, 1],
       [1, 1],
       [1, 1],
       [1, 1],
       [1, 1],
       [1, 1]])

In [29]:
# Create an array of zeros
zeros = np.zeros((5, 3, 3))
zeros

array([[[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]],

       [[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]],

       [[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]],

       [[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]],

       [[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]]])

In [30]:
zeros.dtype

dtype('float64')

In [35]:
# Create an array within a range of values
range_array = np.arange(0, 12, 3)
range_array

array([0, 3, 6, 9])

In [201]:
# Random array
random_array = np.random.randint(1000, size=(5, 3))
random_array

array([[916, 115, 976],
       [755, 709, 847],
       [431, 448, 850],
       [ 99, 984, 177],
       [755, 797, 659]])

In [49]:
# Random array of floats (between 0 & 1)
np.random.random((5, 3))

array([[0.2488054 , 0.33631371, 0.08474724],
       [0.43888365, 0.56614878, 0.75103795],
       [0.43922794, 0.00175712, 0.40505882],
       [0.15707255, 0.6623001 , 0.67977748],
       [0.08285567, 0.18570601, 0.80466754]])

In [51]:
# Random 5x3 array of floats (between 0 & 1), similar to above
np.random.rand(5, 3)

array([[0.65256896, 0.44679125, 0.47991753],
       [0.11364213, 0.6861368 , 0.16501018],
       [0.4729424 , 0.03331111, 0.04848809],
       [0.50685354, 0.61701215, 0.42684429],
       [0.65355341, 0.49716115, 0.47237694]])

In [52]:
np.random.rand(5, 3)

array([[0.2163089 , 0.42933843, 0.66914836],
       [0.46914116, 0.7090049 , 0.13407853],
       [0.91480387, 0.64263202, 0.11837456],
       [0.7766957 , 0.24471835, 0.91116243],
       [0.29884729, 0.10707834, 0.61912891]])

NumPy використовує псевдовипадкові числа, що означає, що числа виглядають випадковими, але насправді такими не є, вони заздалегідь визначені.

Для узгодженості ви можете зберегти випадкові числа, які ви генеруєте, однаковими під час експериментів.

Для цього можна використовувати [`np.random.seed()`](https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.random.seed.html).

In [82]:
# Set random seed to 0
np.random.seed(0)

# Make 'random' numbers
np.random.randint(10, size=(5, 3))

array([[3, 2, 7],
       [2, 0, 0],
       [4, 5, 5],
       [6, 8, 4],
       [1, 4, 9]])

Якщо встановити `np.random.seed()`, щоразу, коли ви запускаєте клітинку вище, генеруватимуться однакові випадкові числа.

Що робити, якщо `np.random.seed()` не встановлено?

Щоразу, коли ви запускаєте клітинку нижче, з’являтиметься новий набір чисел.

In [83]:
# Make more random numbers
np.random.randint(10, size=(5, 3))

array([[8, 1, 1],
       [7, 9, 9],
       [3, 6, 7],
       [2, 0, 3],
       [5, 9, 4]])

Давайте знову подивимося на це в дії, ми залишимося послідовними та встановимо випадкове початкове значення 0.

In [84]:
# Set random seed to same number as above
np.random.seed(42)

# The same random numbers come out
np.random.randint(10, size=(5, 3))

array([[6, 3, 7],
       [4, 6, 9],
       [2, 6, 7],
       [4, 3, 7],
       [7, 2, 5]])

Оскільки `np.random.seed()` встановлено на 0, випадкові числа є такими самими, як і клітинка з `np.random.seed()` також встановленим на 0.

Налаштування `np.random.seed()` не є обов'язковим на 100%, але це корисно, щоб числа залишалися незмінними під час експериментів.

Наприклад, припустімо, що ви хочете випадковим чином розділити свої дані на навчальні та тестові набори.

Кожного разу, коли ви випадково розподіляєте, ви можете отримати різні рядки в кожному наборі.

Якщо ви поділилися своєю роботою з кимось іншим, вони також отримають різні рядки в кожному наборі.

Налаштування `np.random.seed()` гарантує, що випадковість усе ще є, вона просто робить випадковість повторюваною. Звідси й «псевдовипадкові» числа.

## 3. Viewing arrays and matrices (indexing)

Пам’ятайте: оскільки масиви та матриці є `ndarray`, їх можна переглядати подібним чином.

Давайте ще раз перевіримо наші 3 масиви.

In [85]:
a1

array([1, 2, 3])

In [86]:
a2

array([[1. , 2. , 3.3],
       [4. , 5. , 6.5]])

In [87]:
a3

array([[[ 1,  2,  3],
        [ 4,  5,  6],
        [ 7,  8,  9]],

       [[10, 11, 12],
        [13, 14, 15],
        [16, 17, 18]]])

Форма масиву завжди перераховується у форматі `(row, column, n, n, n...)`, де `n` є необов'язковими додатковими розмірами.

In [93]:
a1[2]

3

In [76]:
a1

array([1, 2, 3])

In [96]:
a_test = np.array([1, 2, 4, 6, 7, 8, 9])

In [99]:
a_test[:5]

array([1, 2, 4, 6, 7])

In [100]:
a2

array([[1. , 2. , 3.3],
       [4. , 5. , 6.5]])

In [105]:
a2[1][2]

6.5

In [106]:
a3

array([[[ 1,  2,  3],
        [ 4,  5,  6],
        [ 7,  8,  9]],

       [[10, 11, 12],
        [13, 14, 15],
        [16, 17, 18]]])

In [109]:
a3[1][1][1]

14

In [110]:
# Get 2nd row (index 1) of a2
a2[1]

array([4. , 5. , 6.5])

In [111]:
# Get the first 2 values of the first 2 rows of both arrays
a3[:2, :2, :2]

array([[[ 1,  2],
        [ 4,  5]],

       [[10, 11],
        [13, 14]]])

Це вимагає трохи практики, особливо коли розміри стають вищими. Зазвичай я намагаюся отримати певні значення методом проб і помилок, переглядаю вихідні дані в блокноті та повторюю спробу.

Масиви NumPy друкуються ззовні всередину. Це означає, що число в кінці форми стоїть першим, а число на початку форми — останнім.

In [112]:
a4 = np.random.randint(10, size=(2, 3, 4, 5))
a4

array([[[[4, 1, 7, 5, 1],
         [4, 0, 9, 5, 8],
         [0, 9, 2, 6, 3],
         [8, 2, 4, 2, 6]],

        [[4, 8, 6, 1, 3],
         [8, 1, 9, 8, 9],
         [4, 1, 3, 6, 7],
         [2, 0, 3, 1, 7]],

        [[3, 1, 5, 5, 9],
         [3, 5, 1, 9, 1],
         [9, 3, 7, 6, 8],
         [7, 4, 1, 4, 7]]],


       [[[9, 8, 8, 0, 8],
         [6, 8, 7, 0, 7],
         [7, 2, 0, 7, 2],
         [2, 0, 4, 9, 6]],

        [[9, 8, 6, 8, 7],
         [1, 0, 6, 6, 7],
         [4, 2, 7, 5, 2],
         [0, 2, 4, 2, 0]],

        [[4, 9, 6, 6, 8],
         [9, 9, 2, 6, 0],
         [3, 3, 4, 6, 6],
         [3, 6, 2, 5, 1]]]])

In [113]:
a4.shape

(2, 3, 4, 5)

In [114]:
# Get only the first 4 numbers of each single vector
a4[:, :, :, :4]

array([[[[4, 1, 7, 5],
         [4, 0, 9, 5],
         [0, 9, 2, 6],
         [8, 2, 4, 2]],

        [[4, 8, 6, 1],
         [8, 1, 9, 8],
         [4, 1, 3, 6],
         [2, 0, 3, 1]],

        [[3, 1, 5, 5],
         [3, 5, 1, 9],
         [9, 3, 7, 6],
         [7, 4, 1, 4]]],


       [[[9, 8, 8, 0],
         [6, 8, 7, 0],
         [7, 2, 0, 7],
         [2, 0, 4, 9]],

        [[9, 8, 6, 8],
         [1, 0, 6, 6],
         [4, 2, 7, 5],
         [0, 2, 4, 2]],

        [[4, 9, 6, 6],
         [9, 9, 2, 6],
         [3, 3, 4, 6],
         [3, 6, 2, 5]]]])

`a4` має форму (2, 3, 4, 5), це означає, що він відображається так:
* Внутрішній масив = розмір 5
* Наступний масив = розмір 4
* Наступний масив = розмір 3
* Зовнішній масив = розмір 2

## 4. Manipulating and comparing arrays
* Arithmetic
    * `+`, `-`, `*`, `/`, `//`, `**`, `%`
    * `np.exp()`
    * `np.log()`
    * [Dot product](https://www.mathsisfun.com/algebra/matrix-multiplying.html) - `np.dot()`
    * Broadcasting
* Aggregation
    * `np.sum()` - faster than Python's `.sum()` for NumPy arrays
    * `np.mean()`
    * `np.std()`
    * `np.var()`
    * `np.min()`
    * `np.max()`
    * `np.argmin()` - find index of minimum value
    * `np.argmax()` - find index of maximum value
    * These work on all `ndarray`'s
        * `a4.min(axis=0)` -- you can use axis as well
* Reshaping
    * `np.reshape()`
* Transposing
    * `a3.T` 
* Comparison operators
    * `>`
    * `<`
    * `<=`
    * `>=`
    * `x != 3`
    * `x == 3`
    * `np.sum(x > 3)`

### Arithmetic

In [115]:
a1

array([1, 2, 3])

In [116]:
ones = np.ones(3)
ones

array([1., 1., 1.])

In [117]:
# Add two arrays
a1 + ones

array([2., 3., 4.])

In [118]:
# Subtract two arrays
a1 - ones

array([0., 1., 2.])

In [119]:
# Multiply two arrays
a1 * ones

array([1., 2., 3.])

In [120]:
a1

array([1, 2, 3])

In [121]:
a2

array([[1. , 2. , 3.3],
       [4. , 5. , 6.5]])

In [122]:
# Multiply two arrays
a1 * a2

array([[ 1. ,  4. ,  9.9],
       [ 4. , 10. , 19.5]])

In [123]:
a1.shape, a2.shape

((3,), (2, 3))

In [124]:
a3

array([[[ 1,  2,  3],
        [ 4,  5,  6],
        [ 7,  8,  9]],

       [[10, 11, 12],
        [13, 14, 15],
        [16, 17, 18]]])

In [125]:
# This will error as the arrays have a different number of dimensions (2, 3) vs. (2, 3, 3) 
a2 * a3

ValueError: operands could not be broadcast together with shapes (2,3) (2,3,3) 

### Broadcasting

- Що таке broadcasting?
     - Broadcasting — це функція NumPy, яка виконує операції в кількох вимірах даних без реплікації даних. Це економить час і місце. Наприклад, якщо у вас є масив 3x3 (A) і ви хочете додати масив 1x3 (B), NumPy додасть рядок (B) до кожного рядка (A).

- Правила broadcasting
     1. Якщо два масиви відрізняються за кількістю вимірів, форма масиву з меншою кількістю вимірів доповнюється одиницями на його передній (лівій) стороні.
     2. Якщо форма двох масивів не збігається в жодному вимірі, масив із формою, що дорівнює 1 у цьому вимірі, розтягується, щоб відповідати іншій формі.
     3. Якщо в будь-якому вимірі розміри не збігаються і жоден не дорівнює 1, виникає помилка.
    
    
**The broadcasting rule:**
Для того, щоб здійснювати broadcast, розмір задніх осей для обох масивів в операції має бути однаковим розміром, або одна з них має бути єдиною.

In [126]:
a1

array([1, 2, 3])

In [127]:
a1.shape

(3,)

In [128]:
a2.shape

(2, 3)

In [129]:
a2

array([[1. , 2. , 3.3],
       [4. , 5. , 6.5]])

In [130]:
a1 + a2

array([[2. , 4. , 6.3],
       [5. , 7. , 9.5]])

In [131]:
a2 + 2

array([[3. , 4. , 5.3],
       [6. , 7. , 8.5]])

In [132]:
# Raises an error because there's a shape mismatch (2, 3) vs. (2, 3, 3)
a2 + a3

ValueError: operands could not be broadcast together with shapes (2,3) (2,3,3) 

In [133]:
# Divide two arrays
a1 / ones

array([1., 2., 3.])

In [134]:
# Divide using floor division
a2 // a1

array([[1., 1., 1.],
       [4., 2., 2.]])

In [135]:
# Take an array to a power
a1 ** 2

array([1, 4, 9])

In [136]:
# You can also use np.square()
np.square(a1)

array([1, 4, 9])

In [137]:
# Modulus divide (what's the remainder)
a1 % 2

array([1, 0, 1])

Ви також можете знайти логарифм чи експоненціал масиву за допомогою `np.log()` і `np.exp()`.

In [138]:
# Find the log of an array
np.log(a1)

array([0.        , 0.69314718, 1.09861229])

In [139]:
# Find the exponential of an array
np.exp(a1)

array([ 2.71828183,  7.3890561 , 20.08553692])

In [140]:
matrix = np.array([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

vector = np.array([10, 11, 12])

# Reshape the vector to make it a column vector
vector = vector.reshape(-1, 1)

# Add the vector as a new column to the matrix
new_matrix = np.hstack((matrix, vector))

print("Original Matrix:")
print(matrix)
print("\nVector to be added as a new column:")
print(vector)
print("\nMatrix with the new column added:")
print(new_matrix)

Original Matrix:
[[1 2 3]
 [4 5 6]
 [7 8 9]]

Vector to be added as a new column:
[[10]
 [11]
 [12]]

Matrix with the new column added:
[[ 1  2  3 10]
 [ 4  5  6 11]
 [ 7  8  9 12]]


### Aggregation

Aggregation - об'єднання речей, виконання подібних речей у кількох речах.

In [143]:
a1

array([1, 2, 3])

In [141]:
sum(a1)

6

In [142]:
np.sum(a1)

6

**Tip:** Використовуйте NumPy `np.sum()` для масивів NumPy і Python `sum()` для списків (`list`) Python.

In [144]:
massive_array = np.random.random(100000)
massive_array.size, type(massive_array)

(100000, numpy.ndarray)

In [145]:
%timeit sum(massive_array) # Python sum()
%timeit np.sum(massive_array) # NumPy np.sum()

4.52 ms ± 143 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
21.1 µs ± 103 ns per loop (mean ± std. dev. of 7 runs, 10,000 loops each)


Зверніть увагу, що `np.sum()` швидше працює з масивом Numpy (`numpy.ndarray`), ніж `sum()` Python.

Тепер давайте спробуємо це на списку Python.

In [146]:
import random 
massive_list = [random.randint(0, 10) for i in range(100000)]
len(massive_list), type(massive_list)

(100000, list)

In [147]:
massive_list[:10]

[7, 8, 4, 9, 8, 7, 3, 1, 8, 4]

In [148]:
%timeit sum(massive_list)
%timeit np.sum(massive_list)

524 µs ± 4.04 µs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)
2.72 ms ± 88.9 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


NumPy `np.sum()` все ще швидкий, але Python `sum()` швидший у списках (`list`) Python.

In [149]:
a2

array([[1. , 2. , 3.3],
       [4. , 5. , 6.5]])

In [150]:
# Find the mean
np.mean(a2)

3.6333333333333333

In [151]:
# Find the max
np.max(a2)

6.5

In [152]:
# Find the min
np.min(a2)

1.0

In [153]:
# Find the standard deviation
np.std(a2)

1.8226964152656422

In [154]:
# Find the variance
np.var(a2)

3.3222222222222224

In [155]:
# The standard deviation is the square root of the variance
np.sqrt(np.var(a2))

1.8226964152656422

**What's mean?**

Ви можете знайти середнє значення набору чисел, склавши їх і розділивши на їх кількість.

**What's standard deviation?**

[Standard deviation](https://www.mathsisfun.com/data/standard-deviation.html) це міра того, наскільки розкидані числа.

**What's variance?**

[Variance](https://www.mathsisfun.com/data/standard-deviation.html) є усередненим квадратом різниці середнього значення.

Щоб вирішити це, ви маєте:
1. Обчисліть середнє значення
2. Від кожного числа відніміть середнє значення та зведіть результат у квадрат
3. Знайдіть середнє квадратів різниць

In [156]:
# Demo of variance
high_var_array = np.array([1, 100, 200, 300, 4000, 5000])
low_var_array = np.array([2, 4, 6, 8, 10])

np.var(high_var_array), np.var(low_var_array)

(4296133.472222221, 8.0)

In [157]:
np.std(high_var_array), np.std(low_var_array)

(2072.711623024829, 2.8284271247461903)

In [158]:
# The standard deviation is the square root of the variance
np.sqrt(np.var(high_var_array))

2072.711623024829

### Reshaping

In [159]:
a2

array([[1. , 2. , 3.3],
       [4. , 5. , 6.5]])

In [160]:
a2.shape

(2, 3)

In [144]:
a2.reshape(2, 3, 1)

array([[[1. ],
        [2. ],
        [3.3]],

       [[4. ],
        [5. ],
        [6.5]]])

In [161]:
a3

array([[[ 1,  2,  3],
        [ 4,  5,  6],
        [ 7,  8,  9]],

       [[10, 11, 12],
        [13, 14, 15],
        [16, 17, 18]]])

In [165]:
a22 = a2.reshape(2, 3, 1)

In [166]:
a22.shape

(2, 3, 1)

In [167]:
a2.reshape(2, 3, 1) + a3

array([[[ 2. ,  3. ,  4. ],
        [ 6. ,  7. ,  8. ],
        [10.3, 11.3, 12.3]],

       [[14. , 15. , 16. ],
        [18. , 19. , 20. ],
        [22.5, 23.5, 24.5]]])

### Transpose

Транспонування змінює порядок осей на зворотний.

Наприклад, масив із формою `(2, 3)` стає `(3, 2)`.

In [168]:
a2

array([[1. , 2. , 3.3],
       [4. , 5. , 6.5]])

In [169]:
a2.shape

(2, 3)

In [170]:
a2.T

array([[1. , 4. ],
       [2. , 5. ],
       [3.3, 6.5]])

In [171]:
a2.transpose()

array([[1. , 4. ],
       [2. , 5. ],
       [3.3, 6.5]])

In [172]:
a2.T.shape

(3, 2)

Для великих масивів стандартним значенням транспонування є зміна першої та останньої осей.

Як приклад, `(5, 3, 3)` -> `(3, 3, 5)`. 

In [173]:
matrix = np.random.random(size=(5, 3, 3))
matrix

array([[[0.51552916, 0.80905321, 0.56644164],
        [0.93016294, 0.02998401, 0.94180414],
        [0.74971307, 0.32755526, 0.6276612 ]],

       [[0.5619832 , 0.91046814, 0.41280716],
        [0.09948198, 0.06869403, 0.41365718],
        [0.98568699, 0.61889344, 0.74180844]],

       [[0.96250195, 0.66312584, 0.60195154],
        [0.18844279, 0.2895666 , 0.87992686],
        [0.5077452 , 0.86364382, 0.01580731]],

       [[0.50600507, 0.31528654, 0.28048889],
        [0.86098042, 0.83821389, 0.89601511],
        [0.42948994, 0.96158324, 0.3206436 ]],

       [[0.98916099, 0.75713959, 0.65434406],
        [0.89105284, 0.63160888, 0.41994771],
        [0.36132684, 0.14067026, 0.48067957]]])

In [174]:
matrix.shape

(5, 3, 3)

In [175]:
matrix.T

array([[[0.51552916, 0.5619832 , 0.96250195, 0.50600507, 0.98916099],
        [0.93016294, 0.09948198, 0.18844279, 0.86098042, 0.89105284],
        [0.74971307, 0.98568699, 0.5077452 , 0.42948994, 0.36132684]],

       [[0.80905321, 0.91046814, 0.66312584, 0.31528654, 0.75713959],
        [0.02998401, 0.06869403, 0.2895666 , 0.83821389, 0.63160888],
        [0.32755526, 0.61889344, 0.86364382, 0.96158324, 0.14067026]],

       [[0.56644164, 0.41280716, 0.60195154, 0.28048889, 0.65434406],
        [0.94180414, 0.41365718, 0.87992686, 0.89601511, 0.41994771],
        [0.6276612 , 0.74180844, 0.01580731, 0.3206436 , 0.48067957]]])

In [176]:
matrix.T.shape

(3, 3, 5)

In [177]:
# Check to see if the reverse shape is same as tranpose shape
matrix.T.shape == matrix.shape[::-1]

True

In [178]:
# Check to see if the first and last axes are swapped
matrix.T == matrix.swapaxes(0, -1) # swap first (0) and last (-1) axes

array([[[ True,  True,  True,  True,  True],
        [ True,  True,  True,  True,  True],
        [ True,  True,  True,  True,  True]],

       [[ True,  True,  True,  True,  True],
        [ True,  True,  True,  True,  True],
        [ True,  True,  True,  True,  True]],

       [[ True,  True,  True,  True,  True],
        [ True,  True,  True,  True,  True],
        [ True,  True,  True,  True,  True]]])

Ви можете побачити більш розширені форми транспонування в документації NumPy нижче [`numpy.transpose`](https://numpy.org/doc/stable/reference/generated/numpy.transpose.html).

### Dot product

Основні два правила скалярного добутку, які слід пам’ятати:

1. **Внутрішні розміри** повинні відповідати:
  * `(3, 2) @ (3, 2)` won't work
  * `(2, 3) @ (3, 2)` will work
  * `(3, 2) @ (2, 3)` will work
  
2. Отримана матриця має форму **зовнішніх розмірів**:
 * `(2, 3) @ (3, 2)` -> `(2, 2)`
 * `(3, 2) @ (2, 3)` -> `(3, 3)`
 
**Note:** У NumPy `np.dot()` і `@` можна використовувати для досягнення того самого результату для 1-2-вимірних масивів. Однак їх поведінка починає відрізнятися в масивах з розмірами 3+.

In [179]:
np.random.seed(0)
mat1 = np.random.randint(10, size=(3, 3))
mat2 = np.random.randint(10, size=(3, 2))

mat1.shape, mat2.shape

((3, 3), (3, 2))

In [180]:
mat1

array([[5, 0, 3],
       [3, 7, 9],
       [3, 5, 2]])

In [181]:
mat2

array([[4, 7],
       [6, 8],
       [8, 1]])

In [182]:
np.dot(mat1, mat2)

array([[ 44,  38],
       [126,  86],
       [ 58,  63]])

In [183]:
# Can also achieve np.dot() with "@" 
# (however, they may behave differently at 3D+ arrays)
mat1 @ mat2

array([[ 44,  38],
       [126,  86],
       [ 58,  63]])

In [184]:
np.random.seed(0)
mat3 = np.random.randint(10, size=(4,3))
mat4 = np.random.randint(10, size=(4,3))
mat3

array([[5, 0, 3],
       [3, 7, 9],
       [3, 5, 2],
       [4, 7, 6]])

In [185]:
mat4

array([[8, 8, 1],
       [6, 7, 7],
       [8, 1, 5],
       [9, 8, 9]])

In [186]:
# This will fail as the inner dimensions of the matrices do not match
np.dot(mat3, mat4)

ValueError: shapes (4,3) and (4,3) not aligned: 3 (dim 1) != 4 (dim 0)

In [187]:
mat3.T.shape

(3, 4)

In [188]:
# Dot product
np.dot(mat3.T, mat4)

array([[118,  96,  77],
       [145, 110, 137],
       [148, 137, 130]])

In [189]:
# Element-wise multiplication, also known as Hadamard product
mat3 * mat4

array([[40,  0,  3],
       [18, 49, 63],
       [24,  5, 10],
       [36, 56, 54]])

### Comparison operators 

Дізнатися, чи є один масив більшим, меншим або дорівнює іншому.

In [190]:
a1

array([1, 2, 3])

In [191]:
a2

array([[1. , 2. , 3.3],
       [4. , 5. , 6.5]])

In [192]:
a1 > a2

array([[False, False, False],
       [False, False, False]])

In [193]:
a1 >= a2

array([[ True,  True, False],
       [False, False, False]])

In [195]:
a1 < 5

array([ True,  True,  True])

In [196]:
a1 == a1

array([ True,  True,  True])

In [197]:
a1 == a2

array([[ True,  True, False],
       [False, False, False]])

## 5. Sorting arrays

* [`np.sort()`](https://numpy.org/doc/stable/reference/generated/numpy.sort.html) - сортувати значення в заданому вимірі масиву.
* [`np.argsort()`](https://numpy.org/doc/stable/reference/generated/numpy.argsort.html) - повертає індекси для сортування масиву на заданій осі.
* [`np.argmax()`](https://numpy.org/doc/stable/reference/generated/numpy.argmax.html) - повертає індекс/індекси, які дають найвищі значення вздовж осі.
* [`np.argmin()`](https://numpy.org/doc/stable/reference/generated/numpy.argmin.html) - повертає індекс/індекси, які дають найменше значення вздовж осі.

In [202]:
random_array

array([[916, 115, 976],
       [755, 709, 847],
       [431, 448, 850],
       [ 99, 984, 177],
       [755, 797, 659]])

In [203]:
np.sort(random_array)

array([[115, 916, 976],
       [709, 755, 847],
       [431, 448, 850],
       [ 99, 177, 984],
       [659, 755, 797]])

In [205]:
np.argsort(random_array)

array([[1, 0, 2],
       [1, 0, 2],
       [0, 1, 2],
       [0, 2, 1],
       [2, 0, 1]])

In [206]:
a1

array([1, 2, 3])

In [208]:
# Return the indices that would sort an array
np.argsort(a1)

array([0, 1, 2])

In [209]:
# No axis
np.argmin(a1)

0

In [210]:
random_array

array([[916, 115, 976],
       [755, 709, 847],
       [431, 448, 850],
       [ 99, 984, 177],
       [755, 797, 659]])

In [212]:
random_array

array([[916, 115, 976],
       [755, 709, 847],
       [431, 448, 850],
       [ 99, 984, 177],
       [755, 797, 659]])

In [213]:
# Down the vertical
np.argmax(random_array, axis=1)

array([2, 2, 2, 1, 1])

In [214]:
# Across the horizontal
np.argmin(random_array, axis=0)

array([3, 0, 3])

## 6. Use case

Перетворення зображення в масив NumPy.

Для чого?

Оскільки комп’ютери можуть використовувати числа в масиві NumPy, щоб знаходити ознаки на зображенні та, у свою чергу, використовувати ці ознаки, щоб з’ясувати, що на зображенні.

Це те, що відбувається в сучасних алгоритмах комп’ютерного зору.

Почнемо з цього зображення:

<img src="assets/tiger.jpg" alt="photo of a panda waving" width=450/>

In [215]:
from matplotlib.image import imread

image = imread('assets/tiger.jpg')
print(type(image))

<class 'numpy.ndarray'>


In [216]:
image.shape

(480, 640, 3)

In [217]:
image

array([[[127, 110,  80],
        [127, 110,  80],
        [126, 109,  79],
        ...,
        [135, 120,  63],
        [135, 120,  63],
        [135, 120,  65]],

       [[127, 110,  80],
        [127, 110,  80],
        [126, 109,  79],
        ...,
        [135, 120,  63],
        [135, 120,  65],
        [135, 120,  65]],

       [[129, 110,  80],
        [129, 110,  80],
        [129, 110,  80],
        ...,
        [135, 120,  65],
        [135, 120,  65],
        [135, 120,  65]],

       ...,

       [[ 74,  60,  60],
        [ 73,  59,  59],
        [ 71,  57,  56],
        ...,
        [ 99,  78,  83],
        [ 97,  76,  81],
        [ 96,  73,  81]],

       [[ 73,  61,  63],
        [ 73,  61,  63],
        [ 73,  59,  59],
        ...,
        [ 98,  78,  80],
        [ 96,  75,  80],
        [ 95,  72,  78]],

       [[ 75,  63,  67],
        [ 75,  63,  65],
        [ 75,  60,  63],
        ...,
        [ 97,  77,  79],
        [ 94,  73,  78],
        [ 94,  71,  77]]

In [218]:
import cv2

In [222]:
image = cv2.imread("assets/tiger.jpg", 0)

In [223]:
image.shape

(480, 640)

In [224]:
image

array([[112, 112, 111, ..., 118, 118, 118],
       [112, 112, 111, ..., 118, 118, 118],
       [112, 112, 112, ..., 118, 118, 118],
       ...,
       [ 64,  63,  61, ...,  85,  83,  81],
       [ 65,  65,  63, ...,  84,  82,  80],
       [ 67,  67,  65, ...,  83,  80,  79]], dtype=uint8)

### Experiments

In [225]:
random_image = np.random.randint(255, size=(512, 512))

In [226]:
random_image

array([[147, 142, 167, ...,  87,  30,  54],
       [153,  20,  97, ...,  76,  47,  76],
       [149, 120,  18, ..., 101,  94, 215],
       ...,
       [163, 112, 216, ..., 172, 232,   9],
       [188, 187, 221, ...,  69, 204, 227],
       [213,  92, 145, ..., 148, 136, 243]])

In [228]:
random_image.shape

(512, 512)

In [229]:
cv2.imwrite("random_image.png", random_image)

True