# Бібліотека NumPy для машинного навчання



1. #### Огляд та призначення NumPy
2. #### Встановлення та настроювання NumPy
3. #### Об'єкт Array: властивості та вбудовані методи
4. #### Математичні та статистичні функції в NumPy
5. #### Файлові операції

## 1. Огляд та призначення NumPy

### Функції Python для роботи з числами:
- ### [Стандартна бібліотека stdlib](https://docs.python.org/3/library/)
- ### [Математична бібліотека math](https://docs.python.org/3/library/math.html)
- ### [Статистичні функції statistics](https://docs.python.org/3/library/statistics.html)

### [Numpy — розширення  Python, що додає підтримку великих багатовимірних масивів і матриць, разом з великою бібліотекою високорівневих математичних функцій для операцій з цими масивами .](https://uk.wikipedia.org/wiki/NumPy)

<table style='width:100%'>
 <tr>
     <td style='width:33%'><a href="https://numpy.org/"><img src="https://cdn.worldvectorlogo.com/logos/numpy.svg" width="200"/></a></td>
     <td style='width:33%'><a href="https://pypi.org/project/numpy/"><img src="https://pypi.org/static/images/logo-small.2a411bc6.svg" width="200"/></a></td>
     <td style='width:33%'><a href="https://github.com/numpy/numpy"><img src="https://www.svgrepo.com/show/35001/github.svg" width="200"/></a></td>
  </tr>
</table>

## 2. Встановлення та настроювання NumPy

In [None]:
from IPython.display import IFrame, HTML
HTML('<iframe width="790" height="444" src="https://www.youtube.com/embed/D6o8CjF1DhE" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope;" allowfullscreen></iframe>')

In [None]:
# підключення NumPy
import numpy as np

print(type(np))
print(len(dir(np)))

## 3. Об'єкт Array

[Масив](https://uk.wikipedia.org/wiki/Масив_(структура_даних)) — впорядкований набір фіксованої кількості однотипних елементів, що зберігаються в послідовно розташованих комірках оперативної пам'яті, мають порядковий номер і спільне ім'я, що надає користувач.

#### Структури Python що виступають в якості массивів
- __List__ з стантартної бібліотеки __stdlib__
- __array__ з модуля __Array__

In [1]:
# list
sample_1d_list = list([1, 2, 3.1, "text"])
print(type(sample_1d_list))
print(f'1d: {sample_1d_list}')
sample_2d_list = list([[1, 2, 3.1, "text"],
                       [22, 33, 4, 333]])
print(f'2d: {sample_2d_list}\n...')

# array
from array import array, typecodes
sample_array = array('d',[1, 2, 3.1, 123])
d2 = array?
print(type(sample_array))
print(sample_array, '\n...')

<class 'list'>
1d: [1, 2, 3.1, 'text']
2d: [[1, 2, 3.1, 'text'], [22, 33, 4, 333]]
...
<class 'array.array'>
array('d', [1.0, 2.0, 3.1, 123.0]) 
...


In [None]:
# numpy ndarray
import numpy as np
np_aray = np.array([1, 2, 3, 4])
print(type(np_aray),'\n', np_aray)

n-розмірний [ndarray](https://numpy.org/doc/stable/reference/arrays.html) - це ключовий об'єкт бібліотеки NumPy

![image.png](attachment:image.png)

Три фундаметральні складові массиву:
1. власне сам __ndarray__
2. об'єкт __data-type__ який містить відомості про тип даних
3. массив або скалярна величина, що є контейнером для одиночного елемента

__Переваги__ `ndarray`:
- більш компактні
- більш швидкі (коли операцію можна __векторизувати__)

In [None]:
l = list(range(1_000_000))
a = np.array(l)

%time  r = [i**2 for i in l]
%time  r = a **2

### Створення масивів

In [None]:
# з списку
arr = np.array([1,2,3,4,5])
print(type(arr))
print(arr)

In [None]:
np.lookfor('create array')

### Властивості np-массивів

#### 1. Тип даних (dtype):
-  __Boolean__   : np.bool
-  __Char__      : np.byte
-  __Short__     : np.short
-  __Integer__ : np.short
-  __Long__: np.int_
-  __Float__ : np.single або np.float32
-  __Double__ : np.double або np.float64
-  __np.int8__ : -128 до 127
-  __np.int16__ : -32768 до 32767
-  __np.int32__ : -2147483648 до 2147483647
-  __np.int64__ : -9223372036854775808 до 9223372036854775807

In [None]:
lst = [10, 20, 30]
arr = np.array(lst)
print(arr, arr.dtype)

lst = [10.1, 20, 30]
arr = np.array(lst)
print(arr, arr.dtype)

lst = [10, 20, 30.123]
arr = np.array(lst, dtype=int)
print(arr, arr.dtype)

lst = [10, 20, 30]
arr = np.array(lst, dtype=str)
print(arr, arr.dtype)



![image.png](attachment:image.png)

#### 2. Розмірність  (ndim)

In [None]:
arr1d = np.array([1, 2, 3])
print(arr1d, 'ndim= ', arr1d.ndim, end='\n\n')

arr2d = np.array([[1, 2, 3],[3, 4, 5]] )
print(arr2d, 'ndim= ', arr2d.ndim, end='\n...')

#### 3. Форма (shape)

In [None]:
print(arr1d, 'shape= ', arr1d.shape, end='\n\n')
print(arr2d, 'shape= ', arr2d.shape, end='\n...')

#### 4.Вісь (Axis)

![image-3.png](attachment:image-3.png)

#### 5. Індекси ( Index)

![image-2.png](attachment:image-2.png)

### Методи та функції роботи з масивами
[детальніше](https://www.educba.com/numpy-array-functions/)

#### Створення масивів

In [None]:
#  послідовність з визначеним інтервалом
arr = np.arange(0, 10)
print(arr)
arr = np.arange(0, 10, 2)
print(arr)


In [None]:
# нульовий або одиничний массив
arr = np.zeros(10)
print(arr)
arr = np.ones((5,3))
print(arr)

In [None]:
# заповнення массива
arr = np.full((2,3), 123)
print(arr)

In [None]:
# рівномірно розподілені значення з інтервалу
arr = np.linspace(0, 1, 4)
print(arr, end="\n\n")
arr = np.linspace(0, 1, 20)
print(arr)

In [None]:
# одинична матриця
matr = np.eye(3)
print(matr)

In [None]:
# нормально розподілені значення (rand)
arr = np.random.rand(3)
print(arr)

In [None]:
# стандартно розподілені значення
arr = np.random.randn(3,2)
print(arr)

####  Операції над масивами

In [None]:
# Зміна форми (reshape)
arr = np.zeros((3,2))
print(arr)
arr1 = arr.reshape(6,)
print(arr1, "\n\n")

arr = np.arange(10)
print(arr)
arr1 = arr.reshape((2,5))
print(arr1)

In [None]:
arr1 = np.arange(0, 10)
print(arr1)
arr2 = np.arange(10, 15)
print(arr2)

print(arr1.shape, arr2.shape)
arr1 = arr1.reshape(2, 5)
print(arr1.shape, arr2.shape)

In [None]:
# арифметичні операції: 
arr3 = arr1 + arr2
print(arr3)
print()

arr4 = arr1 * arr2
print(arr4)

![image.png](attachment:image.png)

In [None]:
print(arr)
print(np.power(arr, 2))

![image.png](attachment:image.png)

In [None]:
# агрегативні операції: sum, min, max, average ...

arr = np.arange(10, 20 )
print("arr = ", arr)

print("сума = ", arr.sum())
print("накопичувана сума = ", arr.cumsum(axis=0))
print()

In [None]:
arr1 = arr.reshape((2,5)).astype('double')
print("2d arr = ", arr1)
print("добуток = ", arr1.prod())
print("добуток по стовпчиках = ", arr1.prod(axis=0))

#### Робота з індексами масива

In [None]:
# доступ по індексу
arr = np.arange(10)
print(arr)
print(arr[0], arr[2], end='\n\n')

arr1 = np.arange(0,10).reshape(2,5)
print(arr1)
arr1[1, 3] = 999
print(arr1)

In [None]:
# зрізи (slice)
print(arr)
arr2 = arr[2:6:2]   # з - до - шаг
print(arr2)
print(arr[:8])
print(arr[3:])
print(arr[-2:])
print(arr[-5:8])

![image.png](attachment:image.png)

In [None]:
# 2D-array ...
print(arr1 := arr1.reshape(5,2))
print()
print(arr1[:2])
print(arr1[2:, :1])

## 4. Математичні та статистичні функції в NumPy

[докладніше](https://numpy.org/doc/stable/reference/routines.math.html)

In [None]:
arr1 = np.array([[1,2],[3,4]])
arr2 = np.array([2,3])
# 1-й масив в ступені другого
print(np.power(arr1, arr2))
# квадратний та кубічний корені
print(np.sqrt(arr1), np.cbrt(arr1), sep='\n')


In [None]:
# абсолютне значення
arr = np.arange(5, -10, -2)
print(arr)
print(np.absolute(arr))

In [None]:
# округлення
arr = np.random.rand(3)
print(arr)
print(np.around(arr, 3))

### базова лінійна алгебра

In [None]:
# скалярний добуток (dot)
arr1 = np.arange(12).reshape(4,3)
arr2 = arr1[1:2][0]
print(f'arr1{arr1.shape} = \n{arr1}', f'arr2{arr2.shape} = \n{arr2}', sep='\n\n')
print()
print("dot = ", arr1.dot(arr2))

In [None]:
# транспонування матриці
print(arr1, end='\n\n')
print(arr1.T)

#### більше можливостей в спеціалізованому модулі [`linalg`](https://numpy.org/doc/stable/reference/routines.linalg.html)


In [None]:
from numpy import linalg as LA

print(dir(LA))

###  [Статистичні функції](https://numpy.org/doc/stable/reference/routines.statistics.html)

## 5. Файлові операції

# САМОСТІЙНО

# ПИТАННЯ, ЗАУВАЖЕННЯ, ПРОПОЗИЦІЇ ?