# Основы NumPy
<hr>

**Основа NymPy** -  это объект **ndarray**, который используется для представления **N-мерного массива**; это быстрый и гибкий контейнер для хранения большим наборов данных в Python. Массивы позволяют выполнять математические перации над целыми блоками данных. По сути это обычный list с большим набором возможностей. 

У любого **numpy-массива (array)** есть атрибут **shape** - кортеж, описывающий размер по каждому измерению, и атрибут
**dtype** - объект, описывающий тип данных в массив; **ndim** - количество измерений массива (одномерный, двухмерный и т.д.). **tolist()** - конвертирует array в обычный python list

**Array vs list:**
* Array используют меньше памяти, чем списки
* Array обладают значительно большей функциональностью
* Array требуют, чтобы данные были однородными; списки нет


## **1D (одномерные массивы, списки, векторы), 2D (двумерные массивы, матрицы) и 3D (куб)-arrays:**

![%D0%B8%D0%B7%D0%BE%D0%B1%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D0%B5-2.png](attachment:%D0%B8%D0%B7%D0%BE%D0%B1%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D0%B5-2.png)

Четырехмерный, пятимерный и более массив — это **тензор**.

## Работа с NumPy

In [1]:
import numpy as np

In [15]:
data = [1, 2, 3, 4, 5]

arr = np.array(data) # создание из list

print(arr)
print(arr.shape)
print(arr.dtype)
print(arr.ndim)

[1 2 3 4 5]
(5,)
int64
1


**Типы данных NumPy:**

* np.int64          // Signed 64-bit integer types
* np.float32        // Standard double-precision floating point
* np.complex        // Complex numbers represented by 128 floats>
* np.bool           // Boolean type storing TRUE and FALSE values
* np.object         // Python object type
* np.string_        // Fixed-length string type>
* np.unicode_       // Fixed-length unicode type

In [29]:
arr2 = np.array([1, 2, 3, 4, 5])  

print(arr2)
print(arr2.shape)
print(arr2.dtype)
print(arr2.ndim)

[1 2 3 4 5]
(5,)
int64
1


In [30]:
arr3 = np.array([1, 2, 3, 4, 5], dtype=np.float) # задаём явно тип данных

print(arr3)
print(arr3.shape)
print(arr3.dtype)
print(arr3.ndim)
print(len(arr3))
print(arr3.size)

[1. 2. 3. 4. 5.]
(5,)
float64
1
5
5


In [33]:
arr3 = arr3.astype(np.int64) # приводим все элементы к типу int64

print(arr3)
print(arr3.dtype)

[1 2 3 4 5]
int64


In [36]:
arr4 = np.arange(0, 20, 1.5) 

arr4

array([ 0. ,  1.5,  3. ,  4.5,  6. ,  7.5,  9. , 10.5, 12. , 13.5, 15. ,
       16.5, 18. , 19.5])

In [38]:
arr5 = np.linspace(0, 2, 5) # 5 чисел от 0 до 2

arr5

array([0. , 0.5, 1. , 1.5, 2. ])

In [39]:
arr5 = np.linspace(0, 2, 50)

arr5

array([0.        , 0.04081633, 0.08163265, 0.12244898, 0.16326531,
       0.20408163, 0.24489796, 0.28571429, 0.32653061, 0.36734694,
       0.40816327, 0.44897959, 0.48979592, 0.53061224, 0.57142857,
       0.6122449 , 0.65306122, 0.69387755, 0.73469388, 0.7755102 ,
       0.81632653, 0.85714286, 0.89795918, 0.93877551, 0.97959184,
       1.02040816, 1.06122449, 1.10204082, 1.14285714, 1.18367347,
       1.2244898 , 1.26530612, 1.30612245, 1.34693878, 1.3877551 ,
       1.42857143, 1.46938776, 1.51020408, 1.55102041, 1.59183673,
       1.63265306, 1.67346939, 1.71428571, 1.75510204, 1.79591837,
       1.83673469, 1.87755102, 1.91836735, 1.95918367, 2.        ])

In [45]:
random_arr = np.random.random((5,))

random_arr

array([0.56817985, 0.28291214, 0.00665189, 0.74531184, 0.21818369])

In [46]:
random_arr2 = np.random.random_sample((5,))
random_arr2

array([0.90809868, 0.55985097, 0.03103296, 0.99610853, 0.19104166])

### Диапазон случайных чисел от [a,b]: (b - a) * np.random() + a, где b > a

In [61]:
# 5 случайных значений от -5 до 10
random_arr3 = (10 - -5) * np.random.random_sample((5,)) - 5
random_arr3

array([-4.60920768,  0.31333017,  1.12160255,  8.26806979,  6.93388436])

## Операции

In [71]:
arr = np.array([1, 2, 3, 4, 5])

arr = np.sqrt(arr)
print(arr)

arr = np.sin(arr)
print(arr)

arr = np.cos(arr)
print(arr)

arr = np.log(arr)
print(arr)

arr = np.exp(arr)
print(arr)

[1.         1.41421356 1.73205081 2.         2.23606798]
[0.84147098 0.98776595 0.98702664 0.90929743 0.78674913]
[0.66636675 0.55055622 0.55117323 0.61430028 0.70615086]
[-0.40591509 -0.59682621 -0.59570612 -0.48727141 -0.34792639]
[0.66636675 0.55055622 0.55117323 0.61430028 0.70615086]


In [73]:
a = np.array([1, 2, 3, 4, 5])
b = np.array([6, 7, 8, 9, 10])

print(a)
print(b)

[1 2 3 4 5]
[ 6  7  8  9 10]


In [78]:
c = a + b # np.add(a, b)

print(c)

[ 7  9 11 13 15]


In [79]:
a * b # np.multiply(a,b)

array([ 6, 14, 24, 36, 50])

In [80]:
a - b # np.subtract

array([-5, -5, -5, -5, -5])

In [81]:
a / b #np.divide

array([0.16666667, 0.28571429, 0.375     , 0.44444444, 0.5       ])

In [91]:
arr = np.array([1, 2, 3, 4, 5])
arr = arr * 2  # все элементы умножить на 2
print(arr)

[ 2  4  6  8 10]


In [92]:
arr = arr ** 2  # возводим все элементы в квадрат 
arr

array([  4,  16,  36,  64, 100])

In [95]:
simple_list = [1, 2, 3, 4, 5]
simple_list = simple_list * 2
print(simple_list)

simple_list = simple_list ** 2

[1, 2, 3, 4, 5, 1, 2, 3, 4, 5]


TypeError: unsupported operand type(s) for ** or pow(): 'list' and 'int'

## Функции агрегаты

In [3]:
arr = np.random.randint(-5, 10, 10)
arr

array([-1,  4, -2,  9,  5, -3, -5, -1, -3, -1])

In [4]:
print(arr.max())
print(arr.min())
print(arr.mean())
print(arr.sum())
print(arr.std())
print(np.median(arr))

9
-5
0.2
2
4.1424630354415966
-1.0


In [6]:
arr < 2

array([ True, False,  True, False, False,  True,  True,  True,  True,
        True])

## Манипуляции с массивами

In [8]:
np.insert(arr, 2, -20) # вставляем 20 в позицию 2 

array([ -1,   4, -20,  -2,   9,   5,  -3,  -5,  -1,  -3,  -1])

In [9]:
np.delete(arr, 2) # удаляем элемент во 2 позиции, с матрицами можно укзывать строки или столбцы 

array([-1,  4,  9,  5, -3, -5, -1, -3, -1])

In [10]:
np.sort(arr)

array([-5, -3, -3, -2, -1, -1, -1,  4,  5,  9])

In [17]:
arr2 = np.array([0, 0, 0])
arr = np.concatenate((arr, arr2))
arr

array([-1,  4, -2,  9,  5, -3, -5, -1, -3, -1,  0,  0,  0,  0,  0,  0])

In [18]:
np.array_split(arr, 3) #hsplit, vsplit

[array([-1,  4, -2,  9,  5, -3]),
 array([-5, -1, -3, -1,  0]),
 array([0, 0, 0, 0, 0])]

## Индексы и одномерные массивы 

In [31]:
arr = np.array([1, -2, 3, -4, 5])
arr[0] = 0
print(arr[2])
print(arr[0:2])
print(arr[::-1])
print(arr[arr < 2])
print(arr[(arr < 2) & (arr > 0)])
print(arr[(arr > 4) | (arr < 0)])
arr[1:4] = 0
print(arr)

3
[ 0 -2]
[ 5 -4  3 -2  0]
[ 0 -2 -4]
[]
[-2 -4  5]
[0 0 0 0 5]


## Матрицы и многомерные массивы

In [34]:
matrix = np.array([(1,2,3),(4,5,6)], dtype=np.float64)
matrix

array([[1., 2., 3.],
       [4., 5., 6.]])

In [37]:
matrix = np.array([(1,2,3),(4,5,6), (7, 8, 9)])
matrix

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [39]:
matrix = np.array([(1,2,3),(4,5,6),(7, 8, 9)])
matrix

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [42]:
a_3d_array = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
a_3d_array

array([[[1, 2],
        [3, 4]],

       [[5, 6],
        [7, 8]]])

In [47]:
matrix = np.array([(1,2,3),(4,5,6), (7, 8, 9)])
matrix
print(matrix.shape)
print(matrix.ndim)
print(matrix.size)

(3, 3)
2
9


In [50]:
matrix.reshape(1,9)

array([[1, 2, 3, 4, 5, 6, 7, 8, 9]])

In [75]:
matrix = np.array([(1,2,3),(4,5,6), (7, 8, 9), (10, 11, 12)])
matrix

array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])

In [55]:
matrix.reshape(2,6)

array([[ 1,  2,  3,  4,  5,  6],
       [ 7,  8,  9, 10, 11, 12]])

In [58]:
matrix2 = np.random.random((2,2))
matrix2

array([[0.50350473, 0.99333413],
       [0.30966629, 0.24826833]])

In [76]:
print(matrix)
matrix = np.resize(matrix, (2,2))
print()
print(matrix)

[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]]

[[1 2]
 [3 4]]


In [3]:
new_matrix = np.arange(16).reshape(2,8)
new_matrix

array([[ 0,  1,  2,  3,  4,  5,  6,  7],
       [ 8,  9, 10, 11, 12, 13, 14, 15]])

## Создание специальных матриц

In [62]:
np.zeros((2,3))

array([[0., 0., 0.],
       [0., 0., 0.]])

In [63]:
np.ones((3,3))

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

In [64]:
np.eye(5)

array([[1., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0.],
       [0., 0., 1., 0., 0.],
       [0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 1.]])

In [65]:
np.full((3,3), 9)

array([[9, 9, 9],
       [9, 9, 9],
       [9, 9, 9]])

In [66]:
np.empty((3,2))

array([[0., 0.],
       [0., 0.],
       [0., 0.]])

## Операции над матрицами

In [88]:
matrix1 = np.array([(1, 2), (3, 4)])
print(matrix1)
print()
matrix2 = np.array([(5, 6), (7, 8)])
print(matrix2)

[[1 2]
 [3 4]]

[[5 6]
 [7 8]]


In [89]:
matrix1 + matrix2 # np.add

array([[ 6,  8],
       [10, 12]])

In [90]:
matrix1 - matrix2

array([[-4, -4],
       [-4, -4]])

In [91]:
matrix1 * matrix2

array([[ 5, 12],
       [21, 32]])

In [92]:
matrix1 / matrix2

array([[0.2       , 0.33333333],
       [0.42857143, 0.5       ]])

In [93]:
matrix1.dot(matrix2) # скалаярное произведение

array([[19, 22],
       [43, 50]])

**Axis** - ось. 0 -  ось строк, 1 - ось столбцов

https://i.stack.imgur.com/gj5ue.jpg

In [7]:
matrix = np.array([(1,2,3), (4, 5, 6), (7, 8,9)])
matrix

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [6]:
np.delete(matrix,1,axis=0) # удаляет 1 строку матрицы

array([[1, 2, 3],
       [7, 8, 9]])

In [8]:
np.delete(matrix,1,axis=1) # удаляет 1 столбец матрицы

array([[1, 3],
       [4, 6],
       [7, 9]])

In [100]:
np.sin(matrix)

array([[ 0.84147098,  0.90929743],
       [ 0.14112001, -0.7568025 ]])

In [101]:
np.log(matrix)

array([[0.        , 0.69314718],
       [1.09861229, 1.38629436]])

При применении определенных функций Numpy, таких как np.mean (),max() и т.д. мы можем указать, по какой оси мы хотим вычислять значения.

Для axis = 0 это означает, что мы применяем функцию к каждому «столбцу» или ко всем значениям, которые встречаются по вертикали.

Для axis = 1 это означает, что мы применяем функцию к каждой «строке» или ко всем значениям по горизонтали.

In [102]:
matrix.sum()

10

In [9]:
matrix


array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [10]:
print(matrix.max())
print(matrix.max(axis=0)) # ищем наибольший элемент по каждой строке

9
[7 8 9]


In [12]:
np.mean(matrix, axis=0) # среднее значение идёт по строкам (1 + 4 + 7)/3 = 4

array([4., 5., 6.])

In [13]:
np.mean(matrix, axis=1) # среднее значение идёт по столбцам (1 + 2 + 3)/3 = 2

array([2., 5., 8.])

In [107]:
matrix**2

array([[ 1,  4],
       [ 9, 16]])

In [17]:
arr1 = np.array([[1, 2, 3],[4, 5, 6]])
print(arr1)
print()
arr2 = np.array([[7, 8, 9],[10, 11, 12]])
print(arr2)
print()
arr = np.concatenate((arr1,arr2),axis=1) # добавляем arr2 к arr1 как столбцы
arr

[[1 2 3]
 [4 5 6]]

[[ 7  8  9]
 [10 11 12]]



array([[ 1,  2,  3,  7,  8,  9],
       [ 4,  5,  6, 10, 11, 12]])

In [19]:
arr = np.concatenate((arr1,arr2),axis=0) # добавляем arr2 к arr1 как строки
arr

array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])

In [21]:
np.hstack((arr1,arr2))

array([[ 1,  2,  3,  7,  8,  9],
       [ 4,  5,  6, 10, 11, 12]])

In [23]:
arr = np.vstack((arr1,arr2))
arr

array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])

In [25]:
np.split(arr,2)

[array([[1, 2, 3],
        [4, 5, 6]]),
 array([[ 7,  8,  9],
        [10, 11, 12]])]

In [26]:
np.split(arr,2, axis=0)

[array([[1, 2, 3],
        [4, 5, 6]]),
 array([[ 7,  8,  9],
        [10, 11, 12]])]

In [28]:
np.split(arr,3, axis=1)

[array([[ 1],
        [ 4],
        [ 7],
        [10]]),
 array([[ 2],
        [ 5],
        [ 8],
        [11]]),
 array([[ 3],
        [ 6],
        [ 9],
        [12]])]

In [34]:
np.append(arr, np.array([1, 2, 3]))

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12,  1,  2,  3])

## Индексация

In [110]:
matrix = np.array([(1, 2, 3), (4, 5, 6), (7, 8, 9)])
matrix

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [113]:
matrix[1,2] # 2 элемент 1 строки

6

In [114]:
matrix[2] # 2 строка

array([7, 8, 9])

In [116]:
matrix[:,2] # 2 столбец

array([3, 6, 9])

In [120]:
matrix[1:3, 0:2] # 0 и 1 столбец, 1  и 2 строки

array([[4, 5],
       [7, 8]])

In [121]:
matrix[matrix > 2]

array([3, 4, 5, 6, 7, 8, 9])

# Специальные операции

In [122]:
matrix

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [123]:
matrix.T  # транспонированная 

array([[1, 4, 7],
       [2, 5, 8],
       [3, 6, 9]])

In [124]:
matrix.flatten() # в массив 

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

In [125]:
np.linalg.inv(matrix) # обратная матрица 

array([[-4.50359963e+15,  9.00719925e+15, -4.50359963e+15],
       [ 9.00719925e+15, -1.80143985e+16,  9.00719925e+15],
       [-4.50359963e+15,  9.00719925e+15, -4.50359963e+15]])

In [126]:
np.trace(matrix) # след матрицы

15

In [127]:
np.linalg.det(matrix) # определитель

6.66133814775094e-16

In [128]:
np.linalg.matrix_rank(matrix) # ранк

2

In [130]:
eigenvalues, eigenvectors = np.linalg.eig(matrix) # собственные числа и векторы 
print(eigenvalues)
print()
print(eigenvectors)

[ 1.61168440e+01 -1.11684397e+00 -1.30367773e-15]

[[-0.23197069 -0.78583024  0.40824829]
 [-0.52532209 -0.08675134 -0.81649658]
 [-0.8186735   0.61232756  0.40824829]]


## Доп возможности

In [29]:
np.info(np.eye)

 eye(N, M=None, k=0, dtype=<class 'float'>, order='C')

Return a 2-D array with ones on the diagonal and zeros elsewhere.

Parameters
----------
N : int
  Number of rows in the output.
M : int, optional
  Number of columns in the output. If None, defaults to `N`.
k : int, optional
  Index of the diagonal: 0 (the default) refers to the main diagonal,
  a positive value refers to an upper diagonal, and a negative value
  to a lower diagonal.
dtype : data-type, optional
  Data-type of the returned array.
order : {'C', 'F'}, optional
    Whether the output should be stored in row-major (C-style) or
    column-major (Fortran-style) order in memory.

    .. versionadded:: 1.14.0

Returns
-------
I : ndarray of shape (N,M)
  An array where all elements are equal to zero, except for the `k`-th
  diagonal, whose values are equal to one.

See Also
--------
identity : (almost) equivalent function
diag : diagonal 2-D array from a 1-D array specified by the user.

Examples
--------
>>> np.eye(2, dt

In [35]:
np.loadtxt('file.txt') # загрузка из текстовог офайла 
np.genfromtxt('file.csv',delimiter=',') # загрузка из csv офайла 
np.savetxt('file.txt',arr,delimiter=' ') # запись в  текстовый файл 
np.savetxt('file.csv',arr,delimiter=',') # запись в  csv файл 

OSError: file.txt not found.

## Полезные ссылки

https://www.dataquest.io/blog/numpy-cheat-sheet/
    
https://vk.com/doc114954319_556487793?hash=a4aeb3c8f00331ca46&dl=ce3a2e019cd32c83ee
    
https://towardsdatascience.com/numpy-cheat-sheet-4e3858d0ff0e