<b>NumPy</b> — библиотека с открытым исходным кодом для языка программирования Python. Возможности:

-поддержка многомерных массивов (включая матрицы);

-поддержка высокоуровневых математических функций, предназначенных для работы с многомерными массивами.

In [67]:
import numpy as np

In [68]:
np.array([1, 2, 3, 4, 5])

array([1, 2, 3, 4, 5])

In [69]:
np.array([[1, 2], [3, 4]])

array([[1, 2],
       [3, 4]])

Все элементы array одного типа. При создании автоматически выполняется приведение типа

In [70]:
np.array([1, 2, 'c']) #преведены к строковому

array(['1', '2', 'c'], dtype='<U11')

In [71]:
np.array([1, 2, 3.14, 4, 5]) #преведены к float

array([1.  , 2.  , 3.14, 4.  , 5.  ])

Можно задавать тип явно

In [72]:
np.array([1, 2.1, 3, 4, 5], dtype='int64')

array([1, 2, 3, 4, 5], dtype=int64)

In [73]:
np.array([1, 2, 3, 4, 5], dtype='float64')

array([1., 2., 3., 4., 5.])

In [74]:
intArray = np.array([1, 2, 3, 4, 5], dtype='int64')
floatArray = intArray.astype('float64') #изменение типа массива на float
floatArray

array([1., 2., 3., 4., 5.])

In [75]:
type(intArray)

numpy.ndarray

Помним, что в обычный массив <b>Python</b> можно добавлять элементы любого типа. В отличае от массива <b>Python</b> в <b>np</b> все элементы одного типа. 

Что это даёт:

#### 1. Массив np занимает меньше места в памяти

За счет того, что нет необходимости хранить для каждого элемента массива его тип, размер требуемой памяти сокращается более чем в 2 раза

In [76]:
import sys
pyArray = list(range(30000))
sys.getsizeof(pyArray)

270112

In [77]:
npArray = np.array(pyArray)
sys.getsizeof(npArray)

120096

#### 2. Скорость выполнения операций с элементами массива (опять же за счет того, что при выполнении нет необходимости приводить к нужному типу) выше на порядок

In [78]:
%timeit -n 100 sum(pyArray)
%timeit -n 100 np.sum(npArray)#ускорение подсчета суммы 
                              #относительной стандартного оператора
%timeit -n 100 npArray.sum()

603 µs ± 58.1 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
37.1 µs ± 3.47 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
33.8 µs ± 976 ns per loop (mean ± std. dev. of 7 runs, 100 loops each)


## Различные способы создания массивов

In [79]:
np.zeros(10, dtype=int)

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

In [80]:
np.ones((3, 3))

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

In [81]:
np.full((2, 2), 33, dtype=int)

array([[33, 33],
       [33, 33]])

In [82]:
np.arange(1, 10, 2) #по аналогии с range

array([1, 3, 5, 7, 9])

In [83]:
np.linspace(0, 1, 11) #равномерное разбиение отрезка [0;1] на 11 точек (10 отрезков)

array([0. , 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1. ])

In [84]:
np.random.random((2, 2))

array([[0.35988148, 0.80893298],
       [0.12118044, 0.00588795]])

In [85]:
np.eye(3) #единичная матрица

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

## Доступ к элементам массива - по аналогии с встроенным типом list

In [86]:
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

In [87]:
a[0, 0]

1

In [88]:
a[2,2]

9

In [89]:
a[2,2] = 10

Возврат только определенных элементов, тех, на местах которых стоят True

In [90]:
b = np.array(['a','b','c','d'])
print(b)
b[[True,False,True,False]]

['a' 'b' 'c' 'd']


array(['a', 'c'], dtype='<U1')

## Дополнительно к list

In [91]:
a[0] #как в list

array([1, 2, 3])

In [92]:
a[0, :] #первая строка

array([1, 2, 3])

In [94]:
a[:, 0] #первый столбец

array([1, 4, 7])

In [95]:
a[:, -1] #последний столбец

array([ 3,  6, 10])

## Характеристики массива

In [96]:
a.ndim #размерность - 2 - двумерный

2

In [97]:
a.shape #размеры измерений - 3 на 3

(3, 3)

In [98]:
a.size #всего элементов - 9

9

## Изменение размерности массива

In [99]:
b1 = a.reshape(a.size) #один аргумент
b2 = a.reshape((a.size, 1)) #аргумент кортеж

In [100]:
b1 #вектор-строка

array([ 1,  2,  3,  4,  5,  6,  7,  8, 10])

In [101]:
b2 #вектор-столбец

array([[ 1],
       [ 2],
       [ 3],
       [ 4],
       [ 5],
       [ 6],
       [ 7],
       [ 8],
       [10]])

## Простые операции

In [102]:
a1 = np.array([-1, 0, 1, 2])
a2 = np.array([1, 2, 3, 4])

In [103]:
a1.sum() #поэлементная сумма

2

In [104]:
np.sum(a1)

2

In [105]:
np.abs(a1) #поэлементное взятие абсолютного значения

array([1, 0, 1, 2])

In [106]:
a1 + 1 #поэлементное сложение с единицей

array([0, 1, 2, 3])

In [107]:
a1+a2, a1-a2, a1*a2, a1/a2

(array([0, 2, 4, 6]),
 array([-2, -2, -2, -2]),
 array([-1,  0,  3,  8]),
 array([-1.        ,  0.        ,  0.33333333,  0.5       ]))

In [108]:
a1

array([-1,  0,  1,  2])

In [109]:
np.array([1.111222, 1.113444, 1.113643]).round(3) #Округление

array([1.111, 1.113, 1.114])

#### некоторые агрегатные функции

In [110]:
a1.min(), a1.max(), a1.mean(), a1.std(), a1.argmin(), a1.argmax()

(-1, 2, 0.5, 1.118033988749895, 0, 3)

Накапливаемая сумма

In [112]:
np.cumsum([1,1,1,1,1])

array([1, 2, 3, 4, 5], dtype=int32)

#### Проверка условий: один из, все

In [113]:
a1

array([-1,  0,  1,  2])

In [114]:
a1.any()

True

In [115]:
a1.all()

False

In [116]:
b1 = np.full(5, True)
b2 = b1.copy()
b2[3] = False
b3 = np.full(5, False)

In [117]:
b1, b2, b3

(array([ True,  True,  True,  True,  True]),
 array([ True,  True,  True, False,  True]),
 array([False, False, False, False, False]))

In [118]:
b1.any(), b2.any(), b3.any()

(True, True, False)

In [119]:
b1.all(), b2.all(), b3.all()

(True, False, False)

## Вычисления из ДЗ 1

In [120]:
l1 = np.array([5.1, 3.5, 1.4, 0.2])
l2 = np.array([4.9, 3.0, 1.4, 0.25])

In [121]:
np.dot(l1, l2) #скалярное произведение

37.49999999999999

In [122]:
np.linalg.norm(l1-l2) #евклидово расстояние

0.5408326913195981

## Операторы сравнения

In [123]:
a1

array([-1,  0,  1,  2])

In [124]:
a1 == 0

array([False,  True, False, False])

In [125]:
a1 != 0

array([ True, False,  True,  True])

In [126]:
a1 > 0

array([False, False,  True,  True])

Индексы элементов, значения которых удовлетворяют условию

In [127]:
np.where(a1 > 0)

(array([2, 3], dtype=int64),)

In [128]:
a1

array([-1,  0,  1,  2])

In [129]:
a1 > 0

array([False, False,  True,  True])

a1>0 вернет вектор из bool, a1 [вектор из bool] - вернет только те элементы массива, где соответствующий bool равен True

In [130]:
a1[a1 > 0]

array([1, 2])

In [131]:
a1[[False, False, True, True]]

array([1, 2])

In [132]:
a1[np.where(a1 > 0)]

array([1, 2])

In [133]:
a1[[2,3]]

array([1, 2])

#### Компановка матриц

In [134]:
X1 = np.array([[11,12,13],[21,22,23]])
y1 = np.array([[14],[24]])

In [135]:
X1,y1

(array([[11, 12, 13],
        [21, 22, 23]]),
 array([[14],
        [24]]))

In [136]:
np.hstack((X1,y1)) #склеивание матриц по горизонтали

array([[11, 12, 13, 14],
       [21, 22, 23, 24]])

In [137]:
X2 = np.array([[31,32,33]])

In [66]:
np.vstack((X1,X2)) #склеивание матриц по вертикали

array([[11, 12, 13],
       [21, 22, 23],
       [31, 32, 33]])

## Random

In [138]:
np.random.random() #случайная величина

0.7655600943254259

In [139]:
np.random.random(5) #5 random значений

array([0.05844679, 0.2385232 , 0.31788737, 0.33806166, 0.32121999])

In [140]:
np.random.randint(100) #случайное целое до 100

88

In [141]:
np.random.randint(1, 5, 20) #20 случайных целых от 1 до 5

array([3, 4, 2, 1, 1, 4, 1, 2, 3, 2, 3, 1, 4, 3, 4, 4, 2, 1, 1, 1])

In [142]:
idx = np.random.permutation(10) # перемешанные индексы для массива в 10 элементов
print(idx)

[0 4 8 9 5 2 3 7 6 1]


In [74]:
a = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [75]:
a[idx]

array([9, 8, 1, 6, 7, 0, 4, 3, 2, 5])