 NumPy - векторные/научные вычисления. Объект **NumPy** - это однородный многомерный массив. 





In [1]:
import numpy as np # Подключаем библиотеку numpy

Векторизованные вычисления:
Векторизованные - означает, что все арифметические операции и математические функции выполняются сразу над всеми элементами массивов без циклов. 

In [2]:
b = [4, 8, 15, 16, 23, 42]
y = 2*a + 10
y

NameError: name 'a' is not defined

In [None]:
np.sin(a)**2 + np.cos(a)**2

In [None]:
a.ndim


2- мерныe массивы

In [None]:
a = np.arange(12) # функция np.arange(),  во многом аналогична функции range() языка Python. 
a

In [None]:
a = a.reshape(3, 4) # изменили форму массива с помощью метода `reshape()
a

![image](https://raw.githubusercontent.com/dm-fedorov/numpy_basic/master/pic/2nd_array.jpg)

Глядя на картинку, становится понятно, что первая ось (и индекс соответственно) - это строки, вторая ось - это столбцы. Т.е. получить элемент 9 можно простой командой:

In [None]:
a[:,:]    #  равносильно команде a[2, 1]

Broadcasting *транслирование массивов*:

In [None]:
b = [2, 3, 4, 5]

a * b

np.dot(a,b)

 мы умножили каждый столбец из массива `a` на соответствующий элемент из массива `b`. 


In [1]:
a = np.random.randint(0, 15, size=(4, 6))
a

NameError: name 'np' is not defined

Минимальный элемент :

In [None]:
a.min()

минимальные элементы по столбцам и строкам:

In [None]:
a.max(axis=1)    #  минимальные элементы по столбцам

In [None]:
a.min(axis=1)    #  минимальные элементы по строкам

Это поведение заложено практически во все функции и методы NumPy:

In [None]:
a.mean(axis=0)    #  среднее по столбцам

In [None]:
np.std(a, axis=1)    #  стандартное отклонение по строкам

трехмерный массив:

In [None]:
a = np.arange(4915200*2*20).reshape(20,10,10,128,128,3,2,1)
a.ndim

In [None]:
a[1,2,3,:,:,:,:] #RGB

![image](https://raw.githubusercontent.com/dm-fedorov/numpy_basic/master/pic/3nd_array.jpg)

индексация трехмерных массивов:

In [None]:
a[2][1][3]    #  или a[2, 1, 3]

In [None]:
a.ndim

In [None]:
a.shape # форма массива

In [None]:
a.dtype

Метод `ndarray.size` просто возвращает общее количество элементов массива:

In [None]:
a.size

сколько "весит" один элемент массива:

In [None]:
a.= np.arange(10,50)    #  эквивалентно ndarray.dtype.itemsize

`ndarray.itemsize` возвращает размер элемента в байтах. 

Теперь мы можем узнать сколько "весит" наш массив:

In [None]:
a.size * a.itemsize /1024/1024

Итого - 384 байта. 

In [None]:
a.dtype

`dtype('int64')` - означает, что используется целочисленный тип данных, в котором для хранения одного числа выделяется 64 бита памяти. 

Но если мы выполним какие-нибудь вычисления с массивом, то тип данных может измениться:

In [None]:
b = a/3.14 
b

In [None]:
b.dtype

In [None]:
del a, b

In [None]:
import gc
gc.collect()

### Создание массивов в NumPy

[Большой обзор функций для создания массивов](https://pyprog.pro/array_creation/array_creation_functions.html)


В NumPy реализованы свои типы данных, которые отличаются от встроенных в Python.

Подробнее о типах: https://docs.scipy.org/doc/numpy/user/basics.types.html

In [None]:
import numpy as np

a = np.array([1, 2, 3]) # массив может быть создан из обычного списка или кортежа Python с использованием функции `array()`. 
a

In [None]:
numpy2 = np.array([1, 2, 3, 4, 5, 6]) # Создаем numpy-массив из списка цифр
print(numpy2) # Выводим на экран массив numpy2
print(numpy2.shape) # Выводим на экран размерность массива numpy2

In [None]:
numpy_new = numpy2.reshape((3, 2)) # Изменяем размерность массива numpy2 из (6,) -> (3, 2)
print(numpy_new) # Выводим на экран массив numpy_new

In [None]:
6.26140102e+07 

In [None]:
a.dtype # тип полученного массива зависит от типа элементов последовательности:

In [None]:
a = np.array([1.1, 2.2, 3.3],dtype='float32')
a

In [None]:
a.dtype

In [None]:
a = np.array([1 + 2j, 2 + 3j])
a.dtype

In [None]:
a = np.array([1, 2, 3, 2 + 3j])
a

Функция `array()` преобразует последовательности последовательностей в двумерные массивы, а последовательности последовательностей, которые тоже состоят из последовательностей в трехмерные массивы.

уровень вложенности исходной последовательности определяет размерность получаемого массива:

In [None]:
a = np.array([[2, 4,3], [6, 8,1], [10, 12,6]])
a

In [None]:
b = np.array([[[1, 2], [3, 4]], 
              [[5, 6], [7, 8]], 
              [[9, 10], [11, 12]]])
b

In [None]:
a.ndim    #  Количество осей массива

In [None]:
b.ndim



Функция `zeros` заполняет массив нулями, функция `ones` - единицами, а функция `empty` - случайными числами, которые зависят от состояния памяти. 

По умолчанию, тип создаваемого массива - `float64`.

In [None]:
np.zeros((3,3))

In [None]:
np.ones((3,3))

In [None]:
np.ones((3,3), dtype=complex)  #  Можно изменить тип массива

In [None]:
np.empty([3, 3])

Для создания последовательностей чисел NumPy предоставляет функцию `arange`, которая возвращает одномерные массивы:

In [None]:
np.arange(10)    #  От 0 до указанного числа

In [None]:
np.arange(10, 20)    #  Диапазон

In [None]:
np.arange(20, 100, 10)    #  Диапазон с заданным шагом

In [None]:
np.arange(0.0, 1.8)    #  Аргументы могут иметь тип float

Если функция `arange` используется с аргументами типа `float`, то предсказать количество элементов в возвращаемом массиве не так-то просто. 



Функция `linspace`, так же как и `arange` принимает три аргумента,  третий аргумент указывает количество чисел в диапазоне.

In [3]:
np.linspace(0, 1, 6)

array([0. , 0.2, 0.4, 0.6, 0.8, 1. ])

In [4]:
np.linspace(0, 1, 7)

array([0.        , 0.16666667, 0.33333333, 0.5       , 0.66666667,
       0.83333333, 1.        ])

In [None]:
np.linspace(10, 100, 5)

Функция `linspace` удобна еще и тем, что может быть использована для вычисления значений функций на заданном множестве точек:

In [None]:
x = np.linspace(0, 2*np.pi, 10)
x

In [None]:
y1 = np.sin(x)
y1

In [None]:
y2 = np.cos(x)
y2

### Вывод массивов на экран



Одномерные массивы в NumPy печатаются в виде строк:

In [None]:
a = np.arange(10)    #  Одномерный массив
print(a)

Двумерные массивы печатаются в виде матриц:

In [None]:
b = np.arange(1600).reshape(400, 4)    #  Двумерный массив
print(b)

Трехмерные массивы печатаются в виде списка матриц, которые разделены пустой строкой:

In [None]:
c = np.arange(30).reshape(5, 2, 3)    #  Трехмерный массив
print(c)



В случае, если массив очень большой (больше 1000 элементов), NumPy печатает только начало и конец массива, заменяя его центральную часть многоточием.

In [None]:
print(np.arange(1001))

In [None]:
print(np.arange(1000000))

In [None]:
print(np.arange(1000000).reshape(1000,1000))

Если необходимо выводить весь массив целиком, то такое поведение печати можно изменить с помощью `set_printoptions`.

> np.set_printoptions(threshold=np.nan)

### Файловый ввод и вывод массивов



Двоичные файлы NumPy (.npy, .npz)

NumPy имеет два собственных формата файлов `.npy` - для хранения массивов без сжатия и `.npz` - для предварительного сжатия массивов. 

Если массивы, которые необходимо сохранить являются небольшими, то можно воспользоваться функцией `numpy.save()`. В самом простом случае, данная функция принимает всего два аргумента - имя файла в который будет сохранен массив и имя самого сохраняемого массива. 

In [None]:
import numpy as np

a = np.arange(12).reshape(3, 4)
a

In [None]:
b = np.arange(16).reshape(4, 4)
b

In [None]:

np.save('example_1', a)

После того как массив сохранен, его можно загрузить из файла с помощью функции `numpy.load()`, указав в виде строки имя необходимого файла или путь к нему

In [None]:
import numpy as np

a = np.load('example_1.npy')
a

Файлы `.npy` удобны для хранения одного массива, если в одном файле нужно сохранить несколько массивов, то необходимо воспользоваться функцией `numpy.savez()`, которая сохранит их в несжатом виде в файле NumPy с форматом `.npz`.

In [None]:
a = np.array([1, 2, 3])
b = np.array([[1, 1], [0, 0]])
c = np.array([[1], [2], [3]])

np.savez('example_2', a, b, c)

После сохранения массивов в файл `.npz` они могут быть загружены с помощью, уже знакомой нам функции `numpy.load()`. Однако, имена массивов теперь изменились с `a`, `b` и `c` на `arr_0`, `arr_1` и `arr_2` соответственно:

In [None]:
ex_2 = np.load('example_2.npz')

In [None]:
ex_2.files

In [None]:
ex_2['arr_0']

In [None]:
ex_2['arr_1']

In [None]:
ex_2['arr_2']

Что бы вместе с массивами сохранялись их оригинальные имена, необходимо в функции `numpy.savez()` указывать их как ключи словарей Python:

In [None]:
np.savez('example_2', a_=a, b=b, c=c)

In [None]:
ex_2 = np.load('example_2.npz')

In [None]:
ex_2.files

In [None]:
ex_2['a_']

В случае очень больших массивов можно воспользоваться функцией `numpy.savez_compressed()`.

In [None]:
a = np.arange(100000)
a

In [None]:
#  Файл example_3.npy занимает 400 кБ на диске:
np.save('example_3', a)

#  файл example_3.npynpz занимает всего 139 кБ на диске:
np.savez_compressed('example_3', a)