### Основные преимущества списков NumPy перед стандартными списками

Собственно, векторное применение функций - самый очевидный бонус numpy. Он избавляет от необходимости оборачивания в map или в цикл какой-либо функции.

Важна также функциональность: вы получаете много встроенных функций с NumPy, FFT, свертками, быстрым поиском, базовой статистикой, линейной алгеброй, гистограммами и т.д.

In [None]:
import math
import numpy as np

In [None]:
a = [1, 2, 3, 4, 5]
a = list(map(math.sqrt, a))
a

# здесь можно также указывать точность
# (количество чисел после запятой)
# np.set_printoptions(precision=4)
a = [1, 2, 3, 4, 5]
a = np.sqrt(a)
a

Также часто упоминают хорошую скорость выполнения операций по сравнению операции с теми же оригинальными списками

In [4]:
import time

a = [i for i in range(100000000)]

b = np.array(a, int)

t = time.time()
a = [a[i] + 1 for i in range(len(a))]
print(f'Python array: {time.time() - t}')

t = time.time()
b = b + 1
print(f'Numpy array: {time.time() - t}')

Python array: 10.291004419326782
Numpy array: 0.22296142578125


## Переходим к описаниям функций NumPy

### 3. Создание массива и матриц NumPy

#### Создание массива из списка

In [None]:
some_array = np.array([1, 4, 5, 8], float)
print(type(some_array))

# созданный массив, кстати, позволяет работать с собой
# также, как и обычный список
print(some_array[:2])
print(some_array[3])
some_array[2] = 69
print(some_array)

In [None]:
# массивы так то могут быть и не одномерными (удивительно)
big_array = np.array([[1, 2, 3], [4, 5, 6]])
print(big_array)
# в отличии от списков можно использовать запятые в скобках
print(big_array[0, 0] == big_array[0][0])

#### np.arange()

In [None]:
kek = np.arange(3)
# можно явно указывать тип значений
kek = np.arange(3.0)
kek = np.arange(0, 5)
# от 0 до 5 с шагом 2
kek = np.arange(0, 5, 2)
print(kek)

#### np.zeros() и np.ones()

In [None]:
kavo = np.zeros(5)
# явное указание типа здесь тоже есть
# (вообще оно почти везде есть, можно к этому больше не возвращаться)
kavo = np.zeros((5), dtype=int)
# можно указывать размерность
kavo = np.zeros((5, 2))

# (штука, в очень многом схожая с np.zeros())
chevo = np.ones(5)
chevo = np.ones((5, 2))

#### np.linspace()

In [None]:
# (штука очень похожая на arange, только arange
# создает с указанием шага, а тут указывается
# кол-во элементов)
np.linspace(2.0, 3.0, num=22)

# можно указать, включать ли правую границу в
# содержимое массива
np.linspace(2.0, 3.0, num=5, endpoint=False)

# можно даже возвращать не просто список, а кортеж
# из списка и вычисленного шага между элементами
np.linspace(2.0, 3.0, num=8, retstep=True)

#### np.identity() и np.eye()

In [None]:
# просто единичная матрица
np.identity(5)

# возвращает двумерный массив с единицами на указанной
# диагонали (во всех остальных местах ставятся нули)
np.eye(2, dtype=int)
np.eye(4, dtype=int)
# второй аргумент указывает на размерность
np.eye(4, 3, 1, dtype=int)
# иногда удобнее явно задавать номер диагонали
np.eye(3, k=1)

### 4. Мелкие вспомогательные функции

#### np.shape

In [None]:
# np.shape позволяет
# получить размерность некоторого массива
np.shape(np.eye(3))
np.shape(some_array)
np.shape(big_array)

#### np.dtype

In [None]:
# np.dtype указывает
# на тип содержимого списка
big_array.dtype
print((np.arange(3.0)).dtype)
print(np.array(["pepega", "nice"]).dtype)
print(np.array([{"a": 1}, {"b": 2}]).dtype)

#### np.copy()

In [None]:
# np.copy() копирует список
# с содержимым в другую ячейку в памяти
a = np.array([1, 'm', [2, 3, 4]], dtype=object)
b = np.copy(a)
a[1] = 1
print(a)
print(b)

#### np.flatten()

In [None]:
# делает одномерный массив из многомерного
a = np.array([[1,2], [3,4]])
print(a.flatten())
a = np.array([[1,2], [[3, 3.5, 3.6], 4]])
print(a.flatten())

#### np.concatenate()

In [None]:
# np.concatenate()
# осуществляет конкатенацию списков
a = np.array([[1,2], [3,4]])
a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6]])
print(np.concatenate((a, b), axis=0))
print(np.concatenate((a, b), axis=None))

### 5. Арифметические и логические операции в NumPy

In [None]:
# база
a = np.array([1,2,3], float)
b = np.array([5,2,6], float)
print(a + b)
print(a - b)

# умножение даже двумерных матриц с помощью оператора "*"
# происходит тоже ПОЭЛЕМЕНТНО
print(a * b)
print(a / b)
print(a % b)
print(a ** b)

# ещё база
a = np.array([1, 3, 0], float)
b = np.array([0, 3, 2], float)
print(a > b)
print(a == b)
print(a <= b)
print(c = a > b)
# можем сравнивать с одиночным значением
a = np.array([1, 3, 0], float)
print(a > 2)

#### np.all() и np.any()

In [None]:
# возвращает true, если все значения списка ненулевые
# (по сути это логическое И)
np.all([1, 1, 1])
np.all([0, 1, 1])
# ключевое слово - НЕНУЛЕВЫЕ
np.all([-1, 4, 5])

# можно указывать, возвращать ли значение для всех списков,
# или значения для каждого конкретного
np.all([[True,False],[True,True]])
np.all([[True,False],[True,True]], axis=0)

# np.any()
# возвращает true, если хотя бы одно значение списка ненулевое
# (по сути это логическое ИЛИ)
np.any([0, 0, 0])
np.any([0, 0, 1])

#### np.sqrt(). np.exp(), np.log()

In [None]:
# векторизованные до боли знакомые функции
np.sqrt([1, 4, 9])
np.exp([1, 4, 9])
np.log([1, 4, 9])

# можно работать и с комплексными числами
# но нужно ли...
np.sqrt([4, -1, -3+4J])
np.log([4, -1, -3+4J])

#### np.sum() и np.prod()

In [None]:
# сумма значений списка по конкретной оси
print(np.sum([0.5, 1.5]))
print(np.sum([0.5, 0.7, 0.2, 1.5], dtype=np.int32))
print(np.sum([[0, 1], [0, 5]]))
print(np.sum([[0, 1], [1, 5]], axis=0))
print(np.sum([[0, 1], [1, 5]], axis=1))

# произведение значений списка по конкретной оси
print(np.prod([0.5, 1.5]))
print(np.prod([0.5, 0.7, 0.2, 1.5], dtype=np.int32))
print(np.prod([[1, 2], [3, 4]]))
print(np.prod([[1, 2], [3, 4]], axis=0))
print(np.prod([[1, 2], [3, 4]], axis=1))

#### np.dot() и np.matmul()

In [None]:
# с помощью np.dot()
# можно умножать массивы между собой
# (представляет собой поэлементное
#  умножение элементов списков)
print(np.dot(3, 4))
print(np.dot([2j, 3j], [2j, 3j]))
a = [[1, 0],
     [1, 1]]
b = [[4, 1],
     [2, 2]]
print(np.dot(a, b))


# np.matmul()
# (по сути является обычным
#  матричным произведением)
a = [[1, 0],
     [1, 1]]
b = [[4, 1],
     [2, 2]]
print(np.matmul(a, b))

a = np.array([[1, 1],
              [1, 1]])
b = np.array([1, 2])
print(np.matmul(a, b))

### 6. Константы и статистические приколы

In [None]:
# ничего интересно, просто держим в курсе
print(np.pi)
print(np.e)

#### np.min() и np.max()

In [None]:
print(np.min(np.array([7, 8, 4, 5, 2])))
print(np.min([[1, 2], [2], [3, 4, 3]]))
print(np.max([[1, 2], [2], [3, 4, 3]]))

#### Статистика (медиана, среднее значение, дисперсия, стандартное отклонение)

In [None]:
a = np.array([[10, 7, 4], [3, 2, 1]])
a

print(np.median(a))
print(np.median(a, axis=0))
print(np.median(a, axis=1))

print(np.mean(a))
print(np.mean(a, axis=0))
print(np.mean(a, axis=1))

print(np.var(a))
print(np.var(a, axis=0))
print(np.var(a, axis=1))

print(np.std(a))
print(np.std(a, axis=0))
print(np.std(a, axis=1))

### 7. Ещё полезные функции

#### np.unique()

In [82]:
# возвращает уникальные значения из списка
print(np.unique([1, 1, 2, 2, 3, 3]))
# работает и для многомерных списков
a = np.array([[1, 1], [2, 3]])
print(np.unique(a))

array([False, False,  True, False])

#### np.diagonal()

In [None]:
# получение значение на конкретной
# диагонали матрицы
a = np.arange(16).reshape(4,4)
print(a)
print(a.diagonal())
print(a.diagonal(1))

#### np.nonzero()

In [None]:
# возвращает индексы ненулевых элементов списка
x = np.array([1, 0, 0, 0, 12, 0, -1])
print(x)
print(np.nonzero(x))

# это работает и с многомерными массивами
x = np.array([[3, 0, 0], [0, 4, 0], [5, 6, 0]])
print(x)
print(np.nonzero(x))

# таким хитрым образом можно получить
# сами ненулевые элементы в списке
print(x[np.nonzero(x)])

#### np.isnan()

In [None]:
# возвращает True, если значение None, Null, NaN
print(np.isnan([1, 2, np.nan, 12]))

### 8. Случайные случайности

In [None]:
print(np.random.rand(4))
print(np.random.rand(1, 2))

print(np.random.randint(3))
print(np.random.randint(low=3, high=5, size=3))

# возвращает значение
# стандартного нормального распределения
print(np.random.randn(5, 2))


# перемешивает значения списка
a = [1, 2, 3, 4, 5]
np.random.shuffle(a)
print(a)