<a href="https://colab.research.google.com/github/dm-fedorov/numpy_basic/blob/master/start_numpy/4.%20Введение%20в%20NumPy.ipynb"><img align="left" src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open in Colab" title="Open and Execute in Google Colaboratory" target="_blank"></a>

> © Семён Лукашевский [сайт автора](https://pyprog.pro/why_numpy.html)

### Индексация, срезы, итерирование

Одномерные массивы очень похожи на простые списки Python:

In [None]:
import numpy as np

a = np.arange(12) ** 2
a

In [None]:
#  Обратиться к элементу можно по его индексу
a[0]

In [None]:
a[-1]

In [None]:
#  Извлечение срезов по двум индексам массива
a[4:8]

In [None]:
a[:6], a[6:]

In [None]:
#  Извлечение элементов с определенным шагом
a[::3]

In [None]:
a[::-1]    #  элементы массива в обратном порядке

In [None]:
#  Каждому второму элементу можно присвоить значение
a[:12:2] = -1

In [None]:
a

Многомерные массивы имеют один индекс на одну ось, поэтому обращение к элементам и извлечение срезов производится не по одному, а по нескольким индексам:

In [None]:
a = np.arange(27).reshape(3, 9)
a

In [None]:
a[0, 0]

In [None]:
#  В качестве срезов можно извлекать как столбцы так и строки
a[:, 0]    #  Извлекаем столбец, равносильно a[0:3, 0]

In [None]:
a[:, 1]

In [None]:
a[1:3, 2]    #  Можно извлечь часть столбца

In [None]:
a[0]    #  Извлекаем строку, равносильно a[0, :]

In [None]:
a[0, 2:7]    #  Можно извлечь часть строки

In [None]:
a[2, 4:5]

Те же правила действуют и для многомерных массивов. 

### Дополнительные возможности индексирования

Работая с последовательностями: строками, списками или кортежами, мы привыкли только к одному единственному способу индексирования, который предлагает нам Python. 

Неужели это можно сделать как-то по другому? 

Оказывается можно, и, иногда это оказывается гораздо удобнее, чем может показаться. 

Помимо индексирования целыми числами и срезами, к которому мы так сильно привыкли, NumPy предлагает еще два необычных метода индексирования. 

Первый - это индексация с помощью массивов целых чисел, а второй - это индексация с помощью массивов булевых значений.

### Индексирование массивами целых чисел
Что такое массив индексов? 

Массив индексов - это обычный массив (последовательность) целых чисел, причем каждое число соответствует некоторому индексу определенного элемента в другом массиве, например:

In [None]:
a = np.arange(10, 20)
a

In [None]:
i = np.array([1, 1, 1, 9, 8, 5])
i

In [None]:
b = a[i]
b

Но на практике гораздо удобнее использовать в качестве массивов индексов списки Python. Относительно вышеприведенного примера это будет выглядеть следующим образом:

In [None]:
a

In [None]:
a[[1, 1, 1, 5, 8, 9]]

### Индексация массивами булевых значений

Булевых значений всего два, это `False` и `True`. 

Возникает весьма интересный вопрос, как с помощью таких массивов выполняется индексация, ведь они состоят из одних лишь логических значиний. 

И снова, оказывается не только возможно, но и крайне удобно в некоторых случаях:

In [None]:
a = np.arange(5)
a

In [None]:
a[np.array([False, True, True, False, True])]

In [None]:
a = np.arange(18).reshape(3, 6)
a

In [None]:
a[a % 2 == 0]    #  Создадим булев массив

In [None]:
a[a % 2 == 0] = -1     #  Заменим все четные числа на -1

In [None]:
a

In [None]:
a[a > 1]

In [None]:
a

In [None]:
a[(0 < a) & (a < 20)]

### Манипулирование формой массивов

Форму массива определяет количество элементов вдоль каждой оси:

In [None]:
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]])
a

In [None]:
a.shape    #  Узнаем форму массива

In [None]:
a.ravel()    #  "Сплющивает" массив до одной оси

Изменить форму массива можно разными способами:

In [None]:
a.reshape(2, 6)    #  Возвращает массив с измененной формой

In [None]:
a.reshape(3, 4)

In [None]:
a.T    #  Возвращает транспонированный массив

In [None]:
a

Важно понимать, что функция `reshape` не изменяет исходный массив. 

Если же вам необходимо изменить форму существующего массива, то можно воспользоваться методом `resize`.

In [None]:
a

In [None]:
a.resize((2, 6))

In [None]:
a

Если в функции `reshape` один из размеров задать равным `-1`, то этот размер будет вычислен автоматически:

In [None]:
a

In [None]:
a.reshape(3, -1)

In [None]:
a.reshape(4, -1)

### Объединение массивов

Объединение массивов возможно по разным осям:

In [None]:
a = np.arange(4).reshape(2, 2)
a

In [None]:
b = np.arange(6, 10).reshape(2, 2)
b

In [None]:
np.vstack((a, b))

In [None]:
np.hstack((a, b))

Как видим функция `vstack` объединяет массивы по вертикали, а `hstack` - по горизонтали. Причем количество элементов вдоль объединяемых осей должно быть одинаковым.

Функция `column_stack` представляет одномерные массивы в виде столбцов после чего объединяет их. 

Для двумерных массивов `column_stack` эквивалентна `hstack`:

In [None]:
a = np.arange(2)
a

In [None]:
b = np.arange(2, 4)
b

In [None]:
np.column_stack((a, b))

Функция `row_stack` эквивалентна `vstack` для любых входных массивов:

In [None]:
a = np.arange(4)
a

In [None]:
b = np.arange(4, 8)
b

In [None]:
np.row_stack((a, b))

Есть еще один способ быстро объединять и создавать массивы - это объекты `r_` и `c_`. 

Они позволяют объединить массивы вдоль одной оси или позволяют создать новый массив с использованием операций среза.

In [None]:
np.r_[0:5]    #  Создает массив из среза

In [None]:
np.r_[0:5, 3, 2, 1, 0]    #  Создает массив из среза и последовательности

In [None]:
np.c_[0:5]

### Разделение массивов

Разделить массив вдоль горизонтальной оси можно с помощью функции `hsplit`, а вдоль вертикальной `vsplit`:

In [None]:
a = np.arange(10)
a

In [None]:
np.hsplit(a, 2)

### Копии и представления массивов

Вы, может быть уже заметили, что некоторые функции, что-то делают с массивом, возвращают какой-то результат, но при этом с исходным массивом ничего не происходит. 

Например:

In [None]:
a = np.arange(18).reshape(3, 6)
a

In [None]:
a.T

In [None]:
a

Дело в том, что в NumPy существует два понятия: *копия массива* и *представление массива*. 

Попробуем разобраться на примерах.

In [None]:
a = np.arange(18).reshape(3, 6)
a

In [None]:
b = a
c = a.T

In [None]:
b

In [None]:
c

In [None]:
a[0, 0] = -1

In [None]:
a

In [None]:
b

In [None]:
c

Хорошо, `a` и `b` - это адреса (указатели) одного и того же массива. 

Как быть с переменной `с`? 

По сути это тоже указатель, который ссылается на ту же самую область памяти с данными, на которую ссылаются `a` и `b`, но представлены эти данные в другой форме. 

Поэтому в NumPy и существует понятие - *представление массива*. 

Действительно, одни и те же данные могут быть представлены в разной форме:

In [None]:
a = np.arange(18).reshape(3, 6)
a

In [None]:
b = a.reshape(2, 9)
b

In [None]:
c = a.reshape(2, 3, 3)
c

In [None]:
#  Но если изменить один элемент через а
#  то это отразится во всех представлениях

a[0, 0] = 7777

In [None]:
b

In [None]:
c

Простое присваивание не делает никаких копий массива - это первое, о чем нужно помнить. 

Поэтому отсутствие автоматического копирования при присваивании - небольшая плата за простоту и легкость Python.

In [None]:
a = np.arange(12)
a

In [None]:
b = a
b is a

In [None]:
id(a), id(b)

Довольно часто, необходимо сделать полную копию массива и метод `copy` позволяет сделать это, причем скопировать не только данные массива, но и все его свойства.

In [None]:
a = np.arange(12).reshape(2,6)
a

In [None]:
c = a

In [None]:
b = a.copy()

In [None]:
a[0, 0] = 79
a

In [None]:
c

In [None]:
b

Теперь мы знаем, что простое присваивание не выполняет копирования массивов. 

Если нам нужна копия, то мы можем легко сделать ее с помощью метода `copy`. 

Однако, бывают случаи когда копия массива не нужна, а нужен тот же самый массив, но с другими размерами - другое представление исходного массива.

Для таких нужд NumPy предоставляет метод `ndarray.view()`. 

Этот метод создает новый объект массива, который просматривает данные исходного массива, но изменение размеров одного массива не повлечет изменение размеров другого.

In [None]:
a = np.arange(12)
a

In [None]:
b = a

In [None]:
a.shape = 3, -1     #  Меняем размеры массива "а"

In [None]:
b

In [None]:
#  Теперь создадим представление массива "а"
c = a.view()

In [None]:
a.shape = 2, -1    #  Изменим размеры массива "а"

In [None]:
c

In [None]:
a

In [None]:
b

In [None]:
a[0,0] = 3242

In [None]:
c

Как правило, функции меняющие форму и порядок элементов в массивах возвращают именно представление, а не копию массива:

In [None]:
a = np.arange(8)
a

In [None]:
b = a.reshape(2, 4)    #  Массив "b" - это представление массива "а"

In [None]:
b

In [None]:
c = b.T    #  А вот массив "с" - это представление массива "b"

In [None]:
c

In [None]:
c[0,0] = 888

In [None]:
a

In [None]:
b

Срезы массивов - это тоже представления массивов:

In [None]:
a = np.arange(12)
a

In [None]:
b = a[0:12:2]
b

In [None]:
a[:] = 0

In [None]:
b

Если мы говорим, что массив `b` - это представление массива `a`, то подразумевается, что независимо от формы и вида массива `b` он состоит из тех же данных в памяти, что и массив `a`. 

Поэтому изменение элементов в одном из них повлечет изменение соответствующих элементов в другом.