# Прихотливая (Fancy) индексация

In [None]:
import numpy as np
rand = np.random.RandomState(42)

x = rand.randint(100, size=10)
print(x)

Доступ к элементам с заданными индексами:

In [None]:
[x[3], x[7], x[2]]

Альтернатива - это список или массив индексов:

In [None]:
ind = [3, 7, 4]
x[ind]

Размерность результата - это размерность массива индексов:

In [None]:
ind = np.array([[3, 7],
                [4, 5]])
x[ind]

Fancy индексация работает и в случае многомерных массивов:

In [None]:
X = np.arange(12).reshape((3, 4))
X

Первый массив - это индексы строк, второй - индексы колонок:

In [None]:
row = np.array([0, 1, 2])
col = np.array([2, 1, 3])
X[row, col]

Правила транслирования работают и для индексации:

In [None]:
row[:, np.newaxis]

In [None]:
X[row[:, np.newaxis], col]

## Комбинированная индексация

In [None]:
print(X)

Комбинируем обычный и fancy индекс:

In [None]:
X[2, [2, 0, 1]]

Комбинируем срез и fancy индекс:

In [None]:
X[1:, [2, 0, 1]]

Мы можем комбинировать fancy индекс и маску: 

In [None]:
mask = np.array([1, 0, 1, 0], dtype=bool)
X[row[:, np.newaxis], mask]

Частое применение - выборка случайных подмножеств из матриц

In [None]:
mean = [0, 0]
cov = [[1, 2],
       [2, 5]]
X = rand.multivariate_normal(mean, cov, 100)
X.shape

In [None]:
import matplotlib.pyplot as plt
plt.scatter(X[:, 0], X[:, 1]);

Возьмем 20 случайных точек:

In [None]:
indices = np.random.choice(X.shape[0], 20, replace=False)
indices

In [None]:
selection = X[indices]
selection.shape

Посмотрим какие точки были выбраны:

In [None]:
plt.scatter(X[:, 0], X[:, 1], alpha=0.3)
plt.scatter(selection[:, 0], selection[:, 1]);

Такой подход используется разделения выборки на обучающую и проверочную

## Изменение значений при Fancy индексации

In [None]:
x = np.arange(10)
i = np.array([2, 1, 8, 4])
x[i] = 99
print(x)

А можем и уменьшить:

In [None]:
x[i] -= 10
print(x)

Но результат может быть нетривиальным:

In [None]:
x = np.zeros(10)
x[[0, 0]] = [4, 6]
print(x)

Куда пропала четверка? Первое присваивание ``x[0] = 4``, Второе ``x[0] = 6``.

In [None]:
i = [2, 3, 3, 4, 4, 4]
x[i] += 1
x

Исходное значение запоминается. 
Если необходимо другое поведение, то используйте at():

In [None]:
x = np.zeros(10)
np.add.at(x, i, 1)
print(x)

## Пример: Привязывание данных

Давайте создадим гистограмму вручную:

In [None]:
np.random.seed(1)
x = np.random.randn(100)

bins = np.linspace(-5, 5, 20)

counts = np.zeros_like(bins)

i = np.searchsorted(bins, x)

np.add.at(counts, i, 1)
counts

In [None]:
plt.plot(bins, counts, drawstyle='steps');

In [None]:
print("NumPy гистограмма:")
%timeit counts, edges = np.histogram(x, bins)

print("Наша гистограмма:")
%timeit np.add.at(counts, np.searchsorted(bins, x), 1)