# 11. 어레이 인덱싱 (2부)

### 주요 내용

- 어레이의 축

- 인덱싱과 슬라이싱

- **부울 인덱싱**

- **팬시 인덱싱**

## 11.3. 부울 인덱싱

### 1차원 부울 어레이 활용

* 길이가 7인 1차원 어레이: 중복된 사람 이름을 항목으로 담고 있는 벡터

In [1]:
import numpy as np

names = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'])
names

array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'], dtype='<U4')

In [2]:
np.random.seed(3)

data = np.random.randn(7, 4)
data

array([[ 1.78862847,  0.43650985,  0.09649747, -1.8634927 ],
       [-0.2773882 , -0.35475898, -0.08274148, -0.62700068],
       [-0.04381817, -0.47721803, -1.31386475,  0.88462238],
       [ 0.88131804,  1.70957306,  0.05003364, -0.40467741],
       [-0.54535995, -1.54647732,  0.98236743, -1.10106763],
       [-1.18504653, -0.2056499 ,  1.48614836,  0.23671627],
       [-1.02378514, -0.7129932 ,  0.62524497, -0.16051336]])

### 가정: `names`와 `data`의 연관성

- 2차원 어레이 `data` 의 각 행이 `names` 어레이의 항목과 연관된다고 가정

- 예를 들어, `'Bob'`은 0번 인덱스와 3번 인덱스의 행과 연관됨

### `data` 어레이에서 `'Bob'`과 연관된 행만 추출

In [3]:
name_Bob = (names == 'Bob')
name_Bob

array([ True, False, False,  True, False, False, False])

In [4]:
data[name_Bob]

array([[ 1.78862847,  0.43650985,  0.09649747, -1.8634927 ],
       [ 0.88131804,  1.70957306,  0.05003364, -0.40467741]])

### 부울 인덱싱과 일반 인덱싱/슬라이싱 혼합

* 행 기준: Bob이 포함된 행의 인덱스를 갖는 행
* 열 기준: 3번 열

In [5]:
data[name_Bob, 3]

array([-1.8634927 , -0.40467741])

* 행 기준: Bob이 포함된 행의 인덱스를 갖는 행
* 열 기준: 2번 열 이후 전체

In [6]:
data[name_Bob, 2:]

array([[ 0.09649747, -1.8634927 ],
       [ 0.05003364, -0.40467741]])

### 마스크 활용

**마스크**<font size='2'>boolean mask</font>: 논리 연산자(`~`, `&`, `|`)를 사용하여 얻어진 부울 어레이 표현식

- 이름이 `'Bob'`이 아닌 이름과 연관된 행만 가져오기

In [7]:
mask = names != 'Bob'
data[mask]

array([[-0.2773882 , -0.35475898, -0.08274148, -0.62700068],
       [-0.04381817, -0.47721803, -1.31386475,  0.88462238],
       [-0.54535995, -1.54647732,  0.98236743, -1.10106763],
       [-1.18504653, -0.2056499 ,  1.48614836,  0.23671627],
       [-1.02378514, -0.7129932 ,  0.62524497, -0.16051336]])

In [8]:
mask = ~name_Bob
data[mask]

array([[-0.2773882 , -0.35475898, -0.08274148, -0.62700068],
       [-0.04381817, -0.47721803, -1.31386475,  0.88462238],
       [-0.54535995, -1.54647732,  0.98236743, -1.10106763],
       [-1.18504653, -0.2056499 ,  1.48614836,  0.23671627],
       [-1.02378514, -0.7129932 ,  0.62524497, -0.16051336]])

- `'Bob'` 또는 `'Will'` 이 위치한 인덱스에 해당하는 행만 가져오기

In [9]:
mask = (names == 'Bob') | (names == 'Will')
data[mask]

array([[ 1.78862847,  0.43650985,  0.09649747, -1.8634927 ],
       [-0.04381817, -0.47721803, -1.31386475,  0.88462238],
       [ 0.88131804,  1.70957306,  0.05003364, -0.40467741],
       [-0.54535995, -1.54647732,  0.98236743, -1.10106763]])

### 항목 업데이트

- 마스크를 이용하여 전체 행 또는 전체 열을 특정 값으로 변경 가능

In [10]:
mask = names != 'Joe'
data[mask] = 7
data

array([[ 7.        ,  7.        ,  7.        ,  7.        ],
       [-0.2773882 , -0.35475898, -0.08274148, -0.62700068],
       [ 7.        ,  7.        ,  7.        ,  7.        ],
       [ 7.        ,  7.        ,  7.        ,  7.        ],
       [ 7.        ,  7.        ,  7.        ,  7.        ],
       [-1.18504653, -0.2056499 ,  1.48614836,  0.23671627],
       [-1.02378514, -0.7129932 ,  0.62524497, -0.16051336]])

### 다차원 마스크

- 음수 항목만 추출해서 1차원 어레이 생성하기

In [11]:
mask = data < 0
mask

array([[False, False, False, False],
       [ True,  True,  True,  True],
       [False, False, False, False],
       [False, False, False, False],
       [False, False, False, False],
       [ True,  True, False, False],
       [ True,  True, False,  True]])

In [12]:
data[mask]

array([-0.2773882 , -0.35475898, -0.08274148, -0.62700068, -1.18504653,
       -0.2056499 , -1.02378514, -0.7129932 , -0.16051336])

- 모든 음수 항목을 0으로 변경하기

In [13]:
data[mask] = 0

data

array([[7.        , 7.        , 7.        , 7.        ],
       [0.        , 0.        , 0.        , 0.        ],
       [7.        , 7.        , 7.        , 7.        ],
       [7.        , 7.        , 7.        , 7.        ],
       [7.        , 7.        , 7.        , 7.        ],
       [0.        , 0.        , 1.48614836, 0.23671627],
       [0.        , 0.        , 0.62524497, 0.        ]])

### 부울 인덱싱과 뷰

- 부울 인덱싱은 뷰를 이용하지 않음

In [14]:
data2 = data[names == 'Bob']
data2

array([[7., 7., 7., 7.],
       [7., 7., 7., 7.]])

In [15]:
data2[0] = -1
data2

array([[-1., -1., -1., -1.],
       [ 7.,  7.,  7.,  7.]])

In [16]:
data

array([[7.        , 7.        , 7.        , 7.        ],
       [0.        , 0.        , 0.        , 0.        ],
       [7.        , 7.        , 7.        , 7.        ],
       [7.        , 7.        , 7.        , 7.        ],
       [7.        , 7.        , 7.        , 7.        ],
       [0.        , 0.        , 1.48614836, 0.23671627],
       [0.        , 0.        , 0.62524497, 0.        ]])

## 11.4. 팬시 인덱싱

### 인덱스 리스트 활용

**0번 축 팬시 인덱싱**

In [17]:
arr = np.arange(32).reshape((8, 4))
arr

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19],
       [20, 21, 22, 23],
       [24, 25, 26, 27],
       [28, 29, 30, 31]])

- 예제 1: `arr` 의 4번, 3번, 0번, 6번 인덱스에 해당하는 항목을 모아서 새로운 어레이를 생성한다.
정해진 순서대로 항목을 재배열한다는 점에 주의한다.

In [18]:
arr[[4, 3, 0, 6]]

array([[16, 17, 18, 19],
       [12, 13, 14, 15],
       [ 0,  1,  2,  3],
       [24, 25, 26, 27]])

- 예제 2: 음수 인덱스도 사용할 수 있다.
밑에서 셋째, 다섯째, 일곱째 항목으로 이루어진 어레이는 다음과 같이 구한다.

In [19]:
arr[[-3, -5, -7]]

array([[20, 21, 22, 23],
       [12, 13, 14, 15],
       [ 4,  5,  6,  7]])

**1번 축 팬시 인덱싱**

In [20]:
arr = np.arange(32).reshape((8, 4))
arr

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19],
       [20, 21, 22, 23],
       [24, 25, 26, 27],
       [28, 29, 30, 31]])

In [21]:
arr[:, [0, 3, 1]]

array([[ 0,  3,  1],
       [ 4,  7,  5],
       [ 8, 11,  9],
       [12, 15, 13],
       [16, 19, 17],
       [20, 23, 21],
       [24, 27, 25],
       [28, 31, 29]])

축별 팬시 인덱싱을 연속으로 실행할 수도 있다.
아래 코드는 1번, 5번, 7번, 2번 행에서 각각 0번, 3번, 1번 항목을 
추출하여 2차원 어레이를 생성한다.

In [22]:
arr[[1, 5, 7, 2]][:, [0, 3, 1]]

array([[ 4,  7,  5],
       [20, 23, 21],
       [28, 31, 29],
       [ 8, 11,  9]])

### 축과 팬시 인덱싱

아래 코드는 `(1, 0)`, `(5, 3)`, `(7, 2)`, `(2, 2)` 좌표에 위치한 항목으로 이루어진 어레이는 다음과 같이 
축별로 항목을 모아놓은 두 개의 인덱스 어레이를 사용해서 팬시 인덱싱을 진행한다.

In [23]:
arr[[1, 5, 7, 2], [0, 3, 1, 2]]

array([ 4, 23, 29, 10])

### 예제

<div align="center" border="1px"><img src="https://raw.githubusercontent.com/codingalzi/datapy/master/jupyter-book/images/fancy_indexing.png" style="width:150px;"></div>

In [24]:
arr = np.arange(36).reshape(6, 6) + np.arange(0, 21, 4).reshape(6, 1)
arr

array([[ 0,  1,  2,  3,  4,  5],
       [10, 11, 12, 13, 14, 15],
       [20, 21, 22, 23, 24, 25],
       [30, 31, 32, 33, 34, 35],
       [40, 41, 42, 43, 44, 45],
       [50, 51, 52, 53, 54, 55]])

* 초록색 1차원 어레이: 0번 축과 1번 축의 팬시 인덱싱 조합

<div align="center" border="1px"><img src="https://raw.githubusercontent.com/codingalzi/datapy/master/jupyter-book/images/fancy_indexing.png" style="width:150px;"></div>

In [25]:
arr[[0,1,2,3,4], [1,2,3,4,5]]

array([ 1, 12, 23, 34, 45])

* 빨강색 1차원 어레이: 0번 축 팬시 인덱싱과 1번 축 인덱싱

<div align="center" border="1px"><img src="https://raw.githubusercontent.com/codingalzi/datapy/master/jupyter-book/images/fancy_indexing.png" style="width:150px;"></div>

In [26]:
arr[[0, 2, 5], 2]

array([ 2, 22, 52])

* 파랑색 2차원 어레이: 0번 축 슬라이싱과 1번 축 팬시 인덱싱

<div align="center" border="1px"><img src="https://raw.githubusercontent.com/codingalzi/datapy/master/jupyter-book/images/fancy_indexing.png" style="width:150px;"></div>

In [27]:
arr[3:, [0, 2, 5]]

array([[30, 32, 35],
       [40, 42, 45],
       [50, 52, 55]])

**3차원 어레이 팬시 인덱싱**

In [28]:
arr = np.arange(32).reshape((4, 2, 4))
arr

array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7]],

       [[ 8,  9, 10, 11],
        [12, 13, 14, 15]],

       [[16, 17, 18, 19],
        [20, 21, 22, 23]],

       [[24, 25, 26, 27],
        [28, 29, 30, 31]]])

In [29]:
arr[[1, 2], [0, 1], [2, 3]]

array([10, 23])

In [30]:
arr[[1, 2], [0, 1]]

array([[ 8,  9, 10, 11],
       [20, 21, 22, 23]])