# 넘파이 어레이: 인덱싱과 슬라이싱

기존의 시퀀스 자료형처럼 인덱싱과 슬라이싱을 이용하여 어레이 항목들을 확인할 수 있다.

## 1차원 어레이의 인덱싱과 슬라이싱

1차원 어레이의 경우 리스트의 인덱싱, 슬라이싱과 동일하게 처리한다. 
다만, 슬라이싱의 경우 리턴값 또한 1차원 어레이이다.

In [1]:
import numpy as np

### 인덱싱

인덱싱은 숫자 0부터 인덱스가 시작하며, `-1`은 마지막 항목을 의미한다. 

In [2]:
a = np.arange(10)
a

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [3]:
a[0], a[2], a[-1]

(0, 2, 9)

### 슬라이싱

두 개의 콜론(':')을 사용하여 슬라이싱 구간의 처음과 끝, 그리고 스텝 
옵션을 지정할 수 있다. -1은 역순으로 나열하는 것을 의미한다. 

In [4]:
a[::-1]

array([9, 8, 7, 6, 5, 4, 3, 2, 1, 0])

In [5]:
a[2:9:3] # [start:end:step]

array([2, 5, 8])

In [6]:
a[:4]

array([0, 1, 2, 3])

In [7]:
a[1:3]

array([1, 2])

In [8]:
a[::2]

array([0, 2, 4, 6, 8])

In [9]:
a[3:]

array([3, 4, 5, 6, 7, 8, 9])

## 고차원 어레이의 인덱싱과 슬라이싱

### 인덱싱

먼저 중첩 리스트의 경우 인덱싱을 어떻게 하는지 확인해 보자. 

In [10]:
b = [[0, 1, 2], [3, 4, 5]]
len(b)

2

`a`에서 `0`을 뽑아내고자 할 경우 인덱싱을 두 번 연속해서 사용해야 하는데,
이는 `0`이 `a`의 첫째 항목의 첫째 항목이기 때문이다. 즉,

In [11]:
b[0][0]

0

`5`의 경우 둘째 항목의 셋째 항목이다.

In [12]:
b[1][2]

5

반면에 `b`를 이차원 어레이로 다룰 경우에는 다음과 같이 하면 된다.

In [13]:
b = np.array([[0, 1, 2], [3, 4, 5]])
b

array([[0, 1, 2],
       [3, 4, 5]])

In [14]:
b[0, 0]

0

In [15]:
b[1,2]

5

따라서, 다차원 어레이에서 사용되는 인덱싱은 인덱스 숫자들의 튜플을 사용한다.
사용된 튜플의 길이만큼 인덱싱의 대상이 되는 항목들의 차원이 증가한다. 

보다 다양한 예제들을 이용하여 인덱싱을 연습해보자.

In [16]:
d = np.diag(np.arange(3))
d

array([[0, 0, 0],
       [0, 1, 0],
       [0, 0, 2]])

`1`의 위치는 2행 2열이므로 인덱싱을 `(1, 1)`을 이용한다.

In [17]:
d[1, 1]

1

어레이의 특정 항목의 값을 변경할 수 있다.
즉, 어레이는 가변(mutable) 자료형이다. 
예를 들어, 3행 2열 항목값인 0을 10으로 변경하고자 하면 다음과 같이 인덱싱을 이용하면 된다.

In [18]:
d[2, 1] = 10
d

array([[ 0,  0,  0],
       [ 0,  1,  0],
       [ 0, 10,  2]])

`d[2]`는 무엇을 의미할까?
`d`를 리스트라 생각하면 이해가 될 것이다.
즉, 3번째 항목인 `[0, 10, 2]`를 가리킨다.

In [19]:
d[2]

array([ 0, 10,  2])

### 슬라이싱

다차원 어레이의 슬라이싱은 좀 더 집중을 요구한다. 
복잡하거나 어렵지는 않지만 항상 집중해야 한다. 

먼저, 다음과 같은 모양의 2차원 어레이를 생성해보자. 
단, 수동으로 항목들을 입력하면 안된다.

<table>
  <tr>
    <td align=center>0</td>
    <td align=center>1</td> 
    <td align=center>2</td>
    <td align=center>3</td>
    <td align=center>4</td>
    <td align=center>5</td>
  </tr>
  <tr>
    <td>10</td>
    <td>11</td> 
    <td>12</td>
    <td>13</td>
    <td>14</td>
    <td>15</td>
  </tr>
  <tr>
    <td>20</td>
    <td>21</td> 
    <td>22</td>
    <td>23</td>
    <td>24</td>
    <td>25</td>
  </tr>
  <tr>
    <td>30</td>
    <td>31</td> 
    <td>32</td>
    <td>33</td>
    <td>34</td>
    <td>35</td>
  </tr>
  <tr>
    <td>40</td>
    <td>41</td> 
    <td>42</td>
    <td>43</td>
    <td>44</td>
    <td>45</td>
  </tr>
  <tr>
    <td>50</td>
    <td>51</td> 
    <td>52</td>
    <td>53</td>
    <td>54</td>
    <td>55</td>
  </tr>
</table>

여러 가지 방법이 있을 수 있으나 shape을 변경하는 방법을 활용하는 것이 가장 기초적이다. 
먼저, `np.arange` 함수를 이용하여 길이가 36인 어레이를 생성한 다음에 
shape 값을 변경하여 2차원 어레이를 생성한다. 

In [20]:
a = np.arange(36)
a.shape = (6,6)
a

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29],
       [30, 31, 32, 33, 34, 35]])

`shape`  변경하는 여러 가지 방법이 있다. 

* `shape` 속성을 위와 같이 변경하기.
* `reshape` 메소드 이용하기

In [21]:
a = np.arange(36).reshape((6,6))
a

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29],
       [30, 31, 32, 33, 34, 35]])

이제 각 행별로 4의 배수를 더하면 원하는 어레이가 얻어지는 성질을 이용한다. 
어레이와 숫자의 연산은 각 항목별로 실행된다는 점을 이용한다. 

In [23]:
a = np.arange(36).reshape((6,6))

for i in range(len(a)):
    a[i] = a[i] + 4*i

a

array([[ 0,  1,  2,  3,  4,  5],
       [10, 11, 12, 13, 14, 15],
       [20, 21, 22, 23, 24, 25],
       [30, 31, 32, 33, 34, 35],
       [40, 41, 42, 43, 44, 45],
       [50, 51, 52, 53, 54, 55]])

* 위 코드를 보다 친숙한 방식으로 구현한다면 다음과 같다.

In [24]:
a = np.arange(36).reshape((6,6))

for i in range(len(a)):
        for j in range(6):
            a[i, j] = a[i, j] + 4*i
            
a            

array([[ 0,  1,  2,  3,  4,  5],
       [10, 11, 12, 13, 14, 15],
       [20, 21, 22, 23, 24, 25],
       [30, 31, 32, 33, 34, 35],
       [40, 41, 42, 43, 44, 45],
       [50, 51, 52, 53, 54, 55]])

* 보다 간단하지만 고급 기술을 이용하는 방식은 다음과 같다. 
    어레이 연산은 다음 시간에 보다 자세히 다룰 예정이다.

In [30]:
c = np.arange(0, 51, 10)[:, np.newaxis]
c

array([[ 0],
       [10],
       [20],
       [30],
       [40],
       [50]])

In [31]:
a = np.arange(6) + np.arange(0, 51, 10)[:, np.newaxis]
a

array([[ 0,  1,  2,  3,  4,  5],
       [10, 11, 12, 13, 14, 15],
       [20, 21, 22, 23, 24, 25],
       [30, 31, 32, 33, 34, 35],
       [40, 41, 42, 43, 44, 45],
       [50, 51, 52, 53, 54, 55]])

이제 위 어레이를 이용하여 슬라이싱을 연습하도록 해보자. 
먼저 아래 그림에 나와 있는대로 슬라이싱을 따라해보면서 슬라이싱이 어떻게 
작동하는지 확인해보자.
코드의 색깔과 어레이 그림에서 표시된 동일한 색을 가진 상자들 사이의 관계를 주시하면 된다.

<table cellspacing="20">

<tr>
<td>
<img src="../images/array-slicing.png">
</td>
</tr>
</table>

**`a[0, 3:5]`** 확인하기

먼저 `a[0]`를 확인한다.

In [32]:
a[0]

array([0, 1, 2, 3, 4, 5])

따라서 `a[0, 3:5]` 결과는 아래와 같다.

In [34]:
a[0, 3:5]

array([3, 4])

**`a[4:, 4:]`** 확인하기
1차원 값과 2차원 값을 함께 생각해야 한다. 

* 첫번 째 `'4:'`는 4번 인덱스 행부터 마지막 행까지 전체를 의미한다.
* 두번 째 `'4:'`는 앞서 선택한 4번 인덱스 행부터 마지막 행 각각에서 4번 인덱스 열부터 전체를 나타낸다. 

In [37]:
a[4:, 4:]

array([[44, 45],
       [54, 55]])

위와 비슷한 방식으로 해석하면 아래 코드도 이해할 수 있다.

* `':'` 은 모든 행을 대상으로 삼는 것이고
* `'2'` 는 각 행에서 2번 인덱스 값을 선택한다는 의미이다.

따라서 아래 값이 나온다.

In [38]:
a[:, 2]

array([ 2, 12, 22, 32, 42, 52])

이제 아래 코드를 이해할 수 있어야 한다.

In [39]:
a[2::2, ::2]

array([[20, 22, 24],
       [40, 42, 44]])