![image.png](attachment:77e6bc55-6942-4ccd-a782-f6bbc7db23bc.png)

**numpy 모듈 선언**

In [1]:
import numpy as np

# 3. Array 인덱싱(indexing)과 슬라이싱(Slicing)

- 인덱싱(indexing) : 배열의 위치나 조건을 지정해 배열의 원소를 선택하는 것
- 슬라이싱(slicing) : 범위를 지정해 배열의 원소를 선택하는 것

## (1) Array 인덱싱

### 1차원 배열의 인덱싱

**배열명[위치]**


- 파이썬의 인덱싱과 동일
- 0번째로 시작함

In [2]:
arr1 = np.arange(1,11)
arr1

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [3]:
# 0번째 요소
arr1[0]

1

In [4]:
# 3번째 요소
arr1[3]

4

In [5]:
# 마지막 요소
arr1[-1]

10

**배열명[[위치1, 위치2, ... ,위치n]]** 

In [8]:
# 1,3,4번 위치 요소
arr1[[1,3,4]]
# arr1[1,3,4] #3차원 배열의 인덱스

array([2, 4, 5])

### 2차원 배열의 인덱싱
**배열명[행위치, 열위치]**

In [10]:
arr2 = np.arange(1,13).reshape(3,4)
arr2

array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

In [13]:
# 2차원 행렬에서 인덱싱을 위해 2개의 인자를 [행, 열] 로 구분해서 참조
arr2[0,0]

1

In [15]:
arr2[-1,-1] #마지막 행의 마지막 인덱스

12

In [17]:
# 2차원 행렬에서 인덱싱을 위해 2개의 인자를 [행][열] 두 개 사용해서 참조
arr2[0][0] #같은 결과

1

**2차원배열명[행위치]**

: 2차원 배열에서 지정한 행 전체가 선택됨

In [None]:
arr2[1]

**2차원 배열의 특정 행을 지정해서 행 전체를 변경**

In [18]:
arr2[1] = np.array([50,60,70,80])
arr2

array([[ 1,  2,  3,  4],
       [50, 60, 70, 80],
       [ 9, 10, 11, 12]])

**배열명[[행위치1, 행위치2, ..., 행위치n],[열위치1, 열위치2,...,열위치n]]**

: 지정한 (행위치1, 열위치1), (행위치2, 열위치2), ... ,(행위치n, 열위치n)의 원소를 가진 행렬을 반환 

In [21]:
arr2[[1,2],[0,2]]

array([50, 11])

### 배열명[조건]

: 배열에서 조건을 만족하는 원소만 선택

In [22]:
arr2

array([[ 1,  2,  3,  4],
       [50, 60, 70, 80],
       [ 9, 10, 11, 12]])

In [23]:
# 10보다 큰 요소
arr2>10

array([[False, False, False, False],
       [ True,  True,  True,  True],
       [False, False,  True,  True]])

In [25]:
#매스킹 인덱스 - true인 요소만 가져옴
arr2[arr2>10]

array([50, 60, 70, 80, 11, 12])

## (2) Array Slicing

### 1차원 배열의 슬라이싱(Slicing)

**배열[시작위치:끝위치]**

: 시작위치에서 끝위치-1 에 해당하는 배열의 원소를 반환

In [26]:
arr1 = np.arange(1,11)
arr1

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [28]:
# 3번에서 8번까지의 요소
arr1[3:9]

array([4, 5, 6, 7, 8, 9])

**배열[:끝위치]**

: 처음부터 '끝위치-1' 원소 반환

In [29]:
arr1[:3]

array([1, 2, 3])

**배열[시작위치:]**

: 시작위치부터 마지막 원소까지 반환

In [30]:
arr1[2:]

array([ 3,  4,  5,  6,  7,  8,  9, 10])

**배열[:]**

: 모든 원소 반환

In [31]:
arr1[:]

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

**배열[::step]**

In [32]:
arr1[::2]

array([1, 3, 5, 7, 9])

In [33]:
arr1[::-1] #요소 거꾸로 가져오기

array([10,  9,  8,  7,  6,  5,  4,  3,  2,  1])

### 2차원 배열의 슬라이싱

**배열[행시작위치:행끝위치, 열시작위치:열끝위치]**

In [34]:
arr2 = np.arange(10,22).reshape(3,4)
arr2

array([[10, 11, 12, 13],
       [14, 15, 16, 17],
       [18, 19, 20, 21]])

In [35]:
# 2행의 모든 요소
arr2[2]

array([18, 19, 20, 21])

In [36]:
# 2행의 모든 요소
arr2[2, :]
#arr2[2][:] 같은 결과

array([18, 19, 20, 21])

In [41]:
# 3열의 모든 요소
arr2[:, 3]
#arr2[:][3] #인덱스 에러 오류 발생

array([13, 17, 21])

**배열[행위치][열시작위치:열끝위치]**

: 특정 행을 선택한 후 열을 슬라이싱

In [43]:
arr2[1][0:2]

array([14, 15])

**슬라이싱 된 배열에 값을 지정**

In [44]:
arr2

array([[10, 11, 12, 13],
       [14, 15, 16, 17],
       [18, 19, 20, 21]])

In [45]:
arr2[1][0:2] = np.array([-10,-20])
arr2

array([[ 10,  11,  12,  13],
       [-10, -20,  16,  17],
       [ 18,  19,  20,  21]])

## (3) Array boolean 인덱싱(Mask)

- 다차원의 인덱싱을 응용하여 boolean 인덱싱
- boolean인덱싱을 통해 만들어낸 array를 통해 원하는 행 또는 열의 값만 뽑아냄
- 가리고 싶은 부분은 가리고, 원하는 요소만 꺼냄

In [46]:
names = np.array(['Beomwoo','Beomwoo','Kim','Joan','Lee','Beomwoo',
                  'Park','Beomwoo'])
names

array(['Beomwoo', 'Beomwoo', 'Kim', 'Joan', 'Lee', 'Beomwoo', 'Park',
       'Beomwoo'], dtype='<U7')

In [48]:
names.shape #1차원 데이터

(8,)

In [49]:
# np.random.randn(8,4) : 표준정규분포를 하는 난수발생 N(0, 1) (평균은 0, 표준편차 1)
data = np.random.rand(8,4)
data

array([[0.760392  , 0.98267234, 0.82558921, 0.6108315 ],
       [0.36750982, 0.29559216, 0.03116853, 0.26409136],
       [0.91891141, 0.48773267, 0.38502547, 0.45707558],
       [0.91501793, 0.02667108, 0.83719078, 0.51008746],
       [0.91316885, 0.10537911, 0.24918384, 0.39006095],
       [0.78955355, 0.00428744, 0.15508548, 0.7030619 ],
       [0.79410711, 0.61756375, 0.30380735, 0.02034853],
       [0.96178822, 0.23346813, 0.13486077, 0.94470041]])

In [50]:
names.shape, data.shape #1차원, 2차원

((8,), (8, 4))

In [51]:
names == 'Beomwoo'

array([ True,  True, False, False, False,  True, False,  True])

In [53]:
# 요소가 Beomwoo인 항목에 대한 mask 생성
names_BW_mask = (names == 'Beomwoo')
names_BW_mask

array([ True,  True, False, False, False,  True, False,  True])

In [60]:
# Beomwoo 데이터만 가져오기
data[names_BW_mask]

array([[0.760392  , 0.98267234, 0.82558921, 0.6108315 ],
       [0.36750982, 0.29559216, 0.03116853, 0.26409136],
       [0.78955355, 0.00428744, 0.15508548, 0.7030619 ],
       [0.96178822, 0.23346813, 0.13486077, 0.94470041]])

In [56]:
# Kim의 data 가져오기
data[names == 'Kim']

array([[0.91891141, 0.48773267, 0.38502547, 0.45707558]])

In [57]:
# Kim의 data 가져오기
data[names == 'Kim', :]

array([[0.91891141, 0.48773267, 0.38502547, 0.45707558]])

In [62]:
# Kim 또는 Park의 데이터 가져오기
(names == 'Kim') | (names == 'Park')

array([False, False,  True, False, False, False,  True, False])

In [63]:
data[(names == 'Kim') | (names == 'Park')]

array([[0.91891141, 0.48773267, 0.38502547, 0.45707558],
       [0.79410711, 0.61756375, 0.30380735, 0.02034853]])

In [66]:
#'|' : or 연산 (or, and를 바로 사용불가)
data[(names == 'Kim') | (names == 'Park'), :]

array([[0.91891141, 0.48773267, 0.38502547, 0.45707558],
       [0.79410711, 0.61756375, 0.30380735, 0.02034853]])

## (4) Fancy 인덱싱

- 배열에 리스트나 ndarray로 인덱스 집합을 지정하여 요소 참조

In [67]:
arr = np.arange(1,25).reshape(4,6)
arr

array([[ 1,  2,  3,  4,  5,  6],
       [ 7,  8,  9, 10, 11, 12],
       [13, 14, 15, 16, 17, 18],
       [19, 20, 21, 22, 23, 24]])

In [70]:
[arr[0,0], arr[1,1], arr[2,2], arr[3,3]]

[1, 8, 15, 22]

In [69]:
arr[[0,1,2,3],[0,1,2,3]]

array([ 1,  8, 15, 22])

In [71]:
arr[:, [1,2]]

array([[ 2,  3],
       [ 8,  9],
       [14, 15],
       [20, 21]])

In [72]:
arr[1:3, 0:2]

array([[ 7,  8],
       [13, 14]])

-------