<img src='img/1_numpy.png' width=50 style='float:left'>

# NumPy

**numpy 모듈 선언**

In [1]:
import numpy as np

# 3. Array 인덱싱(indexing)과 슬라이싱(Slicing)

- 인덱싱(indexing) : 배열의 위치나 조건을 지정해 배열의 원소를 선택하는 것
- 슬라이싱(slicing) : 범위를 지정해 배열의 원소를 선택하는 것

## (1) Array 인덱싱

### 1차원 배열의 인덱싱

**배열명[위치]**


- 파이썬의 인덱싱과 동일
- 0번째로 시작함

In [3]:
arr1=np.arange(1,11)
arr1

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [4]:
# 0번째 요소
arr1[0]

1

In [6]:
# 3번째 요소
arr1[3]

4

In [7]:
# 마지막 요소
arr1[-1]

10

**배열명[[위치1, 위치2, ... ,위치n]]** 

In [9]:
# 1,3,4번 위치 요소
arr1[[1,3,4]]

array([2, 4, 5])

### 2차원 배열의 인덱싱
**배열명[행위치, 열위치]**

In [10]:
arr2=np.array([[1,2,3],[4,5,6]])
arr2

array([[1, 2, 3],
       [4, 5, 6]])

In [11]:
# 2차원 행렬에서 인덱싱을 위해 2개의 인자를 [행, 열] 로 구분해서 참조
arr2[1,1]

5

In [12]:
# 2차원 행렬에서 인덱싱을 위해 2개의 인자를 [행][열] 두 개 사용해서 참조
arr2[1][2]

6

**2차원배열명[행위치]**

: 2차원 배열에서 지정한 행 전체가 선택됨

In [14]:
arr2[1]

array([4, 5, 6])

**2차원 배열의 특정 행을 지정해서 행 전체를 변경**

In [15]:
arr2[1]=[10,11,12]
arr2

array([[ 1,  2,  3],
       [10, 11, 12]])

**배열명[[행위치1, 행위치2, ..., 행위치n],[열위치1, 열위치2,...,열위치n]]**

: 지정한 (행위치1, 열위치1), (행위치2, 열위치2), ... ,(행위치n, 열위치n)의 원소를 가진 행렬을 반환 

In [21]:
arr2[[0,1],[1,1]]

array([ 2, 11])

### 배열명[조건]

: 배열에서 조건을 만족하는 원소만 선택

In [25]:
arr2[arr2>3]

array([10, 11, 12])

In [26]:
# 10보다 큰 요소
arr2[arr2>10]

array([11, 12])

## (2) Array Slicing

### 1차원 배열의 슬라이싱(Slicing)

**배열[시작위치:끝위치]**

: 시작위치에서 끝위치-1 에 해당하는 배열의 원소를 반환

In [33]:
arr1

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [34]:
arr1[2:11]

array([ 3,  4,  5,  6,  7,  8,  9, 10])

In [30]:
# 3번에서 8번까지의 요소
arr1[3:9]

array([4, 5, 6, 7, 8, 9])

**배열[:끝위치]**

: 처음부터 '끝위치-1' 원소 반환

In [40]:
arr1[:8]

array([1, 2, 3, 4, 5, 6, 7, 8])

**배열[시작위치:]**

: 시작위치부터 마지막 원소까지 반환

In [39]:
arr1[4:]

array([ 5,  6,  7,  8,  9, 10])

**배열[:]**

: 모든 원소 반환

In [38]:
arr1[:]

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

**배열[::step]**

In [41]:
arr1[::2]

array([1, 3, 5, 7, 9])

In [42]:
arr1[1:9:2]

array([2, 4, 6, 8])

### 2차원 배열의 슬라이싱

**배열[행시작위치:행끝위치, 열시작위치:열끝위치]**

In [50]:
arr=np.array([[1,2,3,4],[4,5,6,7],[7,8,9,10],[10,11,12,13]])
arr

array([[ 1,  2,  3,  4],
       [ 4,  5,  6,  7],
       [ 7,  8,  9, 10],
       [10, 11, 12, 13]])

In [65]:
# 2행의 모든 요소
arr[2,:]

array([ 7,  8,  9, 10])

In [64]:
# 3열의 모든 요소
arr[:,3]

array([ 4,  6, 10, 13])

**배열[행위치][열시작위치:열끝위치]**

: 특정 행을 선택한 후 열을 슬라이싱

In [55]:
arr[1][1:3]

array([5, 6])

**슬라이싱 된 배열에 값을 지정**

In [56]:
arr[1:2,:]=[9,8,7,6]

In [57]:
arr

array([[ 1,  2,  3,  4],
       [ 9,  8,  7,  6],
       [ 7,  8,  9, 10],
       [10, 11, 12, 13]])

## (3) Array boolean 인덱싱(Mask)

- 다차원의 인덱싱을 응용하여 boolean 인덱싱
- boolean인덱싱을 통해 만들어낸 array를 통해 원하는 행 또는 열의 값만 뽑아냄
- 가리고 싶은 부분은 가리고, 원하는 요소만 꺼냄

In [58]:
names = np.array(['Beomwoo','Beomwoo','Kim','Joan','Lee','Beomwoo',
                  'Park','Beomwoo'])
names

array(['Beomwoo', 'Beomwoo', 'Kim', 'Joan', 'Lee', 'Beomwoo', 'Park',
       'Beomwoo'], dtype='<U7')

In [67]:
names.shape

(8,)

In [69]:
data=np.random.randn(8,4)
data

array([[ 0.95609586,  0.62071058,  0.92037899,  0.66290172],
       [-0.13040813,  0.05923921, -0.48987068,  0.09564604],
       [-0.92802571,  0.60358067, -1.18763996, -0.46433387],
       [-0.01316172,  0.37202856, -0.33268633,  0.26100401],
       [-1.86334652, -0.81303856,  0.51191579, -1.49489731],
       [ 0.7508336 ,  2.51445531,  1.01894703,  0.38039222],
       [-0.70008713, -0.04687237,  0.42682936,  0.5502721 ],
       [ 0.88215992, -0.1453711 ,  2.22216276,  0.68417018]])

In [70]:
names.shape,data.shape

((8,), (8, 4))

In [71]:
names=='Beomwoo'

array([ True,  True, False, False, False,  True, False,  True])

In [72]:
# 요소가 Beomwoo인 항목에 대한 mask 생성
maskB=names=='Beomwoo'

In [73]:
# Beomwoo 데이터만 가져오기
data[maskB]

array([[ 0.95609586,  0.62071058,  0.92037899,  0.66290172],
       [-0.13040813,  0.05923921, -0.48987068,  0.09564604],
       [ 0.7508336 ,  2.51445531,  1.01894703,  0.38039222],
       [ 0.88215992, -0.1453711 ,  2.22216276,  0.68417018]])

In [74]:
# Kim의 data 가져오기
maskK=names=='Kim'
data[maskK]

array([[-0.92802571,  0.60358067, -1.18763996, -0.46433387]])

In [78]:
# Kim 또는 Park의 데이터 가져오기
maskKP=(names == 'Kim') | (names=='Park') 

In [79]:
data[maskKP]

array([[-0.92802571,  0.60358067, -1.18763996, -0.46433387],
       [-0.70008713, -0.04687237,  0.42682936,  0.5502721 ]])

## (4) Fancy 인덱싱

- 배열에 리스트나 ndarray로 인덱스 집합을 지정하여 요소 참조

In [82]:
arr=np.arange(1,25).reshape(4,6)
arr

array([[ 1,  2,  3,  4,  5,  6],
       [ 7,  8,  9, 10, 11, 12],
       [13, 14, 15, 16, 17, 18],
       [19, 20, 21, 22, 23, 24]])

In [83]:
arr[0,0],arr[1,1],arr[2,2]

(1, 8, 15)

In [84]:
[arr[0,0],arr[1,1],arr[2,2]]

[1, 8, 15]

In [85]:
arr[[0,1,2,3],[0,1,2,3]]

array([ 1,  8, 15, 22])

-------