# #002_NumPy 

- Numpy의 Indexing

In [2]:
import numpy as np

In [12]:
a = np.arange(36).reshape(-1,6)

In [13]:
a

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29],
       [30, 31, 32, 33, 34, 35]])

In [14]:
a[0,3:5]

array([3, 4])

In [15]:
a[4:,4:] # a[[-2:],[-2:]]

array([[28, 29],
       [34, 35]])

In [16]:
a[:,2]

array([ 2,  8, 14, 20, 26, 32])

In [50]:
a[2::2,::2] # ::2는 2개마다

array([[12, 14, 16],
       [24, 26, 28]])

In [38]:
a[[True,False,True,False,True,False]] # Masking기법,[[]]로 가둬야한다.

array([[ 0,  1,  2,  3,  4,  5],
       [12, 13, 14, 15, 16, 17],
       [24, 25, 26, 27, 28, 29]])

In [40]:
a[np.ix_([2,4],[0,2,4])]

array([[12, 14, 16],
       [24, 26, 28]])

---

## Named Tuple 

- 시퀀스 타입이면서 딕셔너리처럼 사용할 수 있다

In [41]:
from collections import namedtuple

In [45]:
t = namedtuple('AttendanceSheet',['name','attendance'])

In [46]:
x = t('moon','yes')

In [47]:
x[0]

'moon'

In [48]:
x.name

'moon'

In [49]:
type(x)

__main__.AttendanceSheet

---

## Broadcasting

- 원래 벡터 연산은 서로 모양이 같아야 하지만
- 벡터연산시 상수일때에 한해 벡터의 쉐잎을 맞춰 연산을 해준다.

In [52]:
a = np.arange(10)
a

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [53]:
a+1 # a+[1,1,1,1,1,1,1,1,1,1]

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

---

## ufunc

- 유니버셜 펑션
- 보편적인 함수들은 다 벡터라이즈 되어있다.
- 꼭 vector가 아니여도 빠르게 계산이 가능하다.

In [54]:
np.sum(range(1000))

499500

In [57]:
np.sqrt([4,9]) # 루트, == math.sqrt()

array([2., 3.])

In [58]:
np.sqrt((4,9))

array([2., 3.])

- vector에서 mutable이 중요하지 않으면 list나 tuple나 똑같이 사용할 수 있다.

---

## Copy 

In [63]:
a = [1,2,3]
b = a
b.append(4)
a

[1, 2, 3, 4]

In [67]:
a = [1,2,3]
b = a.copy() 
b.append(4)
a # copy를 했기 때문에 서로 공유하지 않는다.

[1, 2, 3]

#### 스왈로 카피

- []가 겹겹히 쌓여있을 때는 안의 []까지 copy가 안되는 문제가 있다.

In [69]:
a = [[1,2,3]]
b = a
a[0][1] = 4
b

[[1, 4, 3]]

In [70]:
a = [[1,2,3]]
b = a.copy()
a[0][1] = 4
b

[[1, 4, 3]]

### copy.deepcopy 

In [72]:
import copy

In [75]:
a = [[1,2,3]]
b = copy.deepcopy(a)
a[0][1] = 4
b

[[1, 2, 3]]

#### NumPy의 copy는 기본적으로 deepcopy다

- 다차원을 다루기 때문에 deepcopy가 기본이다.

In [83]:
a = np.array([[1,2,3],[4,5,6]])
b = a
a[0] = 4
b

array([[4, 4, 4],
       [4, 5, 6]])

In [84]:
a = np.array([[1,2,3],[4,5,6]])
b = a.copy()
a[0] = 4
b

array([[1, 2, 3],
       [4, 5, 6]])

In [85]:
a = np.array([[1,2,3],[4,5,6]])
b = a.copy()
a[0][0] = 4
b

array([[1, 2, 3],
       [4, 5, 6]])

---

##  shape

- 배열을 분할하고 붙이고 차원변경할 수 있다.
- 분할 : .split(), .hsplit(), vsplit()
- 붙이기 : (row).r_[], (column).c_[] 
- 차원변경 : 

---

## ravel & flatten 

- 둘 다 1차원으로 변경해준다.
- but, ravel은 view 방식, flatten은 copy방식

In [96]:
a = np.arange(10).reshape(2,5)
a

array([[0, 1, 2, 3, 4],
       [5, 6, 7, 8, 9]])

In [97]:
a.ravel() # view, 뒤에 .copy를 쓰면 copy로 쓸수있다.

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [99]:
a.flatten() # copy

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

### transposing

- 행과열을 바꿔준다.

In [107]:
a

array([[0, 1, 2, 3, 4],
       [5, 6, 7, 8, 9]])

In [108]:
a.T

array([[0, 5],
       [1, 6],
       [2, 7],
       [3, 8],
       [4, 9]])

---

### np.newaxis 

- 차원을 추가한다.
- 수가 들어가면 Index가 되기 때문에, None을 넣는 것이다.

In [110]:
np.newaxis is None

True

In [111]:
a[:,np.newaxis] # == a[:,None]

array([[[0, 1, 2, 3, 4]],

       [[5, 6, 7, 8, 9]]])

In [112]:
a[:,np.newaxis].shape 

(2, 1, 5)

In [113]:
a[:,:,np.newaxis].shape

(2, 5, 1)

In [114]:
a[np.newaxis,:,:].shape

(1, 2, 5)

In [123]:
a = [[1,2,3],[4,5,6]]

In [124]:
b = np.array(a)

In [125]:
b.shape

(2, 3)

In [133]:
b[np.newaxis]

array([[[1, 2, 3],
        [4, 5, 6]]])

In [134]:
b[:,:,np.newaxis]

array([[[1],
        [2],
        [3]],

       [[4],
        [5],
        [6]]])

In [135]:
b[:,np.newaxis,:]

array([[[1, 2, 3]],

       [[4, 5, 6]]])

In [136]:
b[np.newaxis,:,:]

array([[[1, 2, 3],
        [4, 5, 6]]])

### sorting