# numpy 정리

이 문서에서는 numpy의 여러 함수들을 정리하도록 한다. cs231n에 나오는 함수나, 숙제 시 썼던 함수들을 정리하도록한다.

## numpy array 

### numpy array선언
`np.array( arg, dtype = np.int32 )`로 array를 만들 수 있다. array의 dimension은 shape로 알 수 있다.

In [1]:
# -*- coding: utf-8 -*-
import numpy as np

X = np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]])
W = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
print "X : ", X.shape
print 
print X

print "W : ", W.shape
print 
print W



X :  (4, 3)

[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]]
W :  (3, 4)

[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]


### 내적 ( dot )
다음 두가지 방법으로 내적을 할 수 있다.

In [2]:
dotXW = X.dot(W)
print dotXW
dotXW2 = np.dot(X,W)
print dotXW2

[[ 38  44  50  56]
 [ 83  98 113 128]
 [128 152 176 200]
 [173 206 239 272]]
[[ 38  44  50  56]
 [ 83  98 113 128]
 [128 152 176 200]
 [173 206 239 272]]


### 전치 행렬 (transpose)
matrix의 transpose는 .T로 알 수 있다.

In [3]:
Xt = X.T
print X
print X.T

[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]]
[[ 1  4  7 10]
 [ 2  5  8 11]
 [ 3  6  9 12]]


### np.reshape
np.reshape( X, (m,n) ) : X를 [m x n]으로 재배열한다. ( 더 많은 dim 가능. ) 마지막 dimension의 순위가 높다.

In [16]:
X = np.arange(8)
print X
A = np.reshape(X, (4,2))
print A
B = np.reshape(X, (2,4))
print B

[0 1 2 3 4 5 6 7]
[[0 1]
 [2 3]
 [4 5]
 [6 7]]
[[0 1 2 3]
 [4 5 6 7]]


## numpy 함수들

### np.argsort( array )
array를 sorting할 때, index를 list로 만들어준다.

In [6]:
unsorted = np.array([0,100,20,40,5])
print "unsorted : ", unsorted
# sort할 때 index를 만들어준다.
sortIdx = np.argsort( unsorted )
print "sortIdx : ", sortIdx

unsorted :  [  0 100  20  40   5]
sortIdx :  [0 4 2 3 1]


### np.argmin(X, axis = n)
X의 n번째 축을 기준으로 가장 작은 녀석의 index를 리스트로 내보냄.
반대로는 np.argmax(X, axis = n)이 있다.

In [7]:
test = np.array([[3,2,3],[4,1,6],[7,9,6]])
minTest = np.argmin(test,axis = 0)
print test
print minTest
print test[minTest,[0,1,2]]

minTest = np.argmin(test, axis = 1)
print minTest
print test[np.arange(test.shape[0]),minTest]

[[3 2 3]
 [4 1 6]
 [7 9 6]]
[0 1 0]
[3 1 3]
[1 1 2]
[2 1 6]


### np.sqrt( X )
X의 원소를 모두 square root씌운다.

In [26]:
sqrtX = np.sqrt(X)
print X
print sqrtX

[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]]
[[ 1.          1.41421356  1.73205081]
 [ 2.          2.23606798  2.44948974]
 [ 2.64575131  2.82842712  3.        ]
 [ 3.16227766  3.31662479  3.46410162]]


### np.sqrt( X )
X의 모든 원소를 원소별로 제곱한다.

In [40]:
Xr = np.square( sqrtX )
print Xr

[[  1.   2.   3.]
 [  4.   5.   6.]
 [  7.   8.   9.]
 [ 10.  11.  12.]]


### np.bincount( X )
X의 element의 type이 integer일 때, 각 element의 값을 bin의 index로 하여 카운트를 세준다.

In [47]:
X = np.array( [0,0,1,1,1,4,5,9,3,3,2,1,3,9])
print X
print np.bincount( X )

[0 0 1 1 1 4 5 9 3 3 2 1 3 9]
[2 4 1 3 1 1 0 0 0 2]


### np.arange()
range와 비슷한 것...

In [None]:
np.arange( X.shape[0] ) 

#### xrange V.S. range
xrange는 sequence를 그때그때 만들고 range는 list를 return한다. xrange가 더 빠르대...
다음은 어떤 사람이 만들어본 결과...
```
$ python -m timeit 'for i in range(1000000):' ' pass'
10 loops, best of 3: 90.5 msec per loop
$ python -m timeit 'for i in xrange(1000000):' ' pass'
10 loops, best of 3: 51.1 msec per loop
```

## Broadcast
numpy쓸 때 제일 헷갈리는 녀석!
어떤 경우에 broadcast 되는 지 확실히 하자!

### Scalar와 matrix의 덧셈
이 경우 Scalar의 값을 가진 matrix가 돼서 더해진다.

In [24]:
X = np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]])
print "1. scalar와 matrix의 덧셈 "
print "X : "
print X
print "X + 2 : "
print X + 2 # 2가 [[2,2,2],[2,2,2],[2,2,2],[2,2,2]] 가 됨!

1. scalar와 matrix의 덧셈 
X : 
[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]]
X + 2 : 
[[ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]
 [12 13 14]]


### Vector와 matrix의 덧셈


In [29]:
X = np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]])
A = np.array([1,2,3])
B = np.array([1,2,3,4])
print X
print X + A
# print X + B.T Error!!!
print X.T + B.T

[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]]
[[ 2  4  6]
 [ 5  7  9]
 [ 8 10 12]
 [11 13 15]]
[[ 2  6 10 14]
 [ 3  7 11 15]
 [ 4  8 12 16]]
