# Numpy 알아보기 
#### (basic level, numpy.__version__=1.17)

-  Ref
    - 머신러닝 부트캠프 with 파이썬
    - [Numpy v1.17 manual](https://docs.scipy.org/doc/numpy/index.html)

In [1]:
import numpy as np

- ### numpy에서는 numpy.ndarray 객체를 기본 데이터 구조로 사용

### 1. ndarray 객체 초기화 방법

In [2]:
# 0으로 초기화
# dtype=None이면 numpy.float64 or numpy.int32가 기본값

np.zeros(shape=(1,1), dtype=None)

array([[0.]])

In [3]:
# 1으로 초기화

np.ones(shape=(1,1), dtype=None)

array([[1.]])

### 2. 배열 요소를 지정해 생성

In [4]:
# 보통 object만 사용

# np.array(object, dtype=None, copy=True, order=None, subot=False, ndim=0)

# Example
A = np.array([1, 2, 3]) # (3,) 배열
B = np.array([[1, 2, 3], [4, 5, 6]]) # (2, 3) 배열
print(A, A.shape)
print(B, B.shape)

[1 2 3] (3,)
[[1 2 3]
 [4 5 6]] (2, 3)


### 3. range 배열 생성

In [5]:
# np.arange([start], stop, [step], dtype=None)

np.arange(0, 9, 3, dtype=numpy.int32)

array([0, 3, 6])

### 4. 전치 행렬 구하기

In [6]:
# 2차원 Transpose matirx 구하기

# B.T

print("original B : ")
print(B)
print("shape of B : ", B.shape)
print()
print("transpose B : ")
print(B.T)
print("shape of transpose B : ", B.T.shape)

original B : 
[[1 2 3]
 [4 5 6]]
shape of B :  (2, 3)

transpose B : 
[[1 4]
 [2 5]
 [3 6]]
shape of transpose B :  (3, 2)


In [7]:
# 3차원 Transpose mastrix 구하기
# transpose시 shape는 원래의 역순이 된다.

C = np.array([[[1, 2], [3, 4], [5, 6]]])

print("original C : ")
print(C)
print("shape of C : ", C.shape)
print()
print("transpose C : ")
print(C.T)
print("shape of transpose C : ", C.T.shape)

original C : 
[[[1 2]
  [3 4]
  [5 6]]]
shape of C :  (1, 3, 2)

transpose C : 
[[[1]
  [3]
  [5]]

 [[2]
  [4]
  [6]]]
shape of transpose C :  (2, 3, 1)


### 5. 형태 변경

In [8]:
# np.ndarray.reshape()
# 바꿀 배열 요소의 갯수가 일치해야한다.

print("B : \n", B, "\n")
print("(1, 6)으로 reshape : ")
print(B.reshape(1, 6))
print("오리지널 B의 shape : ", B.shape)
print("reshape 후 B의 shape : ", B.reshape(1,6).shape)

print()
print("(1, 7)로 변환, 갯수가 안맞으면 에러가 난다")
print(B.reshape(1, 7))

B : 
 [[1 2 3]
 [4 5 6]] 

(1, 6)으로 reshape : 
[[1 2 3 4 5 6]]
오리지널 B의 shape :  (2, 3)
reshape 후 B의 shape :  (1, 6)

(1, 7)로 변환, 갯수가 안맞으면 에러가 난다


ValueError: cannot reshape array of size 6 into shape (1,7)

### 6. 배열 연결

In [9]:
# 연결할 차원의 length가 일치하면 연결이 가능함

# numpy.r_[A, B] : 행에 연결
# numpy.c_[A, B] : 열에 연결
# numpy.concatenate( (A, B), axis=0(기본값 0))

E = np.ones((2, 3))
F = B
print(E)
print(F)
print()
print(np.r_[E, F]) # np.concatenate((E, F))
print()
print(np.c_[E, F]) # np.concatenate((E, F), axis=1)

[[1. 1. 1.]
 [1. 1. 1.]]
[[1 2 3]
 [4 5 6]]

[[1. 1. 1.]
 [1. 1. 1.]
 [1. 2. 3.]
 [4. 5. 6.]]

[[1. 1. 1. 1. 2. 3.]
 [1. 1. 1. 4. 5. 6.]]


### 7. 사칙 연산

In [10]:
# ndarray끼리 사칙 연산 적용

print(E+F)
print(E-F)
print(E*F)
print(F/E)

[[2. 3. 4.]
 [5. 6. 7.]]
[[ 0. -1. -2.]
 [-3. -4. -5.]]
[[1. 2. 3.]
 [4. 5. 6.]]
[[1. 2. 3.]
 [4. 5. 6.]]


### 8. 벡터 행렬 곱 연산

- #### 세가지의 행렬 곱
    - ```A * B``` : 행렬 element-wise 곱
    - ```numpy.dot(A, B)``` : dot 연산
    - ```numpy.matmul(A, B)``` : matmul 연산 (=A@B)


- 세 연산의 차이점을 설명한 글 ([링크](http://blog.naver.com/PostView.nhn?blogId=cjh226&logNo=221356199190&categoryNo=17&parentCategoryNo=0&viewDate=&currentPage=1&postListTopCurrentPage=1&from=section&userTopListOpen=true&userTopListCount=5&userTopListManageOpen=false&userTopListCurrentPage=1))


In [11]:
print("## 간단 설명")
# 참고 : https://m.blog.naver.com/PostView.nhn?blogId=cjh226&logNo=221356884894&proxyReferer=https%3A%2F%2Fwww.google.com%2F

X = np.arange(1, 7).reshape(3, 2)
Y = np.arange(7, 13).reshape(2, 3)
print(X,"\n", Y, "\n\n")

print("X * Y : 단순한 element-wise 곱")
print(X * Y.T)

print("\n")
print("dot(내적곱) 연산과 matmul(행렬곱) 연산")
print("- 2차원까지는 둘의 차이 없음")
print("- 아직 내용을 정확히 이해하지 못함")
print(numpy.dot(X, Y))
print(numpy.matmul(X, Y))

print("\n")
array1 = np.arange(1, 7).reshape(2, 3, 1)
array2 = np.arange(7, 13).reshape(2, 1, 3)

print("- matmul 결과")
print("행과 열을 곱하는 일반적인 행렬곱")
print("np.matmul(A,B)[i,j,k] == np.sum(A[i,j,:] * B[i,:,k])")
print(numpy.matmul(array1, array2))
print("\n")
print("- dot 결과")
print("3차원 배열을 연산해서 4차원 배열을 얻었다.")
print("np.dot(A,B)[i,j,k,m] == np.sum(A[i,j,:] * B[k,:,m])")
print("result : ")
print(numpy.dot(array1, array2))

## 간단 설명
[[1 2]
 [3 4]
 [5 6]] 
 [[ 7  8  9]
 [10 11 12]] 


X * Y : 단순한 element-wise 곱
[[ 7 20]
 [24 44]
 [45 72]]


dot(내적곱) 연산과 matmul(행렬곱) 연산
- 2차원까지는 둘의 차이 없음
- 아직 내용을 정확히 이해하지 못함
[[ 27  30  33]
 [ 61  68  75]
 [ 95 106 117]]
[[ 27  30  33]
 [ 61  68  75]
 [ 95 106 117]]


- matmul 결과
행과 열을 곱하는 일반적인 행렬곱
np.matmul(A,B)[i,j,k] == np.sum(A[i,j,:] * B[i,:,k])
[[[ 7  8  9]
  [14 16 18]
  [21 24 27]]

 [[40 44 48]
  [50 55 60]
  [60 66 72]]]


- dot 결과
3차원 배열을 연산해서 4차원 배열을 얻었다.
np.dot(A,B)[i,j,k,m] == np.sum(A[i,j,:] * B[k,:,m])
result : 
[[[[ 7  8  9]
   [10 11 12]]

  [[14 16 18]
   [20 22 24]]

  [[21 24 27]
   [30 33 36]]]


 [[[28 32 36]
   [40 44 48]]

  [[35 40 45]
   [50 55 60]]

  [[42 48 54]
   [60 66 72]]]]
