# 텐서(tensor)란?

* 정의 1: 데이터를 일반적으로 표현한 형태

* 정의 2: 임의의 차원 개수를 가지는 행렬의 일반화된 형태

* 정의 3: 다차원 NumPy 배열

* TensorFlow란 텐서를 처리하는 흐름을 만든다는 뜻임

#**NumPy 모듈 불러오기**

* 모듈이란 미리 작성되어 있는 파이썬 파일/클래스/함수

* import 를 이용해 모듈 불러오기:

  1.   import \<module name\>
  2.   import \<module name\> as \<module nickname\>
  3.   from \<module name\> import \<module element\>
       * \<module element\>란 모듈 안의 클래스 또는 함수
  4.   from \<module name\> import \<module element\> as \<module nickname\>

In [None]:
import numpy as np

#스칼라 (0D 텐서)

* 숫자 하나

In [None]:
x = np.array(10)

x

print(x)

In [None]:
x.ndim

In [None]:
x.size    # 어레이의 전체 엘리먼트 개수

In [None]:
x.shape

In [None]:
type(x)

In [None]:
x.__class__

#벡터 (1D 텐서)

* 숫자의 배열

  * 숫자 간에는 콤마(,)로 구별

* 수학에서 벡터의 표현법은 열벡터와 행벡터의 2가지가 있음

  * 원소가 3개인 벡터의 형태: 3 x 1 vs. 1 x 3

> <img src="https://drive.google.com/uc?id=1Q7YkBQ1z_04DJVyFuvECBWZOWnVPzJ9E" width="250"/>

  * ("*" 연산에서 브로드캐스트 시 행벡터 가정)
  
  * ("matmul" 연산 시 두가지를 구별하지 않음)


In [None]:
x = np.array([1, 2, 3, 4, 5])

x

In [None]:
x.ndim

In [None]:
x.size

In [None]:
x.shape

# 행렬 (2D 텐서)

* 행렬(matrix) 또는 벡터의 집합

> <img src="https://drive.google.com/uc?id=16JNkC8c1D3V_igqIQIvZHjNxrqo878XJ" width="400"/>

* 행렬 형태의 확인

> <img src="https://drive.google.com/uc?id=1LQVjatGAG_hrXv7R78CP2wvdPHtjloSq" width="150"/>



In [None]:
x = np.array([[11, 12, 13, 14, 15],
              [21, 22, 23, 24, 25],
              [31, 32, 33, 34, 35]])
x

In [None]:
x.ndim

In [None]:
x.size

In [None]:
x.shape

In [None]:
x.shape[1]

# 원소 접근하기

* 인덱스 이용

In [None]:
x[0]   # 0행

In [None]:
x[0][1]   # 0행 1열 원소

In [None]:
# for문을 이용해 각 행에 접근하기

for row in x:
  print(row)

In [None]:
# 중첩 for문을 이용해 각 원소에 접근하기

for row in x:
  for element in row:
    print(element)

In [None]:
# 1차원 배열로 변환하기

x_1d = x.flatten()
print(x_1d)
x_1d.shape

In [None]:
# 특정 위치의 원소 얻어오기

x_1d[np.array([0, 2, 4])]

In [None]:
x_1d[0, 2, 4]

In [None]:
# 배열의 관계연산자 연산

x_1d > 15

In [None]:
# 특정 원소 얻어오기 2

x_1d[np.array([False, False, False, False, False,  True,  True,  True,  True,
        True,  True,  True,  True,  True,  True])]

In [None]:
# 조건을 만족하는 원소들만 얻어오기

x_1d[x_1d > 15]

# 3D 텐서

* 행렬의 집합

> <img src="https://drive.google.com/uc?id=1OoK3jcWrYiigycrrNJBlWOBwwmpCoKuh" width="400"/>

* 텐서 형태의 확인

> <img src="https://drive.google.com/uc?id=1j-R_WND9jbVnHRjz4slYQymk30DChSxm" width="150"/>

In [None]:
x = np.array([[[111, 112, 113, 114, 115],
               [121, 122, 123, 124, 125]],
              [[211, 212, 213, 214, 215],
               [221, 222, 223, 224, 225]],
              [[311, 312, 313, 314, 315],
               [321, 322, 323, 324, 325]]])
x

In [None]:
x.ndim

In [None]:
x.size

In [None]:
x.shape

# 2D 텐서의 예

* 흑백이미지 데이터

  * 가로 픽셀수 x 세로 픽셀수 로 구성된 2D 행렬
    * 픽셀: 디지털 이미지에서 점 하나를 의미

    * 각 픽셀의 값은 흑백의 레벨

      * 예: [0, 255] 사이의 값

# 3D 텐서의 예 #1

  * 흑백이미지 데이터 모음

  * MNIST (Modified NIST) 데이터셋

    * 손으로 쓴 숫자 흑백이미지와 그 레이블값(label, 해당숫자) 쌍의 모음

      * 각 이미지는 28 x 28 픽셀, 각 픽셀은 [0, 255] 사이의 값으로 표현

        * 즉, **각 흑백이미지 데이터는 2D 텐서**임

    * 미국 NIST (National Institute of Standards and Technology, 국립표준기술원)가 수집한 데이터를 수정하여 만들어짐

> <img src="https://drive.google.com/uc?id=19_voDxeRtLG0UZ_ld1WUo2AgtYCLSyJ_" width="500"/>     

In [None]:
from keras.datasets import mnist

(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

In [None]:
print(train_images.shape)
print(train_labels.shape)

print(test_images.shape)
print(test_labels.shape)

In [None]:
print(train_images[0].shape)
print(train_labels[0])

In [None]:
# MNIST 이미지 값

train_images[0]

In [None]:
# MNIST 이미지 보기

import matplotlib.pyplot as plt
 
plt.imshow(train_images[0], cmap=plt.cm.binary)
plt.show()

# 3D 텐서의 예 #2

* 컬러 이미지

  * 세로 픽셀 x 가로 픽셀 크기의 이미지에, 픽셀값은 채널별로 존재

    * 컬러채널 예: R, G, B 또는 Y, U, V 또는 C, M, Y, K

# 4D 텐서의 예

* 컬러 이미지들의 모음

  * (샘플 수) x (세로 픽셀수) x (가로 픽셀수) x (채널수)

    * 3개 채널로 표현된 256x256 컬러이미지가 128개 있는 경우: 128 x 256 x 256 x 3

* 비디오 데이터

  * 비디오는 컬러 이미지들의 순차적인 모음임

# 행렬의 원소별(element-wise) 연산

* 기본적인 산술연산자를 이용한 행렬간 연산은 원소별 연산이다.

  * 행렬간 형태(형상)가 동일해야 한다. 

In [None]:
W = np.array([[1, 2, 3],
              [4, 5, 6]])
X = np.array([[0, 1, 2],
              [3, 4, 5]])

In [None]:
W + X

In [None]:
W * X

In [None]:
X / W

In [None]:
# 형태가 다른 텐서 간의 연산

z = np.array([1, 2])

W * z

In [None]:
z * W

# 브로드캐스트 연산

* 형태가 다른 행렬간의 연산

In [None]:
# 행렬 x 스칼라

A = np.array([[1, 2],
              [3, 4]])
A * 10

> <img src="https://drive.google.com/uc?id=15I4opMD10ShMOeE_HZJqnXRMDM8VIr-q" width="600"/>

In [None]:
b = np.array([10, 20])

A * b

> <img src="https://drive.google.com/uc?id=1-LHnzRg1M7mkK_Fo4SVH4b6NtLxt-551" width="600"/>

* "2차원 행렬 * 벡터" 계산인 경우, 브로드캐스트 연산이 되려면 위치별 원소 개수가 동일해야 함

In [None]:
A = np.array([[11, 12, 13],
              [21, 22, 23]])

#A * b
print(A.T)

A.T * b

# 행렬의 곱셈

* 앞 행렬(A)의 u번째 행과 뒤 행렬(B)의 v번째 열 사이에 원소별 곱셈 후 더해 결과 행렬의 (u, v) 원소를 얻는다.

> <img src="https://drive.google.com/uc?id=1T5aAYPsak05jhifHCmTuCgZrIpn4AcFD" width="500"/>


* **"앞 행렬의 열 개수 == 뒤 행렬의 행 개수"** 이어야 함 

  * 행렬 A의 형태 = a x b

  * 행렬 B의 형태 = c x d

  * **b == c** 이어야 함

  * 결과 행렬의 형태는 **a x d** 가 됨



> <img src="https://drive.google.com/uc?id=1S96ihCC5D6jMZnOQfc8hmKS0Dagn1ajF" width="500"/>


* 위 방식의 행렬간 곱셈을 위해서 **numpy의 matmul()** 함수를 사용한다. 

In [None]:
A = np.array([[1, 2],
              [3, 4]])
B = np.array([[5, 6],
              [7, 8]])

# 원소별 연산
print(A * B)

print(B * A)

In [None]:
# 행렬 연산 1
print(np.matmul(A, B))

# 행렬 연산 2
print(np.matmul(B, A))

In [None]:
# 행렬 연산 2
print(np.dot(A, B))

# 행렬 연산 2
print(np.dot(B, A))

In [None]:
b = np.array([10, 20])

# 브로드캐스트 연산
print(A * b)

# 행렬 연산 1
# (2 x 2) x (2 x 1) => (2 x 1), 즉 벡터를 열벡터로 해석한 경우
print(np.matmul(A, b).shape)

In [None]:
# 행렬 연산 2
# (1 x 2) x (2 x 2) => (1 x 2), 즉 벡터를 행벡터로 해석한 경우

print(np.matmul(b, A).shape)

# 배열의 형태 변경하기 (reshape())

* 행렬간 연산을 위해서는 형태가 매칭되어야 하므로, reshape()를 이용해 행렬의 형태를 변경하는 작업이 빈번하게 필요함

> <img src="https://drive.google.com/uc?id=1S0EwRzUiXa-N_Ka6zNlp097T0hvXHrUr" width="500"/>

* 데이터의 이동 규칙을 숙지해야 함

> <img src="https://drive.google.com/uc?id=1N1Ipwk2kbFQF1hIT6CLDg0R-JBoYTSQk" width="500"/>


In [None]:
a = np.arange(1,13)
a

In [None]:
# 2차원 변환

a.reshape(3,4)

In [None]:
# 3차원 변환

a.reshape(2,3,2)

In [None]:
# 특정 축의 크기를 지정하지 않아도 됨(-1로 설정)
# 입력데이터 크기가 매번 다를 수 있는 경우에 유용함

a.reshape(-1,3,2)

# matmul() vs. dot()

* 2차원 이하 배열의 연산에서는 동일

* 그 외에는 다르므로, 매우 주의해서 사용

> <img src="https://drive.google.com/uc?id=1c2uklCK1Q91erKQ9ICelybut2we8oQC3" width="200"/>

  * https://docs.scipy.org/doc/numpy/reference/generated/numpy.dot.html
  * https://docs.scipy.org/doc/numpy/reference/generated/numpy.matmul.html



# NumPy 배열(array) 플롯팅하기

* matplotlib 사용

  * NumPy 배열을 지원함

* 수학함수는 NumPy 배열을 지원하도록 NumPy의 수학함수를 사용

In [None]:
import matplotlib.pyplot as plt

x = np.arange(0, 6, 0.1)
y = np.sin(x)

print(x.shape)
print(y.shape)

In [None]:
# 그래프 그리기

plt.plot(x, y)
plt.show()

In [None]:
# 한 그림에 두 개 그래프를 그리기

y1 = np.sin(x)
y2 = np.cos(x)

plt.plot(x, y1, label="sin")
plt.plot(x, y2, label="cos", linestyle="--")
plt.xlabel("x")
plt.ylabel("y")
plt.title("sin & cos")
plt.legend()
plt.show()