## 신경망을 위한 데이터 표현

**텐서(tensor)**
- 다차원 넘파이 배열
- 최근의 모든 머신 러닝 시스템은 일반적으로 텐서를 기본 데이터 구조로 사용

**스칼라(0D 텐서, 0차원 텐서)**
- 하나의 숫자만 담고 있는 텐서
- 넘파이에서는 float32나 float64 타입의 숫자가 스칼라 텐서에 해당
- ndim 속성을 사용하면 넘파이 배열의 축 개수를 확인할 수 있음
- 스칼라 텐서의 축 개수 : 0 (ndim = = 0)
- 12  
- array(12)  

**벡터(1D 텐서)**
- 숫자의 배열
- 벡터 텐서의 축 개수 : 1 (ndim = = 1)
- [1, 2, 3, 4, 5]
- array([1, 2, 3, 4, 5])


**행렬(2D 텐서)**
- 벡터의 배열이 행렬(matrix) 또는 2D 텐서임
- 행렬텐서의 축 개수 : 2 (ndim = = 2)
- 보통 행(row)과 열(column)이라고 부름
- 첫 번째 축에 놓여 있는 원소를 행이라 부르고
- 두 번째 축에 놓여 있는 원소를 열이라 부름
- array([[ 5, 78,  2, 34,  0],  
       [ 6, 79,  3, 35,  1],  
       [ 7, 80,  4, 36,  2]])  


**3D 텐서와 고차원 텐서**
- 2D 행렬들을 하나의 새로운 배열로 합치면 
- 숫자가 채워진 직육면체 형태로 해석할 수 있는 3D 텐서가 만들어짐

- 2차원 행렬 3개 를 하나로 합침 (아래)
- array([[[ 5, 78,  2, 34,  0],  
        [ 6, 79,  3, 35,  1],  
        [ 7, 80,  4, 36,  2]],  

       [[ 5, 78,  2, 34,  0],  
        [ 6, 79,  3, 35,  1],  
        [ 7, 80,  4, 36,  2]],  

       [[ 5, 78,  2, 34,  0],  
        [ 6, 79,  3, 35,  1],  
        [ 7, 80,  4, 36,  2]]])  
- 3D 텐서들을 하나의 배열로 합치면 4D 텐서를 만드는 식으로 이어짐

- 딥러닝에서는 보통 0D에서 4D까지의 텐서를 다룸
- 동영상 데이터를 다룰 경우에는 5D 텐서까지 가기도 함




**5D 벡터 vs 5D 텐서**
- 5D 벡터 
  - array([1, 2, 3, 4, 5])  
  - 5개의 원소를 가지고 있으므로 5차원 벡터라고 부름
    - 5D 벡터는 하나의 축을 따라 5개의 차원을 가진 것임       
- 5D 텐서는 5개의 축을 가진 것임  
    - 텐서의 각 축을 따라 여러 개의 차원을 가진 벡터가 놓일 수 있음


In [1]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity="all"

In [2]:
import numpy as np

In [4]:
# 스칼라(0D 텐서, 0차원 텐서)
s = np.array(12)
s
print(s) # 값만 프린트

array(12)

12


In [5]:
# 스칼라 텐서의 축 개수 확인 : 0개 (ndim==0)
s.ndim

0

In [8]:
# 벡터(1D 텐서)
v = np.array([1, 2, 3, 4, 5])
v
print(v)
v.ndim  # 축 1개

array([1, 2, 3, 4, 5])

[1 2 3 4 5]


1

In [12]:
# 행렬(2D 텐서)
m = np.array([[5, 78, 2, 34, 0],
            [6, 79, 3, 35, 1],
            [7, 80, 4, 36, 2]])

m
print(m)
m.ndim # 축 2개
# 첫번 째 축 : 행 [5, 78, 2, 34, 0]
# 두번 째 축 : 열 [5, 6, 7]

array([[ 5, 78,  2, 34,  0],
       [ 6, 79,  3, 35,  1],
       [ 7, 80,  4, 36,  2]])

[[ 5 78  2 34  0]
 [ 6 79  3 35  1]
 [ 7 80  4 36  2]]


2

In [15]:
# 3D 텐서와 고차원 텐서
x3 = np.array([[[5, 78, 2, 34, 0],
            [6, 79, 3, 35, 1],
            [7, 80, 4, 36, 2]],
            [[5, 78, 2, 34, 0],
            [6, 79, 3, 35, 1],
            [7, 80, 4, 36, 2]],
            [[5, 78, 2, 34, 0],
            [6, 79, 3, 35, 1],
            [7, 80, 4, 36, 2]]])
x3
print(x3)
x3.ndim # 축 3개
# 첫 번째 축 : X축(행) [5, 78, 2, 34, 0]
# 두 번째 축 : Y축(열) [5, 6, 7]
# 세 번째 축 : Z축 [5, 5, 5]

array([[[ 5, 78,  2, 34,  0],
        [ 6, 79,  3, 35,  1],
        [ 7, 80,  4, 36,  2]],

       [[ 6, 78,  2, 34,  0],
        [ 6, 79,  3, 35,  1],
        [ 7, 80,  4, 36,  2]],

       [[ 5, 78,  2, 34,  0],
        [ 6, 79,  3, 35,  1],
        [ 7, 80,  4, 36,  2]]])

[[[ 5 78  2 34  0]
  [ 6 79  3 35  1]
  [ 7 80  4 36  2]]

 [[ 6 78  2 34  0]
  [ 6 79  3 35  1]
  [ 7 80  4 36  2]]

 [[ 5 78  2 34  0]
  [ 6 79  3 35  1]
  [ 7 80  4 36  2]]]


3

### 텐서(data)의 3가지 핵심 속성  
(1) 축의 개수  
- 예를 들어 3D 텐서에는 3개의 축이 있고, 
- 행렬에는 2개의 축이 있음
- 넘파이 라이브러리에서는 ndim 속성에 저장되어 있음  
         
(2) 크기(shape)
- 텐서의 각 축을 따라 얼마나 많은 차원이 있는지를 나타낸 파이썬의 튜플(tuple) 형태  
- 예를 들어 앞에 나온 행렬의 크기는 (3, 5)이고 3D 텐서의 크기는 (3, 3, 5)임
- 벡터의 크기는 (5,)처럼 1개의 원소로 이루어진 튜플임
- 배열 스칼라는 ()처럼 크기가 없음
         
(3) 데이터 타입(넘파이에서는 dtype에 저장됨)
- 텐서에 포함된 데이터의 타입  
- 예를 들어 텐서의 데이터 타입은 float32, uint8, float64 등이 될 수 있음
- 드물게 char 타입을 사용
- 텐서는 사전에 할당되어 연속된 메모리에 저장되어야 하므로
  - 넘파이 배열에서는 (그리고 대부분 다른 라이브러리에서도) 가변 길이의 문자열은 지원하지 않음  


### 텐서의 예 
- 우리가 사용할 데이터는 대부분 다음 중 하나에 속할 것임
- 2D 텐서 : 벡터 데이터: (samples, features) 크기의 2D 텐서
- 3D 텐서 : 시계열 데이터 또는 시퀀스(sequence) 데이터
    - (samples, timesteps, features) 크기의 3D 텐서
- 4D 텐서 : 이미지: (samples, height, width, channels)  
            - 또는 (samples, channels, height, width) 크기의 4D 텐서  
- 5D 텐서 : 동영상: (samples, frames, height, width, channels)  
            - 또는 (samples, frames, channels, height, width) 크기의 5D 텐서  

#### 벡터 데이터 : 대부분의 경우에 해당됨
- 데이터셋에서는 하나의 데이터 포인트가 벡터로 인코딩될 수 있으므로 
- 배치 데이터는 2D 텐서로 인코딩될 것임(즉 벡터의 배열임)
- 첫 번째 축은 샘플 축이고
- 두 번째 축은 특성 축(feature axis)임  

- 예1: 사람의 나이, 우편 번호, 소득으로 구성된 인구 통계 데이터  
    - 각 사람은 3개의 값을 가진 벡터로 구성됨   
    - 10만 명이 포함된 전체 데이터셋은 (100000, 3) 크기의 텐서에 저장될 수 있음   


#### 시계열 데이터 또는 시퀀스 데이터
- 데이터에서 시간이 (또는 연속된 순서가) 중요할 때는 
- 시간 축을 포함하여 3D 텐서로 저장됨  
- (samples, timesteps, features) 
- 각 샘플은 벡터(2D 텐서)의 시퀀스로 인코딩되므로 
- 배치 데이터는 3D 텐서로 인코딩될 것임
- 관례적으로 시간 축은 항상 두 번째 축(인덱스가 1인 축)임

#### 시계열 데이터 또는 시퀀스 데이터 예

예1 : 주식 가격 데이터셋
- 1분마다 현재 주식 가격, 지난 1분 동안의 최고 가격과 최소 가격을 저장함
- 1분마다 데이터는 3D 벡터로 인코딩되고
- 하루 동안의 거래는 (390, 3) 크기의 2D 텐서로 인코딩됨
- (하루의 거래 시간은 390분임)
- 250일치의 데이터는 (250,390, 3) 크기의 3D 텐서로 저장될 수 있음
- 1일치 데이터가 하나의 샘플이 됨

예2: 트윗 데이터셋
- 각 트윗은 128개의 알파벳으로 구성된 280개의 문자 시퀀스인데
- 각 문자가 128개의 크기인 이진 벡터로 인코딩될 수 있음
- (해당 문자의 인덱스만 1이고 나머지는 모두 0인 벡터)  
- 그러면 각 트윗은 (280, 128) 크기의 2D 텐서로 인코딩될 수 있음
- 100만 개의 트윗으로 구성된 데이터셋은 
- (1000000, 280, 128) 크기의 텐서에 저장됨


![image.png](attachment:image.png)

#### 이미지 데이터

- 이미지는 전형적으로 높이, 너비, 컬러 채널의 3차원으로 이루어짐
- (MNIST 숫자처럼) 흑백 이미지는 하나의 컬러 채널만을 가지고 있어 
  - 2D 텐서로 저장될 수 있지만   
  - 관례상 이미지 텐서는 항상 3D로 저장됨  
  - 흑백 이미지의 경우 컬러 채널의 차원 크기는 1임  
    - 256×256 크기의 흑백 이미지에 대한 128개의 배치는   
    - (128, 256, 256, 1) 크기의 텐서에 저장될 수 있음  
  - 컬러 이미지의 경우 컬러 채널의 차원 크기는 3임 (RGB 컬러 채널)    
    - 컬러 이미지에 대한 128개의 배치라면   
    - (128, 256, 256, 3) 크기의 텐서에 저장될 수 있음  


#### 이미지 텐서의 크기를 지정하는 방식은 두 가지   
- (1) 채널 마지막 (channel-last) 방식 : 텐서플로에서 사용  
  - (samples, height, width, color_depth) 순서   
  - 컬러 채널의 깊이를 끝에 놓음  
- (2) 채널 우선(channel-first) 방식 : 씨아노에서 사용  
  - (samples, color_depth, height, width) 순서  
  - 컬러 채널의 깊이를 배치 축 바로 뒤에 놓음  
  - 씨아노 방식을 사용하면 앞선 예는   
  - (128, 1, 256, 256)과 (128, 3,256, 256)이 됨  

- 케라스 프레임워크는 두 형식을 모두 지원   

![image-2.png](attachment:image-2.png)

# 현재 많이 사용되는 대표적인 딥러닝 프레임 워크
- Theano
    - python 기반
    - 데이터 탐색, 수치 계산에 유용
    - 확장성 뛰어나지 않고, GPU 지원 부족

- tensorflow
    - theano 대신 하기 위해 google에서 개발
    - deep 알고리즘, 강화 학습 등 다양한 알고리즘 지원
    - 텐서 보드라는 모델 가상화 도구 제공 : 모델 시각화
    
- keras
    - theano 또는 tensorflow 사용
    - 전문가가 아니면 사용하기 어려울 수 있고
    - 효율적인 인공신경망을 단순하게 구축하기를 목표로 구축
    - 토치와 같이 사용할 경우 순환 신경망 분야에서 인기가 높음
    
- 토치
    - Lua라는 스크립트 언어 기반
    - 대기업에서 토치 기반으로 자체 버전 개발할 정도로 효율적인 프레임워크
    -  순환 신경망 분야에서 인기가 높음 
    
- DL4J(DeepLearning4J)
    - 자바로 개발된 딥러닝 프레임워크 (자바 지원)
    - 하둡과 스파크 기반으로하는 빅데이터 도구와 함께 사용해서
    - 효율적인 딥러닝 가능
    - 비지니스 환경 중심의 분산 딥러닝 플랫폼으로 널리 사용
    
    
- 딥러닝 개발에 사용되는 프레임 워크
    - 특정 딥러닝 분야에 특화 되어 있거나
    - 기능상 차이가 있음
    - 개발하고자 하는 분야에 맞춰서 프레임워크 선택해서 사용