# TF2 Dataset
* 학습 및 테스트 데이타 입력 파이브 라인 
* `tf.data.Dataset`
    * `from_tesor_slice(tensors)`
    * `from_tensors(tensor)`
    * `from_generator(generator)`
* `tf.data.TextLineDataset`
* `tf.data.TFRecordDataset`


In [None]:
import tensorflow as tf
import numpy as np

data = np.arange(10)
data

### Dataset 생성
* `from_tensor_slices(array)`

In [None]:
dataset = tf.data.Dataset.from_tensor_slices(data)
dataset

### Iterable Object
* for-in 구문으로 순회 가능

In [None]:
for i, e in enumerate(dataset):
    print(i, e.numpy(), e)

### Iterator 생성
* `iter(dataset)`
    * `next(it)`

In [None]:
it = iter(dataset)
for i in range(10):
    print(next(it))

### Shuffle
* `dataset.suffle(buffer_size)`
    * buffer_size > len(data)

In [None]:
shuffled = dataset.shuffle(10)
for e in dataset:
    print(e.numpy(), end=" ")
print("\n", "-"*30)
for e in shuffled:
    print(e.numpy(), end=" ")

### Batch
* `dataset.batch(batch_size, drop_remainder=False)`
    * `drop_remainder` : 배수가 되지 못하는 set 버리기

In [None]:
batched = dataset.batch(3)
for i, e in enumerate(batched):
    print(f"{i}:{e.numpy()}, ", end="")


* `drop_remainder=True`

In [None]:
batched = dataset.batch(3, True)
for i, e in enumerate(batched):
    print(f"{i}:{e.numpy()}, ", end="")

### Repeat
* 데이타의 끝까지 도달하면 자동으로 처음 부터 반복
* `dataset.repeat([count])`
    * `count=None` : 무한 반복

In [None]:
for e in dataset.repeat(2):
    print(e.numpy(), end=" ")


### take
* `dataset.take(count)`
    * 주어진 갯수만으로 dataset 생성

In [None]:
for e in dataset.take(5):
    print(e.numpy(), end=" ")

### Map
* 각 요소를 함수와 맵핑
* `dataset.mapa(func)`

In [None]:
maped = dataset.map(lambda x : x + 10)
for e in maped :
    print(e)

### Prefetch
* `dataset.prefetch(buffer_size)`
    * 메모리(CPU/GPU)에 미리 올려두기
    * input dataset에 적용에 주의
        * `dataset.prefetch(2)` : 2개의 요소 prefetch
        * `dataset.batch(20).prefetch(2)` : 2batch prefetch

In [None]:
for e in dataset.prefetch(2):
    print(e)

### Chaining Methods
* 모든 함수가 dataset를 반환하기 때문에 연결해서 호출 가능

In [None]:
it = iter(dataset.shuffle(10).batch(3).repeat())
for i in range(10):
    print(next(it))
