## 데이터 설명
### 유의사항
- 서버의 master 데이터셋을 local로 복사한 후에 사용할 것
- 외부 데이터 사용 불가

### 데이터 구성
- Training dataset (407 subjects each with 16 slices)
  - Aliased image: FastMRI 촬영으로 얻은 이미지
  - GRAPPA reconstructed image: GRAPPA 알고리즘을 이용해 재구성한 이미지
  - Multichannel k-space data provided (full data with undersampling mask): 이미지로 변환하기 이전의 raw 데이터. 학습용으로 사용 시 mask를 곱하여 사용해야 함(데이터 양을 1/5로 언더샘플링)
  - Aliasing free image (ground truth): 원본 MRI 데이터, target에 해당
- Test dataset for leaderboard (50 subjects each with 16 slices)
  - Aliased image
  - GRAPPA reconstructed image
  - Multichannel k-space data provided (undersampled data only)
  - Aliasing free image (ground truth)
- Test dataset for final evaluation
  - Will not be available for public
  - Evaluation procedure to be anounced

## Potential Scenario
- GRAPPA Reconed image -> neural net -> aliasing free image
- k-space data -> custom reconed image -> neural net -> aliasing free image
- k-space data -> neural net -> aliasing free image

## 이미지 데이터 확인

### 모듈 임포트

In [None]:
import h5py
import matplotlib.pyplot as plt
import numpy as np

### 파일 지정

In [None]:
f = h5py.File('../../input/train/image/brain95.h5', 'r')

### 키 확인

h5py.File acts like a Python dictionary, thus we can check the keys

In [None]:
print(list(f.keys()))
# ['image_grappa', 'image_input', 'image_label']

### 데이터 형태 및 자료형 확인

Let's examine the data set as a Dataset object

In [None]:
image_grappa = f['image_grappa']
image_input = f['image_input']
image_label = f['image_label']

The object we obtained isn’t an array, but an HDF5 dataset.  
Like NumPy arrays, datasets have both a shape and a data type:

In [None]:
print("image_grappa: ")
print(image_grappa.shape)
print(image_grappa.dtype)
print('\n')
'''
image_grappa: 
(16, 384, 384)
float32
'''

print("image_input: ")
print(image_input.shape)
print(image_input.dtype)
print('\n')
'''
image_input: 
(16, 384, 384)
float32
'''

print("image_label: ")
print(image_label.shape)
print(image_label.dtype)
print('\n')
'''
image_label: 
(16, 384, 384)
float32
'''

- 각각 384*384 크기의 이미지 16장으로 구성
- 실수형 픽셀 데이터

### 데이터 분포 확인

numpy로 평균과 표준편차, 최댓값, 최솟값 확인

In [None]:
print("[image_grappa]")
print("평균: ", np.mean(image_grappa))
print("표준편차: ", np.std(image_grappa))
print("최댓값: ", np.max(image_grappa))
print("최솟값: ", np.min(image_grappa))
print('\n')

print("[image_input]")
print("평균: ", np.mean(image_input))
print("표준편차: ", np.std(image_input))
print("최댓값: ", np.max(image_input))
print("최솟값: ", np.min(image_input))
print('\n')

print("[image_label]")
print("평균: ", np.mean(image_label))
print("표준편차: ", np.std(image_label))
print("최댓값: ", np.max(image_label))
print("최솟값: ", np.min(image_label))
print('\n')

- 픽셀 데이터의 스케일이 작은 편이다.
- 각 데이터셋은 거의 균일한 스케일을 가지는 것으로 확인됐으며, 별도의 스케일링 작업을 하지 않아도 무방할 듯 하다.

## k-space 데이터 확인

### 파일 지정

In [None]:
f = h5py.File('../../input/train/kspace/brain95.h5', 'r')

### 키 확인

In [None]:
print(list(f.keys()))
# ['kspace', 'mask']

### 데이터 형태 및 자료형 확인

In [None]:
kspace = f['kspace']
mask = f['mask']

print("kspace: ")
print(kspace.shape)
print(kspace.dtype)
print('\n')
'''
kspace: 
(16, 20, 768, 396)
complex64
'''

print("mask: ")
print(mask.shape)
print(mask.dtype)
print('\n')
'''
mask: 
(396,)
float32
'''

In [None]:
print(list(mask))

- k-space 데이터는 (16, 20, 768, 396) 크기의 복소수 배열
- mask는 0 또는 1의 값을 갖는 396 크기의 1차원 실수 배열(k-space 데이터에 곱하여 사용)

- k-space 데이터는 (16, 20, 768, 396) 크기의 복소수 배열
- mask는 0 또는 1의 값을 갖는 396 크기의 1차원 실수 배열(k-space 데이터에 곱하여 사용)