# 1.딥러닝 모델링 실습

## 0. Diabetic retinopathy 데이터
- 당뇨병의 합병증으로 망막의 미세혈관이 손상되었을 때에 나타남
- 세계 각국의 실명 원인 중에서 높은 비중을 차지
- 당뇨병 경력이 30년 또는 그 이상되는 환자의 약 90%에서 발생
- 초기에는 망막병증이 있으면서도 별다른 증상이 없는 경우가 많기 때문에 정기적인 안과 관찰이 필요하다. 
- 구글에서 이 안사진을 사용해서 병의 심각성을 0-5 level로 나누는 모델을 만들었다. 그 후 jama 라는 저널에 실었다. 

### Dataset

https://www.kaggle.com/c/diabetic-retinopathy-detection/data
    
large set of high-resolution retina images.
A left and right field is provided for every subject.
Images are labeled with a subject id as well as either left or right
lebel
    - 0: No DR
    - 1: Mild
    - 2: Moderate
    - 3: Severe
    - 4: Proliferative DR

### 사용 모델
#### Convolution Neural Network (CNN)
- 필터를 통해 이미지의 특징을 추출하여 판단하는 모델
- 스스로 필요한 필터를 학습하며 깊이 진행될 수록 추상적인 특징을 추출한다. 
- 필터(커널이라고도 함)(filter or Kernel) : 이미지 데이터의 특징을 추출하는 범위, 창 -> 필터를 통해 나온 결과를 특징맵(feature map)이라고 함. 
- 스트라이드(Stride) : 필터를 적용할 때의 간격
    ex) stride 2는 2칸씩 건너뛴다는 것!
- 패딩(Padding) : 사이즈 축소를 방지하기 위헤 테두리에 임의의 값으로 채워 넣는 방법
    ex) padding=1 : 테두리에 1줄을 채워 넣었다는 의미
      주로 zero-padding을 사용
      
- 완전 연결 신경망(Fully Connected Layer, FCL)
    - 특지을 뽑으면 특징 맵이 많아짐
    - feature map 을 가지고 정상/비정상을 알아야 하는데 -> feature map들을 1줄로 늘여놓는다. 그 후 판단한다. 이때 각 feature map이 fully connected된다. 

![%E1%84%89%E1%85%B3%E1%84%8F%E1%85%B3%E1%84%85%E1%85%B5%E1%86%AB%E1%84%89%E1%85%A3%E1%86%BA%202020-02-12%20%E1%84%8B%E1%85%A9%E1%84%8C%E1%85%A5%E1%86%AB%207.09.42.png](attachment:%E1%84%89%E1%85%B3%E1%84%8F%E1%85%B3%E1%84%85%E1%85%B5%E1%86%AB%E1%84%89%E1%85%A3%E1%86%BA%202020-02-12%20%E1%84%8B%E1%85%A9%E1%84%8C%E1%85%A5%E1%86%AB%207.09.42.png)

## 1. 데이터 읽기

In [3]:
import PIL
from PIL import Image
import matplotlib.pyplot as plt

In [6]:
img1 = Image.open('파일명')
img2 = Image.open('파일명')

In [None]:
#데이터 시각화
fig.axes = plt.subplot(1, 2, figsize = (16, 16))
axis[0].imshow(img1)
axis[1].imshow(img2)

## 2. 데이터 전처리
### 두 이미지를 보았을 때 우선적으로 어떤 전처리가 필요할까
- 이미지 크기
- 필요한 부분만 남기고 잘라주기(없애기)

In [7]:
### 1. 이미지 크기, 필요한 부분만 남기고 잘라주기 
### 여기서 내가 배운 것은, trim함수가 아니라,
### 이 경계를 잘라주는데 필요한 코드를 구글링해서 찾아 볼 수 있다는 것이다. 
### 예를 들어, 'trim black margin in PIL'처럼

def trim(image):
    bg = PIL.Image.new(image.mode, image.size, image.getpixel((0, 0)))
    diff = PIL.ImageChops.difference(image, bg)
    diff = PIL.ImageChops.add(diff, diff, 2.0, -20)
    bbox = diff.getbbox()
    if bbox:
        return image.crob(bbox)

- 컴퓨터 사양에 맞게 데이터 조절해주기 예를들어, 해상도를 낮춘다던가.

단, 크다고 무작정 해상도를 낮추면 안되고, 반드시 시각화를 통해 어느정도가 적절한지 봐가면서 해야한다. 

In [None]:
### 2. 컴퓨터 사양에 맞게 데이터 조절해주기 예를들어, 해상도를 낮춘다던가.(resize)
img1 = img1.resize((128, 128))
img2 = img2.resize((129, 129))

fig.axes = plt.subplot(1, 2, figsize = (16, 16))
axes[0].imshow(img1)
axes[1].imshow(img2)

- 이 병이나 안구에 Domain knowledge가 있다면, 
진단에 color는 불필요하다는 걸 알고 color 정보를 배제할 수 있다.

이것도 'convert to gray in PIL'이라고 쳐보았다. 

In [None]:
### color 정보를 배제
img1 =img1.convert('LA')
img2 = img2.convert('LA')

fig.axes = plt.subplot(1,2, figsize = (16, 16))
axes[0].imshow(img1)
axes[1].imshow(img2)


