# [Week8] 이미지 분석 활용 맛보기(OCR) + 마스크 분류 프로젝트

## 1. 문자인식(OCR, Optical Character Recognition) 맛보기

### (1) 라이브러리 다운로드 : tesserocr

* 참고 링크 : https://pypi.org/project/tesserocr/

1. 아나콘다에서 작업할 가상환경으로 들어온다 (conda activate)
2. 다음 명령을 통해 라이브러리를 다운로드 한다.
```
conda install -c conda-forge tesserocr
```
3. 다음 코드를 통해 버전과 언어를 확인한다.

In [None]:
import tesserocr
from PIL import Image

print(tesserocr.tesseract_version())  # print tesseract-ocr version
print(tesserocr.get_languages())  # prints tessdata path and list of available languages

4. 한글 인식을 위해 데이터를 다운로드 한다.
    * [한글 데이터 다운로드 링크](https://github.com/tesseract-ocr/tessdata/blob/master/script/Hangul.traineddata)
    * [(참고) 다른 언어 데이터 링크](https://github.com/tesseract-ocr/tessdata/tree/master/script)
5. 4번에서 다운받은 파일을 현재 가상환경 아래의 tessdata 폴더에 넣는다.

In [None]:
# 디렉터리 위치 확인
print(tesserocr.get_languages()[0])

6. 다음 코드를 통해 'Hangul' 이 추가되었는지 확인한다.

In [None]:
# 지원되는 언어 다시 확인
print(tesserocr.get_languages()[1])

### (2) 문자 인식 실습

In [None]:
# 영어 버전
path = './Image/english.png'
image = Image.open(path)
display(image)
print(tesserocr.image_to_text(image, lang='eng'))  # print ocr text from image

In [None]:
# 한글 버전
path = './Image/korean.png'
image = Image.open(path)
display(image)
print(tesserocr.image_to_text(image, lang='Hangul'))  # print ocr text from image

### (3) 문자 인식을 활용한 프로젝트 아이디어

> __이미지에서 문자를 추출하는 문자인식 기술을 사용한 프로젝트들을 검색하거나 생각해보고 1개 이상 작성해주세요.__

답변 : 

## 2. 마스크 착용 여부 분류 (mask classification)

### (1) 캐글에서 모델 만들기

* 캐글 데이터셋 : https://www.kaggle.com/andrewmvd/face-mask-detection
* 복사할 노트북 : https://www.kaggle.com/tapan2930/fastai-mask-classification/

1. 노트북을 [Copy and Edit]한다.
2. 노트북을 하나씩 실행해보며 결과를 확인한다.
3. 마지막 코드에서 model export 을 주석 풀고 실행한다.
4. output 결과로 나오는 /kaggle/working/model.pkl 을 다운로드하여, Model 폴더에 넣는다.

### (2) 라이브러리 설치

* 참고 링크 : https://pypi.org/project/fastai/1.0.60/
* __주의사항 : fastai 버전은 1로 맞춰서 설치해주세요!__

In [None]:
!pip install fastai==1.0.60

In [None]:
import warnings
warnings.filterwarnings('ignore')

In [None]:
import fastai
fastai.__version__

In [None]:
import cvlib as cv
import cv2
import torch
import time
import imutils
from PIL import Image as PImage
from matplotlib import pyplot as plt
from fastai.vision import *
from torchvision.transforms import Compose, Resize, ToPILImage, ToTensor

### (3) 마스크 착용 여부 분류 프로그램 작성하기

* 참고 링크 : https://github.com/vinaykudari/mask-classification/blob/master/inference/mask-detection-on-webcam.ipynb

In [None]:
# 모델 가져오기
learn = load_learner("./Model", 'model.pkl')

In [None]:
# Transform image
transformations = Compose([
        ToPILImage(),
        Resize((224, 224)),
        ToTensor(),
    ])

In [None]:
webcam = cv2.VideoCapture(0)

if not webcam.isOpened():
    print("Could not open webcam")
    exit()

while webcam.isOpened():
    status, frame = webcam.read()

    if not status:
        print("Could not read frame")
        exit()

    im = cv2.flip(frame, 1)
    
    # 1. cvlib 의 얼굴 인식 함수를 사용하여 다음 코드를 완성하세요.
    # --------- Start Edit -------------
    faces, confidences = None
    # --------- End Edit   -------------
    
    for face in faces:
        (startX,startY) = face[0],face[1]
        (endX,endY) = face[2],face[3]
        
        # 2. 사진에서 얼굴 부분만 크롭하세요.
        # --------- Start Edit -------------
        face_crop = None
        # --------- End Edit   -------------
        
        # 3. face_crop 이미지를 BGR 에서 RGB 로 변환해주세요.
        # --------- Start Edit -------------
        face_RGB = None
        # --------- End Edit   -------------
        
        outImg = Image(transformations(face_RGB))
        
        # 4. learn.predict() 을 이용하여, outImg 의 결과를 받아오세요.
        # --------- Start Edit -------------
        pred_class, pred_idx, class_scores = None
        # --------- End Edit   -------------
        
        text = f'{pred_class}, {int(class_scores[pred_idx]*100)} accurate'
        cv2.putText(im, text, (startX,startY), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 1)
    
    cv2.imshow("Real-time video", im)

    # 키보드의 'q'를 누르면 프로그램이 종료됩니다.
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

webcam.release()
cv2.destroyAllWindows()