# 다양한 OCR모델 비교하기
--------

## Step1. 검증용 데이터셋 준비

#### STEP 1) 구글의 파이썬 API 인터페이스 모듈을 아래와 설치합니다.

```python
$ pip install --upgrade google-api-python-client
$ pip install google-cloud-vision
```

#### STEP 2) Google Cloud Vision API 사용

```python
$ cp ~/Downloads/sheet-contents-xxxx.json ~/aiffel/ocr_python/my_google_api_key.json  
```

#### STEP 3) 인증키 경로 등록 후 커널 재기동     
터미널을 열고 아래와 같이 인증키 경로 변수를 등록한 후 커널을 종료하고 재기동합니다. 

```python
$ export GOOGLE_APPLICATION_CREDENTIALS=$HOME/aiffel/ocr_python/my_google_api_key.json
$ echo "export GOOGLE_APPLICATION_CREDENTIALS=$HOME/aiffel/ocr_python/my_google_api_key.json" >> ~/.bashrc
```

#### STEP 4) API 사용 테스트

In [2]:
def detect_text(path):
    """Detects text in the file."""
    from google.cloud import vision
    import io
    client = vision.ImageAnnotatorClient()

    with io.open(path, 'rb') as image_file:
        content = image_file.read()
        
    image = vision.Image(content=content)

    response = client.text_detection(image=image)
    texts = response.text_annotations
    print('Texts:')

    for text in texts:
       print('\n"{}"'.format(text.description))

    vertices = (['({},{})'.format(vertex.x, vertex.y)
                 for vertex in text.bounding_poly.vertices])

    print('bounds: {}'.format(','.join(vertices)))

    if response.error.message:
        raise Exception(
            '{}\nFor more info on error messages, check: '
            'https://cloud.google.com/apis/design/errors'.format(
                response.error.message))

In [4]:
# 다운받은 인증키 경로가 정확하게 지정되어 있어야 합니다. 
!ls -l $GOOGLE_APPLICATION_CREDENTIALS

import os
os.environ["GOOGLE_APPLICATION_CREDENTIALS"] =  os.getenv('HOME')+'/aiffel/ocr_python/my_google_api_key.json'

# 입력 이미지 경로를 지정해 주세요.
# (예시) path = os.getenv('HOME')+'/aiffel/ocr_python/test_image.png'
path = os.getenv('HOME')+'/aiffel/ocr_python/test_image.png'# [[YOUR IMAGE FILE PATH]]   

# 위에서 정의한 OCR API 이용 함수를 호출해 봅시다.
detect_text(path)

-rw-rw-r-- 1 aiffel aiffel 2352  3월 11 10:15 /home/aiffel/aiffel/ocr_python/my_google_api_key.json
Texts:

"논문 공유 서비
해외 유수의 대학과 기업은
다양한 기술의 확대에 기여 중
ArXiv
MODULABS
소스 코드 공유
GitHub
Stan
ford
MIT
공유 문화의 형성
→ 빠른 기술 발전
Google
Coursera
stack
overflow
Udacity
eDX
Quora
고품질 온라인 강의
Reddit
FB/
Twitter
지식 공유 소셜 서비스
"

"논문"

"공유"

"서비"

"해외"

"유수"

"의"

"대학"

"과"

"기업"

"은"

"다양한"

"기술"

"의"

"확대"

"에"

"기여"

"중"

"ArXiv"

"MODULABS"

"소스"

"코드"

"공유"

"GitHub"

"Stan"

"ford"

"MIT"

"공유"

"문화"

"의"

"형성"

"→"

"빠른"

"기술"

"발전"

"Google"

"Coursera"

"stack"

"overflow"

"Udacity"

"eDX"

"Quora"

"고품질"

"온라인"

"강의"

"Reddit"

"FB/"

"Twitter"

"지식"

"공유"

"소셜"

"서비스"
bounds: (1159,640),(1222,640),(1222,659),(1159,659)
