# 이미지 수집

## google images download 라이브러리
- 다운받고 싶은 이미지 keyword를 입력하면 구글에서 이미지 검색해서 다운로드 하는 라이브러리
- CLI (Command Line Interface) 환경에서 명령어를 이용해 다운받는 방법과 python 코드로 작성해 다운받는 2가지 방식을 다 지원한다.
- doc: https://google-images-download.readthedocs.io/en/latest/installation.html
- github : https://github.com/Joeclinton1/google-images-download

### 설치
- `!pip install git+https://github.com/Joeclinton1/google-images-download.git`
- 100개 이상의 이미지를 다운받기 위해서는 Chromedriver를 받아서 옵션에 설정한다.
    - https://chromedriver.chromium.org/downloads

### 명령프롬프트에서 실행
- 구문
```
googleimagesdownload --옵션 옵션값
ex) googleimagesdownload --keywords "Polar bears, baloons, Beaches" --limit 20 -f jpg
```
- chrome driver 연동시 `--chromedriver 드라이버경로`  설정
```
googleimagesdownload keywords "Polar bears, baloons, Beaches" --limit 1000 --chromedriver C:\Users\domain\Downloads\chromedriver_win32\chromedriver.exe
```
- 옵션: https://google-images-download.readthedocs.io/en/latest/arguments.html

### 설정파일
- 매직커맨드 : 단어별로 옵션 다르게 줄때, 옵션을 키값으로 입력
- 자바스크립트는 true 소문자로

In [1]:
%%writefile config2.json
{
    "Records":[
        {"keywords":"apple",
         "limit":5,
         "format":"jpg",
         "color-type":"full-color",
         "print_url":true,
         "print_size":true
        },
        {"keywords":"strawberry",
         "limit":10,
         "format":"jpg",
         "color-type":"full-color",
         "print_url":true,
         "print_size":true
        }
    ]
}

Writing config2.json


In [2]:
!googleimagesdownload --config_file config2.json


Item no.: 1 --> Item name = apple
Evaluating...
Starting Download...
Image Size: 28.3 KB
Completed Image ====> 1.og-default.jpg
URLError on an image...trying next one... Error: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: self signed certificate in certificate chain (_ssl.c:1091)>
Image Size: 15.9 KB
Completed Image ====> 2.aauvwnjmqg0vnjympsea4x60oqgj6a_ko4clp0duhrg0ca=s900-c-k-c0x00ffffff-no-rj.jpg
Image Size: 5.0 KB
Completed Image ====> 3.p7zz5dxz_400x400.jpg
Image Size: 57.5 KB
Completed Image ====> 4.airtag-og-202104.jpg
Image Size: 291.3 KB
Completed Image ====> 5.untitled.png.jpg

Errors: 1


Everything downloaded!
Total errors: 1
Total time taken: 5.126995325088501 Seconds

Item no.: 1 --> Item name = strawberry
Evaluating...
Starting Download...
Image Size: 14.2 MB
Completed Image ====> 1.garden_strawberry_%28fragaria_%c3%97_ananassa%29_single.jpg
Image Size: 64.3 KB
Completed Image ====> 2.fraise-large.jpg
Image Size: 64.4 KB
Completed Image ==

In [3]:
# 파이썬 코드로 다운로드

In [4]:
from google_images_download import google_images_download

response = google_images_download.googleimagesdownload()

In [8]:
args = {
    "kewords":"퐁키",
    "limit":10,
    "format":"jpg",
    "print_url":True,
    "print_size":True
}

In [9]:
path = response.download(args)

-------------------------------
Uh oh! Keywords is a required argument 

Please refer to the documentation on guide to writing queries 
https://github.com/hardikvasa/google-images-download#examples

exiting!
-------------------------------


SystemExit: 

## 영상 무료 제공 사이트

다음 사이트들은 영상에 저자권 없이 무료로 다운 받아 사용할 수 있는 사이트들
- pixabay: https://pixabay.com/ko/
- Unsplash: https://unsplash.com/

## 이미지 캡쳐를 이용한 데이터 수집
- OpenCV의 VideoCapture를 이용해 이미지 수집

In [11]:
import cv2
import sys
import time
import uuid
import os

In [12]:
IMAGE_DIR = 'images'
if not os.path.isdir(IMAGE_DIR):
    os.mkdir(IMAGE_DIR)

In [13]:
labels =['one','two','three','four','five']
n_images = 15 # 카테고리별로 몇장씩 만들지

In [None]:
cap = cv2.VideoCapture(0)
if not cap.isOpened():
    print('웹캠 연결 실패')
    
#웸캠 이미지 사이즈 설정
cap.set(cv2.CAP_PROP_FRAME_WIDTH,640)
cap.set(cv2.CAP_PROP_FRAME_HEIGHT,480)

break_all = False #중복 반복문 전체를 빠져나오기 위해

#라벨별로 반복해서 캡쳐
for label in labels:
    print(f"{label}라벨 캡쳐")
    time.sleep(2) #2초 대기시간
    
    #이미지 n_images 개수만큼 캡쳐
    #한번 반복할때마다 한장씩 캡쳐
    for img_num in range(n_images):
        ret, frame = cap.read() #캡쳐: 성공여부, 캡쳐이미지-엔디어래이로 반환
        
        frame = cv2.flip(frame,1)
        filename = "{}-{}".format(label, str(uuid.uuid1())) #uuid1이라는 함수: 난수개념
        file_path = os.path.join(IMAGE_DIR,filename)
        #화면에 출력
        cv2.imshow('frame',frame)
        #캡쳐, 이미지파일로 저장
        cv2.imwrite(file_path, frame)
        print(f"{img_num}번째,", end =" ")
        
        if cv2.waitKey(2000) ==27: #esc 누르면 강제종료/웨이트키 : 2초후에 다음동작을 캡쳐
            #2초기다렸는데도 esc안누르면 반복문 다시 돌아감
            print("강제종료")
            break_all = True
            break
    if break_all:
        break
    print()
    
#종료
cap.release()
cv2.destroyAllWindows()

# LabelImg 를 이용한 Object Detection 데이터 Labelling
- github에서 다운 받은 뒤 압축풀기
    - https://github.com/tzutalin/labelImg
- 의존 라이브러리 설치
    - conda install pyqt=5
    - conda install -c anaconda lxml
    - pyrcc5 -o libs/resources.py resources.qrc
- data\predefined_classes.txt 변경
    - Labeling할 대상 클래스들로 변경
- 실행
    - `python labelImg.py`
    - 메뉴: view > Auto save mode 체크
    - open dir - labeling할 이미지 디렉토리 열기
    - change save dir: annotation 파일 저장 디렉토리 설정
    - Labelling Format 지정: Pascal VOC, YOLO
- 주요 단축키
|단축키|설명|
|-|-|
|w|BBox 그리기|
|d|다음 이미지|
|a|이전 이미지|
|del|BBox 삭제|
|ctrl+shift+d|현재 이미지 삭제|
