### 필요한 라이브러리와 폰트 설치

* 파이선에서는 특정 목적을 위해 사용할 수 있는 다양한 도구들의 집합인 라이브러리를 제공한다!
* 일단 필요한 라이브러리를 설치하고 
* 한글 폰트 출력을 위한 폰트 설치 역시 진행해보자.
* 그 전에 제일 먼저 해야 할 일은 런타임 -> 런타임 유형 변경 -> 하드웨어 가속 -> None을 GPU로 바꿔보자!
* AI 학습에는 GPU 그래픽 카드의 성능이 중요하다!

In [None]:
#fastai2 라이브러리 설치
!pip install fastai2



In [None]:
# 한글 나눔 폰트 설치
!apt -qq -y install fonts-nanum

fonts-nanum is already the newest version (20170925-1).
0 upgraded, 0 newly installed, 0 to remove and 37 not upgraded.


In [None]:
# 폰트 경로 설정 
import matplotlib.pyplot as plt
import matplotlib.font_manager as fm

fontpath = '/usr/share/fonts/truetype/nanum/NanumGothic.ttf'
font = fm.FontProperties(fname=fontpath, size=10)
fm._rebuild()
# 위 코드 실행 후 [메뉴] - [런타임] - [런타임 다시 시작] - [예]

In [None]:
# 폰트 설정import matplotlib.pyplot as plt
plt.rc('font', family='NanumGothic') 

In [None]:
#fastbook 라이브러리 설정
#우리가 맨날 사용했던 구글 드라이브 접근 코드와 권한은 비슷하다!
!pip install -Uqq fastbook

In [None]:
import fastbook
fastbook.setup_book()

In [None]:
# fastbook 라이브러리에서 모든 도구들을 가져온다
# fastai.viwison.widgets에서 모든 도구들을 가져온다.

from fastbook import *
from fastai.vision.widgets import *

### 데이터 수집하기

* 항상 AI 모델 학습을 위해서는 AI 학습을 위한 데이터가 필요하다.
* 그동안 우리가 사용했던 데이터는 선생님이 다운로드해서 찾거나 여러분들이 직접 찾아서 파일형태로 사용했는데
* 이번에는 MS의 검색엔진인 Bing을 이용하여 
* 이미지를 자동으로 수집하고 저장하는 과정을 진행해보자!

In [None]:
# bing에서 이미지를 검색할 수 있는 도구가 존재하는지 확인하기
search_images_bing

<function fastbook.search_images_bing>

In [None]:
#serach_image_ddg 함수를 사용하면 입력한 키워드에 따른 검색 이미지의 주소를 가져와 저장할 수 있다
result1 = search_images_ddg('IU',max_images=100)
result2 = search_images_ddg('cat',max_images=100)
result3 = search_images_ddg('치킨',max_images=100)

print(result3)
print(len(result1))

['https://i.ytimg.com/vi/HDH9YAAhLYI/maxresdefault.jpg', 'http://recipe1.ezmember.co.kr/cache/recipe/2017/08/02/ce64e1bf96084498fd2df8fae09870d91.jpg', 'https://3.bp.blogspot.com/-1o8QTFuxhAw/XG1iR8qI4tI/AAAAAAAAO9E/BhBIoxe1ov4vfw22I4P-N6gt5ZaUCoPcwCLcBGAs/s1600/20190209-IMG_6293.jpg', 'https://blog.kakaocdn.net/dn/ejsBxQ/btqHGT6BMBX/jPKkS4TuHxu8SSeO7o1mGk/img.jpg', 'https://t1.daumcdn.net/cfile/tistory/263E704F592FCE231D', 'https://img1.daumcdn.net/thumb/R800x0/?scode=mtistory2&fname=https:%2F%2Ft1.daumcdn.net%2Fcfile%2Ftistory%2F2514FA3F57A5940D03', 'https://img.siksinhot.com/place/1532677984992084.jpg', 'http://www.src3.com/uploads/bw1710002/202101/70d58c2eda858e2ed3022b1ab114f25c_crop.jpg?t=176d62172f3', 'https://img.insight.co.kr/static/2020/04/22/1200/v157h390sb27xg0tyw3e.jpg', 'https://t1.daumcdn.net/cfile/tistory/990D72395CF1D55033', 'https://t1.daumcdn.net/cfile/tistory/99CF4C3D5CA760062B', 'https://jc-one.co.kr/wp-content/uploads/2019/11/%EB%B0%98%EB%B0%98.jpg', 'https://t1.d

In [None]:
#download_url을 사용하면 (주소,'경로')를 통해 주소에 있는 이미지를 경로에 저장할 수 있다.
#im을 활용하면 이미지를 열어 저장할 수 있고
#크기를 지정한 후 
#확인할 수 있다.
#가로 세로 256 크기로 보이도록 

for i in range(0,99):
  download_url(result2[i],f'/content/gdrive/MyDrive/[프로그래밍]SDHS/CAT/CAT{i}.png')
  im = Image.open('/content/gdrive/MyDrive/[프로그래밍]SDHS/CAT42.png')
  im.thumbnail((256,256))
  im

In [None]:
# 분류할 type을 key_types에 문자열로 저장한다.
key_types = '고양이','아이유','치킨'
# 드라이브에 사진을 저장할 기본 폴더를 만든 후 이를 경로로 지정한다
path = Path('/content/gdrive/MyDrive/[프로그래밍]SDHS/AIpicture/')

In [None]:
# 설정한 경로에 폴더가 없으면 폴더를 만들고
if not path.exists() :
  path.mkdir() 
#o라는 이름으로 key_type을 돌면서
  for o in key_types : 
    print(path, o) # 확인용
    dest = (path/o) #각각의 키워드에 따라 사진을 저장할 폴더 경로
    print(dest) # 확인용
    dest.mkdir(exist_ok = True) #폴더가 없으면 폴더를 만들고 
    results = search_images_ddg(o,max_images=100) #키워드에 해당하는 이미지 주소를 가져오고
    download_images(dest, urls = results) #설정한 경로에 내용을 파일로 저장한다.

/content/gdrive/MyDrive/[프로그래밍]SDHS/AIpicture 고양이
/content/gdrive/MyDrive/[프로그래밍]SDHS/AIpicture/고양이
/content/gdrive/MyDrive/[프로그래밍]SDHS/AIpicture 아이유
/content/gdrive/MyDrive/[프로그래밍]SDHS/AIpicture/아이유
/content/gdrive/MyDrive/[프로그래밍]SDHS/AIpicture 치킨
/content/gdrive/MyDrive/[프로그래밍]SDHS/AIpicture/치킨


In [None]:
#모든 사진파일 정보 확인
fns = get_image_files(path)
fns
#왜 300개가 아닐까?

(#0) []

In [None]:
# 모든 사진파일의 경로가 들어있는 fns를 검증하여 실패한 사진의 경로만 따로 저장함
failed = verify_images(fns)
failed

(#0) []

In [None]:
# 다운에 실패한 이밎의 위치를 Path에서 제거함
failed.map(Path.unlink)