# 1장. 카카오를 통해 이미지 크롤링 프로젝트

## 1.2.1 회원가입
- 카카오 개발자 사이트 : https://developers.kakao.com

## 1.3.1 파일 읽고, 쓰기

In [1]:
# 파일 쓰기
# data = "hello"
# with open("text.txt", "w") as f
#     f.write(data)

# # 파일 읽기
# with open("text.txt", "r") as f
#     print(f.read())

## 1.3.2 웹에 있는 이미지 파일을 저장하는 방법
- https://search1.kakaocdn.net/argon/600S0_65_wr/ImZk3b2X1w8

In [20]:
!pip install requests



In [28]:
import requests

In [46]:
# 이미지가 있는 url 주소
url = "https://search4.kakaocdn.net/argon/0x200_85_hr/7HGHIGpqXIK" 

# 해당 url로 서버에게 요청
img_response = requests.get(url)

# 요청에 성공했다면,
if img_response.status_code == 200:  # 서버에 접속성공
    print('====================== 이미지 저장 ======================')
    
    with open("test.jpg", "wb") as f:
        f.write(img_response.content)



# 1.4 구현하기

## Step 1) 카카오 이미지 검색 OpenAPI 호출하기
- 카카오 이미지 검색 OpenAPI 문서 : https://developers.kakao.com/docs/latest/ko/daum-search/dev-guide#search-image

In [23]:
import requests
import json

keyword = ''

# 이미지 검색
url = "https://search4.kakaocdn.net/argon/0x200_85_hr/7HGHIGpqXIK"
headers = {
#     "Authorization" : "KakaoAK <REST_API 앱 키를 입력하세요>"
        "Authorization" :'KakaoAK d14be6002a90d442569859af3ed267bf'
}

data = {
    "query" : keyword 
}

# 이미지 검색 요청
response = requests.post(url, headers=headers, data=data)
# 요청에 실패했다면,
if response.status_code != 200:
    print("error! because ", response.json())
else: # 성공했다면,
    count = 0
    for image_info in response.json()['documents']:
        print(f"[{count}th] image_url =", image_info['image_url'])
        # 저장될 이미지 파일명 설정
        count = count + 1

error! because  {'errorType': 'MissingParameter', 'message': 'query parameter required'}


## Step 2) 이미지 파일 저장하기

In [47]:
# 이미지가 있는 image_url을 통해 file_name 파일로 저장하는 함수
def save_image(image_url, file_name):
    img_response = requests.get(image_url)
    # 요청에 성공했다면,
    if img_response.status.code == 200:
        # 파일 저장
        with open(file_name, ' wb') as f:
            f.write(img_response.content)
     

## Step 3) 사진을 저장할 폴더 생성 

In [48]:

# 사진을 저장할 폴더 생성 
def createFolder(keyword):
    try:
        if not os.path.exists(keyword):
            os.makedirs(keyword)
    except OSError:
        print('Error: Creating directory. ' + keyword)


## Step 3) 전체 코드 완성하기

In [50]:
import requests
import json
import os 


# 이미지가 있는 image_url을 통해 file_name 파일로 저장하는 함수
def save_image(image_url, file_name):
    img_response = requests.get(image_url)
    # 요청에 성공했다면,
    if img_response.status_code == 200:  # 서버에 접속성공
        print('====================== 이미지 저장 ======================')
        with open(file_name, "wb") as f:
            f.write(img_response.content)
            
# 이미지 검색
url = "https://dapi.kakao.com/v2/search/image"
headers = {
#     "Authorization" : "KakaoAK <REST_API 앱 키를 입력하세요>"
        "Authorization" :'KakaoAK d14be6002a90d442569859af3ed267bf'
}

keyword=input('검색 키워드를 입력 하세요 ')

# 사진 저장할 폴더 생성 함수를 실행 
createFolder(keyword)

data = {
    "query" : keyword
}

# 이미지 검색 요청
response = requests.post(url, headers=headers, data=data)

# 요청에 실패했다면,
if response.status_code != 200:
    print("error! because ", response.json())

else: # 성공했다면,
    count = 0
    for image_info in response.json()['documents']:
        print(f"[{count}th] image_url =", image_info['image_url'])
        count = count + 1
        # 저장될 이미지 파일명 설정
        file_name = f"{keyword}_{count}.jpg"
        
        # 이미지 저장
        save_image(image_info['image_url'], f'{keyword}/{file_name}')

검색 키워드를 입력 하세요 갯마을
[0th] image_url = http://cfs6.blog.daum.net/image/13/blog/2008/02/03/08/08/47a4f7d909ae9&filename=%EA%B0%AF%EB%A7%88%EC%9D%84.jpg
[1th] image_url = http://t1.daumcdn.net/cfile/tistory/211C9145559C025A2B
[2th] image_url = https://support.visitkorea.or.kr/img/call?cmd=VIEW&id=9cba0ecd-734f-4717-9430-0f226d6d5dcb
[3th] image_url = https://support.visitkorea.or.kr/img/call?cmd=VIEW&id=d5123c38-26fc-4213-9333-e07f0f8ab63a
[4th] image_url = https://t1.daumcdn.net/news/202110/08/entermedia/20211008131012435jwgv.jpg
[5th] image_url = http://postfiles5.naver.net/20160811_100/amd728335_1470882298899UtQL0_JPEG/%B0%B9%B8%B6%C0%BB2.jpg?type=w966
[6th] image_url = http://postfiles4.naver.net/20160509_163/amd728335_1462770403535q3fU6_JPEG/%B0%B9%B8%B6%C0%BB3.JPG?type=w966
[7th] image_url = http://postfiles4.naver.net/20160811_147/amd728335_14708822989057Ylt9_JPEG/%B0%B9%B8%B6%C0%BB4.jpg?type=w966
[8th] image_url = http://postfiles5.naver.net/20160907_212/amd728335_1473216826233azKa

[56th] image_url = http://www.queen.co.kr/news/photo/202110/367833_106842_5540.jpg
[57th] image_url = http://scrap.kakaocdn.net/dn/TfqAY/hyLUmg3pPU/ozSL5o9jxygpkUGakelXVk/img.jpg?width=1280&height=720&face=228_120_1162_484
[58th] image_url = http://cfs11.blog.daum.net/image/22/blog/2008/08/01/15/06/4892a7d49ac12&filename=%EA%B0%AF%EB%A7%88%EC%9D%84058.jpg
[59th] image_url = http://cfile270.uf.daum.net/image/184092364E8C51D7196D98
[60th] image_url = https://t1.daumcdn.net/cfile/cafe/9950A04A5F5856392D
[61th] image_url = https://t1.daumcdn.net/news/202110/13/ked/20211013154206338ueok.jpg
[62th] image_url = https://scrap.kakaocdn.net/dn/boXBUx/hyLNejAw1h/rwLsAsvPyScaRjlCKA8SIk/img.jpg?width=1920&height=1080&face=552_183_981_300
[63th] image_url = http://postfiles13.naver.net/MjAxNzA4MDlfMjU0/MDAxNTAyMjc2NDIzNTQ0.ZJN4txrZyPm8i-2o5xcDbyjrKSzeF91IVQmHM7AoJYIg.Ymqdekka5FkDQaX1PpC7PMvPLM_j1wEsHvtJWv84pbUg.JPEG.pyj_5004/3.jpg?type=w773
[64th] image_url = http://cfile283.uf.daum.net/image/240EFA