# 인턴 교육 2주차 과제: 네이버 OPEN API를 통한 웹 크롤링
- 과제 기한: 6월 14일까지

**세부과제**
1. 네이버 OPEN API 이용
    - 검색어에 대한 20개의 상품을 찾는다.
    - 중고, 렌탈은 제외한다.

2. Pandas를 이용한 데이터프레임 저장
    - 출력된 각 key들의 의미에 대해 이해한다.
    - (column: 상품id, 상품명, 제조사, 최저가, 이미지링크, 구매링크)을 가진 데이터프레임을 만든다.(변수명은 자유)
    - csv로 저장한다.

3. Python 코드로 함수 작성
    - 키워드(검색어)만 입력하면 바로 저장될 수 있도록 함수를 만든다.
        - 키워드를 입력하면 API를 이용해 데이터를 받고 이를 데이터프레임에 저장을 한뒤 자동으로 저장될 수 있게 한다.

**목표**

업무 자동화 시스템을 만들면서 OPEN API에 대한 이해와 데이터 저장에 대한 스킬을 높인다.

**팁**

1. [네이버 OPEN API에 대한 가이드](https://developers.naver.com/docs/common/openapiguide/)

2. [Pandas API reference](https://pandas.pydata.org/docs/reference/index.html)

3. [Python Documentation](https://docs.python.org/ko/3/library/urllib.html)

4. [Python json module Documentation](https://docs.python.org/3/library/json.html#)


1. API데이터를 함수를 통해 받는 코드 작성

In [10]:
import os
import urllib.parse
import urllib.request

from dotenv import load_dotenv

load_dotenv()

def searh_naver_shopping(keyword):
    
    client_id = os.getenv("NAVER_CLIENT_ID")
    client_key = os.getenv("NAVER_CLIENT_KEY")
    
    encrypt_text = urllib.parse.quote(keyword)
    
    url = "https://openapi.naver.com/v1/search/shop?query="+ encrypt_text +"&display=20&exclude=used:rental"

    req_url = urllib.request.Request(url)
    
    req_url.add_header("X-Naver-Client-Id", client_id)
    req_url.add_header("X-Naver-Client-Secret", client_key)
    
    response = urllib.request.urlopen(req_url)
    resp_code = response.getcode()

    if resp_code == 200:
        shop_output = response.read().decode("utf-8")
    else:
        shop_output = "Error" + resp_code
    
    return shop_output



In [11]:
keyword_input = searh_naver_shopping("반팔티")
print(keyword_input)
print(type(keyword_input))

{
	"lastBuildDate":"Wed, 05 Jun 2024 17:01:00 +0900",
	"total":18687121,
	"start":1,
	"display":20,
	"items":[
		{
			"title":"남여공용 스투시 베이직 로고 <b>반팔티셔츠<\/b> BLACKWHITE -",
			"link":"https:\/\/search.shopping.naver.com\/gate.nhn?id=40655140276",
			"image":"https:\/\/shopping-phinf.pstatic.net\/main_4065514\/40655140276.20240526074654.jpg",
			"lprice":"39150",
			"hprice":"",
			"mallName":"네이버",
			"productId":"40655140276",
			"productType":"1",
			"brand":"스투시",
			"maker":"",
			"category1":"패션의류",
			"category2":"남성의류",
			"category3":"티셔츠",
			"category4":""
		},
		{
			"title":"지오다노 코튼 피케 폴로 <b>반팔 티셔츠<\/b> 013502",
			"link":"https:\/\/search.shopping.naver.com\/gate.nhn?id=46139137391",
			"image":"https:\/\/shopping-phinf.pstatic.net\/main_4613913\/46139137391.20240531124510.jpg",
			"lprice":"11050",
			"hprice":"",
			"mallName":"네이버",
			"productId":"46139137391",
			"productType":"1",
			"brand":"지오다노",
			"maker":"",
			"category1":"패션의류",
			"category2":"남성의류",
			"cate

In [16]:
import json
import pandas as pd

json_input = json.loads(keyword_input)
# print(json_input)
print(json.dumps(json_input))
# shop_review=pd.read_json(path_or_buf="", orient=json_input)
with open("naver_news_shopping.json", 'w', encoding="utf-8") as json_file:
    json.dump(json_input, json_file, ensure_ascii=False, sort_keys=True, indent="\t")

{"lastBuildDate": "Wed, 05 Jun 2024 17:01:00 +0900", "total": 18687121, "start": 1, "display": 20, "items": [{"title": "\ub0a8\uc5ec\uacf5\uc6a9 \uc2a4\ud22c\uc2dc \ubca0\uc774\uc9c1 \ub85c\uace0 <b>\ubc18\ud314\ud2f0\uc154\uce20</b> BLACKWHITE -", "link": "https://search.shopping.naver.com/gate.nhn?id=40655140276", "image": "https://shopping-phinf.pstatic.net/main_4065514/40655140276.20240526074654.jpg", "lprice": "39150", "hprice": "", "mallName": "\ub124\uc774\ubc84", "productId": "40655140276", "productType": "1", "brand": "\uc2a4\ud22c\uc2dc", "maker": "", "category1": "\ud328\uc158\uc758\ub958", "category2": "\ub0a8\uc131\uc758\ub958", "category3": "\ud2f0\uc154\uce20", "category4": ""}, {"title": "\uc9c0\uc624\ub2e4\ub178 \ucf54\ud2bc \ud53c\ucf00 \ud3f4\ub85c <b>\ubc18\ud314 \ud2f0\uc154\uce20</b> 013502", "link": "https://search.shopping.naver.com/gate.nhn?id=46139137391", "image": "https://shopping-phinf.pstatic.net/main_4613913/46139137391.20240531124510.jpg", "lprice": "110

In [17]:
print(json.dumps(json_input))

{"lastBuildDate": "Wed, 05 Jun 2024 17:01:00 +0900", "total": 18687121, "start": 1, "display": 20, "items": [{"title": "\ub0a8\uc5ec\uacf5\uc6a9 \uc2a4\ud22c\uc2dc \ubca0\uc774\uc9c1 \ub85c\uace0 <b>\ubc18\ud314\ud2f0\uc154\uce20</b> BLACKWHITE -", "link": "https://search.shopping.naver.com/gate.nhn?id=40655140276", "image": "https://shopping-phinf.pstatic.net/main_4065514/40655140276.20240526074654.jpg", "lprice": "39150", "hprice": "", "mallName": "\ub124\uc774\ubc84", "productId": "40655140276", "productType": "1", "brand": "\uc2a4\ud22c\uc2dc", "maker": "", "category1": "\ud328\uc158\uc758\ub958", "category2": "\ub0a8\uc131\uc758\ub958", "category3": "\ud2f0\uc154\uce20", "category4": ""}, {"title": "\uc9c0\uc624\ub2e4\ub178 \ucf54\ud2bc \ud53c\ucf00 \ud3f4\ub85c <b>\ubc18\ud314 \ud2f0\uc154\uce20</b> 013502", "link": "https://search.shopping.naver.com/gate.nhn?id=46139137391", "image": "https://shopping-phinf.pstatic.net/main_4613913/46139137391.20240531124510.jpg", "lprice": "110

In [18]:
print(json.dump(json_input))

TypeError: dump() missing 1 required positional argument: 'fp'