# 인턴 교육 2주차 과제: 네이버 OPEN API를 통한 웹 크롤링
- 과제 기한: 6월 14일까지

**세부과제**
1. 네이버 OPEN API 이용
    - 검색어에 대한 20개의 상품을 찾는다.
    - 중고, 렌탈은 제외한다.

2. Pandas를 이용한 데이터프레임 저장
    - 출력된 각 key들의 의미에 대해 이해한다.
    - (column: 상품id, 상품명, 제조사, 최저가, 이미지링크, 구매링크)을 가진 데이터프레임을 만든다.(변수명은 자유)
    - csv로 저장한다.

3. Python 코드로 함수 작성
    - 키워드(검색어)만 입력하면 바로 저장될 수 있도록 함수를 만든다.
        - 키워드를 입력하면 API를 이용해 데이터를 받고 이를 데이터프레임에 저장을 한뒤 자동으로 저장될 수 있게 한다.

**목표**

업무 자동화 시스템을 만들면서 OPEN API에 대한 이해와 데이터 저장에 대한 스킬을 높인다.

**팁**

1. [네이버 OPEN API에 대한 가이드](https://developers.naver.com/docs/common/openapiguide/)

2. [Pandas API reference](https://pandas.pydata.org/docs/reference/index.html)

3. [Python Documentation](https://docs.python.org/ko/3/library/urllib.html)

4. [Python json module Documentation](https://docs.python.org/3/library/json.html#)


1. API데이터를 함수를 통해 받는 코드 작성

In [1]:
import os
import urllib.parse
import urllib.request

from dotenv import load_dotenv

load_dotenv()

def searh_naver_shopping(keyword):
    
    client_id = os.getenv("NAVER_CLIENT_ID")
    client_key = os.getenv("NAVER_CLIENT_KEY")
    
    encrypt_text = urllib.parse.quote(keyword)
    
    url = "https://openapi.naver.com/v1/search/shop?query="+ encrypt_text +"&display=20&exclude=used:rental"

    req_url = urllib.request.Request(url)
    
    req_url.add_header("X-Naver-Client-Id", client_id)
    req_url.add_header("X-Naver-Client-Secret", client_key)
    
    response = urllib.request.urlopen(req_url)
    resp_code = response.getcode()

    if resp_code == 200:
        shop_output = response.read().decode("utf-8")
    else:
        shop_output = "Error" + resp_code
    
    return shop_output



In [2]:
keyword_input = searh_naver_shopping("반팔티")
print(keyword_input)
print(type(keyword_input))

{
	"lastBuildDate":"Sun, 09 Jun 2024 20:33:03 +0900",
	"total":18972729,
	"start":1,
	"display":20,
	"items":[
		{
			"title":"남여공용 스투시 베이직 로고 <b>반팔티셔츠<\/b> BLACKWHITE -",
			"link":"https:\/\/search.shopping.naver.com\/catalog\/40655140276",
			"image":"https:\/\/shopping-phinf.pstatic.net\/main_4065514\/40655140276.20240526074654.jpg",
			"lprice":"38770",
			"hprice":"",
			"mallName":"네이버",
			"productId":"40655140276",
			"productType":"1",
			"brand":"스투시",
			"maker":"",
			"category1":"패션의류",
			"category2":"남성의류",
			"category3":"티셔츠",
			"category4":""
		},
		{
			"title":"무지티 남자 <b>반팔티<\/b> 17수 32수 오버핏 빅사이즈",
			"link":"https:\/\/smartstore.naver.com\/main\/products\/8156962354",
			"image":"https:\/\/shopping-phinf.pstatic.net\/main_8570146\/85701462677.3.jpg",
			"lprice":"5900",
			"hprice":"",
			"mallName":"FLEX SHOP 플렉스샵",
			"productId":"85701462677",
			"productType":"2",
			"brand":"프린트스타",
			"maker":"프린트스타",
			"category1":"패션의류",
			"category2":"남성의류",
			"catego

In [3]:
import json
import pandas as pd

json_input = json.loads(keyword_input)
# print(json_input)
print(json.dumps(json_input))
# shop_review=pd.read_json(path_or_buf="", orient=json_input)
with open("naver_shopping.json", 'w', encoding="utf-8") as json_file:
    json.dump(json_input, json_file, ensure_ascii=False, sort_keys=True, indent="\t")

{"lastBuildDate": "Sun, 09 Jun 2024 20:33:03 +0900", "total": 18972729, "start": 1, "display": 20, "items": [{"title": "\ub0a8\uc5ec\uacf5\uc6a9 \uc2a4\ud22c\uc2dc \ubca0\uc774\uc9c1 \ub85c\uace0 <b>\ubc18\ud314\ud2f0\uc154\uce20</b> BLACKWHITE -", "link": "https://search.shopping.naver.com/catalog/40655140276", "image": "https://shopping-phinf.pstatic.net/main_4065514/40655140276.20240526074654.jpg", "lprice": "38770", "hprice": "", "mallName": "\ub124\uc774\ubc84", "productId": "40655140276", "productType": "1", "brand": "\uc2a4\ud22c\uc2dc", "maker": "", "category1": "\ud328\uc158\uc758\ub958", "category2": "\ub0a8\uc131\uc758\ub958", "category3": "\ud2f0\uc154\uce20", "category4": ""}, {"title": "\ubb34\uc9c0\ud2f0 \ub0a8\uc790 <b>\ubc18\ud314\ud2f0</b> 17\uc218 32\uc218 \uc624\ubc84\ud54f \ube45\uc0ac\uc774\uc988", "link": "https://smartstore.naver.com/main/products/8156962354", "image": "https://shopping-phinf.pstatic.net/main_8570146/85701462677.3.jpg", "lprice": "5900", "hprice

In [4]:
print(json.dumps(json_input))

{"lastBuildDate": "Sun, 09 Jun 2024 20:33:03 +0900", "total": 18972729, "start": 1, "display": 20, "items": [{"title": "\ub0a8\uc5ec\uacf5\uc6a9 \uc2a4\ud22c\uc2dc \ubca0\uc774\uc9c1 \ub85c\uace0 <b>\ubc18\ud314\ud2f0\uc154\uce20</b> BLACKWHITE -", "link": "https://search.shopping.naver.com/catalog/40655140276", "image": "https://shopping-phinf.pstatic.net/main_4065514/40655140276.20240526074654.jpg", "lprice": "38770", "hprice": "", "mallName": "\ub124\uc774\ubc84", "productId": "40655140276", "productType": "1", "brand": "\uc2a4\ud22c\uc2dc", "maker": "", "category1": "\ud328\uc158\uc758\ub958", "category2": "\ub0a8\uc131\uc758\ub958", "category3": "\ud2f0\uc154\uce20", "category4": ""}, {"title": "\ubb34\uc9c0\ud2f0 \ub0a8\uc790 <b>\ubc18\ud314\ud2f0</b> 17\uc218 32\uc218 \uc624\ubc84\ud54f \ube45\uc0ac\uc774\uc988", "link": "https://smartstore.naver.com/main/products/8156962354", "image": "https://shopping-phinf.pstatic.net/main_8570146/85701462677.3.jpg", "lprice": "5900", "hprice

[Pandas.read_json에 대한 설명](https://pandas.pydata.org/docs/reference/api/pandas.read_json.html)

In [5]:
import pandas as pd

In [6]:
# naver_news_shopping.json의 경로를 설정해준다.
df = pd.read_json('naver_shopping.json')
df

Unnamed: 0,display,items,lastBuildDate,start,total
0,20,"{'brand': '스투시', 'category1': '패션의류', 'categor...","Sun, 09 Jun 2024 20:33:03 +0900",1,18972729
1,20,"{'brand': '프린트스타', 'category1': '패션의류', 'categ...","Sun, 09 Jun 2024 20:33:03 +0900",1,18972729
2,20,"{'brand': '지오다노', 'category1': '패션의류', 'catego...","Sun, 09 Jun 2024 20:33:03 +0900",1,18972729
3,20,"{'brand': '', 'category1': '패션의류', 'category2'...","Sun, 09 Jun 2024 20:33:03 +0900",1,18972729
4,20,"{'brand': '프린트스타', 'category1': '패션의류', 'categ...","Sun, 09 Jun 2024 20:33:03 +0900",1,18972729
5,20,"{'brand': '라코스테', 'category1': '패션의류', 'catego...","Sun, 09 Jun 2024 20:33:03 +0900",1,18972729
6,20,"{'brand': '라코스테', 'category1': '패션의류', 'catego...","Sun, 09 Jun 2024 20:33:03 +0900",1,18972729
7,20,"{'brand': '', 'category1': '패션의류', 'category2'...","Sun, 09 Jun 2024 20:33:03 +0900",1,18972729
8,20,"{'brand': '메종키츠네', 'category1': '패션의류', 'categ...","Sun, 09 Jun 2024 20:33:03 +0900",1,18972729
9,20,"{'brand': '타미힐피거', 'category1': '패션의류', 'categ...","Sun, 09 Jun 2024 20:33:03 +0900",1,18972729


- 문제 발생! item 항목에 brand category등 분류가 안되게 들어갔음.
- Parsing을 해줘야하는데 어떻게 해야하는지 감이 안잡힘...\
- `rename`을 써줘야하나 일단 columns들을 영어변수로 바꿔서 편리하게 해보자


- column: 상품id, 상품명, 제조사, 최저가, 이미지링크, 구매링크
- df.columns = ["product_id","product_name","brand_name","low_price","img_link","buy_link"]
- columns 갯수를 넘어가므로 일단 만들어두고 JSON file의 key value 부분을 columns로 쓰는 방법에 대해서 고민을 해보자.
- 1. rename에 대한 방법
- 2. set_axis에 대한 방법  [set_axis](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.set_axis.html)
- 3. pivot_table에 대한 방법 - item열에 있는 것을 columns로 바꾼다는 아이디어 [Pivot_table](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.pivot_table.html#pandas.DataFrame.pivot_table)

In [14]:
# shopping_review = df["items"].pivot_table(columns="productId","title","brand","lprice","image","link")

- concat에 대해서 찾아보다가 to_frame()함수에 대해서 찾음 [concat/to_frame()](https://pandas.pydata.org/docs/reference/api/pandas.concat.html)

In [None]:
# to_frame()
item_reviews = df["items"].to_frame()

Unnamed: 0,items
0,"{'brand': '스투시', 'category1': '패션의류', 'categor..."
1,"{'brand': '지오다노', 'category1': '패션의류', 'catego..."
2,"{'brand': '프린트스타', 'category1': '패션의류', 'categ..."
3,"{'brand': '타미힐피거', 'category1': '패션의류', 'categ..."
4,"{'brand': '프린트스타', 'category1': '패션의류', 'categ..."
5,"{'brand': '', 'category1': '패션의류', 'category2'..."
6,"{'brand': '아디다스', 'category1': '패션의류', 'catego..."
7,"{'brand': '라코스테', 'category1': '패션의류', 'catego..."
8,"{'brand': '산토초이', 'category1': '패션의류', 'catego..."
9,"{'brand': '메종키츠네', 'category1': '패션의류', 'categ..."


[json_normalize 문서](https://pandas.pydata.org/docs/reference/api/pandas.json_normalize.html#pandas-json-normalize)

In [16]:
# 문제 해결
# json_normalize() 함수를 써야함.
from pandas import json_normalize

shopping_info = json_normalize(json_input["items"])
shopping_info

Unnamed: 0,title,link,image,lprice,hprice,mallName,productId,productType,brand,maker,category1,category2,category3,category4
0,남여공용 스투시 베이직 로고 <b>반팔티셔츠</b> BLACKWHITE -,https://search.shopping.naver.com/catalog/4065...,https://shopping-phinf.pstatic.net/main_406551...,38770,,네이버,40655140276,1,스투시,,패션의류,남성의류,티셔츠,
1,무지티 남자 <b>반팔티</b> 17수 32수 오버핏 빅사이즈,https://smartstore.naver.com/main/products/815...,https://shopping-phinf.pstatic.net/main_857014...,5900,,FLEX SHOP 플렉스샵,85701462677,2,프린트스타,프린트스타,패션의류,남성의류,티셔츠,
2,지오다노 코튼 피케 폴로 <b>반팔 티셔츠</b> 013502,https://search.shopping.naver.com/catalog/4613...,https://shopping-phinf.pstatic.net/main_461391...,11700,,네이버,46139137391,1,지오다노,,패션의류,남성의류,티셔츠,
3,<b>반팔티</b> 무지티 남자 여름 기본 면 이너 라운드 빅사이즈 단체티,https://smartstore.naver.com/main/products/892...,https://shopping-phinf.pstatic.net/main_864724...,4890,,로파제,86472451126,2,,,패션의류,남성의류,티셔츠,
4,남자 <b>반팔티</b> 무지 티셔츠 17수 32수,https://smartstore.naver.com/main/products/707...,https://shopping-phinf.pstatic.net/main_846189...,5900,,후리찌,84618944775,2,프린트스타,프린트스타,패션의류,남성의류,티셔츠,
5,라코스테 남성 슬림핏 카라 <b>반팔 티셔츠</b> PH4012,https://search.shopping.naver.com/catalog/3898...,https://shopping-phinf.pstatic.net/main_389889...,43600,,네이버,38988916962,1,라코스테,라코스테,패션의류,남성의류,티셔츠,
6,라코스테 <b>반팔티</b> 크루넥 베이직 라운드 여름 티셔츠,https://smartstore.naver.com/main/products/955...,https://shopping-phinf.pstatic.net/main_870997...,34900,,퀵스마트 스토어,87099744126,2,라코스테,라코스테,패션의류,남성의류,티셔츠,
7,기능성 <b>반팔</b> 쿨<b>티셔츠</b> 남자 무지 쿨론 헬스 냉감 쿨링 운동...,https://smartstore.naver.com/main/products/628...,https://shopping-phinf.pstatic.net/main_838251...,5500,,FLEX SHOP 플렉스샵,83825153567,2,,,패션의류,남성의류,티셔츠,
8,메종키츠네 <b>반팔티</b> 카라티 더블 폭스헤드 칠랙스 핸드라이팅,https://smartstore.naver.com/main/products/488...,https://shopping-phinf.pstatic.net/main_824259...,91000,,브랜드리퍼블릭,82425930806,2,메종키츠네,메종키츠네,패션의류,남성의류,티셔츠,
9,타미힐피거 커플 여름 PK <b>반팔</b> 카라티,https://search.shopping.naver.com/catalog/4718...,https://shopping-phinf.pstatic.net/main_471817...,29580,,네이버,47181793552,1,타미힐피거,,패션의류,남성의류,티셔츠,
