### 네이버 쇼핑 키워드 인사이트

#### 개인과제
- 키워드에 대한 검색량 데이터 수집
- 검색어에 대한 상품등록수 수집
- 수집한 데이터에 대한 인사이트 도출 : 예시) 경쟁률

#### 조별과제
- 스마트 스토어를 운영한다고 생각하고 경쟁력이 낮으면서 많은 수익을 낼수 있는 키워드와 상품 찾기
    - 예시외의 추가적인 페이지 데이터 수집하여 프로젝트 수행가능

#### 참고 서비스
- 신사임당 유투브 : https://youtu.be/Z0hL9khbpIw
- 응용 서비스 : https://whereispost.com/keyword, https://itemscout.io

#### 데이터 수집 프로세스
1. 네이버 검색광고 회원가입 및 로그인 : https://searchad.naver.com
2. 광고 시스템 > 도구 > API 사용관리
3. CUSTOMER_ID, API_KEY, SECRET_KEY 획득
4. 네이버 검색 광고 API 매뉴얼 사이트 참고 : http://naver.github.io/searchad-apidoc/#/guides
5. github 페이지 참고
    - https://github.com/naver/searchad-apidoc
    - https://github.com/naver/searchad-apidoc/blob/master/python-sample/examples/ad_management_sample.py
6. 키워드 입력하면 해당 키워드에 대한 데이터 수집

- hint
    - github 페이지의 코드에서 signaturehelper.py 파일을 이용하여 header를 만들어야 합니다.

In [1]:
import requests, json, time
import pandas as pd
import signaturehelper
import warnings
warnings.filterwarnings('ignore')

#### 1. 개별과제 : 키워드에 대한 검색량 데이터 수집

In [None]:
def keyword_master(keyword):
    pass

In [8]:
keyword = "실내자전거"
df = keyword_master(keyword)

In [9]:
df.head()

Unnamed: 0,relKeyword,monthlyPcQcCnt,monthlyMobileQcCnt,monthlyAvePcClkCnt,monthlyAveMobileClkCnt,monthlyAvePcCtr,monthlyAveMobileCtr,plAvgDepth,compIdx
0,실내자전거,18300,159100,117.7,2666.3,0.72,1.81,15,높음
1,온라인PT,580,1600,14.5,105.4,2.7,6.68,15,높음
2,하체운동기구,1070,7800,6.3,119.9,0.67,1.65,15,높음
3,스피닝자전거,2380,25000,13.9,369.1,0.63,1.57,15,높음
4,헬스자전거,1270,11500,17.8,322.3,1.54,3.06,15,높음


In [2]:
def get_header(method, uri, api_key, secret_key, customer_id):
    timestamp = str(round(time.time() * 1000))
    signature = signaturehelper.Signature.generate(timestamp, method, uri, SECRET_KEY)
    return {'Content-Type': 'application/json; charset=UTF-8', 'X-Timestamp': timestamp, 'X-API-KEY': API_KEY, 'X-Customer': str(CUSTOMER_ID), 'X-Signature': signature}


BASE_URL = 'https://api.naver.com'
API_KEY = '0100000000f659663a32ddcf2524608ca10d7f1f874f03f29318d2c5c8b891860602e7c555'
SECRET_KEY = 'AQAAAAD2WWY6Mt3PJSRgjKENfx+Hnj/2V/o/mVw3yzpALQMYaQ=='
CUSTOMER_ID = '2488388'


In [3]:
def keyword_master(keyword):
    uri = '/keywordstool'
    method = 'GET'
    r = requests.get(BASE_URL + uri+f'?hintKeywords={keyword}&showDetail=1',
                 headers=get_header(method, uri, API_KEY, SECRET_KEY, CUSTOMER_ID))
    return pd.DataFrame(r.json()['keywordList'])



In [46]:
keyword = "스틱커피"
df1 = keyword_master(keyword)

In [47]:
df1.head(40)

Unnamed: 0,relKeyword,monthlyPcQcCnt,monthlyMobileQcCnt,monthlyAvePcClkCnt,monthlyAveMobileClkCnt,monthlyAvePcCtr,monthlyAveMobileCtr,plAvgDepth,compIdx
0,스틱커피,700,2460,2.3,20.3,0.35,0.89,15,높음
1,천연카페인,60,200,0.6,2.3,1.15,1.32,13,중간
2,헤이즐넛커피,980,9220,2.9,100.3,0.32,1.19,15,높음
3,바륨,790,3070,1.2,2.0,0.17,0.07,9,중간
4,회사간식,1430,3000,26.7,54.5,2.16,2.13,15,높음


In [48]:
df1

Unnamed: 0,relKeyword,monthlyPcQcCnt,monthlyMobileQcCnt,monthlyAvePcClkCnt,monthlyAveMobileClkCnt,monthlyAvePcCtr,monthlyAveMobileCtr,plAvgDepth,compIdx
0,스틱커피,700,2460,2.3,20.3,0.35,0.89,15,높음
1,천연카페인,60,200,0.6,2.3,1.15,1.32,13,중간
2,헤이즐넛커피,980,9220,2.9,100.3,0.32,1.19,15,높음
3,바륨,790,3070,1.2,2.0,0.17,0.07,9,중간
4,회사간식,1430,3000,26.7,54.5,2.16,2.13,15,높음
...,...,...,...,...,...,...,...,...,...
439,맥심화이트골드160,110,450,0.1,2.3,0.14,0.57,15,높음
440,더치기계,20,120,0.2,0.0,0.91,0.00,15,높음
441,마이더치,180,1010,0.3,7.0,0.16,0.73,14,높음
442,더치커피기계,60,240,0.8,6.3,1.27,3.17,15,높음


#### 2. 개별과제 : 검색어에 대한 상품등록수 수집
- item_count : 등록된 상품수
- total_search_count : PC, Mobile 을 합친 검색량

In [13]:
def item_count(keyword):
    pass

In [22]:
result_df

Unnamed: 0,relKeyword,monthlyPcQcCnt,monthlyMobileQcCnt,item_count,total_search_count
0,실내자전거,18300,159100,245638,177400
1,온라인PT,580,1600,11983,2180
2,하체운동기구,1070,7800,56684,8870
3,스피닝자전거,2380,25000,60342,27380
4,헬스자전거,1270,11500,243545,12770
5,홈트,4500,19900,924110,24400
6,스쿼트머신,2230,17100,45269,19330
7,다리운동기구,360,4110,73169,4470
8,실내운동기구,1530,13300,341120,14830
9,실내사이클,3600,32500,140261,36100


In [28]:
from scrapy.http import TextResponse

In [49]:
keywords = []
keywords = df1['relKeyword']

In [50]:
#//*[@id="__next"]/div/div[2]/div[2]/div[4]/div[1]/div[1]/ul/li[1]/a/span[1]
# //*[@id="__next"]/div/div[2]/div/div[3]/div[1]/div[1]/ul/li[1]/a/span[1]
# //*[@id="__next"]/div/div[2]/div[2]/div[3]/div[1]/div[1]/ul/li[1]/a/span[1]




def item_count(keyword):
    total_count = []
    url = f'https://search.shopping.naver.com/search/all?query={keyword}'
    req = requests.get(url)
    response = TextResponse(req.url, body=req.text, encoding='utf-8')
    try:
        return int(response.xpath('//*[@id="__next"]/div/div[2]/div[2]/div[3]/div[1]/div[1]/ul/li[1]/a/span[1]/text()')[0].extract().replace(',', ''))
    except:
        return int(response.xpath('//*[@id="__next"]/div/div[2]/div/div[3]/div[1]/div[1]/ul/li[1]/a/span[1]/text()')[0].extract().replace(',', ''))
    

In [51]:
keywords[:50]

0             스틱커피
1            천연카페인
2           헤이즐넛커피
3               바륨
4             회사간식
5          캐모마일차효능
6             시트르산
7     L-카르니틴타르트레이트
8             버터커피
9             방탄커피
10           사무실간식
11          맥심커피믹스
12            더치커피
13            액상커피
14          디카페인커피
15             알커피
16           홈카페용품
17         에스프레소원액
18        키토제닉다이어트
19             음료수
20            음료도매
21          디카페인원두
22           항산화커피
23         카누아메리카노
24           커피박람회
25           베트남커피
26            콜드브루
27            커피티백
28           피로회복제
29           드립백커피
30              맥심
31           탕비실간식
32          캔음료수도매
33            커피메뉴
34          맥심모카골드
35          믹스커피추천
36        저탄고지다이어트
37          공정무역커피
38            당뇨커피
39       커피프렌차이즈순위
40        디카페인커피믹스
41            쟈뎅커피
42            커피맛집
43            맥심커피
44           캐모마일차
45             캔음료
46          콜드브루원액
47           에너지충전
48            드립커피
49          캐모마일효능
Name: relKeyword, dtype: object

In [54]:

total_count2 = []
for keyword in keywords:
    try:
        total_count2.append(item_count(keyword))
        print(keyword)
    except:
        total_count2.append(0)
        print(keyword+'1')
    
    

스틱커피
천연카페인
헤이즐넛커피
바륨
회사간식
캐모마일차효능
시트르산
L-카르니틴타르트레이트
버터커피
방탄커피
사무실간식
맥심커피믹스
더치커피
액상커피
디카페인커피
알커피
홈카페용품
에스프레소원액
키토제닉다이어트
음료수
음료도매
디카페인원두
항산화커피
카누아메리카노
커피박람회
베트남커피
콜드브루
커피티백
피로회복제
드립백커피
맥심
탕비실간식
캔음료수도매
커피메뉴
맥심모카골드
믹스커피추천
저탄고지다이어트
공정무역커피
당뇨커피
커피프렌차이즈순위
디카페인커피믹스
쟈뎅커피
커피맛집
맥심커피
캐모마일차
캔음료
콜드브루원액
에너지충전
드립커피
캐모마일효능
액상스틱커피
카누
과자도매
과자
사무실음료
업소용음료
커피종류
음료수도매
더치커피원액
아메리카노원액
과자몰
카모마일차
캐모마일티백
남성피로회복제
L카르니틴
루카스나인라떼
카모마일효능
커피원액
맛있는믹스커피추천
아이스큐브라떼
BULLETPROOFCOFFEE1
에스프레소액상
케톤다이어트
콜드부르
콜드블루만들기
콜드블루액상
더치커피만드는법
아메리카노콜드브루
업소용콜드브루
일회용더치커피
다니엘커피
더치커피기구제작
코드브루
아메리카노액상
커피백
커피선물세트
루왁커피
드립백포장박스
드립백커피추천
고급커피
커피세트
커피용품
커피패키지
커피필터
티백커피
핸드드립커피
핸드드립커피세트
헤즐넛커피
홈커피머신
커피드리퍼세트
커피드립백
아메리카노
맥심커피믹스400
콜드프레소
베트남연유커피
일회용커피
아이스콜드브루
커피스틱
페르네
프렌치카페
프렌치카페믹스
핫쵸코
헤즐럿커피
복음자리유자차
블루베리아이스티
아라비카100
아이스커피믹스
아이스티복숭아
오뚜기생강차
자판기믹스
카누100
카누아이스
네스카페믹스
네스카페커피
단호박마차
담터단호박마차
도라지생강차
루카스나인바닐라라떼
린저21
맥스웰마일드
맥심모카믹스
맥심믹스
맥심아이스커피믹스
모카아라비카
루카스나인
루카스나인더블샷라떼
루카스9
프렌치카페커피믹스
콜드브루파우치
맛있는더치커피
빼자커피
LOOKAS9
커피대통령
더치커피맛집
커피액상
더치큐브
콜드브루가격
크리머
목초버터
BULLETPROOF
액상에

In [55]:
total_count2

[147442,
 925,
 69232,
 1361,
 60329,
 634,
 1179,
 912,
 13146,
 8408,
 160950,
 188346,
 106894,
 34345,
 80794,
 67477,
 755960,
 3287,
 1453,
 471648,
 79129,
 34274,
 948,
 34192,
 179,
 33176,
 103058,
 77224,
 18054,
 73059,
 229173,
 23771,
 9349,
 14081,
 57485,
 645160,
 2404,
 3696,
 481,
 629,
 26226,
 31024,
 3162,
 212168,
 75345,
 420186,
 17786,
 36577,
 983569,
 673,
 2531,
 240422,
 17518,
 5416472,
 106698,
 219793,
 9894514,
 33082,
 20966,
 1081,
 125609,
 75345,
 45465,
 3961,
 23865,
 15933,
 673,
 27613,
 16953,
 242,
 0,
 7234,
 1598,
 494,
 12411,
 17421,
 37,
 4010,
 899,
 803,
 1384,
 8963,
 64,
 6714,
 203235,
 145536,
 4937,
 273,
 73060,
 144222,
 1107010,
 4847710,
 16991,
 424768,
 77224,
 395101,
 105890,
 7492,
 6445,
 45413,
 73060,
 240583,
 2244,
 118,
 2045,
 154555,
 13117,
 147456,
 455,
 21547,
 14546,
 69387,
 70015,
 2434,
 1306,
 22665,
 12109,
 41003,
 4183,
 16368,
 22981,
 2172,
 36729,
 64270,
 5552,
 5040,
 12975,
 3012,
 371,
 9895,
 6

In [56]:
columns = [ 'monthlyAvePcClkCnt', 'monthlyAveMobileClkCnt', 'monthlyAvePcCtr',
       'monthlyAveMobileCtr', 'plAvgDepth', 'compIdx']

In [57]:
result_df = df1.drop(columns, axis=1)
result_df.insert(3, 'item_count',total_count2)
result_df['monthlyPcQcCnt'] = result_df['monthlyPcQcCnt'].replace('< ', '', regex=True)
result_df['monthlyMobileQcCnt'] = result_df['monthlyMobileQcCnt'].replace('< ', '', regex=True)
result_df['monthlyPcQcCnt']=result_df['monthlyPcQcCnt'].astype(int)
result_df['monthlyMobileQcCnt'] =result_df['monthlyMobileQcCnt'].astype(int)
result_df['total_search_count'] = (result_df['monthlyPcQcCnt']+result_df['monthlyMobileQcCnt']).astype(int)
result_df

Unnamed: 0,relKeyword,monthlyPcQcCnt,monthlyMobileQcCnt,item_count,total_search_count
0,스틱커피,700,2460,147442,3160
1,천연카페인,60,200,925,260
2,헤이즐넛커피,980,9220,69232,10200
3,바륨,790,3070,1361,3860
4,회사간식,1430,3000,60329,4430
...,...,...,...,...,...
439,맥심화이트골드160,110,450,342,560
440,더치기계,20,120,3232,140
441,마이더치,180,1010,1295,1190
442,더치커피기계,60,240,2467,300


#### 3. 개별과제 : 경쟁률
- 아이템수/검색수 : 높을수록 경쟁이 심한 상품 키워드
- 수집된 데이터에서 추가로 얻을수 있는 인사이트 추가
    - 논리적인 인사이트이면 인사이트 수준에 대한 평가는 하지 않음

In [30]:
# 딥다라인, 실내자전거렌탈의 키워드가 경쟁령이 낮다.
result_df

Unnamed: 0,relKeyword,monthlyPcQcCnt,monthlyMobileQcCnt,item_count,total_search_count,competition_rate
0,딥다라인,370,3550,50,3920,0.012755
1,실내자전거렌탈,100,790,581,890,0.652809
2,실내자전거,18300,159100,245638,177400,1.384656
3,스핀바이크,2240,10400,22938,12640,1.814715
4,스피닝자전거,2380,25000,60342,27380,2.203871
5,스쿼트머신,2230,17100,45269,19330,2.341904
6,밸런스보드,5710,30200,105822,35910,2.946867
7,실내사이클,3600,32500,140261,36100,3.885346
8,온라인PT,580,1600,11983,2180,5.496789
9,하체운동기구,1070,7800,56684,8870,6.39053


In [58]:
result_df['competition_rate'] = result_df['item_count']/result_df['total_search_count']
result_df.sort_values('competition_rate').head(50)

Unnamed: 0,relKeyword,monthlyPcQcCnt,monthlyMobileQcCnt,item_count,total_search_count,competition_rate
247,부산양도양수,100,550,0,650,0.0
70,BULLETPROOFCOFFEE,10,30,0,40,0.0
215,바른선달밤라떼,10,10,0,20,0.0
400,남자체지방률,2130,18200,73,20330,0.003591
154,간헐적단식효과,330,2640,12,2970,0.00404
248,간헐적단식,8100,76100,1410,84200,0.016746
49,캐모마일효능,2650,25600,673,28250,0.023823
235,방탄커피만들기,260,3720,105,3980,0.026382
66,카모마일효능,1430,17200,673,18630,0.036125
361,간헐적단식커피,640,3410,154,4050,0.038025


In [196]:
# 렉스파스핀엑스의 경쟁력이 낮기 때문에 해당 키워드로 진입하면 위험부담이 적다

#### 4. 조별과제 : 스마트 스토어를 운영한다고 생각하고 경쟁력이 낮으면서 많은 수익을 낼수 있는 키워드 찾기
- 정답이 있는것은 아닙니다
- 여러가지 가정과 데이터를 수집, 분석하여 판매할 상품과 키워드를 선정해 보시면 됩니다.
- 앞서 2일간 했던 프로젝트와 같은 방법으로 수행하시면 됩니다.

### 평가기준

#### 개인평가(70)

    - 기본 문제 해결(30)
        - 데이터 수집 방법 : 10점
            - 최적의 수집 방법을 사용했는지 확인
        - 수집된 데이터의 결과 : 20점
            - 1번: 키워드에 대한 검색량 데이터 수집 : 15점
            - 2번: 검색어에 대한 상품등록수 수집 : 5점
            
    - 적절한 주석 및 설명(10)
        - 코드의 가독성 및 코드의 설명 : 10점
        
    - 코드 오류(10)
        - 발생 오류마다 : -2점
        
    - 추가 분석(20)
        - 인사이트 도출
            - 경쟁률 데이터 출력 : 10점
            - 추가 인사이트 : 10점
            
#### 조별평가(30)
    
    - 비지니스 인사이트 도출(5)
        - 스마트 스토어 운영자 입장에서의 추가 인사이트 도출
        - 예시) 선정한 상품으로 소호몰에서 1위 하였을경우 예상되는 매출
        - 인사이트 도출을 위한 프로세스
        
    - 실습문제의 분석(5)
        - 제출 자료가 잘 정리되고 판매 상품과 키워드를 논리적으로 잘 선정
        - 상품과 키워드 선정 자동화 > 가독성 좋은 키워드와 상품 선정 프로세스
        
    - 실습문제의 적절한 정리(20)
        - 프로젝트 주제(상품과 키워드 선정)에 맞는 논리적 인사이트가 있는지 확인
        - 프로젝트 수행 후 추후 과제 및 느낀점