## 데이터 확인
쇼핑하우 페이지로 이동해서 가져오려는 데이터를 확인합니다.
**실행하는 시점에 따라 HOTDEAL로 제공하는 상품은 변경될 수 있습니다.**
- https://shoppinghow.kakao.com/siso/p/hotdeal/list/

<img src="image/00.png" width="350" height="250" />

메인 페이지 주소는 그대로인데 표현되는 데이터가 변경된다는 것은 웹 서버와 데이터를 여러 번에 걸쳐 주고 받는 다는 것을 예측할 수 있습니다. 실제로 다음 코드를 실행해 보면 핫딜 URL로 요청한 HTML에서 "질슈트어트"라는 데이터를 찾을 수 없습니다. 

In [1]:
import requests

url = "https://shoppinghow.kakao.com/siso/p/hotdeal/list/"
resp = requests.get(url)

print("질슈트어트" in resp.text)

False


## 데이터 분석
크롬 개발자 도구를 실행하고 새로고침 (F5)을 눌러 페이지를 다시 로딩합니다. 주고 받은 요청과 응답에 "질슈트어트"라는 값이 들어 있는 항목을 검색합니다. shoppinghow.kakao.com/siso/p/api/hotdeal/list?contentseq=&_=1588650320893 이라는 요청에 원하는 데이터가 포함된 것을 확인할 수 있습니다. 

<img src="image/01.png" width="400" height="250" />

    검색된 항목의 요청을 파이썬으로 표현하면 Response Tab에 있는 다음 딕셔너리 형태의 문자열 (JSON)을 얻을 수 있겠죠?

<img src="image/02.png" width="400" height="250" />

## 데이터 요청
크롬 개발자 도구에서 분석한 요청사항을 파이썬으로 표현합니다. 얻어온 데이터에 "질슈트어트"가 포함된 것을 알 수 있습니다.

In [3]:
import requests

url = "https://shoppinghow.kakao.com/siso/p/api/hotdeal/list?contentseq=&_=1588650320893"
resp = requests.get(url)

print("질슈트어트" in resp.text)

True


## 데이터 파싱
서버가 반환하는 데이터가 HTML이 아니라 JSON(딕셔너리 형태의 문자열)입니다. 따라서 BeautifulSoup 모듈을 사용할 필요 없이 Response 객체의 json() 메서드로 딕셔너리 변환합니다. 

In [4]:
result = resp.json()
print(result)

{'todayList': [{'contentseq': 1636494, 'imageUrl': '//shop2.daumcdn.net/shophow/c/image/content/set/ad8255/20200429153534087_708022', 'maxPrice': '59000', 'minPrice': '15000', 'discount': '75', 'title': '[질슈트어트 스포츠] 점퍼/티셔츠 리얼 1만원~', 'linkUrl': 'http://ammonia.daum.net/cptclick?contentseq=1636494&puid=77835244711543186&pagenum=1&impprodnum=24&contentnum=1&positionseq=41604&detailpositionseq=41591', 'shopId': 'halfclub', 'shopName': '하프클럽', 'onlyToday': 'onlytodayY'}], 'hotdealList': [{'contentseq': 1634575, 'imageUrl': '//shop1.daumcdn.net/shophow/c/image/content/set/ad8255/20200428104139063_74756', 'maxPrice': '47000', 'minPrice': '32900', 'title': '급 꽉낀 청바지! 살빼고싶어? 삼시3끼 ~7천원', 'linkUrl': 'http://ammonia.daum.net/cptclick?contentseq=1634575&puid=77835244711543186&pagenum=1&impprodnum=0&contentnum=1&positionseq=41604&detailpositionseq=41591', 'shopId': 'weightwinner', 'shopName': '날신완성'}, {'contentseq': 1634141, 'imageUrl': '//shop2.daumcdn.net/shophow/c/image/content/set/ad8255/2020040

반복문으로 데이터를 하나씩 출력하면 다음과 같습니다. 

In [5]:
for item in result['todayList']:
    print(item['title'], item['minPrice'])

[질슈트어트 스포츠] 점퍼/티셔츠 리얼 1만원~ 15000


실시간 HotDeal을 체크하는 코드는 다음과 같습니다. while문을 사용하면 계속해서 가격을 조회 합니다. 예제 코드에서는 5번만 가격을 조회합니다. 

In [6]:
import requests
import time

# while 문을 사용하면 무한히 대기 함
# while True:

# 5번 만 반복 조회
for i in range(5):
    url = "https://shoppinghow.kakao.com/siso/p/api/hotdeal/list?contentseq=&_=1588650320893"
    resp = requests.get(url)
    
    # 첫 번째 Deal만 가져옴
    item = result['todayList'][0]
    print(item['title'], item['minPrice'])
    
    # 3초 Delay
    time.sleep(3)    

[질슈트어트 스포츠] 점퍼/티셔츠 리얼 1만원~ 15000
[질슈트어트 스포츠] 점퍼/티셔츠 리얼 1만원~ 15000
[질슈트어트 스포츠] 점퍼/티셔츠 리얼 1만원~ 15000
[질슈트어트 스포츠] 점퍼/티셔츠 리얼 1만원~ 15000
[질슈트어트 스포츠] 점퍼/티셔츠 리얼 1만원~ 15000


품목이 변경될 경우에만 알림을 보내고 싶다면 다음과 같이 코드를 수정하면 됩니다. 핵심은 이전 값을 변수(prev_item)에 저장하고 현재 스크래핑한 값과 비교하는 코드입니다.

In [7]:
import requests
import time

prev_item = None

# 5번 만 반복 조회
for i in range(5):
    url = "https://shoppinghow.kakao.com/siso/p/api/hotdeal/list?contentseq=&_=1588650320893"
    resp = requests.get(url)
    
    # 첫 번째 Deal만 가져옴
    item = result['todayList'][0]
    
    # 이전 값과 비교해서 다를 경우 값을 출력함
    # - 이전 값이 없다면 prev_item = None
    if (prev_item is None) or prev_item != item['title']:
        prev_item = item['title']
        print(item['title'], item['minPrice'])    
    
    # 3초 Delay
    time.sleep(3)    

[질슈트어트 스포츠] 점퍼/티셔츠 리얼 1만원~ 15000
