## 쇼핑 상품 리뷰 수집

- 네이버 쇼핑(https://shopping.naver.com/) 페이지를 탐색합니다.
  - 검색창에 관심 키워드를 입력하고 브랜드 카탈로그를 클릭합니다.(예: 스탠바이미)
  - 주소창에서 상품코드를 확인합니다.(예: 29938164618)
  - 웹 페이지 중간에 쇼핑몰리뷰 버튼을 클릭합니다.
  - 크롬 개발자도구를 열고 네트워크 탭에서 문서로 이동합니다.
  - 삭제 버튼을 클릭하고 웹 페이지를 새로고침합니다.
  - '숫자'로 시작하는 리소스를 클릭하고 미리보기에서 수집하려는 텍스트를 찾습니다.
  - 헤더로 이동하여 HTTP 요청 방식과 요청 URL을 확인합니다.

### HTTP 요청 실행

In [None]:
# 관련 라이브러리를 호출합니다.
import requests

In [None]:
# 상품코드를 설정합니다.(스탠바이미)
prod = '29938164618'

In [None]:
# 요청 URL을 설정합니다.
url = f'https://search.shopping.naver.com/catalog/{prod}'

In [None]:
# HTTP 요청을 실행합니다.
res = requests.get(url = url)

### HTTP 응답 확인

In [None]:
# HTTP 응답 상태코드를 확인합니다.
res.status_code

In [None]:
# HTTP 응답 헤더에서 Content-Type을 확인합니다.
res.headers['content-type']

In [None]:
# HTTP 응답 바디 문자열을 출력합니다.
res.text

In [None]:
# HTTP 요청 URL을 출력합니다.
res.url

### HTML로 변환

In [None]:
# 관련 라이브러리를 호출합니다.
from bs4 import BeautifulSoup as bts

In [None]:
# HTTP 응답 바디 문자열을 bs4.BeautifulSoup 자료형으로 변환합니다.
soup = bts(markup = res.text, features = 'html.parser')

In [None]:
# soup을 출력합니다.
soup

In [None]:
# soup의 클래스를 확인합니다.
type(soup)

### 고객의 상품 리뷰 수집

In [None]:
# 상품 리뷰를 포함하는 CSS selector를 변수에 할당합니다.
css = 'p.reviewItems_text__XrSSf'

In [None]:
# HTML 요소를 선택하고 items에 할당합니다.
items = soup.select(selector = css)

In [None]:
# items를 출력합니다.
items

In [None]:
# items의 각 원소에서 상품 리뷰를 추출합니다.
[item.text for item in items]

### 데이터프레임 생성

In [None]:
# 사용자 모듈과 관련 라이브러리를 호출합니다.
import myFuncs as mf
import pandas as pd

In [None]:
# 고객의 상품 별점과 리뷰를 수집하고 데이터프레임 df에 할당합니다.
star = mf.getHtmlText(x = soup, css = 'span.reviewItems_average__0kLWX')
text = mf.getHtmlText(x = soup, css = 'p.reviewItems_text__XrSSf')
df = pd.DataFrame(data = {'별점': star, '리뷰': text})

In [None]:
# df의 처음 5행을 출력합니다.
df.head()

### 작업 경로 확인 및 변경

In [None]:
# 관련 라이브러리를 호출합니다.
import os

In [None]:
# 현재 작업 경로를 확인합니다.
os.getcwd()

In [None]:
# 현재 작업 경로와 형제 폴더명이 없으면 새로 만듭니다.
folder_path = '../data'
if not os.path.exists(path = folder_path):
    os.mkdir(path = folder_path)

### xlsx 파일로 저장

In [None]:
# data 폴더로 작업 경로를 변경합니다.
os.chdir(path = folder_path)

In [None]:
# xlsx 파일로 저장합니다.
df.to_excel(excel_writer = 'Shopping_Review.xlsx', index = None)

In [None]:
# 현재 작업 경로에 있는 폴더명과 파일명을 출력합니다.
os.listdir()

## End of Document