In [5]:
import os
from time import sleep

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.common.exceptions import NoSuchElementException
from selenium.common.exceptions import ElementNotInteractableException
from selenium.common.exceptions import StaleElementReferenceException
from bs4 import BeautifulSoup

##############################################################  ############
##################### variable related selenium ##########################
##########################################################################
options = webdriver.ChromeOptions()
options.add_argument('headless')
options.add_argument('lang=ko_KR')

driver = webdriver.Chrome('../webdriver/chromedriver')
# chromedriver_path = "chromedriver"
# driver = webdriver.Chrome(os.path.join(os.getcwd(), chromedriver_path), options=options)  # chromedriver 열기


def main():
    global driver, load_wb, review_num

    driver.implicitly_wait(4)  # 렌더링 될때까지 기다린다 4초
    driver.get('https://map.kakao.com/')  # 주소 가져오기

    # 검색할 목록
    place_infos = ['맛집']

    for i, place in enumerate(place_infos):
        # delay
        if i % 4 == 0 and i != 0:
            sleep(5)
        print("#####", i)
        search(place)

    driver.quit()
    print("finish")


def search(place):
    global driver

    search_area = driver.find_element_by_xpath('//*[@id="search.keyword.query"]')  # 검색 창
    search_area.send_keys(place)  # 검색어 입력
    driver.find_element_by_xpath('//*[@id="search.keyword.submit"]').send_keys(Keys.ENTER)  # Enter로 검색
    sleep(1)

    # 검색된 정보가 있는 경우에만 탐색
    # 1번 페이지 place list 읽기
    html = driver.page_source

    soup = BeautifulSoup(html, 'html.parser')
    place_lists = soup.select('.placelist > .PlaceItem') # 검색된 장소 목록

    # 검색된 첫 페이지 장소 목록 크롤링하기
    crawling(place, place_lists)
    search_area.clear()

    # 우선 더보기 클릭해서 2페이지
    try:
        driver.find_element_by_xpath('//*[@id="info.search.place.more"]').send_keys(Keys.ENTER)
        sleep(1)

        # 2~ 5페이지 읽기
        for i in range(2, 6):
            # 페이지 넘기기
            xPath = '//*[@id="info.search.page.no' + str(i) + '"]'
            driver.find_element_by_xpath(xPath).send_keys(Keys.ENTER)
            sleep(1)

            html = driver.page_source
            soup = BeautifulSoup(html, 'html.parser')
            place_lists = soup.select('.placelist > .PlaceItem') # 장소 목록 list

            crawling(place, place_lists)

    except ElementNotInteractableException:
        print('not found')
    finally:
        search_area.clear()


def crawling(place, place_lists):
    """
    페이지 목록을 받아서 크롤링 하는 함수
    :param place: 리뷰 정보 찾을 장소이름
    """

    while_flag = False
    for i, place in enumerate(place_lists):
        # 광고에 따라서 index 조정해야함
        #if i >= 3:
         #   i += 1

        place_name = place.select('.head_item > .tit_name > .link_name')[0].text  # place name
        place_address = place.select('.info_item > .addr > p')[0].text  # place address

        detail_page_xpath = '//*[@id="info.search.place.list"]/li[' + str(i + 1) + ']/div[5]/div[4]/a[1]'
        driver.find_element_by_xpath(detail_page_xpath).send_keys(Keys.ENTER)
        driver.switch_to.window(driver.window_handles[-1])  # 상세정보 탭으로 변환
        sleep(1)

        print('####', place_name)

        # 첫 페이지
        extract_review(place_name)

        # 2-5 페이지
        idx = 3
        try:
            page_num = len(driver.find_elements_by_class_name('link_page')) # 페이지 수 찾기
            for i in range(page_num-1):
                # css selector를 이용해 페이지 버튼 누르기
                driver.find_element_by_css_selector('#mArticle > div.cont_evaluation > div.evaluation_review > div > a:nth-child(' + str(idx) +')').send_keys(Keys.ENTER)
                sleep(1)
                extract_review(place_name)
                idx += 1
            driver.find_element_by_link_text('다음').send_keys(Keys.ENTER) # 5페이지가 넘는 경우 다음 버튼 누르기
            sleep(1)
            extract_review(place_name) # 리뷰 추출
        except (NoSuchElementException, ElementNotInteractableException):
            print("no review in crawling")

        # 그 이후 페이지
        while True:
            idx = 4
            try:
                page_num = len(driver.find_elements_by_class_name('link_page'))
                for i in range(page_num-1):
                    driver.find_element_by_css_selector('#mArticle > div.cont_evaluation > div.evaluation_review > div > a:nth-child(' + str(idx) +')').send_keys(Keys.ENTER)
                    sleep(1)
                    extract_review(place_name)
                    idx += 1
                driver.find_element_by_link_text('다음').send_keys(Keys.ENTER) # 10페이지 이상으로 넘어가기 위한 다음 버튼 클릭
                sleep(1)
                extract_review(place_name) # 리뷰 추출
            except (NoSuchElementException, ElementNotInteractableException):
                print("no review in crawling")
                break

        driver.close()
        driver.switch_to.window(driver.window_handles[0])  # 검색 탭으로 전환


def extract_review(place_name):
    global driver

    ret = True

    html = driver.page_source
    soup = BeautifulSoup(html, 'html.parser')

    # 첫 페이지 리뷰 목록 찾기
    review_lists = soup.select('.list_evaluation > li')

    # 리뷰가 있는 경우
    if len(review_lists) != 0:
        for i, review in enumerate(review_lists):
            comment = review.select('.txt_comment > span') # 리뷰
            rating = review.select('.grade_star > em') # 별점
            val = ''
            if len(comment) != 0:
                if len(rating) != 0:
                    val = comment[0].text + '/' + rating[0].text.replace('점', '')
                else:
                    val = comment[0].text + '/0'
                print(val)

    else:
        print('no review in extract')
        ret = False

    return ret


if __name__ == "__main__":
    main()



##### 0
#### 조연탄
헉 가게가 좀 부산스럽고 종업원분들이 극 인싸이싱거같아요 그거랑 별개로 맛은 정말 좋습니다/5
어엄청 친절하셔유! 맛있어여 또 갈거예요/5
/5
찐맛집/5
내 최애 고기집/5
말모... 존맛/5
/5
육즙에 향긋한 고기.  소주와 맥주를 다른 온도에서 얼려 살얼음 만들어 망치로 팡팡 두들겨 주시는 술, 맬젓에 비빈 밥, 냉면, 만두, 묵은지 베이스 국물의 김치, 고기 소스 조합까지 완벽그자체 다 최고예요 /5
고기가 저의 스타일이 아니였어여 나머지 메뉴는 맛있었어여 비냉.솥밥 다괜찮았어여 술을부르는안주가많았어여/2
저는 그냥 쏘쏘하네요 ^^~/2
맞은편 2호점에 사장님인지 점원인지 손님와도 쳐다도 안보고 해서 둘이라고 했는대 무시하고 자기일해서 다른직원한테 저기앉으면되냐니까 본점가라고 하는데 아 웨이팅해야 되요?하니까 가보면 안다면서 엄청바쁜것도 아닌데 기본적인 친절은 없네요 핸드폰 충전되냐니까 일단 나가고 앉으면 다시말하래요 ㅋㅋㅋ 본점이란데는 웨이팅하는사람 추위에 떨고있는데 난로 꺼져있고 방문자.../1
원래 오랜기간 목동 원조소금구이집 다니다가 하도 사람이 많길래 궁금해서 와보니 와보길 잘했다싶게 맛좋고 곁드림 소스와 찬들이 제대로 써포트해주네./4
1점도 아까움/1
너무 맛있어요 비계가 좀 많긴 하지만 그래도/5
가격에 비해 양은 적지만 고기가 맛있고 사이드가 뭐 하나 빠지지 않고 맛있어요! 고기도 잘라줘서 편하게 (직접 먹여줄 때도 있어 낯 가리면 부담될 수도) 먹을 수 있고 일하시는 분들 분위기가 유쾌합니다. 고기보다 사이드가 더더 맛있음!!/4
고기 맛있어요. 요즘엔 자주 못가는데 또 가고 싶음/5
웨이팅 할 정도로 맛있어요 소스와 반찬들과 전반적인 조화도 너무 좋구요! 돼지 껍질에 털이 보이는 미스정도? 소주를 얼음보틀에 담아주는 세심함까지 최고였어요! 그런데 맛이 좋음에도 바쁜시간대에 갔더니 직원분들이 엄청 뿔이나 있더라구요 웨이팅까지 해가며서 맛있게 먹으러 갔는데 직원분들 기분 좋은지 아닌지 주문하는거 무시(?)

NoSuchElementException: Message: no such element: Unable to locate element: {"method":"xpath","selector":"//*[@id="info.search.place.list"]/li[4]/div[5]/div[4]/a[1]"}
  (Session info: chrome=92.0.4515.131)
Stacktrace:
Backtrace:
	Ordinal0 [0x01263733+2504499]
	Ordinal0 [0x011FC401+2081793]
	Ordinal0 [0x01102628+1058344]
	Ordinal0 [0x0112CEBB+1232571]
	Ordinal0 [0x011568F2+1403122]
	Ordinal0 [0x01145EBA+1334970]
	Ordinal0 [0x01154CDB+1395931]
	Ordinal0 [0x01145D4B+1334603]
	Ordinal0 [0x011222B4+1188532]
	Ordinal0 [0x01123149+1192265]
	GetHandleVerifier [0x013DFB8C+1512252]
	GetHandleVerifier [0x0148B0DF+2214031]
	GetHandleVerifier [0x012E4BC3+484211]
	GetHandleVerifier [0x012E3E69+480793]
	Ordinal0 [0x0120218D+2105741]
	Ordinal0 [0x012066E8+2123496]
	Ordinal0 [0x01206827+2123815]
	Ordinal0 [0x0120FB73+2161523]
	BaseThreadInitThunk [0x7643FA29+25]
	RtlGetAppContainerNamedObjectPath [0x77C67A7E+286]
	RtlGetAppContainerNamedObjectPath [0x77C67A4E+238]
