### 셀레니움 설치 및 드라이버 실행

In [None]:
# 셀레니움 설치
pip install selenium

# 설치 확인
pip show selenium

### Webdriver 실행하기

In [10]:
from selenium import webdriver
driver = webdriver.Chrome() # selenium 4.10
print("WebDriver 객체 :", type(driver))

WebDriver 객체 : <class 'selenium.webdriver.chrome.webdriver.WebDriver'>


### 구글 url 로 이동하기

In [11]:
driver.get('http://www.google.com')

### 구글 검색창에 "파이썬" 입력하기

In [4]:
from selenium.webdriver.common.by import By

# find_element( 선택 방식, 조건 ) : 요소를 찾아서 가져오는 함수
target = driver.find_element( By.CSS_SELECTOR, "[name='q']" )       # 구글 검색창
print('검색창 객체 : ', type(target))

# send_keys('입력값') : 입력값을 지정한 요소(target)
target.send_keys('파이썬')





검색창 객체 :  <class 'selenium.webdriver.remote.webelement.WebElement'>


## 구글 검색창에서 엔터 키 입력하기

In [5]:
from selenium.webdriver.common.keys import Keys

# target : 구글 검색창
target.send_keys( Keys.ENTER )

### 웹 드라이버 종료

In [6]:
driver.quit()

### 네이버 검색창에 "여름" 이라고 검색하기

In [15]:
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
import time
driver = webdriver.Chrome()

# url 이동
driver.get('http://www.naver.com')
time.sleep(2)       # 2초간 기다리기
# 검색창 선택
target = driver.find_element( By.CSS_SELECTOR, '#query' )       # 구글 검색창
# 검색어 "여름 " 입력
target.send_keys('여름')
# 엔터 키 입력
target.send_keys( Keys.ENTER )





### find_element() 함수 활용

In [1]:
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By


In [2]:
# 드라이버 실행
driver = webdriver.Chrome()
driver.get('http://www.naver.com')

In [None]:
# ID 선택
target = driver.find_element( By.ID, 'query' )

In [None]:
# class 선택
target = driver.find_element( By.CLASS_NAME, 'search_input' )

In [None]:
# CSS 선택자
target = driver.find_element( By.CSS_SELECTOR, '#query' )

In [None]:
# 태그 이름 선택
target = driver.find_element( By.TAG_NAME, 'title' )

In [None]:
# 선택한 요소에 키 입력
target.send_keys('키워드')

In [None]:
# 선택한 요소에 엔터 키
target.send_keys(Keys.ENTER)

### 버튼 클릭하기

In [3]:
target = driver.find_element( By.CSS_SELECTOR, '[class^="MyView-module__link_login"]' )
target.click()


# 페이징 처리된 데이터 크롤링하기 - 메가박스 영화 실관람평

In [None]:
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
import time

url = 'https://www.megabox.co.kr/movie-detail/comment?rpstMovieNo=23034900'
driver = webdriver.Chrome()
driver.get(url)

points = []
recommends = []
texts = []

# 1 페이지 정보
# extend() : 리스트에 다른 리스트의 모든 요소 추가
story_points = [p.text for p in driver.find_elements( By.CLASS_NAME, 'story-point' )]
points.extend(story_points)

story_recommends = [r.text for r in driver.find_elements( By.CLASS_NAME, 'story-recommend' )]
recommends.extend(story_recommends)

story_txts = [t.text for t in driver.find_elements( By.CLASS_NAME, 'story-txt' )]
texts.extend(story_txts)

print(points)
print(recommends)
print(texts)
print(len(points))
print(len(recommends))
print(len(texts))

# 2~20 페이지 정보 동적으로 크롤링하기
for page in range(2,21):
    
    if page % 10 == 1:      # 11, 21, 31, ...
        page_next = driver.find_element( By.CSS_SELECTOR, '.control.next' )
        page_next.click()
    else:
        page_next = driver.find_element( By.LINK_TEXT, str(page) )
        page_next.click()
       
    driver.implicitly_wait(3)       # 페이지 로딩 시, 최대 3초간 기다리고 바로 넘어감
    time.sleep(2)                   # 2초간 기다림
    
    # 관람평 정보 가져오기
    story_points = [p.text for p in driver.find_elements( By.CLASS_NAME, 'story-point' )]
    points.extend(story_points)

    story_recommends = [r.text for r in driver.find_elements( By.CLASS_NAME, 'story-recommend' )]
    recommends.extend(story_recommends)

    story_txts = [t.text for t in driver.find_elements( By.CLASS_NAME, 'story-txt' )]
    texts.extend(story_txts)


print(len(points))
print(len(recommends))
print(len(texts))


# 수집한 데이터를 csv 파일로 저장
with open('movie.csv', 'wt', encoding='utf-8') as f:
    f.write('평점,추천,관람평\n')
    for p, r, t in zip( points, recommends, texts ):
        f.write('{},{},{}'.format( p, r, t ) + '\n')


In [None]:
# a 태그의 텍스트로 요소를 선택
page_two = driver.find_element( By.LINK_TEXT, str(2) )
page_two.click()

### 무한 스크롤 페이지 크롤링 하기

In [2]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
import time

driver = webdriver.Chrome()
driver.get('http://map.naver.com')

driver.implicitly_wait(2)

# 검색창에 영등포 치킨"
target = driver.find_element(By.CSS_SELECTOR, ".input_search")

target.send_keys("영등포 치킨")
target.send_keys(Keys.ENTER)


# 프레임 변경하기
driver.switch_to.frame("searchIframe")   #iframe 태그의 id로 프레임 전환

while True:
    names = driver.find_elements( By.CSS_SELECTOR, ".place_bluelink")
    #addrs = driver.find_elements( By.CSS_SELECTOR, "")
    categories = driver.find_elements( By.CSS_SELECTOR, ".KCMnt")
    
    print(len(names))
    print(len(categories))
    
    if len(names) == 0:
        print('데이터가 없습니다…')
        break

    
    for i in range(len(names)):
        print('{},{}'.format(names[i].text, categories[i].text))
        
    print('————————————')
    
    # 스크롤 내리기
    selector = '#app-root > div > div.XUrfU > div.zRM9F > a:nth-child(7)'
    try:
        btn_next = driver.find_element(By.CSS_SELECTOR, selector)
    
    except:
        print('마지막 페이지 입니다…')
        break
    btn_next.click()
    time.sleep(3)

10
10
오븐마루치킨 병무청점,치킨,닭강정
교촌치킨 문래점,치킨,닭강정
양키통닭 본점,맥주,호프
농부와닭동네 여의도MBC점,치킨,닭강정
감계무량 당산본점,치킨,닭강정
이목구비,맥주,호프
양키통닭,치킨,닭강정
어거스트치킨 여의도점,치킨,닭강정
쥬크비어,맥주,호프
참나라숯불바베큐치킨통닭,치킨,닭강정
————————————
10
10
BBQ여의도역점,치킨,닭강정
옛날통닭,치킨,닭강정
당산별곡,요리주점
코펜호프,맥주,호프
가마호프,맥주,호프
꼬꼬야숯불뜨겁니,치킨,닭강정
아트몬스터 영등포점,맥주,호프
마늘치킨OB광장,치킨,닭강정
교촌치킨 당산점,치킨,닭강정
푸라닭 대방점,치킨,닭강정
————————————
10
10
선식당 문래점,스파게티,파스타전문
삼통치킨 영등포구청점,치킨,닭강정
BBQ치킨 영등포점,치킨,닭강정
BHC치킨 당산점,치킨,닭강정
청년치킨 당산점,치킨,닭강정
BHC치킨 문래점,치킨,닭강정
굽네치킨 문래점,치킨,닭강정
금별맥주 당산점,맥주,호프
네네치킨 여의도점,치킨,닭강정
펀비어킹 영등포 당산역점,맥주,호프
————————————
10
10
페리카나 신풍시장점,치킨,닭강정
치킨플러스 당산점,치킨,닭강정
잉치킨 양평역점,치킨,닭강정
BHC치킨 영등포공원점,치킨,닭강정
BHC치킨 양평역점,치킨,닭강정
치킨마루 신길점,치킨,닭강정
푸라닭 당산점,치킨,닭강정
온더보더 타임스퀘어점,멕시코,남미음식
교촌치킨 대림2호점,치킨,닭강정
치킨뱅이 신풍역점,치킨,닭강정
————————————
10
9
퍼스트플러스에이드,다이어트,샐러드
르프리크캐주얼 더현대서울,햄버거
바비큐보스 도림사거리점,치킨,닭강정
헤밀파스타,스파게티,파스타전문
알로하포케 IFC몰점,다이어트,샐러드
코지마,이자카야
아이엠바오 더현대 서울,햄버거
버거플리즈 BRGR PLZ,샌드위치
써브웨이 여의도화재보험점,인도음식


IndexError: list index out of range

### 자바스크립트를 이용하여 처리하기

In [3]:
driver.execute_script(' alert("js") ')

In [None]:
# yes24 리뷰 가져오기.

In [3]:
### 요소가 렌더링 될 때까지, 기다렸다가 처리하기
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
import time

url = 'https://www.yes24.com/Product/Goods/117014613'
driver = webdriver.Chrome()
driver.get(url)

temp_list = []
time.sleep(3)
stop_flag = False

while True:
    
    # 페이지 반복
    for n in range(4, 13):
        readmores = driver.find_elements( By.CSS_SELECTOR, '#infoset_reviewContentList .review_more' )
        for more in readmores:
            # more.click()
            # arguments[0] : more 요소를 가지고 arguments[0]로 첫번째 요소를 지정.
            driver.execute_script('arguments[0].click()', more)
            time.sleep(2)
        
        reviewList = driver.find_elements( By.CSS_SELECTOR, '#infoset_reviewContentList div.review_cont' )     # 리뷰 내용
        time.sleep(2)
        
        
        # 리뷰 내용 태그의 텍스트만 추출
        for review in reviewList:
            temp_list.append(review.text)
        
        
        if len(reviewList) < 5:
            stop_flag = True
        
        if stop_flag == True:
            break
        
        
        # 다음 페이지로 이동
        next_link = '#infoset_reviewContentList > div.review_sort.sortBot > div.review_sortLft > div > a:nth-child(' + str(n) +')'
        page = driver.find_element( By.CSS_SELECTOR, next_link )
        page.click()
        time.sleep(2)
        
        
        
        
        
        
        
        
        
        
        
        
        
        
        

NoSuchWindowException: Message: no such window: target window already closed
from unknown error: web view not found
  (Session info: chrome=114.0.5735.134)
Stacktrace:
Backtrace:
	GetHandleVerifier [0x00A1A813+48355]
	(No symbol) [0x009AC4B1]
	(No symbol) [0x008B5358]
	(No symbol) [0x0089D293]
	(No symbol) [0x008FE37B]
	(No symbol) [0x0090C473]
	(No symbol) [0x008FA536]
	(No symbol) [0x008D82DC]
	(No symbol) [0x008D93DD]
	GetHandleVerifier [0x00C7AABD+2539405]
	GetHandleVerifier [0x00CBA78F+2800735]
	GetHandleVerifier [0x00CB456C+2775612]
	GetHandleVerifier [0x00AA51E0+616112]
	(No symbol) [0x009B5F8C]
	(No symbol) [0x009B2328]
	(No symbol) [0x009B240B]
	(No symbol) [0x009A4FF7]
	BaseThreadInitThunk [0x754000C9+25]
	RtlGetAppContainerNamedObjectPath [0x774C7B4E+286]
	RtlGetAppContainerNamedObjectPath [0x774C7B1E+238]
