# 12. 웹사이트 자동 조작하기

## 12.1 `element` 제어 관련 주요 이벤트 함수

- `element.click()` : element 클릭
- `element.double_click()` : element 더블 클릭
- `element.send_keys()` : element 키보드 입력 전송
- `element.move_to_element()` : element로 마우스 이동

In [2]:
import warnings
warnings.filterwarnings('ignore')

In [3]:
from selenium import webdriver
from selenium.webdriver.remote.webelement import WebElement
from selenium.webdriver.common.keys import Keys
from selenium.webdriver import ActionChains

phantomjsDriver = "E:/shkim/pythonRepository/Crawling/phantomjs/phantomjs-2.1.1-windows/bin/phantomjs.exe"
driver = webdriver.PhantomJS(phantomjsDriver)

driver.get('http://pythonscraping.com/pages/files/form.html')

firstnameField = driver.find_element_by_name('firstname')
lastnameField = driver.find_element_by_name('lastname')
submitButton = driver.find_element_by_id('submit')

firstnameField.send_keys("Doky")
lastnameField.send_keys("Kim")
submitButton.click()

print(driver.find_element_by_tag_name('body').text)

driver.close()

Hello there, Doky Kim!


<br>

## 12.2 `ActionChains()`

- 행동 여러 개를 체인으로 묶어서 저장하고 원하는 만큼 실행
- `perform()` 메서드 실행 시 전체 행동을 실행함

In [4]:
from selenium import webdriver
from selenium.webdriver.remote.webelement import WebElement
from selenium.webdriver.common.keys import Keys
from selenium.webdriver import ActionChains

phantomjsDriver = "E:/shkim/pythonRepository/Crawling/phantomjs/phantomjs-2.1.1-windows/bin/phantomjs.exe"
driver = webdriver.PhantomJS(phantomjsDriver)

driver.get('http://pythonscraping.com/pages/files/form.html')

firstnameField = driver.find_element_by_name('firstname')
lastnameField = driver.find_element_by_name('lastname')
submitButton = driver.find_element_by_id('submit')

actions = ActionChains(driver).click(firstnameField).send_keys("Doky").click(lastnameField).send_keys("Kim").send_keys(Keys.RETURN)
actions.perform()

print(driver.find_element_by_tag_name('body').text)

driver.close()

Hello there, Doky Kim!


<br>

## 12.3 연습 문제

- 다음 코드를 기반으로, 코드를 추가하여 해당 다음 뉴스 댓글을 모두 출력하는 프로그램 작성

In [46]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import TimeoutException

chromedriver = "E:/shkim/pythonRepository/Crawling/webdriver/chromedriver_win32/chromedriver.exe"
driver = webdriver.Chrome(chromedriver)

driver.get("http://v.media.daum.net/v/20170922175202762")
print(driver.current_url)

comment_list = []
author_list = []

try:
    # 댓글 영역 div 태그 로딩 대기
    element = WebDriverWait(driver, 10).until(
        EC.presence_of_element_located((By.ID, "alex-area"))
    )
    
    more_button = driver.find_element_by_css_selector("div.alex_more") # 댓글 더보기 버튼
    cmt_list_cnt = 0 # 클릭 전 댓글 개수 저장 변수
    
    loop = True
    while loop:
        try:
            # 댓글 p 태그 로딩 대기
            element = WebDriverWait(driver, 2).until(
                EC.presence_of_element_located((By.CSS_SELECTOR, "ul p.desc_txt"))
            )
            
            # 더보기 버튼 클릭
            webdriver.ActionChains(driver).move_to_element(more_button).click(more_button).perform()
            
            # 클릭 후 댓글 개수
            temp_cnt = len(driver.find_elements_by_css_selector("ul p.desc_txt"))
            
            print(cmt_list_cnt, "->", temp_cnt)
            
            if temp_cnt == cmt_list_cnt: # 클릭 후 댓글 개수 == 클릭 전 댓글 개수 -> 모든 댓글 로딩 완료
                loop = False
            elif temp_cnt > cmt_list_cnt: # 클릭 후 댓글 개수 > 클릭 전 댓글 개수 -> 추가 로딩 필요
                cmt_list_cnt = temp_cnt
            
        except:
            print("Comments Loading Error")
            loop = False
            
    cmt_list = driver.find_elements_by_css_selector("ul p.desc_txt") # 댓글
    atr_list = driver.find_elements_by_css_selector("ul a.link_nick") # 댓글 작성자
    
    for cmt, atr in zip(cmt_list, atr_list):
        comment_list.append(cmt.text.strip())
        author_list.append(atr.text.strip())
        
finally:
    driver.quit()

https://news.v.daum.net/v/20170922175202762
0 -> 3
3 -> 13
13 -> 23
23 -> 33
33 -> 43
43 -> 53
53 -> 63
63 -> 73
73 -> 83
83 -> 93
93 -> 103
103 -> 113
113 -> 121
121 -> 121


In [49]:
import pandas as pd

df = pd.DataFrame({"Author": author_list, "Comment": comment_list})
df.head()

Unnamed: 0,Author,Comment
0,야호,언제나 언론은 삼성편들면서\n아이폰을 깎아내리지만\n얼마후 외신발 기사는\n항상 아...
1,Cond,호주에서 아이폰8 첫 구매자는 올해 20세인 대학생 메이전 코로우치 씨였다. 그는 ...
2,blackofwhite,아이폰은 아니지만 아이폰이 있었기에 인터넷도하고 좋은 스마트폰 잘 쓰고있음.
3,BKY,8년째 기우제 지내는 기레기들\n\n나중에 진짜로 아이폰 인기 시들해지면 아주 광분...
4,카페지기,삼상꺼는 안산다\n\n국민연금 건드린 새끼들꺼\n\n사는놈들이 더 나빠


In [50]:
df.tail()

Unnamed: 0,Author,Comment
116,오뎃,딱봐 100명 넘어보인데\n그립질
117,카일,조만간 샤오미한테 추월 ㅋㅋ
118,주바람,4에서끝난듯해처음부터애플쓰기시작해서\n지금6s인대.......갈수록디자인구려짐 성능...
119,레오,아이폰을 8년 써보았다. 테더링 잘 않되고 스마트tv와 미러링도 않된다. 노트8이...
120,yoyogaga,올해는 삼성이 대박이다...\n\n주식많이 사라..\n\n지난주 알제리간다고 터키 ...
