#### 3.1 정적 웹사이트와 동적 웹사이트

- HTML 내용이 고정된 정적 웹 사이트, HTML 문서가 완전하게 응답된다.
- HTML 내용이 변하는 동적 웹 사이트, 렌더링이 될 때까지의 지연시간이 존재한다.


1. 동적 웹 사이트의 동작 방식
    - javascript 언어가 비동기 처리를 통해 필요한 데이터를 채움
    - 동기 처리: 요청에 따른 응답을 기다림
    - 비동기 처리: 요청에 따른 응답을 기다리지 않음
    - 따라서 비동기 처리의 경우 데이터가 온전하지 않을 수 있다, request는 이의 경우를 처리하기 어려움
    


2. 해결법?
    - 임의로 시간을 지연한 후, 데이처 처리가 끝난뒤 정보를 가져옴
    - 키보드 입력, 마우스 클릭 등의 이벤트를 어떻게 처리할까? > 파이썬으로 조작해보자!(selenium)

#### 3.2 브라우저 자동화, selenium

In [6]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager

## 드라이버 객체 만들기(크롬 브라우저 생성)
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))
driver.get('https://www.example.com')
print(driver.page_source)

<html><head>
    <title>Example Domain</title>

    <meta charset="utf-8">
    <meta http-equiv="Content-type" content="text/html; charset=utf-8">
    <meta name="viewport" content="width=device-width, initial-scale=1">
    <style type="text/css">
    body {
        background-color: #f0f0f2;
        margin: 0;
        padding: 0;
        font-family: -apple-system, system-ui, BlinkMacSystemFont, "Segoe UI", "Open Sans", "Helvetica Neue", Helvetica, Arial, sans-serif;
        
    }
    div {
        width: 600px;
        margin: 5em auto;
        padding: 2em;
        background-color: #fdfdff;
        border-radius: 0.5em;
        box-shadow: 2px 3px 7px 2px rgba(0,0,0,0.02);
    }
    a:link, a:visited {
        color: #38488f;
        text-decoration: none;
    }
    @media (max-width: 700px) {
        div {
            margin: 0 auto;
            width: auto;
        }
    }
    </style>    
</head>

<body>
<div>
    <h1>Example Domain</h1>
    <p>This domain is for use in illustr

In [2]:
## 명령 종료 후 창 닫게 하기
with webdriver.Chrome(service=Service(ChromeDriverManager().install())) as driver:
    driver.get('https://www.example.com')

In [10]:
## drive에서 특정 요소 추출

# by import
from selenium.webdriver.common.by import By

# P 태그 해당하는 요소 찾기
with webdriver.Chrome(service=Service(ChromeDriverManager().install())) as driver:
    driver.get('https://www.example.com')
    print(driver.find_element(By.TAG_NAME, 'p').text) # 여러개를 찾기 위해서는 find_elements


This domain is for use in illustrative examples in documents. You may use this domain in literature without prior coordination or asking for permission.


#### 3.3 wait and call

1. wait
    - implicit wait: 로딩이 될 때까지 지정한 시간 동안 대기
    - Explicit wait: 특정 요소에 대한 제약
    

1.1 xpath?
 - 스크래핑을 방지할 목적으로 클래스 이름을 랜덤으로 생성해  놓은것
 - 위치를 활용한 방법으로 스크래핑 가능

In [12]:
## 개발자 도구 > 해당 태그 > 복사 > xpath
url = '//*[@id="__next"]/div/main/div[2]/div/div[4]/div[1]/div[1]/div/a/div[2]/p[1]'
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))

driver.get('https://indistreet.com/live?sortOption=startDate%3AASC')

# 비동기 방식이기 때문에 오류 발생
driver.find_element(By.XPATH, url)

implict wait

In [17]:
with webdriver.Chrome(service=Service(ChromeDriverManager().install())) as driver:
    driver.get('https://indistreet.com/live?sortOption=startDate%3AASC')

    driver.implicitly_wait(10)
    
    print(driver.find_element(By.XPATH, url))
    

<selenium.webdriver.remote.webelement.WebElement (session="3ffd528d010cf64af7f5d70601b01c34", element="FFD9C3088134D72DDE29C53571820887_element_214")>


explicit wait

In [18]:
# until(): 인자의 조건이 만족될 때까지
# until_not(): 인자의 조건이 만족되지 않을 때까지
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import WebDriverWait

with webdriver.Chrome(service=Service(ChromeDriverManager().install())) as driver:
    driver.get('https://indistreet.com/live?sortOption=startDate%3AASC')

    element = WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.XPATH, url)))
    
    print(element.text)

Knock Live Rock band


In [22]:
# 여러 개의 공연 제목 가져오기
with webdriver.Chrome(service=Service(ChromeDriverManager().install())) as driver:       
    driver.get('https://indistreet.com/live?sortOption=startDate%3AASC')
    driver.implicitly_wait(10)
    for i in range(1, 6):
        url =  f'//*[@id="__next"]/div/main/div[2]/div/div[4]/div[1]/div{[i]}/div/a/div[2]/p[1]'
        print(driver.find_element(By.XPATH, url))

<selenium.webdriver.remote.webelement.WebElement (session="7501b51b003cbafa0012123f940db5e4", element="66ECE532E635B9A3DB40C6EFA03ABC16_element_9")>
<selenium.webdriver.remote.webelement.WebElement (session="7501b51b003cbafa0012123f940db5e4", element="66ECE532E635B9A3DB40C6EFA03ABC16_element_211")>
<selenium.webdriver.remote.webelement.WebElement (session="7501b51b003cbafa0012123f940db5e4", element="66ECE532E635B9A3DB40C6EFA03ABC16_element_212")>
<selenium.webdriver.remote.webelement.WebElement (session="7501b51b003cbafa0012123f940db5e4", element="66ECE532E635B9A3DB40C6EFA03ABC16_element_214")>
<selenium.webdriver.remote.webelement.WebElement (session="7501b51b003cbafa0012123f940db5e4", element="66ECE532E635B9A3DB40C6EFA03ABC16_element_215")>


#### 3.4 마우스 이벤트 처리

1. 입력하고자 하는 요소 탐색
2. 입력하고자 하는 내용 click으로 전달
3. .perform()을 통해 수행

In [23]:
# 라이브러리 불러오기 
from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By
from webdriver_manager.chrome import ChromeDriver

In [27]:
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))
driver.get('https://qna.programmers.co.kr')
driver.implicitly_wait(0.5)

button = driver.find_element(By.XPATH, '//*[@id="main-app-gnb-header"]/div/div/div[1]/div/div[2]/div/div/div[1]/span[1]/a[1]')
ActionChains(driver).click(button).perform()

#### 3.5 키보드 이벤트 처리

In [29]:
import time
driver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))
driver.get('https://qna.programmers.co.kr')
driver.implicitly_wait(0.5)

button = driver.find_element(By.XPATH, '//*[@id="main-app-gnb-header"]/div/div/div[1]/div/div[2]/div/div/div[1]/span[1]/a[1]')
ActionChains(driver).click(button).perform()

# 아이디, input 요소에 아이디 버튼 적용
id_input = driver.find_element(By.XPATH, '//*[@id="main-app-account"]/div/div[2]/div/div[2]/div[1]/div/div[2]/div[2]/input')
ActionChains(driver).send_keys_to_element(id_input, '내아이디').perform()
time.sleep(1)
# 패스워드에 비밀번호 입력
password_input = driver.find_element(By.XPATH, '//*[@id="main-app-account"]/div/div[2]/div/div[2]/div[1]/div/div[2]/div[4]/input')
ActionChains(driver).send_keys_to_element(password_input, 12345678)
time.sleep(1)
# 로그인 버튼 누르기
login = driver.find_element(By.XPATH ,'//*[@id="main-app-account"]/div/div[2]/div/div[2]/div[1]/div/div[2]/button')
ActionChains(driver).click(login).perform()