# 11. 페이지 로딩 시간을 기다린 후, 크롤링하기

- 몇몇 페이지의 경우, 페이지 로딩 지연이 발생(ex. 여러 요청이 병합하여 페이지 결과를 생성하는 경우)하여 태그를 못 읽어오는 경우가 발생할 수 있다.
- 이 때, 아래의 코드를 이용하여 해결 가능하다.
  - e.g.) 10초 내에 해당 tag를 찾으면 반환, 그렇지 않으면 timeout 발생
- 참고 링크 : [http://selenium-python.readthedocs.io/waits.html](http://selenium-python.readthedocs.io/waits.html)

<br>

## 11.1 `WebDriverWait()` 메서드

- 명시적인 페이지 로드 대기에 사용
- 주로 다음 코드와 같이 사용됨

```python
try:
    element = WebDriverWait(driver, 몇초).until(
        # By.ID : ID로 검색
        # By.CSS_SELECTOR : CSS Selector로 검색
        EC.presence_of_element_located((By.ID, "cMain"))
    )
except TimeoutException:
    print("타임아웃")
finally:
    driver.quit()
```

<br>

## 11.2 검색 지원 방법

- `from selenium.webdriver.common.by import By`

- `By.ID`
  - 태그에 있는 ID로 검색

- `By.CSS_SELECTOR`
  - CSS Selector로 검색

- `By.NAME`
  - 태그에 있는 `name`으로 검색

- `By.TAG_NAME`
  - 태그 이름으로 검색

<br>

## 11.3 실습

In [1]:
import warnings
warnings.filterwarnings('ignore')

In [2]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

phantomjsDriver = "E:/shkim/pythonRepository/Crawling/phantomjs/phantomjs-2.1.1-windows/bin/phantomjs.exe"
driver = webdriver.PhantomJS(phantomjsDriver)

driver.get('http://v.media.daum.net/v/20170202180355822')

try:
    # id가 cMain인 tag를 10초 내에 검색
    # 그렇지 않으면 timeoutException 발생
    element = WebDriverWait(driver, 10).until(
        EC.presence_of_element_located((By.ID, "cMain"))
    )
    
    print(element.text)
except TimeoutException:
    print("해당 페이지에 cMain 을 ID 로 가진 태그가 존재하지 않거나, 해당 페이지가 10초 안에 열리지 않았습니다.")
finally:
    driver.quit()

[김익현의 미디어 읽기] '마이너리티 리포트'와 AI
(지디넷코리아=김익현 기자)한 때 ‘마이너리티 리포트’란 영화가 인기를 끈 적 있다. 최첨단 치안시스템을 통해 범죄를 미리 예측한 뒤 특수 경찰을 보내 미래의 범죄자들을 체포하는 얘기다.
하지만 그 영화를 보면서 “그럴듯하다”고 생각했던 사람은 거의 없었다. ‘무서운 미래’이긴 했지만 ‘있음직한 미래상’은 아니었단 얘기다.
최근 인공지능(AI)이 포커 시합에서 최고수 프로 선수를 꺾었단 소식을 접하면서 ‘마이너리티 리포트’가 황당한 얘기만은 아닐 수도 있다는 생각을 하게 됐다.
일단 팩트부터 챙겨보자.
프로 포커 선수 네 명을 꺾은 화제의 주인공은 리브라투스(Libratus)란 AI 프로그램이다. 미국 카네기멜론대학 연구팀이 개발한 이 프로그램은 지난 달 11일부터 30일까지 20일 동안 계속된 포커 대결에서 승리했다.
자세한 얘기는 생략한다. 궁금한 분은 지디넷코리아에 게재된 기사를 확인해보시라.
■ 바둑과는 또 다른 포커 정복
이번 결과에 대해 카네기멜론대학 뿐 아니라 세계 주요 외신들도 흥분을 감추지 못하고 있다.
당연히 궁금증이 제기되지 않을 수 없다. 이미 AI는 퀴즈쇼, 체스에 이어 난공불락의 영역이라 일컬어지던 바둑까지 정복했기 때문이다.
세계 최강 이세돌 9단에 이어 중국의 커제 9단까지 알파고에 완패한 마당에 포커 시합에서 진 게 뭐 그리 대단한 일이냐고 생각할 수도 있다.
하지만 포커와 바둑은 조금 다르다.
물론 바둑 경기에서 고려해야 할 수는 무한 대에 가깝다. 한 수를 둘 때 가능한 수가 250개 정도에 이른다.한 경기에 150수 이상 둔다고 가정하면 '250의 150승’이란 경우의 수가 만들어진다. 이게 유기적으로 연결돼야 한다. 중간에 수 하나만 삐끗해도 시합을 망치게 된다.
인공지능 프로그램 리브라투스와 프로 포커 선수들의 시합 장면. (사진=카네기멜론대학)
그 동안 ‘바둑은 인간의 영역’이라고 했던 건 인공지능은 직관적으로 문제를 해결하긴 쉽지 않을 것으로 생각했기 때문이다.
이