# 파이썬 웹 크롤링 & 텍스트 분석

## 5. 브라우저 자동화(splinter)
- 페이지 방문하기
- 요소 찾기
- 입력
- 마우스 동작
- 링크 찾기
- 브라우저 속성 가져오기

In [1]:
from splinter import Browser

In [2]:
browser = Browser("chrome")

In [None]:
browser.visit("https://google.com")

### 페이지 방문하기
- ```visit()``` 함수를 활용하여 원하는 웹 페이지에 방문할 수 있다.
- 함수의 인자값으로 URL 주소를 string 타입으로 입력해 준다.

In [7]:
# 다음 영화 메인 페이지 방문하기
browser = Browser("chrome")
browser.visit("https://movie.daum.net/")

### 요소 찾기(finding elements)
- Splinter는 웹 페이지의 요소를 찾을 수 있는 6가지 방식을 제공한다.
- 아래 여섯 가지 함수는 조건을 충족하는 요소를 모두 찾아 리스트로 반환한다.
    - ```find_by_id()```는 최대 하나의 요소만 찾을 수 있다. 그 이유는?
```python
browser.find_by_css() 
browser.find_by_xpath()
browser.find_by_tag()
browser.find_by_text()
browser.find_by_id()
browser.find_by_value()
```

In [15]:
search = browser.find_by_name("searchText")
print(search)

[<splinter.driver.webdriver.WebDriverElement object at 0x000002335474D780>]


### 입력(input)
- ```fill()``` 함수를 활용하면 키보드로 내용을 입력하듯이 원하는 문자열/숫자를 창에 입력할 수 있다.
```python
browser.fill(name, value)
```

In [14]:
browser.fill("searchText", "라라랜드")

### 마우스 동작(mouse interaction)
- 아래 함수를 활용하면 마우스 동작을 구현할 수 있다
```python
mouse_over()
mouse_out()
click()
double_click()
right_click()
drag_and_drop()
```

In [17]:
# "검색하기" 버튼 클릭
button = browser.find_by_text("검색하기")
button.click()

In [18]:
# 라라랜드 영화 메인 페이지로 클릭해서 들어간다
browser.find_by_id("contents_result").find_by_tag("a").click()

### 링크 찾기("a")
- 링크는 HTML 요소 중에 "a" 태그와 "href" 속성을 가진 요소로, 클릭하면 다른 페이지나 화면으로 이동을 유도한다.
- Splinter에서 링크를 찾는 함수는 아래와 같다.
```python
browser.find_link_by_text()
browser.find_link_by_partial_text()
browser.find_link_by_href()
browser.find_link_by_partial_href()
```

In [19]:
# 평점 화면으로 넘어가기
browser.find_link_by_partial_href("/moviedb/grade?movieId=").click()

### 브라우저의 속성 가져오기
- 브라우저의 속성을 아래와 같이 가져올 수 있다.
```python
browser.title
browser.html
browser.url
```

In [20]:
url = browser.url
print(url)

http://movie.daum.net/moviedb/grade?movieId=95306


In [21]:
# 페이지 순서대로 넘기기
no_pages = 5
i = 1

while i < no_pages:
    browser.find_link_by_href("grade?movieId=95306&type=netizen&page={}".format(i+1)).click()
    i +=1

### 실습 5-1. 영어 사전 크롤링하기 (1)
- 영어 사전 페이지에 접속해 단어 "orange"를 검색한 결과의 첫 번째 의미(meaning)을 출력한다.
- URL: ```http://www.dictionary.com```

In [7]:
## Your answer

'a globose, reddish-yellow, bitter or sweet, edible citrus fruit. '

### 실습 5-2. 영어 사전 크롤링하기 (2)
- 영어 사전 페이지에 접속해 단어 "orange"를 검색한 결과의 모든 의미(meaning)를 텍스트 파일(5-2.txt)에 저장해 본다.
- URL: ```http://www.dictionary.com```

In [12]:
## Your answer

### 실습 5-3. 영어 사전 크롤링하기 (3)
- 영어 사전 페이지에 접속해 단어 "orange"를 검색한 결과에서 **[Word Origin]** 버튼을 클릭해 "Origin of orange"가 화면에 나오도록 해본다.
- URL: ```http://www.dictionary.com```

In [9]:
## Your answer