### 기본 함수
 * 참조 URL : https://selenium-python.readthedocs.io/locating-elements.html
 * 하나의 정보를 가져오는 함수
    * find_**element**_by_[id/name/xpath..]
 * 여러개의 정보를 가져오는 함수
    * find_**elements**_by_[id/name/xpath..]

```
find_element_by_id
find_element_by_name
find_element_by_xpath
find_element_by_link_text
find_element_by_partial_link_text
find_element_by_tag_name
find_element_by_class_name
find_element_by_css_selector
```

```
find_elements_by_name
find_elements_by_xpath
find_elements_by_link_text
find_elements_by_partial_link_text
find_elements_by_tag_name
find_elements_by_class_name
find_elements_by_css_selector
```

In [1]:
from selenium import webdriver

#### 드라이버 설정

In [2]:
driver = webdriver.Chrome('chromedriver.exe')

#### 웹 페이지 접속

In [3]:
driver.get('https://www.naver.com/')

#### 검색창에 검색어 입력하기
* 검색창의 객체(정보)를 가져오기
    * driver.find_element_by_xpath('xpath 정보')
* 가져온 객체에 명령
* xpath : //*[@id="query"]

In [4]:
search = driver.find_element_by_xpath('//*[@id="query"]')

In [5]:
search.send_keys('미세먼지')

#### 검색 버튼 클릭
* xpath : //*[@id="search_btn"]

In [6]:
search_btn = driver.find_element_by_xpath('//*[@id="search_btn"]')

In [7]:
search_btn.click()

#### 연관검색어 가져오기

In [8]:
from bs4 import BeautifulSoup

In [9]:
page = driver.page_source
soup = BeautifulSoup(page,'lxml')
soup.title

<title>미세먼지 : 네이버 통합검색</title>

In [10]:
r_word = soup.find('ul', class_='_related_keyword_ul')
word = r_word.find_all('a')

keyword = []
for one in word : 
    #print(one.text)
    keyword.append(one.text)

import pandas as pd
key = pd.DataFrame({'keyword':keyword})

key.to_excel('keyword.xlsx', index=False)

### 실습 : https://pythonstart.github.io/web/ 

In [16]:
from selenium import webdriver

driver = webdriver.Chrome('chromedriver')

In [17]:
url = 'https://pythonstart.github.io/web/'
driver.get(url)

#### id를 이용한 접근
* find_element_by_id('id명')

In [18]:
sel_id = driver.find_element_by_id('rank')
sel_id

<selenium.webdriver.remote.webelement.WebElement (session="685b12c4785a247037a48e312ca56b4d", element="9c0587f4-c71a-49ea-abaf-6c348fe2bfb8")>

In [20]:
print('가져온 객체의 텍스트 :', sel_id.text)
print('태그명 :', sel_id.tag_name)

가져온 객체의 텍스트 : 10. 랭킹 정보 가져오기(웹 크롤링)
태그명 : a


#### 태그 이름을 이용한 접근
* find_element_by_tag_name
* find_elements_by_tag_name

In [23]:
sel_tag = driver.find_element_by_tag_name('h1')
sel_tag

<selenium.webdriver.remote.webelement.WebElement (session="685b12c4785a247037a48e312ca56b4d", element="c9c04666-1c86-4dd6-af73-07c45936310b")>

In [24]:
print('가져온 객체의 텍스트 :', sel_tag.text)
print('태그명 :', sel_tag.tag_name)

가져온 객체의 텍스트 : my web page
태그명 : h1


#### a태그 전체 가져오기

In [25]:
sel_a = driver.find_elements_by_tag_name('a')
sel_a   # list 형태로 정보를 받아옴

[<selenium.webdriver.remote.webelement.WebElement (session="685b12c4785a247037a48e312ca56b4d", element="89ebad9b-b7f7-45eb-83f3-80c46f22dc03")>,
 <selenium.webdriver.remote.webelement.WebElement (session="685b12c4785a247037a48e312ca56b4d", element="4f429aad-1110-4e69-a68e-4d7c8e9983c7")>,
 <selenium.webdriver.remote.webelement.WebElement (session="685b12c4785a247037a48e312ca56b4d", element="307dcab5-3f94-4b0f-a2ee-689520a89fb3")>,
 <selenium.webdriver.remote.webelement.WebElement (session="685b12c4785a247037a48e312ca56b4d", element="63a32aca-c309-4b0d-8b33-abec533e3ae6")>,
 <selenium.webdriver.remote.webelement.WebElement (session="685b12c4785a247037a48e312ca56b4d", element="4a9312d3-14c0-44f2-8836-672a8049fdac")>,
 <selenium.webdriver.remote.webelement.WebElement (session="685b12c4785a247037a48e312ca56b4d", element="6dfca613-7af6-41a7-8668-debc42a9d13b")>,
 <selenium.webdriver.remote.webelement.WebElement (session="685b12c4785a247037a48e312ca56b4d", element="42ca70da-d7b2-4b2e-99b0-25

In [30]:
for a in sel_a:
    print(a.text)

01. 제목 가져오기(title)
02. 텍스트 가져오기(p)
03. 링크 가져오기(a)
04. 이미지 정보 가져오기(img)
05. 리스트 정보 가져오기(ul,ol)
06. id를 활용한 정보 획득
07. class를 활용한 정보 획득
08. 하나의 이미지 다운로드
09. 여러개의 이미지 다운로드
10. 랭킹 정보 가져오기(웹 크롤링)


#### name 속성을 이용한 접근

In [31]:
sel_name = driver.find_element_by_name('text_get')
sel_name.text

'02. 텍스트 가져오기(p)'

In [34]:
sel_names = driver.find_elements_by_name('link_get')
for one in sel_names:
    print(one.text)

01. 제목 가져오기(title)
03. 링크 가져오기(a)


#### class 이름을 이용한 접근
* find_element_by_class_name
* find_elements_by_class_name

#### selector를 이용한 접근
* find_elements_by_css_selector

```
<style>
   h1 {color:'blue'}
   #rank {color:'blue'}
   .class_n {color:'blue'}
   a#rank {}
</style>
```

```
<html>
<body>
    <p class='content'>Content 부분</p>
</body>
</html>
```

In [36]:
sel_css = driver.find_element_by_css_selector('a#rank')
sel_css.text

'10. 랭킹 정보 가져오기(웹 크롤링)'

In [37]:
sel_css = driver.find_element_by_css_selector('ul a')
sel_css.text

'01. 제목 가져오기(title)'

In [38]:
sel_css = driver.find_elements_by_css_selector('ul a')

for one in sel_css:
    print(one.text)

01. 제목 가져오기(title)
02. 텍스트 가져오기(p)
03. 링크 가져오기(a)
04. 이미지 정보 가져오기(img)
05. 리스트 정보 가져오기(ul,ol)
06. id를 활용한 정보 획득
07. class를 활용한 정보 획득
08. 하나의 이미지 다운로드
09. 여러개의 이미지 다운로드
10. 랭킹 정보 가져오기(웹 크롤링)


In [39]:
sel_css = driver.find_element_by_css_selector('body ul a#rank')
sel_css.text

'10. 랭킹 정보 가져오기(웹 크롤링)'

#### 마우스 제어

In [41]:
# 클릭해서 해당 페이지로 이동
sel_3 = driver.find_element_by_xpath('/html/body/ul/a[3]')
sel_3.click()

In [42]:
page = driver.page_source
soup = BeautifulSoup(page,'lxml')
soup

<html><head>
<title>나의 웹 페이지</title>
</head>
<body>
<h1> my web page </h1>
<ul>
<a href="./01.html" name="link_get" target="_blank"> 01. 제목 가져오기(title) </a> <br/>
<a href="./02.html" name="text_get" target="_blank"> 02. 텍스트 가져오기(p) </a> <br/>
<a href="./03.html" name="link_get" target="_blank"> 03. 링크 가져오기(a) </a> <br/>
<a href="https://pythonstart.github.io/web/04.html" target="_blank"> 04. 이미지 정보 가져오기(img) </a> <br/>
<a href="./05.html" target="_blank"> 05. 리스트 정보 가져오기(ul,ol) </a> <br/>
<a href="./06.html" target="_blank"> 06. id를 활용한 정보 획득 </a> <br/>
<a href="./07.html" target="_blank"> 07. class를 활용한 정보 획득 </a> <br/>
<a href="./08.html" target="_blank"> 08. 하나의 이미지 다운로드 </a> <br/>
<a href="https://pythonstart.github.io/web/09.html" target="_blank"> 09. 여러개의 이미지 다운로드 </a> <br/>
<a href="./10.html" id="rank" target="_blank"> 10. 랭킹 정보 가져오기(웹 크롤링) </a> <br/>
</ul>
</body></html>