# Selenium

- ブラウザを遠隔操作できる。
- ヘッドレス（ブラウザを立ち上げず）にデータを取得。

```
brew install geckodriver
brew install chromedriver
```

- https://scraping-for-beginner.readthedocs.io/ja/latest/src/0.html
<br>

### SeleniumでDOM要素を選択
- DOMの中から最初に見つけた要素を１つだけ取得
| メソッド名 | 説明 |
| --- | --- |
| find_elemnt_by_id(id) | id属性から要素を１つ取得 |
| find_elemnt_by_name(name) | name属性から要素を１つ取得 |
| find_elemnt_by_css_selector(query) | CSSセレクターを指定して要素を１つ取得 |
| find_elemnt_by_xpath(query) | XPathを指定して要素を１つ取得 |
| find_elemnt_by_tag_name(name) | tag名nameの要素を１つ取得 |
| find_elemnt_by_link_text(text) | リンクのテキストから要素を１つ取得 |
| find_elemnt_by_partial_link_text(text) | リンクの子要素を含むテキストから要素を１つ取得 |
| find_elemnt_by_class_name(name) | クラス名nameから要素を１つ取得 |

- DOMの中にある全ての要素を取得
何も見つからない場合、NoSuchElementExceptionが発生する。
| メソッド名 | 説明 |
| --- | --- |
| find_elemnts_by_css_selector(query) | CSSセレクターを指定して全ての要素を取得 |
| find_elemnts_by_xpath(query) | XPathを指定して全ての要素を取得 |
| find_elemnts_by_css_selector(query) | CSSセレクターを指定して要素を１つ取得 |
| find_elemnts_by_tag_name(name) | tag名nameの全ての要素を取得 |
| find_elemnts_by_class_name(name) | クラス名nameから全ての要素を取得 |
| find_elemnts_partial_link_text(text) | リンクの子要素を含むテキストから複数要素を取得 |

### Seleniumで要素に対して行う操作
- 任意のDOM要素に対して、キーを送信したり、クリックしたりと操作ができる。
- DOM要素に備わっているメソッドとプロパティの一覧
| メソッド名 | 説明 |
| --- | --- |
| clear() | テキスト入力できる要素でテキストをクリアする |
| click() | 要素をクリックする |
| get_attribute(name) | 要素の属性namewを取得 |
| is_displayed() | 要素がユーザーから見えるかどうか |
| is_enabled() | 要素が有効になっているかどうか |
| text() | 要素のテキスト |
| is_selected() | チェックボックスなどの要素が選択された状態かどうか |
| screenshot(filename) | スクリーンショットを取る |
| send_keys(value) | キーを送信する |
| value_of_css_propaty(name) | CSSのnameの値を取得 |
| id | id要素 |
| location | 要素の位置 |
| parent | 親要素 |
| rect | サイズと位置の情報を辞書型で返す |
| screenshot_as_base64 | スクリーンショットをBase64で得る |
| screenshot_as_png | スクリーンショットをpng形式のバイナリーデータで得る |
| size | 要素のサイズ |
| tag_name | タグの名前 |
| text | 要素のテキスト |

- send_keys()でキーを送る際、テキストデータの他に、キーボードの特殊キーを送信することもできる。
```
from selenium.Webdriver.common.keys import Keys
```
```
ARROW_DOWN, ARROW_LEFT, ARROW_RIGHT, ARROW_UP, BACKSPACE, DELETE, HOME, END, INSERT, 
ALT, COMMAND, CONTROL, SHIFT, ENTER, ESCAPE, SPACE, TAB, F1, F2, F3, F4, F5...F12
```

### Seleniumのドライバーに対する操作
| メソッド名 | 説明 |
| --- | --- |
| add_coockie(cookie_dict) | クッキーに値を辞書形式で追加 |
| back() / forward() | 履歴を見て１つの前のページに戻る / 進む |
| close() | ブラウザを閉じる |
| current_url | 現在のURL |
| delete_all_coockies() | 全てのクッキーを削除する |
| delete_cookie(name) | 指定のクッキー変数を削除 |
| title | 現在のページのタイトルを返す |
| execute(command, params) | ブラウザ固有のコマンドを実行 | 
| execute_async_script(script, *args) | 非同期でJavaScriptを実行 | 
| execute_script(script, *args) | 同期的にJavaScriptを実行 | 
| get(url) | Webページから読み込む |
| get_cookie(name) | クッキーの値を得る |
| get_coolies() | クッキーの値を全て辞書型で得る |
| get_log(type) | ログを得る |
| get_screenshot_as_base64() | base64形式でスクリーンショットを得る |
| get_screenshot_as_file(filename) | スクリーンショットをファイルに保存 |
| get_screenshot_as_png() | PNG形式でスクリーンショットのバイナリーを得る |
| get_window_position(windowHandle="current") | ウィンドウの位置を得る |
| get_window_size(windowHandle="current") | ウィンドウのサイズを得る |
| implicity_wait(sec) | 最大待機秒を指定して、処理が終わるのを待つ |
| quit() | ドライバーを終了させ、各ウィンドウを閉じる |
| save_screenshot(filename) | スクリーンショットを保存する |
| set_page_load_timeout(time_to_wait) | 読み込みがタイムアウトする時間を指定 |
| set_script_timeout(time_to_wait) |  スクリプトがタイムアウトする時間を指定 |
| set_window_position(windowHandle="current") | ウィンドウの位置を指定 |
| set_window_size(windowHandle="current") | ウィンドウサイズを指定 |
| title | 現在のページのタイトルを返す |


In [1]:
from selenium.webdriver import Firefox, FirefoxOptions

url = "https://www.aozora.gr.jp/cards/000081/files/46268_23911.html"

# Firefoxをヘッドレスモードを有効にする --- (※1)
options = FirefoxOptions()
options.add_argument('-headless')

# Firefoxを起動する --- (※2)
browser = Firefox(options=options)   # ドライバーの初期化

# URLを読み込む --- (※3)
browser.get(url)

# 画面をキャプチャしてファイルに保存 --- (※4)
browser.save_screenshot("images/website.png")
# ブラウザを終了 --- (※5)
browser.quit()

## 作詞掲示板にキーを埋め込んでログイン

In [2]:
from selenium.webdriver import Firefox, FirefoxOptions
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

USER = "JS-TESTER"
PASS = "ipCU12ySxI"

# Firefoxのドライバを得る --- (※1)
options = FirefoxOptions()
options.add_argument('-headless')
browser = Firefox(options=options)

# ログインページにアクセス --- (※2)
url_login = "https://uta.pw/sakusibbs/users.php?action=login"
browser.get(url_login)
print("ログインページにアクセスしました")

# テキストボックスに文字を入力 --- (※3)
e = browser.find_element_by_id("user")
e.clear()
e.send_keys(USER)
e = browser.find_element_by_id("pass")
e.clear()
e.send_keys(PASS)
# フォームを送信 --- (※4)
frm = browser.find_element_by_css_selector("#loginForm form")
frm.submit()
print("情報を入力してログインボタンを押しました")
# ページのロード完了まで待機 --- (※5)
WebDriverWait(browser, 10).until(
    EC.presence_of_element_located((By.CSS_SELECTOR, ".islogin"))
)

# マイページのURLを得る --- (※6)
a = browser.find_element_by_css_selector(".islogin a")
url_mypage = a.get_attribute('href')
print("マイページのURL=", url_mypage)

# マイページを表示 --- (※7)
browser.get(url_mypage)

# お気に入りのタイトルを列挙 --- (※8)
links = browser.find_elements_by_css_selector(
    "#favlist li > a")
for a in links:
    href = a.get_attribute('href')
    title = a.text
    print("-", title, ">", href)

ログインページにアクセスしました
情報を入力してログインボタンを押しました
マイページのURL= https://uta.pw/sakusibbs/users.php?user_id=32
- 今日も明日もJS三昧 by JS-TESTER > https://uta.pw/sakusibbs/post.php?mml_id=161
- 眠ってもデバッグ by JS-TESTER > https://uta.pw/sakusibbs/post.php?mml_id=162
- プリンとシュークリーム by JS-TESTER > https://uta.pw/sakusibbs/post.php?mml_id=246
- 吾輩はテスターである by JS-TESTER > https://uta.pw/sakusibbs/post.php?mml_id=268
- 吾輩はテスターである　その２ by JS-TESTER > https://uta.pw/sakusibbs/post.php?mml_id=269
- テスト by JS-TESTER > https://uta.pw/sakusibbs/post.php?mml_id=816
- ぱいソング by JS-TESTER > https://uta.pw/sakusibbs/post.php?mml_id=845
- Learning Python by JS-TESTER > https://uta.pw/sakusibbs/post.php?mml_id=938
- Learning Python Song by JS-TESTER > https://uta.pw/sakusibbs/post.php?mml_id=939
- 詠み人知らず by 吟遊詩人に成れない > https://uta.pw/sakusibbs/post.php?mml_id=979
- 春はそこまで by 吟遊詩人に成れない > https://uta.pw/sakusibbs/post.php?mml_id=983
- 色情熱情・嗚呼純情 by 月城 麻里奈 > https://uta.pw/sakusibbs/post.php?mml_id=936
- 儚い愛はかすみ色 by 月城 麻里奈 > https://uta.

## JavaScriptで実行

In [3]:
from selenium.webdriver import Firefox, FirefoxOptions

# Firefoxを起動
options = FirefoxOptions()
options.add_argument('-headless')
browser = Firefox(options=options)

# 適当なWebサイトを開く
browser.get("https://google.com")

# JavaScriptを実行
r = browser.execute_script("return 100 + 50")
print(r)

150
