Google検索を自動化するプログラムです。
Googleのトップページからコマンドラインで入力したキーワードを検索します。
各ページに遷移し、ページURLを取得します。取得したURLはコマンドラインに出力します。
任意のページ数まで取得することが可能です。
以下で動作確認済みです。
OS
:macOS 10.15.6
Python
:3.6.9
以下の2通りの方法がありますので、どちらかでインストールしてください。
$ pip install selenium
$ pip install -r requirements.txt
ブラウザはGoogleChromeを使用します。
ブラウザを自動操作するためにはChromeDriverが必要です。
以下から自分のGoogleChromeと同じバージョンのドライバーをダウンロードします。
https://sites.google.com/a/chromium.org/chromedriver/downloads
ChromeDriverをダウンロードしたら解凍して、任意の場所に配置します。
そして、chromedriver_path
のところに自分がダウンロードした場所を指定します。
max_page
に取得するページ数を指定します。
コマンドラインで実行します。キーワード
には検索したいキーワードを入力します。
$ python scraping_google.py キーワード