Web操作ライブラリ
Web操作ライブラリ
- WebSiteクラス
- get_html()メソッド
- get_text_from_html()メソッド
- output_to_file()メソッド
-
get_html(url:str)
- 引数
url
:url
- 戻り値
- str:html
- str:エラー内容(エラーがない時は空文字)
- 特徴
- 指定したurlのhtml文書を取得します
- エラーがあった場合、エラー内容を返します
- 引数
-
get_text_from_html(html:str, tag:str="div", cls:str="hatenablog-entry")
- 引数
html
:html文書を指定tag
:テキストを取得する対象のタグ(このタグの子孫のテキストが取得対象)cls
:テキストを取得する対象のクラス
- 戻り値
- str:テキスト
- 特徴
- 指定したhtml文書からテキストを取得します
- clsクラスを持つtagタグの子孫のテキストを取得します
- 引数
-
output_to_file(text:str, ext:str="txt")
- 引数
text
:テキストext
:ファイル拡張子
- 特徴
- textをファイルに出力します
- ファイル名は兄弟のtestsディレクトリに「html_yymmddHHMM.txt」
- 引数
- Python 3.8.5
- requests 2.31.0
- beautifulsoup4 4.12.2
juu7g
このソフトウェアは、MITライセンスのもとで公開されています。LICENSE.txtを確認してください。