Skip to content

juu7g/Python-www

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Python-www

Web操作ライブラリ

概要 Description

Web操作ライブラリ

内容 Contents

  • WebSiteクラス
    • get_html()メソッド
    • get_text_from_html()メソッド
    • output_to_file()メソッド

WebSiteクラス

メソッド Method

  • get_html(url:str)

    • 引数
      • url:url
    • 戻り値
      • str:html
      • str:エラー内容(エラーがない時は空文字)
    • 特徴
      • 指定したurlのhtml文書を取得します
      • エラーがあった場合、エラー内容を返します
  • get_text_from_html(html:str, tag:str="div", cls:str="hatenablog-entry")

    • 引数
      • html:html文書を指定
      • tag:テキストを取得する対象のタグ(このタグの子孫のテキストが取得対象)
      • cls:テキストを取得する対象のクラス
    • 戻り値
      • str:テキスト
    • 特徴
      • 指定したhtml文書からテキストを取得します
      • clsクラスを持つtagタグの子孫のテキストを取得します
  • output_to_file(text:str, ext:str="txt")

    • 引数
      • text:テキスト
      • ext:ファイル拡張子
    • 特徴
      • textをファイルに出力します
      • ファイル名は兄弟のtestsディレクトリに「html_yymmddHHMM.txt」

依存関係 Requirement

  • Python 3.8.5
  • requests 2.31.0
  • beautifulsoup4 4.12.2

プログラムの説明サイト

作者 Authors

juu7g

ライセンス License

このソフトウェアは、MITライセンスのもとで公開されています。LICENSE.txtを確認してください。

About

Web操作ライブラリ

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages