青空文庫の XHTML 形式を Kindle で読める mobi 形式に変換する Python スクリプト
Switch branches/tags
Nothing to show
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Failed to load latest commit information.
README.md
aozoraxhtml2mobi.py

README.md

aozoraxhtml2mobi

  • 青空文庫の XHTML 形式のファイルを Kindle で読める .mobi 形式に変換す る python スクリプトです
  • このスクリプトで自力で変換しなくても、kindle ストアの「本 > 無料本」 で Kindle 形式で入手できます。それに気づかずに作成してしまったスクリ プトです :)
  • amazon.com が無料で配布している kindlegen が必要です
  • Linux で実行することを想定しています
  • 出力サンプルはこちら

インストールに必要なもの

インストール

  1. インストールするディレクトリを作成し、移動します

     % mkdir aozoraxhtml2mobi
     % cd aozoraxhtml2mobi
    
  2. aozoraxhtml2mobi.py をダウンロードします

     % curl https://github.com/yasuoka/aozoraxhtml2mobi/raw/master/aozoraxhtml2mobi.py
    
  3. kindlegen を配置します

     % ln -fs (kindlegen のディレクトリ)/kindlegen ./
    
  4. 青空文庫の外字の画像を配置します

     % curl http://www.sumomo.sakura.ne.jp/~aozora/gaiji/gaiji.zip
     % unzip -x gaiji.zip 
    

実行方法

インストールしたディレクトリに移動し、python aozoraxhtml2mobi.py を実 行します。引数には、青空文庫からダウンロードした XHTML のファイル名を 与えます。

例:

% curl http://www.aozora.gr.jp/cards/000096/files/2231_22251.html
% python aozoraxhtml2mobi.py 2231_22251.html

変換が成功すると、mobi 形式のファイルが outout.mobi として生成されます。

技術的なこと

青空文庫で配布されている XHTML は、そのまま kindle で表示することがで きます。しかし、そのままでは、横書きで、左綴じです。このスクリプトは、 縦書き、右綴じにするために必要な最小限の変換を行います。

参考文献