# 10. 標準ライブラリミニツアー

## 10.1. OSへのインタフェース
os モジュールは、オペレーティングシステムと対話するための多くの関数を提供しています:

In [1]:
>>> import os
>>> os.getcwd()      # Return the current working directory

'/Users/denkenhii/Documents/python_tutorial'

In [2]:
#>>> os.chdir('/server/accesslogs')   # Change current working directory
#>>> os.system('mkdir today')   # Run the command mkdir in the system shell
0

0

from os import * ではなく、 import os 形式を使うようにしてください。そうすることで、動作が大きく異なる組み込み関数 open() が os.open() で遮蔽されるのを避けられます。

組み込み関数 dir() および help() は、 os のような大規模なモジュールで作業をするときに、対話的な操作上の助けになります:

    >>>
    >>> import os
    >>> dir(os)
    <returns a list of all module functions>
    >>> help(os)
    <returns an extensive manual page created from the module's docstrings>
ファイルやディレクトリの日常的な管理作業のために、より簡単に使える高水準のインタフェースが **shutil** モジュールで提供されています:
    >>> import shutil
    >>> shutil.copyfile('data.db', 'archive.db')
    'archive.db'
    >>> shutil.move('/build/executables', 'installdir')
    'installdir'
これは便利そう

## 10.2. ファイルのワイルドカード表記

glob モジュールでは、ディレクトリのワイルドカード検索からファイルのリストを生成するための関数を提供しています:

In [4]:
>>>
>>> import glob
>>> glob.glob('*.ipynb')

['10. 標準ライブラリミニツアー.ipynb',
 '3.形式ばらないPythonの紹介.ipynb',
 '4. その他の制御フローツール.ipynb',
 '5. データ構造.ipynb',
 '6. モジュール (module).ipynb',
 '7. 入力と出力.ipynb',
 '8. エラーと例外.ipynb',
 '9. クラス.ipynb']

## 10.3. コマンドライン引数
一般的なユーティリティスクリプトでは、よくコマンドライン引数を扱う必要があります。コマンドライン引数は sys モジュールの argv 属性にリストとして保存されています。例えば、以下の出力は、 python demo.py one two three とコマンドライン上で起動した時に得られるものです:

    >>>
    >>> import sys
    >>> print(sys.argv)
    ['demo.py', 'one', 'two', 'three']
getopt モジュールは、 sys.argv を Unix の getopt() 関数の慣習に従って処理します。より強力で柔軟性のあるコマンドライン処理機能は、 argparse モジュールで提供されています。

## 10.4. エラー出力のリダイレクトとプログラムの終了
sys.exit() は、スクリプトを終了させるもっとも直接的な方法です

## 10.5. 文字列のパターンマッチング
re モジュールでは、より高度な文字列処理のための正規表現を提供しています。


## 10.6. 数学
math モジュールは、浮動小数点演算のための C 言語ライブラリ関数にアクセスする手段を提供しています:


In [5]:
>>> import math
>>> math.cos(math.pi / 4)

0.7071067811865476

In [6]:
>>> math.log(1024, 2)

10.0

random モジュールは、乱数に基づいた要素選択のためのツールを提供しています:

In [7]:
>>> import random
>>> random.choice(['apple', 'pear', 'banana'])

'apple'

In [8]:
>>> random.sample(range(100), 10)   # sampling without replacement

[17, 33, 40, 81, 47, 8, 78, 26, 91, 97]

In [9]:
>>> random.random()    # random float

0.8335541252134001

In [10]:
>>> random.randrange(6)    # random integer chosen from range(6)

3

statistics モジュールは数値データの基礎的な統計的特性（平均、中央値、分散等）を計算します:

In [11]:
>>> import statistics
>>> data = [2.75, 1.75, 1.25, 0.25, 0.5, 1.25, 3.5]
>>> statistics.mean(data)

1.6071428571428572

In [12]:
>>> statistics.median(data)

1.25

In [13]:
>>> statistics.variance(data)

1.3720238095238095

## 10.7. インターネットへのアクセス(原文)
インターネットにアクセスしたりインターネットプロトコルを処理したりするための多くのモジュールがあります。最も単純な2つのモジュールは、 URL からデータを取得するための urllib.request と、メールを送るための smtplib です:

    >>> from urllib.request import urlopen
    >>> with urlopen('http://tycho.usno.navy.mil/cgi-bin/timer.pl') as response:
    ...     for line in response:
    ...         line = line.decode('utf-8')  # Decoding the binary data to text.
    ...         if 'EST' in line or 'EDT' in line:  # look for Eastern Time
    ...             print(line)

    <BR>Nov. 25, 09:43:32 PM EST

    >>> import smtplib
    >>> server = smtplib.SMTP('localhost')
    >>> server.sendmail('soothsayer@example.org', 'jcaesar@example.org',
    ... """To: jcaesar@example.org
    ... From: soothsayer@example.org
    ...
    ... Beware the Ides of March.
    ... """)
    >>> server.quit()


## 10.8. 日付と時刻
datetime モジュールは、日付や時刻を操作するためのクラスを、単純な方法と複雑な方法の両方で提供しています。日付や時刻に対する算術がサポートされている一方、実装では出力のフォーマットや操作のための効率的なデータメンバ抽出に重点を置いています。このモジュールでは、タイムゾーンに対応したオブジェクトもサポートしています。


In [14]:
>>> # dates are easily constructed and formatted
>>> from datetime import date
>>> now = date.today()
>>> now

datetime.date(2018, 3, 11)

In [15]:
>>> now.strftime("%m-%d-%y. %d %b %Y is a %A on the %d day of %B.")


'03-11-18. 11 Mar 2018 is a Sunday on the 11 day of March.'

In [17]:
>>> # dates support calendar arithmetic
>>> birthday = date(1997, 1, 9)
>>> age = now - birthday
>>> age.days

7731

## 10.9. データ圧縮
一般的なデータアーカイブと圧縮形式は、以下のようなモジュールによって直接的にサポートされます: zlib, gzip, bz2, lzma, zipfile, tarfile。

In [18]:
>>> import zlib
>>> s = b'witch which has which witches wrist watch'
>>> len(s)

41

In [21]:
s

b'witch which has which witches wrist watch'

In [19]:
>>> t = zlib.compress(s)
>>> len(t)

37

In [20]:
t

b'x\x9c+\xcf,I\xceP(\xcf\xc8\x04\x92\x19\x89\xc5PV9H4\x15\xc8+\xca,.Q(O\x04\xf2\x00D?\x0f\x89'

In [22]:
>>> zlib.decompress(t)

b'witch which has which witches wrist watch'

## 10.10. パフォーマンスの計測
Python ユーザの中には、同じ問題を異なったアプローチで解いた際の相対的なパフォーマンスについて知りたいという深い興味を持っている人がいます。Python は、そういった疑問に即座に答える計測ツールを提供しています。

例えば、引数の入れ替え操作に対して、伝統的なアプローチの代わりにタプルのパックやアンパックを使ってみたいと思うかもしれません。 timeit モジュールを使えば、パフォーマンスがほんの少し良いことがすぐに分かります:

    >>>
    >>> from timeit import Timer
    >>> Timer('t=a; a=b; b=t', 'a=1; b=2').timeit()
    0.57535828626024577
    >>> Timer('a,b = b,a', 'a=1; b=2').timeit()
    0.54962537085770791
timeit では小さい粒度を提供しているのに対し、 profile や pstats モジュールではより大きなコードブロックにおいて律速となる部分を判定するためのツールを提供しています。

のこりは大して重要じゃなさそうなので省略

# 11. 標準ライブラリミニツアー

## 11.4. マルチスレッディング
スレッド処理 (threading) とは、順序的な依存関係にない複数のタスクを分割するテクニックです。スレッドは、ユーザの入力を受け付けつつ、背後で別のタスクを動かすようなアプリケーションの応答性を高めます。同じような使用例として、I/O を別のスレッドの計算処理と並列して動作させるというものがあります。

以下のコードでは、高水準のモジュール threading でメインのプログラムを動かしながら背後で別のタスクを動作させられるようにする方法を示しています:

    import threading, zipfile

    class AsyncZip(threading.Thread):
        def __init__(self, infile, outfile):
            threading.Thread.__init__(self)
            self.infile = infile
            self.outfile = outfile

        def run(self):
            f = zipfile.ZipFile(self.outfile, 'w', zipfile.ZIP_DEFLATED)
            f.write(self.infile)
            f.close()
            print('Finished background zip of:', self.infile)

    background = AsyncZip('mydata.txt', 'myarchive.zip')
    background.start()
    print('The main program continues to run in foreground.')

    background.join()    # Wait for the background task to finish
    print('Main program waited until background was done.')

## 11.8. 10 進浮動小数演算
decimal モジュールでは、 10 進浮動小数の算術演算をサポートする Decimal データ型を提供しています。組み込みの 2 進浮動小数の実装である float に比べて、このクラスがとりわけ便利なのは、以下の場合です

財務アプリケーションやその他の正確な10進表記が必要なアプリケーション、
精度の制御、
法的または規制上の理由に基づく値丸めの制御、
有効桁数の追跡が必要になる場合
ユーザが手計算の結果と同じ演算結果を期待するようなアプリケーション。
例えば、70 セントの電話代にかかる 5% の税金を計算しようとすると、10 進の浮動小数点値と 2 進の浮動小数点値では違う結果になってしまいます。計算結果を四捨五入してセント単位にしようとすると、以下のように違いがはっきり現れます:

In [23]:
>>> from decimal import *
>>> round(Decimal('0.70') * Decimal('1.05'), 2)

Decimal('0.74')

In [24]:
>>> round(.70 * 1.05, 2)

0.73

上の例で、Decimal を使った計算では、末尾桁のゼロが保存されており、有効数字2桁の被乗数から自動的に有効数字を 4 桁と判断しています。Decimal は手計算と 同じ方法で計算を行い、2 進浮動小数が 10 進小数成分を正確に表現できないことに よって起きる問題を回避しています。

Decimal クラスは厳密な値を表現できるため、2 進浮動小数点数では 期待通りに計算できないような剰余の計算や等値テストも実現できます:

In [25]:
>>> Decimal('1.00') % Decimal('.10')

Decimal('0.00')

In [26]:
>>> 1.00 % 0.10

0.09999999999999995

In [27]:
>>> sum([Decimal('0.1')]*10) == Decimal('1.0')

True

In [28]:
>>> sum([0.1]*10) == 1.0

False

In [29]:
sum([0.1]*10)

0.9999999999999999

In [32]:
[0.1]*10

[0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1]

In [34]:
#decimal モジュールを使うと、必要なだけの精度で算術演算を行えます:
>>> getcontext().prec = 36
>>> Decimal(1) / Decimal(7)

Decimal('0.142857142857142857142857142857142857')