**【Jupyter Notebookとしての注意】**
+ 本ファイルはJupyter Notbook形式で記載するので 、(>>> や ...) といったプロンプトはプログラム例から削除しています。
+ 対話形式では、式を入れると値が表示されますが、Jupyter Notbookでは、最後の結果しか表示されないため、プログラム例に適宜「print」を追加しています。
+ print文で表示すると文字列の表現等が異なるため、プログラム例では、適宜、式に対して「repr」という関数を適用した結果をprintしています。

# 10. 標準ライブラリミニツアー
## 10.1. OSへのインタフェース
os モジュールは、オペレーティングシステムと対話するための何ダースもの関数を提供しています:

In [1]:
import os
print os.getcwd()

os.system('mkdir today')
print os.chdir('today')

F:\Develop\Python\Python-Tutorial-Jupyter
None


from os import \* ではなく、 import os 形式を使うようにしてください。そうすることで、動作が大きく異なる組み込み関数 open() が os.open() で遮蔽されるのを避けられます。

組み込み関数 dir() および help() は、 os のような大規模なモジュールで作業をするときに、対話的な操作上の助けになります:

In [2]:
import os
print dir(os)

help(os)

['F_OK', 'O_APPEND', 'O_BINARY', 'O_CREAT', 'O_EXCL', 'O_NOINHERIT', 'O_RANDOM', 'O_RDONLY', 'O_RDWR', 'O_SEQUENTIAL', 'O_SHORT_LIVED', 'O_TEMPORARY', 'O_TEXT', 'O_TRUNC', 'O_WRONLY', 'P_DETACH', 'P_NOWAIT', 'P_NOWAITO', 'P_OVERLAY', 'P_WAIT', 'R_OK', 'SEEK_CUR', 'SEEK_END', 'SEEK_SET', 'TMP_MAX', 'UserDict', 'W_OK', 'X_OK', '_Environ', '__all__', '__builtins__', '__doc__', '__file__', '__name__', '__package__', '_copy_reg', '_execvpe', '_exists', '_exit', '_get_exports_list', '_make_stat_result', '_make_statvfs_result', '_pickle_stat_result', '_pickle_statvfs_result', 'abort', 'access', 'altsep', 'chdir', 'chmod', 'close', 'closerange', 'curdir', 'defpath', 'devnull', 'dup', 'dup2', 'environ', 'errno', 'error', 'execl', 'execle', 'execlp', 'execlpe', 'execv', 'execve', 'execvp', 'execvpe', 'extsep', 'fdopen', 'fstat', 'fsync', 'getcwd', 'getcwdu', 'getenv', 'getpid', 'isatty', 'kill', 'linesep', 'listdir', 'lseek', 'lstat', 'makedirs', 'mkdir', 'name', 'open', 'pardir', 'path', 'paths

ファイルやディレクトリの日常的な管理作業のために、より簡単に使える高水準のインタフェースが shutil モジュールで提供されています:

In [3]:
import shutil

shutil.copyfile(r'..\data.db', 'archive.db')
shutil.move('archive.db', 'move.db')

os.system('dir move.db')

# cleanup
os.system('del move.db')
os.chdir("..")
os.system('rmdir today')

0

## 10.2. ファイルのワイルドカード表記
glob モジュールでは、ディレクトリのワイルドカード検索からファイルのリストを生成するための関数を提供しています:

In [4]:
import glob
print glob.glob("*.py")

['fibo.py']


## 10.3. コマンドライン引数
一般的なユーティリティスクリプトでは、よくコマンドライン引数を扱う必要があります。コマンドライン引数は sys モジュールの argv 属性にリストとして保存されています。例えば、以下の出力は、 python demo.py one two three とコマンドライン上で起動した時に得られるものです:

In [10]:
%%file argv_test.py
import sys
print sys.argv

Overwriting argv_test.py


In [11]:
!python argv_test.py one tow three

['argv_test.py', 'one', 'tow', 'three']


getopt モジュールは、 sys.argv を Unix の getopt() 関数の慣習に従って処理します。より強力で柔軟性のあるコマンドライン処理機能は、 argparse モジュールで提供されています。

## 10.4. エラー出力のリダイレクトとプログラムの終了
sys モジュールには、 stdin, stdout, stderr を表す属性も存在します。 stderr は、警告やエラーメッセージを出力して、 stdout がリダイレクトされた場合でも読めるようにするために便利です:

In [12]:
import sys
sys.stderr.write('Warning, log file not found starting a new one\n')



sys.exit() は、スクリプトを終了させるもっとも直接的な方法です。

## 10.5. 文字列のパターンマッチング
re モジュールでは、より高度な文字列処理のための正規表現を提供しています。正規表現は複雑な一致検索や操作に対して簡潔で最適化された解決策を提供します:

In [15]:
import re
print re.findall(r'\bf[a-z]*', 'which foot or hand fell fastest')
print re.sub(r'(\b[a-z]+) \1', r'\1', 'cat in the the hat')

['foot', 'fell', 'fastest']
cat in the hat


最小限の機能だけが必要なら、読みやすくデバッグしやすい文字列メソッドの方がお勧めです:

In [14]:
print 'tea for too'.replace('too', 'two')

tea for two


## 10.6. 数学
math モジュールは、浮動小数点演算のための C 言語ライブラリ関数にアクセスする手段を提供しています:

In [16]:
import math
print math.cos(math.pi / 4.0)
print math.log(1024, 2)

0.707106781187
10.0


random モジュールは、乱数に基づいた要素選択のためのツールを提供しています:

In [17]:
import random
print random.choice(['apple', 'pear', 'banana'])
print random.sample(xrange(100), 10)   # sampling without replacement
print random.random()                  # random float
print random.randrange(6)              # random integer chosen from range(6)

banana
[28, 31, 96, 12, 49, 15, 91, 29, 65, 64]
0.588634846547
3


## 10.7. インターネットへのアクセス
インターネットにアクセスしたりインターネットプロトコルを処理したりするための多くのモジュールがあります。最も単純な2つのモジュールは、 URL からデータを取得するための urllib2 と、メールを送るための smtplib です:

In [18]:
import urllib2
for line in urllib2.urlopen('https://httpd.apache.org/docs/2.4/new_features_2_4.html'):
  if '2.4.' in line :
    print line

# ERROR(can't run in Windows Envrironment)
#import smtplib
#server = smtplib.SMTP('localhost')
#server.sendmail('iitt21-all@yahoo.co.jp', 'iitt21-all@yahoo.co.jp',
#"""To: anonymous@yahoo.co.jp
#From: nobody@yahoo.co.jp
#
#Beware the Ides of March.
#""")
#server.quit()

      <dd>Despite many new features, 2.4.x tends to use less memory than

      <dt><code class="module"><a href="./mod/mod_macro.html">mod_macro</a></code> (available since 2.4.5)</dt>

      <dt><code class="module"><a href="./mod/mod_proxy_wstunnel.html">mod_proxy_wstunnel</a></code> (available since 2.4.5)</dt>

      <dt><code class="module"><a href="./mod/mod_authnz_fcgi.html">mod_authnz_fcgi</a></code> (available since 2.4.10)</dt>

      <dt><code class="module"><a href="./mod/mod_http2.html">mod_http2</a></code> (available since 2.4.17)</dt>

      <dd>Support for TLS-SRP (available in 2.4.4 and later).</dd>

      <dd>Support for Unix domain sockets to the backend (available in 2.4.7

      2.4.5 and later).</dd>

        <dd>Support for the bcrypt algorithm (available in 2.4.4 and later).



(2つ目の例は localhost でメールサーバーが動いている必要があることに注意してください。)

## 10.8. 日付と時刻
datetime モジュールは、日付や時刻を操作するためのクラスを、単純な方法と複雑な方法の両方で提供しています。日付や時刻に対する算術がサポートされている一方、実装では出力の書式化や操作のための効率的なデータメンバ抽出に重点を置いています。このモジュールでは、タイムゾーンに対応したオブジェクトもサポートしています。

In [20]:
from datetime import date
now = date.today()
print now
print now.strftime("%m-%d-%y. %d %b %Y is a %A on the %d day of %B.")

# dates support calendar arithmetic
birthday = date(1961, 2, 5)
age = now - birthday
print age.days

2016-06-02
06-02-16. 02 Jun 2016 is a Thursday on the 02 day of June.
20206


## 10.9. データ圧縮
一般的なデータアーカイブと圧縮形式は、以下のようなモジュールによって直接的にサポートされます: zlib, gzip, bz2, zipfile, tarfile 。

In [21]:
import zlib
s = 'witch which has which witches wrist watch'
print len(s)
t = zlib.compress(s)
print len(t)

print zlib.decompress(t)
print "crc32={:08x}".format(zlib.crc32(s))

41
37
witch which has which witches wrist watch
crc32=0d84c8db


## 10.10. パフォーマンスの計測
Python ユーザの中には、同じ問題を異なったアプローチで解いた際の相対的なパフォーマンスについて知りたいという深い興味を持っている人がいます。Python は、そういった疑問に即座に答える計測ツールを提供しています。

例えば、引数の入れ替え操作に対して、伝統的なアプローチの代わりにタプルのパックやアンパックを使ってみたいと思うかもしれません。 timeit モジュールを使えば、パフォーマンスがほんの少し良いことがすぐに分かります:

In [23]:
# jupyter化に際して少し追加
from timeit import Timer
print Timer('t=a; a=b; b=t', 'a=1; b=2').timeit()
print Timer('a,b = b,a', 'a=1; b=2').timeit()
print

print Timer('sum([i*i for i in range(1, 10)])').timeit()
print Timer("""
sum = 0
for i in range(1, 10):
  sum += i*i
""").timeit()

0.0263513130016
0.0203429093699

0.888165636156
0.623028478844


timeit では小さい粒度を提供しているのに対し、 profile や pstats モジュールではより大きなコードブロックにおいて律速となる部分を判定するためのツールを提供しています。

## 10.11. 品質管理
高い品質のソフトウェアを開発するための一つのアプローチは、各関数に対して開発と同時にテストを書き、開発の過程で頻繁にテストを走らせるというものです。

doctest モジュールでは、モジュールを検索してプログラムの docstring に埋め込まれたテストの評価を行うためのツールを提供しています。テストの作り方は単純で、典型的な呼び出し例とその結果を docstring にカット&ペーストするだけです。この作業は、ユーザに使用例を与えるという意味でドキュメントの情報を増やすと同時に、ドキュメントに書かれているコードが正しい事を確認できるようになります:

In [24]:
def average(values):
    """Computes the arithmetic mean of a list of numbers.

    >>> print average([20, 30, 70])
    40.0
    """
    return sum(values, 0.0) / len(values)

import doctest
print doctest.testmod()   # automatically validate the embedded tests

TestResults(failed=0, attempted=1)


unittest モジュールは doctest モジュールほど気楽に使えるものではありませんが、より網羅的なテストセットを別のファイルで管理することができます:

In [25]:
%%file average.py

def average(values):
    """Computes the arithmetic mean of a list of numbers.

    >>> print average([20, 30, 70])
    40.0
    """
    return sum(values, 0.0) / len(values)

import unittest
class TestStatisticalFunctions(unittest.TestCase):
    def test_average(self):
        self.assertEqual(average([20, 30, 70]), 40.0)
        self.assertEqual(round(average([1, 5, 7]), 1), 4.3)
        with self.assertRaises(ZeroDivisionError):
            average([])
        with self.assertRaises(TypeError):
            average(20, 30, 70)

print unittest.main() # Calling from the command line invokes all tests

Writing average.py


In [26]:
!python average.py

.
----------------------------------------------------------------------
Ran 1 test in 0.000s

OK


## 10.12. バッテリー同梱
Python には “バッテリー同梱 (batteries included)” 哲学があります。この哲学は、洗練され、安定した機能を持つ Python の膨大なパッケージ群に如実に表れています。例えば:

+ xmlrpclib および SimpleXMLRPCServer モジュールは、遠隔手続き呼び出し (remote procedure call) を全く大したことのない作業に変えてしまいます。モジュール名とは違い、XML を扱うための直接的な知識は必要ありません。


+ email パッケージは、MIME やその他の RFC 2822 に基づくメッセージ文書を含む電子メールメッセージを管理するためのライブラリです。実際にメッセージを送信したり受信したりする smtplib や poplib と違って、email パッケージには (添付文書を含む) 複雑なメッセージ構造の構築やデコードを行ったり、インターネット標準のエンコードやヘッダプロトコルの実装を行ったりするための完全なツールセットを備えています。


+ xml.dom および xml.sax パッケージでは、一般的なデータ交換形式である XML を解析するための頑健なサポートを提供しています。同様に、 csv モジュールでは、広く用いられているデータベース形式のデータを直接読み書きする機能をサポートしています。これらのモジュールやパッケージを利用することで、Python アプリケーションと他のツール群との間でのデータ交換が劇的に簡単になります。


+ 国際化に関する機能は、 gettext, locale, codecs パッケージといったモジュール群でサポートされています。