# 5. モジュール、パッケージ、プログラム

## 5.1 スタンドアローンプログラム

インタプリタを使って対話的にプログラムを実行していたが、スタンドアローンで実行したほうが便利なこともある。  
jupyterではファイルを作成するのが面倒くさいので、やり方だけ記載する。

[ファイル名:test1.py]
```python
print("This standalone program works!")
```
=> This standalone program workd!

これ以降は、notebook上でプログラムを記載する。

## 5.2 コマンドライン引数

コンピュータ上で次の2行を含む`test2.py`というファイルを作成する。

In [None]:
import sys
print('Program arguments:', sys.argv)

## 5.2 モジュールとimport文

モジュールは、Pythonコードを纏めたファイルのことである。  
`import`文を使うことで、他のモジュールのコードを参照する。これで、インポートしたモジュールのコード、変数をプログラム内で使えるようになる。

### 5.3.1 モジュールのインポート

import文のもっとも単純な使い方は、`import <module>`という書式である。

ここで、気象台をシミュレートして天気予報を表示してみる。  
- メインプログラムが予報を表示する。
- 別のモジュールは関数を1つ持つ。
    - この関数は、予報で使われている天気についての説明を返す。

メインプログラムは下記のようになる。

[ファイル名:weatherman.py]
```python
import report

description = report.get_description()
print("Today's weather", description)
```

そして、モジュールは次のとおり。

[ファイル名:report.py]
```python
def get_description():  # 下記docstringを参照
    """プロと同じようにランダムな天気を返す。"""
    from random import choice
    possibilities = ['rain', 'snow', 'sleet', 'fog', 'sun', 'who knows']
    return choice(possibilities)
```

ファイルのimportの関係性は下記の図のようになる。  
[weatherman.py]  
↑ import  
[report.py]

これら2つのファイルを同じディレクトリに置き、Pythonにweatherman.pyをメインプログラムとして実行せよと支持すると、  
weatherman.pyはreportモジュールにアクセスし、そのget_description()関数を実行する。  
このバージョンのget_description()は、文字列リストからランダムな結果を返すように作られているので、  
メインプログラムはその結果を手に入れて表示する。

```bash
$ python weatherman.py
"Today's weather: who knows"
$ python weatherman.py
"Today's weather: sun"
$ python weatherman.py
"Today's weather: sleet"
```

このプログラムでは、2つの別々の場所でインポートを使っている。
- メインプログラムのweatherman.pyは、reportモジュールをインポートしている。
- モジュールファイルreport.pyのget_description()関数は、Python標準のrandomモジュールからchoice関数をインポートしている。

ふたつのインポートはインポートの方法も異なる。
- weatherman.pyはimport reportを呼び出し、次にreport.get_description()を実行している。
- report.pyのget_description()関数は、from random import choiceを呼び出してから、choice(possibilities)を呼び出している。

1. 一つ目の方法は、reportモジュール全体をインポートしているが、get_description()のプレフィックスとしてreportを使わなければならない。  
このimport文を通り過ぎると、メインプログラムはreport.というプレフィックスを付ける限り、  
report.pyに含まれる全ての部分にアクセスできるようになる。  
モジュールの名前でモジュールの内容を修飾することにより、名雨の衝突が避けられる。  
どこかほかのモジュールにget_description()関数があっても、間違ってそれを呼び出すことはない。  

2. 二つ目の方法は、関数の中でimportおり、他にchoiceという名前のものは無いことが分かっているため、  
randomモジュールから直接choice()関数をインポートしている。  
そのため、get_description()関数は、次のようにランダムな結果を返すコードとして書くことも出来る。

```python
def get_description():
    import random
    possibilities = ['rain', 'snow', 'sleet', 'fog', 'sun', 'who knows']
    return random.choice(possibilities)
```

importの参照方法は、自分のコーディングスタイルに合わせて統一すべき。  
モジュール修飾名(random.choice)の方が安全だが、タイプ数が増える。  

今までのget_description()サンプルでは、**何を**インポートするかについて異なる例を示した。  
下記では、**どこで**インポートするかについて示す。  
importを呼び出していたのは、どの例でも関数の中だった。randomは関数の外からでもインポートできる。

```python
import random

def get_description():
    possibilities = ['rain', 'snow', 'sleet', 'fog', 'sun', 'who knows']
    return random.choice(possibilities)
    
get_description()
# => 'Who knows'
get_description()
# => 'rain'
```

インポートされるコードが複数の箇所で使われている場合には、関数の外でインポートした方が良い。  
使われる場所が限定されている場合には、使う関数の中から呼び出す。  
コードの依存関係を全てはっきりと分かるようにするために、ファイルの冒頭で全てのインポートをするという人もいる。どちらでも機能する。

### 5.3.2 別名によるモジュールのインポート

先程はメインプログラムのweatherman.pyでimport reportを呼び出した。  
しかし、同じ名前の別のモジュールが必要なときや、もっと覚えやすい名前や簡潔な名前を使いたい場合は、  
**別名**を使ってインポートすれば良い。`wr`という別名を使ってみよう。

```python
import report as wr
description = wr.get_decsription()
print("Today's weather:", description)
```

### 5.3.3 必要なものだけをインポートする方法

Pythonでは、モジュールから一つ以上の部品だけをインポートすることが出来る。  
元の名前にするか別名を使うかは部品ごとに決められている。  
まず、reportからget_description()を元の名前でインポートしてみる。

```python
from report import get_description()
description = get_description()
print("Today's weather:", description)
```

次に、`do_it`という名前でインポートする。

```python
from report import get_description as do_it
description = do_it()
print("Today's weather:", description)
```

上記のように、別の名前で同じモジュールをインポートできる。

### 5.3.4 モジュールサーチパス

Pythonは、インポートするファイルをどこに探しに行くのだろうか？  
実は、標準のsysモジュールのpath変数に格納されているディレクトリ名や、ZIPアーカイブ名のリストを使う。  
**Note: このリストにはアクセスして書き換えることが出来る。**

In [None]:
import sys

print(sys.path)

for place in sys.path:
    print(place)

上記の、最初の空行(実はある)は、空文字列の''で、カレントディレクトリという意味である。  
sys.pathの先頭が''なら、インポート時には、Pythonはまずカレントディレクトリを見る。  
例えば、import reportは、report.pyを探す。  
使われるのは、最初にマッチしたファイルである。  
その為、自分でrandomというモジュールを定義してそれが標準ライブラリよりも前のサーチパスに含まれている場合、  
標準ライブラリのrandomにはアクセスできないことになる。

## 5.4 パッケージ

Pythonアプリケーションをもっと大規模なものにするために、モジュールはパッケージと呼ばれる階層構造に属する事が出来る。  
例えば、異なるタイプの天気予報のテキストが欲しいものとする。一つは翌日のもの、もう一つは翌週のもの。  
このようなとき、例えばsourcesというディレクトリを作り、その中にdaily.pyとweekly.pyの2つのモジュールを作って、  
両方のモジュールにforecastという関数を作る。  
- sources/
    - daily.py
    - weekly.py
    
dailyバージョンは1個の文字列を返し、weeklyバージョンは7個の文字列のリストを返すとする。  

では、メインプログラムと2つのモジュールを見ていく。  
enumerate()関数は、リストを分解してforループにリストの個々の要素を供給する。  
この時、おまけで個々の要素に番号を追加する。

[メインプログラム:ファイル名:boxes/weather.py]
```python
from sources import daily, weekly

print("Daily forecast:", daily.forecast())
print("Weekly forecast:")
for number, outlook in enumerate(weekly.foreast(), 1):
    print(number, outlook)
```

[モジュール1:ファイル名:boxes/sources/daily.py]
```python
def forecast():
    'ニセの天気予報'
    return 'like yesterday'
```

[モジュール2:ファイル名:boxes/sources/weekly.py]
```python
def forecast():
    """ニセの週間天気予報"""
    return ['snow', 'more snow', 'sleet', 'freezing rain', 'rain', 'hail']
```

sourceディレクトリには、もう一つ`__init__.py`という名前のファイルを作る必要がある。  
**中身はからで良いが、Pythonはこの`__init__.py`ファイルがあるディレクトリをパッケージとして扱う。**

メインプログラムのweather.pyを実行して、何が起きるのかを見てみる。

`# 実際にはファイルを作ってないので、雰囲気だけ下記に書き出す。`
```bash
$ python weather.py
Daily forecast: like yesterday
Weekly forecast:
1 snow
2 more snow
3 sleet #霙
4 freezing rain #氷晶雨
5 rain
6 fog #濃霧
7 hail #雹
```

## 5.5 Python標準ライブラリ

Pythonの主張の中でも特段目立つのが、「バッテリー同梱」である。  
Pythonには、最初から、様々な役立つモジュールを集めた大規模な標準ライブラリがあり、コア言語が膨れ上がるのを防ぐために、別に管理されている。  
Pythonコードを書こうとするときには、まず、求めている事を既に実行している標準モジュールを探してみると良い。  
Pythonは、下記のようなドキュメント等を提供している。
- [モジュールの公式ドキュメント集](http://docs.python.org/3/library)
- [標準ライブラリチュートリアル](http://bit.ly/library-tour)

また、下記も役立つガイドである。
- Doug Hellmannの[今週のPythonモジュール](http://bit.ly/py-motw)
- 彼の著書[『The Python Standard Library by Example』(Addison-Wesley Professional)](http://bit.ly/py-libex)

この章からは、ウェブ、システム、データベース等々の個別分野を対象とする標準モジュールを多数使っていくこととなる。  
この節では、汎用的に使える標準モジュールの一部を取り上げる。

### 5.5.1 `setdefault()`と`defaultdict()`による存在しないキーの処理

既に説明したように、存在しないキーで辞書にアクセスしようとすると例外が発生する。  
辞書の`get()`関数を使って、キーが存在しない場合はデフォルト値を返すようにすれば、例外を避けられる。  
さて、`setdefault()`関数は`get()`関数と似ているが、キーが無ければ更に辞書に要素を追加するところが異なる。

In [2]:
periodic_table = {'Hydrogen' : 1, 'Helium' : 2}
print(periodic_table)

{'Hydrogen': 1, 'Helium': 2}


キーがまだ辞書になければ、新しい値とともに辞書に追加される。

In [3]:
carbon = periodic_table.setdefault('Carbon', 12)
carbon

12

In [4]:
periodic_table

{'Carbon': 12, 'Helium': 2, 'Hydrogen': 1}

既存のキーに別のデフォルト値を代入しようとしても、もとの値が返され、辞書は一切変更されない。

In [5]:
helium = periodic_table.setdefault('Helium', 947)
helium

2

In [6]:
periodic_table

{'Carbon': 12, 'Helium': 2, 'Hydrogen': 1}

defaultdict()も例外を防ぐという点では似ているが、辞書作成時にあらゆる新しいキーのためにデフォルト値を設定するところが異なる。  
引数は**関数**である。  

次の例では、int**関数**を渡している。  
このintはint()という形で呼び出され、整数の0を返す。

In [47]:
from collections import defaultdict

periodic_table = defaultdict(int)

これで、存在しないキーに対する値は整数(`int`)の0になる。

In [41]:
periodic_table['Hydrogen'] = 1
periodic_table['Lead']

0

In [40]:
periodic_table

defaultdict(int, {'Hydrogen': 1, 'Lead': 0})

defaultdict()に存在しないキーを用いた場合、そのキーが自動で生成される。  
そのキーの値は、defaultdict()に渡された引数の方が設定される。次の例では、値が必要になったときにno_idea()が呼び出される。

In [44]:
from collections import defaultdict

def no_idea():
    return 'Huh?'

bestiary = defaultdict(no_idea)
bestiary['A'] = 'Abominable Snowman'
bestiary['B'] = 'Basilisk'
bestiary['A']

'Abominable Snowman'

In [45]:
bestiary['B']

'Basilisk'

In [46]:
bestiary['C']

'Huh?'

`int()`、`list()`、`dict()`を使えば、これらの型の空の値を返して存在しないキーのデフォルト値にすることができる。  
`int()`は0、`list()`は空リスト(`[]`)、`dict()`は空辞書(`{}`)を返す。  
デフォルト値引数を省略すると、新しいキーに与えられるデフォルト値はNoneになる。  

なお、lambdaを使えば、defaultdict()呼び出しのなかでデフォルト作成関数を定義できる。

In [43]:
bestiary = defaultdict(lambda: 'Hah-hah!')
print(bestiary['E'])
print(bestiary)

Hah-hah!
defaultdict(<function <lambda> at 0x10412d2f0>, {'E': 'Hah-hah!'})


intは、独自カウンタを作るための手段になり得る。

In [35]:
from collections import defaultdict

food_counter = defaultdict(int)
for food in ['spam', 'spam', 'eggs', 'spam']:
    food_counter[food] += 1

for food, count in food_counter.items():
    print(food, count)

eggs 1
spam 3


__Note: 上記は便利なコードスニペットとして覚えておくと良いかも。__

飢えの例で、food_counterがdefaultdictではなく、通常の辞書だったら、辞書の要素のfood_counter[food]は初期化されていないため、  
これを初めてインクリメントしようとするたびにPythonは例外を発生させてしまう。  
次に示すように、余分な作業が必要になっていたはずである。

In [2]:
dict_counter = {}
for food in ['spam', 'spam', 'eggs', 'spam']:
    if not food in dict_counter:
        dict_counter[food] = 0
    dict_counter[food] += 1
    
for food, count in dict_counter.items():
    print(food,count)

eggs 1
spam 3


### 5.5.2 Counter()による要素数の計算

上記ではカウンタが話題になったが、Python標準ライブラリには、飢えの例で行ったことだけではなく、  
更に多くの機能を持った関数が含まれている。

In [3]:
from collections import Counter
breakfast = ['spam', 'spam', 'eggs', 'spam']
breakfast_counter = Counter(breakfast)
breakfast_counter

Counter({'eggs': 1, 'spam': 3})

`most_common()`関数は、すべての要素を降順で返す。引数として整数を指定すると、最上位から数えてその個数分だけを表示する。

In [4]:
breakfast_counter.most_common()

[('spam', 3), ('eggs', 1)]

In [5]:
breakfast_counter.most_common(1)

[('spam', 3)]

カウンタを結合することも出来る。まず、breakfast_counterの内容を確認しておく。

In [6]:
breakfast_counter

Counter({'eggs': 1, 'spam': 3})

次に、lunchという新しいリストとlunch_counterというカウンタを作る。

In [7]:
lunch = ['eggs', 'eggs', 'bacon']
lunch_counter = Counter(lunch)
lunch_counter

Counter({'bacon': 1, 'eggs': 2})

ここで、2つのカウンタを結合する。その方法の1つは、「+」を使った加算だ。

In [8]:
breakfast_counter + lunch_counter

Counter({'bacon': 1, 'eggs': 3, 'spam': 3})

片方からもう片方を引くには、-を使う。  
朝食では食べるが昼食では食べないものは何か。

In [9]:
breakfast_counter - lunch_counter

Counter({'spam': 3})

また、朝食では食べないが、昼食では食べるものは何か。

In [10]:
lunch_counter - breakfast_counter

Counter({'bacon': 1, 'eggs': 1})

4章の集合と同様に、積集合演算子の&を使えば、共通要素が得られる。  
朝食でも昼食でも食べるものは何だろうか。

In [13]:
breakfast_counter & lunch_counter

Counter({'eggs': 1})

和集合演算子の|を使えば、全ての要素を得ることが出来る。  
朝食か昼食で食べるものは何だろうか。

In [14]:
breakfast_counter | lunch_counter

Counter({'bacon': 1, 'eggs': 2, 'spam': 3})

### 5.5.3 OrderdDict()によるキー順のソート

今まで多くのサンプルコードでは、辞書のキーの順序は予測不能だということを示してきた。  
例えば、a, b, cというキーをその順序で追加しても、keys()はc,a,bと返してくることがある。  
次に示すのは、1章で既に使ったサンプルである。

In [15]:
quotes = {
    'Moe' : 'A wise guy, huh?',
    'Larry' : 'Ow!',
    'Corly' : 'Nyuk nyuk!',
}
for stooge in quotes:
    print(stooge)

Corly
Larry
Moe


OrderdDict()は、キーが追加された順序を覚えていて、イテレータから同じ順序でキーを返す。  
(key, value)タプルのシーケンスからOrderdDictを作ってみる。

In [17]:
from collections import OrderedDict
quotes = OrderedDict([
        ('Moe', 'A wise guy, huh?'),
        ('Larry', 'Ow!'),
        ('Curly', 'Nyuk nyuk!'),
    ])
for stooge in quotes:
    print(stooge)

Moe
Larry
Curly


### 5.5.4 スタック+キュー=デック

deque(デックと発音する)は、両端キューのことで、スタックとキューの両方の機能を持っている。  
シーケンスのどちらの端でも要素を追加、削除できるようにしたい時に便利である。  

次のサンプルは、単語の両端から中央に向かって文字を一つずつ処理し、単語が回文になっているかどうかをチェックする。  
popleft()は、デックから左端の要素を削除して返す。pop()は右端の要素を削除して返す。  
これらを組み合わせれば、両端から中央に向かって文字を一つずつ処理できる。  
両端の文字が等しければ、中央に到達するまで文字の削除を続けていく。

In [18]:
def palindrome(word):
    from collections import deque
    dq = deque(word)
    while len(dq) > 1:
        if dq.popleft() != dq.pop():
            return False
    return True

palindrome('a')

True

In [19]:
palindrome('racecar')

True

In [20]:
palindrome('')

True

In [21]:
palindrome('radar')

True

In [22]:
palindrome('halibut')

False

※上記のコードはデックの使い方の単純な例として使ったまでであり、高速な回文チェッカーがほんとうに必要であれば、  
逆順の文字列と比較したほうが遥かに簡単である。  
Pythonは、文字列で使えるreverse()関数を持っていないが、次のようにスライスを使えば逆順の文字列を作れる。

In [23]:
def another_palindrome(word):
    return word == word[::-1]

another_palindrome('radar')

True

In [24]:
another_palindrome('halibut')

False

### 5.5.5 itertoolsによるコード構造の反復処理

[itertools](http://bit.ly/py-itertools)には、特別な目的を持ついてラータ関数が含まれている。  
これらは、for ... in ループ内で呼び出されると、一度に1個の要素を返し、呼び出しの間も自分の状態を覚えている。  

chain()は、引数全体が一つのイテラブルであるかのように扱い、そのなかの要素を反復処理する。

In [1]:
#import itertools
#for item in itertools.chain([1, 2], ['a', 'b']):
#    print(item)

↑上記は無限ループなので実行しない。

cycle()は無限反復子で、引数から循環t系に要素を返す。

In [2]:
# import itertools
# for item in itertools.cycle([1, 2]):
#    print(item)

↑上記も永遠に続く。これを止めるにはCtrl-Cを押す。

accumulate()は、要素を一つにまとめた値を計算する。  
デフォルトでは和を計算する。  

accumulate()は、第2引数として関数を受け付け、この引数が加算の代わりに使われる。  
この関数は、2個の引数を受付、1個の結果を返すものでなければならない。

- 和を計算する

In [3]:
import itertools
for item in itertools.accumulate([1, 2, 3, 4]):
    print(item)

1
3
6
10


- 総乗を計算する

In [5]:
import itertools
def multiply(a, b):
    return a * b

for item in itertools.accumulate([1, 2, 3, 4], multiply):
    print(item)

1
2
6
24


itertoolsモジュールは、これら以外にも多くの関数を定義している。  
特に、順列、組み合わせの関数は、必要なときには時間の節約になる。

### 5.5.6 pprint()によるきれいな表示

本書のサンプルは、全てprint()を使って表示してきた(或いは、対話型インタープリタで単に変数名を入力して表示した)。  
しかし、ときどき結果は見栄えの悪いものになってしまった。  
pprintの様に綺麗に表示してくれる関数を使ってみる。

In [10]:
from collections import OrderedDict
from pprint import pprint
quotes = OrderedDict([
        ('Moe', 'A wise guy, huh?'),
        ('Larry', 'Ow!'),
        ('Curly', 'Nyuk nyuk!'),
    ])
print('pprint===========================')
pprint(quotes)
print('print============================')
print(quotes)

OrderedDict([('Moe', 'A wise guy, huh?'),
             ('Larry', 'Ow!'),
             ('Curly', 'Nyuk nyuk!')])
OrderedDict([('Moe', 'A wise guy, huh?'), ('Larry', 'Ow!'), ('Curly', 'Nyuk nyuk!')])


## 5.6 他のPythonコードの入手方法

標準ライブラリには必要な処理をしてくれる関数がなかったり、微妙に動作が要求とは異なる関数しか無かったりする。  
しかし、標準ライブラリ以外にも、オープンソースのサードパーティーPythonソフトウェアの世界がある。  
優れたリソースとしては、次のものがある。

- [PyPI](http://pypi.python.org)
- [github](https://github.com/Python)
- [readthedocs](https://readthedocs.org/)

また、[activestate](http://code.activestate.com/recipes/langs/python/)には、比較的小さなコードサンプルが多数揃っている。  
本書のほぼ全てのPythonコードは、コンピュータに標準でインストールされているPythonシステムの内容を使っている。  
そのなかには、全ての組み込みライブラリと標準ライブラリが含まれている。  
しかし、外部パッケージも使っているところがある。  

1章では、requestsを使ったが、9.1.3節ではその詳細を説明する。また、付録Dでは、サードパーティーPythonソフトウェアのインストール方法、その他の開発上必要な詳細を示す。

----

## 5.7 復習課題

5-1. zoo.pyというファイルを作り、その中に'Open 9-5 daily'という文字列を表示するhours()という関数を定義しよう。  
次に、対話型インタープリタでzooモジュールをインポートし、そのhours()関数を呼び出そう。

In [6]:
def test():
    import zoo
    zoo.hours()

test()

Open 9-5 daily


In [1]:
# おまけ
def test():
    from zoo import hours
    hours()
    
test()

Open 9-5 daily
