# Pythonプログラミング入門 第6回
Python 実行ファイルとモジュールについて説明します

# Python プログラムファイル
この講義ではこれまで、プログラムを jupyter-notebook （拡張子 .ipynb）のコードセル（Code）に書き込むスタイルを採ってきました。
jupyter-notebook では、コードセルに加え、文書セル（Markdown）、出力結果を json 形式で保存しています。
この形式は学習には適していますが、Python で標準的に使われるプログラムファイル形式ではありません。

Python の標準プログラム形式（拡張子 .py）では Python プログラム、すなわち jupyter-notebook におけるコードセルの内容を記述します。
オペレーティングシステム（実際にはシェル）から Python プログラム、例えば `foo.py` を実行するには、以下のようにします。（もちろん `python` は実行パスに入っている必要があります）

---
```console
$ python foo.py
あるいは
$ python3 foo.py
```

---

## プログラムファイルの文字コード

Python の標準プログラム形式では、ヘッダ行が定義されておりプログラムで使用する文字コードや、Unix 環境では Python インタープリタのファイルパスなどを記述します。
Python の標準文字コードは UTF-8 (Unicode) ですが、これに代えて Windows などで使われてきた Shift_JIS を利用する場合は、先頭行に以下を記述します。

---
```Python
# -*- coding: shift_jis -*-
```

---

Unix ではプログラムスクリプトの先頭行には、そのスクリプトを読み込むインタプリタを指定します（shebang 行）。
このケースでは先頭行は例えば、以下のようになります。

---
```Python
#!/usr/bin/env python3
# -*- coding: shift_jis -*-
```

---

## jupyter-notebook で Python プログラム (.py) をあつかう

jupyter-notebook で Python プログラムをあつかうには大きく２種類の方法があります。

1. jupyter-notebook で直接 Python プログラム(.py)を開く
1. jupyter-notebook を Python プログラム(.py)に変換する

### jupyter-notebook で Python プログラムを開く
jupyter-notebook で直接 Python プログラムファイルを開くには、
（jupyter-notebook 起動時に表示される）ファイルマネージャ画面で、`New -> Text file` を選択すると、エディタ画面に遷移します。
その後、`File -> Rename` あるいはファイル名を直接クリックして .py 拡張子をもつファイル名として保存します。
実際には、セルで動作を確認したプログラムスクリプトをクリップボードにコピー、ここのエディタにペーストするという方法が現実的と思われます。

### jupyter-notebook 形式を Python プログラム(.py)に変換する
講義で利用している jupyter-notebook を .py としてセーブするには、`File -> Download as -> Python(.py)`を選択します。
そうすると、コードセルだけがプログラム行として有効になり、その他の行は `#` でコメントアウトされた Python プログラムファイルがダウンロードファイルに生成されます。環境によっては、`.py` ではなく `.html` ファイルとして保存されるかもしれませんが、ファイル名を変更すれば Python プログラムファイルとして利用できます。
後者の方法は、全てのコードセルの内容を一度に実行するプログラムとして保存されます。jupyter-notebook のようにセル単位の実行とはならないことに注意する必要があります。

**ここでは jupyter-notebook で Python プログラムファイルを作成する方法を紹介しましたが、
使い慣れているエディタがあればそちらを使ってもかまいません。**

## プログラムへの引数の渡し方
Python プログラムファイル(.py)の実行時には、パラメータとして引数を与えることができます。  
引数は、`sys` モジュールの `argv` 変数にリストとして格納されます。
以下のプログラムはコマンドラインに与えられた引数を出力します。

---
```Python:argsprint.py
from sys import argv
for i, arg in enumerate(argv):
    print(i,":", arg)
```

---
これを実行すると、以下のように出力されます。
リストの最初の要素には、プログラム名そのものが格納されることに注意してください。

---
```console
$ python argsprint.py foo bar baz
0 : argsprint.py
1 : foo
2 : bar
3 : baz
$
```

---

# モジュール

プログラムが大きくなるとそれを複数のファイルに分割した方がプログラム開発・維持が簡単になります。
また一度定義した便利な関数・クラスを別のプログラムで再利用するにもファイル分割が必要となります。
Python ではプログラムをモジュール単位で複数のファイルに分割することができます。

以下が記述された simpleutcourse.py というモジュールを読み込む場合を説明します。

---
```Python:simpleutcourse.py
class SimpleCourse:
    def __init__(self):
        self.students = []
    def add_member(self, id):
        self.students.append(id)
        
class SimpleUTCourse(SimpleCourse):
    def __init__(self, title_j, name_j, year, terms, slot):
        super().__init__()
        self.title_j = title_j
        self.year = year
        self.terms = terms
        self.slot = slot
```

---

ここで定義されているクラスを利用するには、`import モジュール名（.pyは省略）` と書きます。
ここで、モジュールで定義されている関数名・クラス名は `モジュール名.クラス名`となります。

In [1]:
import simpleutcourse

sc = simpleutcourse.SimpleCourse()
sc.add_member("18-1234")
print(sc.students)

['18-1234']


モジュール内で定義されている名前を読み込み元のプログラムでそのまま使いたい場合は、以下のように書くことができます。

In [2]:
from simpleutcourse import SimpleCourse, SimpleUTCourse

sc1 = SimpleCourse()
sc1.add_member("33-1234")
print(sc1.students)

['33-1234']


別の方法として、ワイルドカード`*`を利用する方法もあります。  
この方法ではアンダースコア`_`で始まるものを除いた全ての名前が読み込まれるため、明示的に名前を指定する必要はありません。

ただしこの方法は推奨されていません。理由は読み込んだモジュール内の未知の名前とプログラム内の名前が衝突する可能性があるためです。

In [3]:
from simpleutcourse import *

モジュール名が長すぎるなどの理由から別の名前としたい場合は、`as` を利用する方法もあります。

In [4]:
import simpleutcourse as sc

sc1 = sc.SimpleCourse()
sc1.add_member("18-1234")
print(sc1.students)

['18-1234']


## 練習
第一回では、数学関数を以下のように import し、`math.sqrt()` 関数を利用していました。

---
```Python
import math
print(math.sqrt(2))
print(math.sin(math.pi))
```

---

以下のセルのプログラムを `math.変数・関数名`を `変数・関数名`として利用するように書き換えてください。
すなわち、`math.sqrt()` に代えて `sqrt()` を `math.pi` に代えて `pi` を使うように修正してください。

In [8]:
import math
print(math.sqrt(2))
print(math.sin(math.pi))

1.4142135623730951
1.2246467991473532e-16


In [16]:
from math import sqrt, pi, sin

print(sqrt(2))
print(sin(pi))

1.4142135623730951
1.2246467991473532e-16


## モジュールの検索パス

import されるモジュールは Python インタプリタの検索パスに置く必要があります。
当面は自身でつくるモジュールはプログラムファイルと同じディレクトリに置けば問題はありません。
検索パスの情報は `sys.path`　変数から取得できます。

In [7]:
import sys
sys.path

['',
 '/Users/yohei/anaconda3/lib/python36.zip',
 '/Users/yohei/anaconda3/lib/python3.6',
 '/Users/yohei/anaconda3/lib/python3.6/lib-dynload',
 '/Users/yohei/anaconda3/lib/python3.6/site-packages',
 '/Users/yohei/anaconda3/lib/python3.6/site-packages/aeosa',
 '/Users/yohei/anaconda3/lib/python3.6/site-packages/IPython/extensions',
 '/Users/yohei/.ipython']

# 予習課題

**この予習課題は、これまで学んだ Python プログラミングだけではなく OS に関する知識も必要となり、
難易度が若干高くなっています。  
この課題に関しては、講義前にクリアできない場合でも講義の解説後の再提出も受け付けます。**



東京大学授業カタログ大学院版、学部前期課程版をそれぞれ `grad-2018.json`、`jd-2018.json` というファイルに用意しました。
これらの json ファイルを Python 標準 json モジュールの `json.load()`によって読み込み、教員名`name_j`が"全教員"となっている講義情報のみを json として出力するプログラム、filter_all.py を作成してください。

ただし、コマンドライン引数によって読み込む授業カタログファイルを指定します。
大学院版を読み込む場合は以下のようになります。

```console
$ python filter_all.py grad-2018.json
あるいは
$ python3 filter_all.py grad-2018.json
```

出力する json ファイルのファイル名は、`"all_" + 与えたファイル名` としてください。

In [2]:
from sys import argv
import json

with open(argv[1], "r", encoding="utf-8") as f:
    j = json_load(f)

nd = []

for d in j:
    if "全教員" == d["name_j"]:
        nd.append(d)

with open("all_" + argv[1], "w", encoding = "utf-8") as fw:
    json_dump(nd, fw)

FileNotFoundError: [Errno 2] No such file or directory: '-f'

In [36]:
with open("jd-2018.json", "r") as f:
    j = load(f)
    #for d in j:
        #if d["name_j"] == "全教員":
            #print(d)

with open("all_jd-2018.json", "w", encoding = "utf-8") as g:
    for d in j:
        if d["name_j"] == "全教員":
            dump(d, g, ensure_ascii=False)
        else:
            pass

In [34]:
for d in j:
    if d.get('title',-1)==-1:
        print(d)

## モジュールファイルの実行(参考)

モジュールファイルは他のプログラムで利用する関数・クラスを定義するだけではなく、
それ自身を Pythoh プログラムとして実行したい場合もあります。
このような場合は、プログラム実行部分に以下のコードを追加することで実現できます。

---
```Python
関数・クラスの定義
if __name__ == "__main__":
    プログラムの実行文
```

---

Python では、直接実行されたファイルは `"__main__"` という名前（`__name__`）のモジュールとして扱われます。
プログラムの中でモジュールの名前は `__name__` という変数に
入っていますので、`__name__ == "__main__"` という条件により、
直接実行されたファイルかどうかが判定できます。

## パッケージ(参考)
パッケージは Python モジュール名を、区切り文字 `.` を利用して構造化する方法です。  
多くの関数・クラスを提供する巨大なモジュールで利用されています。

以下は、`foo` パッケージのサブモジュール `bar.baz` を import する例です。

---
```Python
import foo.bar.baz
あるいは
from foo import bar.baz
```

---

パッケージはファイルシステムのディレクトリによって構造化されています。
Python はディレクトリに `__init__.py` があればディレクトリパッケージとして取り扱います。
最も簡単なケースでは `__init__.py` はただの空ファイルで構いませんが、 `__init__.py` にパッケージのための初期化コードを入れることもできます。

上の例 `foo.bar.baz` は以下のディレクトリ構造となります。

---
```console
foo/
    __init__.py
    bar/
        __init__.py
        baz/
            __init__py
            baz_moduke.py
```

---