# 5. ファイル操作とモジュール
***
本節では、Pythonでファイルを読み書きする方法と、
Pythonファイルの分割と再利用のためモジュールについて説明します。
また、Pythonが用意するモジュールである標準ライブラリも紹介します。

<a id="guide-files"></a>
## 5.1. ファイル操作
***
プログラムには何らかの入出力が不可欠です。ここでは入力元、出力先としてファイルを操作する方法を説明します。

<a id="Files-open"></a>
### 5.1.1. ファイルのオープン(書き込みモード)
***
まずはPythonでファイルに書き込んでみます。

Pythonでファイルを書き込むために、ファイルを開く必要があります。
Pythonでファイルを開くには ``open()`` 関数を使います。
書き込み用にファイルを開く場合には、以下のように引数を指定してファイルを **書き込みモード** で開きます。

* 第1引数 ファイルのパス
* 第2引数 ファイルのモード(この場合は ``w`` で書き込みモード)
* encoding引数 ファイルの文字コード(この場合は ``utf-8``)

以下のように指定して ``pycamp.txt`` というファイルを書き込みモードで開きます([リスト5.1](#file-open) )。

<a id="file-open"></a>
#### リスト5.1 ファイルを開く

In [None]:
 f = open('pycamp.txt', 'w', encoding='utf-8')
 f

``open()`` 関数は、ファイルオブジェクトを返します（[リスト5.1](#file-open) の場合は ``f`` へ代入しています）。
ファイルオブジェクトを通じて、開いたファイルに対する書き込みや読み込みの操作を行います。

<a id="tip"></a>
   ファイルが存在しない状態で書き込みモードでファイルを開くと、ファイルが新規に作成されます。

   ファイルが存在する場合は、もとの中身が削除されます。大事なファイルの中身を書き込みモードで消さないように注意してください。

<a id="Files-write"></a>
### 5.1.2. ファイルへの書き込み
***
ファイルへ書き込みを行うには、ファイルオブジェクトの ``.write()`` メソッドを使用します。
引数に書き込む文字列を指定します（[リスト5.2](#write-string)）。
``.write()`` メソッドを実行すると、書き込んだ文字数が返されます。

<a id="write-string"></a>
#### リスト5.2 ファイルへ書き込み

In [None]:
f.write('Hello')

In [None]:
f.write(' Python\n')  # 改行を書き込むには \n を指定する

In [None]:
f.write('こんにちはPython\n')  # 日本語も書き込み可能

[リスト5.1](#file-open)、[リスト5.2](#write-string) の結果、実行環境直下に ``pycamp.txt`` というファイルが次のような内容で作成されます。

#### リスト5.3 新規作成されたpycamp.txtの内容
```
   Hello Python
   こんにちはPython
```
<a id="File-close"></a>
### 5.1.3. ファイルのクローズ
***
ファイルを開いた後は閉じる必要があります。ファイルを閉じることにより、ファイルを開くために使われていたシステム資源を解放します。

ファイルを閉じるには、ファイルオブジェクトの ``.close()`` メソッドを呼び出します。

#### リスト5.4 ファイルを閉じる

In [None]:
f.close()

<a id="File-read"></a>
### 5.1.4. ファイルの読み込み
***
ファイルの中身を読み込むには、ファイルを読み込みモード(``r``)で開きます。
その後ファイルオブジェクトの ``.read()`` メソッドでファイルの中身を読み込みます（[リスト5.5](#read-file)）。

<a id="read-file"></a>
#### リスト5.5 ファイル内容の読み込み

In [None]:
f = open('pycamp.txt', 'r', encoding='utf-8')
f

In [None]:
txt = f.read()
print(txt)

In [None]:
f.close()

``.read()`` メソッドは、ファイルの内容の文字列（``str``）を返します。

なお、第2引数のデフォルトは読み込みモードなので、 ``r`` の指定は省略できます([リスト5.6](#read-file2))。

<a id="read-file2"></a>
#### リスト5.6 第2引数を省略してファイルを開く

In [None]:
f = open('pycamp.txt', encoding='utf-8')
f

<a id="note"></a>

   with文でのファイルオープン

   ファイルを扱う際には、 [with文](https://docs.python.org/ja/3/reference/compound_stmts.html#with) を使うと便利です。
   ``with`` 文を使うことで、ファイルのクローズを自動で行えます。処理中に例外が発生しても必ずファイルを閉じることができます。

   ``with`` 文を使うと、ファイルのオープン、読み込み、クローズの処理は、[リスト5.7](#with-statement) のように書き換えられます。

<a id="with-statement"></a>
#### リスト5.7 ファイルオープンとwith文

In [None]:
with open('pycamp.txt', encoding='utf-8') as f:
     txt = f.read()
print(txt)

<a id="File-append-mode"></a>

### 5.1.5. 追記モードでの書き込み
***
書き込みモード(``'w'``)でファイルを開くと、ファイルの内容は常に新しく上書きされます。

[リスト5.2](#write-string) の書き込みをもう一度行っても、ファイルの内容は ``'Hello Python\nこんにちはPython\n'`` となります。

すでに存在するファイルを対象に、末尾に追記するには、ファイルを追記モードで開きます。
追記モードでファイルを開くには、 ``open()`` 関数の第2引数に ``'a'`` を指定します（[リスト5.8](#append-mode)）。

<a id="append-mode"></a>
#### リスト5.8 追記モードでファイルを開く

In [None]:
f = open('pycamp.txt', 'a', encoding='utf-8')
f.write('こんにちは世界\n')

[リスト5.8](#append-mode) の結果、追記後の ``pycamp.txt`` の内容は次のようになります
#### リスト5.9 追記されたpycamp.txtの内容
```
   Hello Python
   こんにちはPython
   こんにちは世界
```
<a id="guide-module"></a>
### 5.2. モジュール
***
ここまでの処理はPythonインタープリタの対話モード上か、1つのPythonファイルに記述して実行してきました。

しかし、対話モード上では処理を残すことができませんし、1つのファイルに記述していると、プログラムが長くなるとどこに何を書いているのかがわからなくなってきます。

処理が長く、複雑になると、複数のファイルに処理を分割する必要があります。役割ごとにファイルを分割することで、それぞれどういった処理をするものかを明確にできます。

Pythonでは他のPythonファイルや関数をインポート（import）して再利用できます。処理を複数のファイルに分割し、必要な処理をインポートして使います。

実行環境直下に ``calc.py`` というファイルを作成して、 ``add()`` 、 ``sub()`` 関数を定義しましょう（[リスト5.10](#calc-py)）。

<a id="calc-py"></a>
#### リスト5.10 add()、sub()関数の定義（calc.py）
```python
def add(a, b):
    return a + b


def sub(a, b):
    return a - b
```
<a id="Module-import"></a>
別のファイルをインポートするには ``import`` 文を使います。

Pythonインタープリタを起動して、 ``calc.py`` をインポートしましょう（[リスト5.11](#import-calc)）。

<a id="import-calc"></a>
#### リスト5.11 calcのインポート

In [None]:
import calc

``calc`` というモジュールがインポートされました。

Pythonファイルをインポートすることでモジュール（module）として再利用できます。

``calc`` モジュールから ``add()`` 関数を使うには、 ``calc.add()`` と呼び出します（[リスト5.12](#call-calc-add)）。

<a id="call-calc-add"></a>
#### リスト5.12 別モジュールの関数を利用

In [None]:
calc.add(1, 2)

<a id="Module-from"></a>
### 5.2.1. 関数のインポート
***
``add()`` 関数を直接インポートするには、 ``from ＜モジュール＞ import ＜インポート対象＞`` 文を使います。

``from ＜モジュール＞`` の部分にモジュール、 ``import ＜インポート対象＞`` の部分にインポートの対象を書きます（[リスト5.13](#import-function)）。

<a id="import-function"></a>
#### リスト5.13 関数のインポート

In [None]:
from calc import add
add(1, 2)

<a id="Module-as"></a>
### 5.2.2. 別名をつける
***
インポートした関数やモジュールに別名をつけるには ``as`` を使います。
関数やモジュールが頻繁に使われるのに名前が長い場合に使われます。

``import <インポート対象> as <別名>`` のように別名を指定します。
``calc`` モジュールに別名 ``c`` をつけてインポートするには [リスト5.14](#import-as) のようにします。

<a id="import-as"></a>
#### リスト5.14 インポート対象に別名をつける

In [None]:
import calc as c
c.add(1, 2)

### 5.2.3. 複数の対象をインポート
***
``calc`` モジュールから ``add()`` 、 ``sub()`` 関数を一度にインポートするには、
``import`` 文でカンマ区切りでインポート対象を指定します([リスト5.15](#import-functions))。

<a id="import-functions"></a>
#### リスト5.15 複数の対象をインポート

In [None]:
from calc import add, sub
add(1, 2)

In [None]:
sub(2, 1)

また、 :numref:`import-functions2` のように括弧を使っても指定できます。
インポート対象が多い場合は括弧を使った書き方のほうが可読性が高いので、こちらを使います。

<a id="import-functions2"></a>
#### リスト5.16 括弧を使った複数のインポート

from calc import (
     add,
     sub,
)

<a id="Standard-library"></a>
## 5.3. 標準ライブラリの利用
***
Python自体も標準でモジュールを提供しています。これら標準で提供されているモジュールをまとめて標準ライブラリと呼びます。

必要な処理をすべて自分で実装するのでなく、積極的に標準ライブラリを利用しましょう。

標準ライブラリを利用すると重複する実装が減り、コードの記述量を大幅に削減できます。

<a id="daetime"></a>
### 5.3.1. 日付を扱うモジュール
***
標準ライブラリの1つ ``datetime`` モジュールを取り上げます。
``datetime`` は日付や時刻を簡単に取り扱うことができるモジュールです。
ここでは例として日付の計算を行います。

``datetime.date()`` コンストラクタを使って日付を意味するオブジェクトを生成できます。
引数として年、月、日を指定します。

#### リスト5.17 datetime.date()コンストラクタ

In [None]:
import datetime
d = datetime.date(2016, 12, 23)
print(d.year, d.month, d.day)

また、 ``datetime.date.today()`` メソッドを使うと今日の日付を取得することができます。

#### リスト5.18 datetime.date.today()メソッド

In [None]:
today = datetime.date.today()
print(today)  # 実行する日によって結果が異なる

ここで、自分が生まれてから今日までに何日経過したのかを計算してみましょう。
自分で実装しようとすると、月ごとに日数が違う、うるう年の計算など面倒な計算が必要となりますが、
``datetime.date`` を使うと面倒な部分をモジュールが肩代わりしてくれます。

#### リスト5.19 datetime.date.today()メソッド

In [None]:
birthday = datetime.date(2008, 12, 3)  # Python 3.0のリリース日
today = datetime.date.today()
delta = today - birthday  # 日付や時刻の差を表すdatetime.timedeltaオブジェクト
print(delta.days)  # 実行する日によって結果が異なる

``datetime`` モジュールは他にも時刻を扱う ``datetime.time``, 日付と時刻両方を扱う ``datetime.datetime`` など日付や時刻の計算に便利な関数がたくさんあります。
詳しくはPythonの公式ドキュメントの「 [datetimeモジュール](https://docs.python.org/ja/3/library/datetime.html) 」を参考にしてください。

<a id="re"></a>
### 5.3.2. 正規表現モジュール
***
次に標準ライブラリの1つ ``re`` モジュールを扱います。
``re`` モジュールはPythonで正規表現を扱うためのモジュールです。

``re.search()`` 関数を使って、文字列が正規表現にマッチするか調べられます。第1引数に正規表現、第2引数に対象の文字列を渡します（[リスト5.20](#re-module)）。

<a id="re-module"></a>
#### リスト5.20 reモジュールの利用

In [None]:
import re
m = re.search('(P(yth|l)|Z)o[pn]e?', 'Python')
m

正規表現にマッチした場合、 ``re.search()`` は結果を表すマッチオブジェクトを返します。
マッチオブジェクトから値を取り出すには、 ``.group()`` メソッドを呼び出します（[リスト5.21](#match-object)）。

<a id="match-object"></a>
#### リスト5.21 正規表現にマッチした文字列の取得

In [None]:
m.group()

正規表現がグループを含む場合、グループの番号を引数に渡して取り出せます。
引数を指定しないか、0を指定すると、正規表現全体のマッチが返されます（[リスト5.22](#match-group)）。

<a id="match-group"></a>
#### リスト5.22 グループを指定して文字列の取得

In [None]:
m = re.search('py(thon)', 'python')
m.group()

In [None]:
m.group(0)

In [None]:
m.group(1)

正規表現にマッチしない場合は、[リスト5.23](#not-match) に示すように何も返しません（``None`` を返します）。

<a id="not-match"></a>
#### リスト5.23 正規表現にマッチしない場合

In [None]:
re.search('py', 'ruby')

### コラム: 正規表現の文字列
***
正規表現の文字列にはPythonのraw文字列を使うのが一般的です。

``r`` プレフィックスをつけてraw文字列を定義します。
raw文字列ではバックスラッシュを特別扱いしないので、
正規表現中にバックスラッシュを使う際に ``'\\'`` と書く必要がなくなります。


``re`` モジュールには、ここで説明していない有効な使い方があります。
Pythonの公式ドキュメントの「 [reモジュール](https://docs.python.org/ja/3/library/re.html) 」を参考にしてください。

また、他のPython標準ライブラリについては、「 [Python標準ライブラリ](https://docs.python.org/ja/3/library/index.html) 」を参考にしてください。


## 5.4. まとめ
***
本節では、Pythonでファイルを読み書きする方法、Pythonファイルを分割して再利用する方法を解説しました。
また、標準ライブラリである ``datetime`` モジュールや ``re`` モジュールの紹介をしました。