# ファイル入出力の基本


## ファイルのオープン

ファイルから文字列を読み込んだり、ファイルに書き込んだりするには
`open()`という関数でファイルをオープンする必要がある。

```
f = open('ターゲットとなるファイル', モード)
```
`sample.txt`というファイルを開きたかったら

```
f = open('sasmple.txt', r)
```
ファイルの指定は、相対パスあるいは絶対パスのどちらでも良い。

モードは`r`が読み込み、`w`が書き込み、`a`が追記、`+`が読み書きどちらも指定となる。

In [1]:
f = open('fileIO.txt', 'r')

## ファイルのクローズ

ファイルオブジェクトは用が済んだら原則`close()`で閉じる。

```
f.close()
```

放置するとトラブルの原因になるので`close()`あるいは`with文`で処理する。

In [2]:
f.close()

## 行の読み込み

ファイルオブジェクトには`readline()`というメソッドを適用することが出来る。
ファイルから1行読み込んで文字列として返す。
1行は、ファイルの先頭か改行文字の次の文字からファイルの終わり、もしくは改行文字
までの文字列。
必ずしも改行で終わらない。
ファイルの終わりに達すると空文字列を返す。


In [3]:
f = open('fileIO.txt', 'r')

f.readline()

'hoge\n'

In [4]:
f.readlines()

['oh\n', 'hogehoge\n', 'yes\n', 'hoge']

In [5]:
f.readline()

''

In [6]:
f.close()

In [7]:
def last_line(name):
    last = ''
    with open(name, 'r') as f:
        while True:
            line = f.readline()
            if line == '':
                return last
            last = line

last_line('fileIO.txt')

'hoge'

## ファイル全体の読み込み
ファイル全体を一括で読み込んで、一つの文字列として出力させたい場合は
`read()`メソッドを使う。
一度`read()`メソッドで読み込ませるとファイルの終端に到達するので、それ以降は
空文字列を返す。

`read()`メソッドは内部的には`readline()`メソッドを呼び出している。
したがって、ファイルオブジェクトを消費する。

In [8]:
f = open('fileIO.txt', 'r')
f.read()

'hoge\noh\nhogehoge\nyes\nhoge'

In [9]:
f.read()


''

In [10]:
# readメソッドでファイルの内容を終端までまとめて出力

def number_of_characters(name):
    f = open(name, 'r')
    s = f.read()
    f.close()
    return len(s)

number_of_characters('fileIO.txt')

25

## 編集中のファイルの動作

プログラムでファイルを開くと、そのプログラム内でそのファイルを閉じない限り
他のプログラムで利用することはできない。
（表計算ソフトの排他制御のようなイメージ）
つまり、`close()`メソッドを忘れてはいけない。



## ファイルに対するwith文

`close()`メソッドが重要なのはわかっていても、忘れることがあるのは間違いない。
プログラム中で自身でクローズするなんてうっかりやらかしそうである。
そこで、with文を使う。

```
with ファイルオブジェクト as 変数:
    ファイルオブジェクトに対する処理

```

with文は処理が終わったら自動でファイルオブジェクトをクローズしてくれる。


In [11]:
with open('fileIO.txt', 'r') as f:
    print(f.read())

hoge
oh
hogehoge
yes
hoge


In [12]:
# with文が自動でクローズしてくれていることが、エラーで返ってくる。
f.read()

ValueError: I/O operation on closed file.

## ファイルへの書き込み

ファイルへの書き込みは`print`関数にキーワード引数`file`を指定してファイル名を
渡すことで行える。
モードは`w`を指定する。
同名のファイルが存在しない場合は新たに作成し、存在する場合は上書きする。
（追記ではない点に注意。以前の内容は消える）
`a`を指定すると追記モードになり、ファイルが存在する場合既存の内容の後に追記される。

In [None]:
with open('printTest.txt', 'w') as f:
    print('Hello\nWorld', file=f)

`print`関数はデフォルトで、与えられた文字列の末尾に改行文字を加えて表示するが、
キーワード引数`end`で任意の文字を挿入できる。

In [None]:
with open('printTest.txt', 'a') as f:
    print('hello', 'world\n', end='', file=f)

複数の印字対象を渡すと、デフォルトで空白文字で区切って印字する。
区切り文字は`sep`で指定する。


In [None]:
with open('printTest.txt', 'a') as f:
    print('hello', 'world', sep=', ', file=f)

より原始的な書き込み用メソッドとして、`write()`と`read()`がある。
`write()`メソッドは与えられた文字列を単に書き込む。

In [None]:
with open('fileIO.txt') as src, open('fileIO.txt.bak', 'w') as dst:
    dst.write(src.read())

In [17]:
def file_upper(infile, outfile):
    with open(infile, 'r') as f:
        with open(outfile, 'w') as wf:
            wf.write(f.read().upper())


In [18]:
with open('print-test.txt', 'w') as f:
    print('hello', 'world', file=f)

print(file_upper('print-test.txt', 'print-test-upper.txt'))

with open('print-test-upper.txt', 'r' ) as f:
    print(f.read() == 'HELLO WORLD\n')

None
True


## ファイルの読み書きにおける文字コード指定

`open`でファイルを開くと、通常そのファイルをテキストモードで開く。
その際、特に指定しなければデフォルトの文字コードでファイルを開こうとするが
テキストにて指定された文字コードと一致しない場合文字化けを起こす。

デフォルトの文字コードはWindowsでShift_JIS、macOSやLinuxではUTF-8になっていることが多い。
半角英数字は上記二種類の文字コードで共通のルールでエンコードされているためエラーになることはないが
マルチバイト文字（漢字など）はエンコードのルールが異なるため文字化けを起こすのでそのような文字を含むファイルを
保存する際、開く際は文字コードの種類を確認する。
PythonではOSの種類に関係なくUTF-8がよく使われる。

## 改行文字の削除

ファイルをテキストモードで開いて、`read()`や`readline()`で呼び出すと、`str`型の文字列として読み込まれる。


