# 外部ファイルの読み込み
データの個数が増えてくると、手で間違いなく打ちこむのは大変な作業になるので、ファイルに一旦書きこんだデータを読みこめると便利です。

ファイルといってもいろんなファイルがありますよね。パソコンの中には、ワープロで書いた文章、音楽、写真、映画、などなどいろんなファイルがありますが、一番簡単にあつかえるのは、テキストファイルと呼ばれる、最もシンプルな形式のファイルです。テキストファイルには、文字と、改行文字だけが含まれていて、文字の色、大きさ、書体などといった装飾的な情報は一切入っていません。そっけないぐらいシンプルな分、取り扱いも簡単です。実験データはたいていテキストファイル形式になっていますから、ここではテキストファイルの読み込み方だけを説明します。音楽や写真を読みこむ場合には、また別の方法を学ぶ必要があります。なお、pythonのプログラム自体もテキストファイルです。

テキストファイルを読みこむ、定型的なプログラムは次の通りです。
(2015コメント 一旦リストに入れたほうが、作業がわかりやすいかもしれない)

In [None]:
file = open(ファイルの名前)
for line in file:
    変数lineにファイルの1行が順番に読みこまれるので、
    lineに対して処理を行う。

たとえば、pythonのプログラム “sample.py” を読みこんで、行番号と行の長さをつけて表示するプログラムは、これを変形して、

In [None]:
file = open("sample.py")
linenum=1
for line in file:                 # ファイルの最後まで、一行ずつ読んでlineに入れる
    print(linenum,len(line),line)  # 行番号と、lineの長さと、lineを表示する。
    linenum = linenum + 1         # linenumを1増やす。

ファイルから読みこんだ各行の最後には改行文字が含まれていますが、printするとさらに改行するので2回ずつ改行されます。

注意しなければいけないことは、ファイルに数字が書いてあっても、pythonはそれを文字列として読みこんでしまうということです。例えば、ファイル “data.txt”に書かれた数字を二乗して表示するプログラムは、こんな風に書くとエラーになってしまいます。

### data.txtの内容

In [None]:
1.000
2.000
3.000
4.000
5.000
6.000
7.000
8.000

In [None]:
file = open("data.txt")
for line in file:
    print(line**2)       # lineは文字列なので、これはエラー!

また、通常、1行にいくつもデータが並んで書かれている場合が多いですが、こういうデータも、それぞれの行をひとつながりの文字列として読みこんでしまいます。ですから、きちんと数値として読みこむためには、一旦文字列として読みこんだ行を、数字に読み換える必要があります。

### 書きなおしたプログラム

In [None]:
file = open("data.txt")
for line in file:
    x = float(line)
    print(x**2, end=":")       # xは実数。改行の代わりにコロンを出力

例えば次のような3列の数字が書かれたテキストファイル sample1.txt を読みこんで、各行の和と、各列の和を同時に計算するプログラムを書いてみましょう。

### サンプルデータファイル sample1.txt の内容

まずは、pythonがこのファイルをどんな風に読むかを見てみるために、1行ずつ読みこんで、行の長さと内容をprintするプログラムを書いてみます。

In [None]:
file = open("sample1.txt")
for line in file:
    print(len(line),line,end="")

すると、確かに各行をひとつながりの文字列として読みこんでいることがわかります。(print文の中でend=""としたので、2度改行しなくなります。)

split命令を使うと、文字列を空白のところで分割し、改行文字をとりのぞいてリストにしてくれます。

In [None]:
file = open("sample1.txt")
for line in file:
    columns = line.split()
    print(columns)

splitを使うと、lineがカラムごとにきりはなされて、3つの値を含むリストになりました。しかし、見てわかる通り、読みこんだ内容は文字列とみなされているため、次のようにして3つのカラムの和を計算しようとすると、文字列同士をつないでしまいます。

In [None]:
file = open("sample1.txt")
for line in file:
    columns = line.split()
    print(columns)
    print(columns[0] + columns[1] + columns[2])

そこで、文字列を実数に読みかえるfloat()関数を使います。

In [None]:
file = open("sample1.txt")
for line in file:
    columns = line.split()
    print(float(columns[0]),float(columns[1]),float(columns[2]))

あとは、行と列の合計を計算するように、ちょっと書き加えます。行の合計はその場で計算できますが、列の合計は変数に加算していく必要があるので、新しい変数を追加します。

In [None]:
file = open("sample1.txt")
sum0 = 0      #カラム(列)ごとの合計値を入れる変数を準備しておく。
sum1 = 0
sum2 = 0
for line in file:
    columns = line.split()     #行をカラムごとに分割
    col0 = float(columns[0])   #各カラムの値を数値になおす
    col1 = float(columns[1])
    col2 = float(columns[2])
    sum0 += col0        
    sum1 += col1
    sum2 += col2
    print(col0+col1+col2)
    print(sum0,sum1,sum2)

いかがでしょうか? プログラムの動きが読めましたか?

### 練習
上のプログラムから余分なものを省いて、最初のカラムの値の平均値だけを表示するプログラムを作って下さい。