<a href="https://colab.research.google.com/github/vitroid/PythonTutorials/blob/2020b3/1%20For%20beginners/5-3%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB%E5%85%A5%E5%8A%9B.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 外部ファイルの読み込み
データの個数が増えてくると、手で間違いなく打ちこむのは大変な作業になるので、ファイルに一旦書きこんだデータを読みこめると便利です。

ファイルといってもいろんなファイルがありますよね。パソコンの中には、ワープロで書いた文章、音楽、写真、映画、などなどいろんなファイルがありますが、一番簡単にあつかえるのは、テキストファイルと呼ばれる、最もシンプルな形式のファイルです。テキストファイルには、文字と、改行文字だけが含まれていて、文字の色、大きさ、書体などといった装飾的な情報は一切入っていません。そっけないぐらいシンプルな分、取り扱いも簡単です。実験データはたいていテキストファイル形式になっていますから、ここではテキストファイルの読み込み方だけを説明します。音楽や写真を読みこむ場合には、また別の方法を学ぶ必要があります。なお、pythonのプログラム自体もテキストファイルです。

## はじめに: Google Driveの準備

あらかじめ、Google Driveをマウントして、Colabから読み書きできるようにしておきます。

In [0]:
from google.colab import drive
drive.mount('/content/drive')

## テキストファイルの読みこみ

テキストファイルを読みこむ、定型的なプログラムは次の通りです。

In [0]:
file = open("drive/My Drive/data.txt") # My Driveのなかのdata.txtを「開く」
lines = file.readlines()    # ファイルからすべての行を，文字列のリストとして読みこむ
print(lines)

ファイルの内容が、行ごとに分割され、リストになっていることが見てとれます。

### data.txtの内容

```text
1.000
2.000
3.000
4.000
5.000
6.000
7.000
8.000
```

`data.txt`を読みこみ、書かれている数字を二乗して表示するプログラムを書いてみます。

In [0]:
file = open("drive/My Drive/data.txt")
lines = file.readlines()
for line in lines:
    print(line**2)       # lineは文字列なので、これはエラー!

### 書きなおしたプログラム

In [0]:
file = open("drive/My Drive/data.txt")
lines = file.readlines()
for line in lines:
    x = float(line)   # lineは文字列、xはそれをfloat(実数)に変換したもの
    print(x**2)       # xの二乗を表示。

## もう少し複雑なデータの読みこみ

例えば次のような3列の数字が書かれたテキストファイル sample1.txt を読みこんで、各行の和と、各列の和を同時に計算するプログラムを書いてみましょう。

### サンプルデータファイル sample1.txt の内容

```plain
1.000  1.000  1.000
2.000  1.000  2.000
3.000  2.000  4.000
4.000  3.000  8.000
5.000  5.000  16.000
6.000  8.000  32.000
7.000  13.000  64.000
8.000  21.000  128.000
```

まずは、pythonがこのファイルをどんな風に読むかを見てみましょう。

In [0]:
file = open("drive/My Drive/sample1.txt")
lines = file.readlines()
print(lines)

各行をひとつながりの文字列として読みこんでいることがわかります。

あとの処理のために、1行ずつプリントするように変更します。(ついでに、行番号を表示します)

In [0]:
file = open("drive/My Drive/sample1.txt")
lines = file.readlines()
num = 1
# 繰り返し。lineには、linesの要素が前から順番に入る。
for line in lines:
    # 行番号numと、行の内容lineを表示
    print(num,line)
    # 行番号を1増やす
    num += 1

split命令を使うと、1つの文字列を空白のところで分割し、改行文字をとりのぞいてリストにしてくれます。

In [0]:
file = open("drive/My Drive/sample1.txt")
lines = file.readlines()
for line in lines:
    # lineを、さらに空白の位置で分割してリストにします。
    columns = line.split()
    print(columns)

splitを使うと、lineがカラムごとにきりはなされて、3つの値を含むリストになりました。しかし、見てわかる通り、読みこんだ内容は文字列とみなされているため、次のようにして3つのカラムの和を計算しようとすると、文字列同士をつないでしまいます。

In [0]:
file = open("drive/My Drive/sample1.txt")
lines = file.readlines()
for line in lines:
    columns = line.split()
    print(columns)
    print(columns[0] + columns[1] + columns[2])

そこで、文字列を実数に読みかえるfloat()関数を使います。

In [0]:
file = open("drive/My Drive/sample1.txt")
lines = file.readlines()
for line in lines:
    columns = line.split()
    print(float(columns[0]),float(columns[1]),float(columns[2]))

あとは、行と列の合計を計算するように、ちょっと書き加えます。行の合計はその場で計算できますが、列の合計は変数に加算していく必要があるので、新しい変数を追加します。

In [0]:
file = open("drive/My Drive/sample1.txt")
lines = file.readlines()
sum0 = 0      #カラム(列)ごとの合計値を入れる変数を準備しておく。
sum1 = 0
sum2 = 0
for line in lines:
    columns = line.split()     #行をカラムごとに分割
    col0 = float(columns[0])   #各カラムの値を数値になおす
    col1 = float(columns[1])
    col2 = float(columns[2])
    sum0 += col0        
    sum1 += col1
    sum2 += col2
    total = col0+col1+col2
    print(col0, col1, col2, "|", total)

print("------------------")
print(sum0,sum1,sum2)

いかがでしょうか? プログラムの動きが読めましたか?

### 練習

上のプログラムから余分なものを省いて、最初のカラムの値の平均値だけを表示するプログラムを作って下さい。(36/8=4.5になるはず)