# csvモジュール

# Readerオブジェクト

In [1]:
import csv
example_file = open(r".\pydata\example.csv")
example_reader = csv.reader(example_file)
example_data = list(example_reader)
example_data

[['4/5/2015 13:34', 'Apples', '73'],
 ['4/5/2015 3:41', 'Cherries', '85'],
 ['4/6/2015 12:46', 'Pears', '14'],
 ['4/8/2015 8:59', 'Oranges', '52'],
 ['4/10/2015 2:07', 'Apples', '152'],
 ['4/10/2015 18:10', 'Bananas', '23'],
 ['4/10/2015 2:40', 'Strawberries', '98']]

csvファイルからデータを読み込むには csv モジュールの reader 関数に読み込み専用のFileオブジェクトを渡して Readerオブジェクトを生成する必要がある

簡単にReaderオブジェクトの中身を取り出すには、list関数に渡してリストにすると簡単で、呼び出すとリストのリストにして返してくれる

In [2]:
example_data[0][0]

'4/5/2015 13:34'

In [3]:
example_data[0][1]

'Apples'

In [4]:
example_data[0][2]

'73'

In [5]:
example_data[1][1]

'Cherries'

In [6]:
example_data[6][1]

'Strawberries'

リストなので上のように指定することで取り出すことができる

一つ目のインデックスが行(row)を表し、二つ目のインデックスが列(column)を表している

# forループでReaderオブジェクトからデータを読み出す

In [7]:
import csv
example_file = open(r".\pydata\example.csv")
example_reader = csv.reader(example_file)
for row in example_reader:
    print("Row #" + str(example_reader.line_num) + " " + str(row))

Row #1 ['4/5/2015 13:34', 'Apples', '73']
Row #2 ['4/5/2015 3:41', 'Cherries', '85']
Row #3 ['4/6/2015 12:46', 'Pears', '14']
Row #4 ['4/8/2015 8:59', 'Oranges', '52']
Row #5 ['4/10/2015 2:07', 'Apples', '152']
Row #6 ['4/10/2015 18:10', 'Bananas', '23']
Row #7 ['4/10/2015 2:40', 'Strawberries', '98']


上ではforループを使って行番号と内容を読み込んでループして表示している

行番号を取得するには、Readerオブジェクトの line_num 変数を使うことでできる(ファイルを開くと1回しか使えないので開きなおすか、seekを使う)

# Writerオブジェクト

In [8]:
import csv
output_file = open(r".\pydata\output.csv", "w", newline="")
output_writer = csv.writer(output_file)
output_writer.writerow(["spam", "eggs", "bacon", "ham"])
output_writer.writerow(["Hello, World!", "eggs", "bacon", "ham"])
output_writer.writerow([1, 2, 3.141592, 4])
output_file.close()

データをcsvファイルに書き込むには csvモジュール の writer 関数に書き込み専用でnewlineを改行なしに設定したFileオブジェクトを渡してWriterオブジェクトを生成する必要がある

Writerオブジェクトの writerow メソッドにリスト渡すことで1行ずつカンマでセルを区切りながら書き出すことができる

呼び出すたびに改行され次の行に入れることができる(newlineを改行なしにするのはこのためで、2重に改行されないようにするため)

# キーワード引数のdelimiterとlineterminator

In [9]:
import csv
csv_file = open(r".\pydata\example.tsv", "w", newline="")
csv_writer = csv.writer(csv_file,delimiter="\t", lineterminator="\n\n")
csv_writer.writerow(["apples", "oranges", "grapes"])
csv_writer.writerow(["eggs", "bacon", "ham"])
csv_writer.writerow(["spam", "spam", "spam", "spam", "spam", "spam"])
csv_file.close()

キーワードの delimiter は区切り文字のことで、デフォルトはカンマですが、上ではタブ文字に変更

キーワードの lineterminator は行終端文字のことで、デフォルトは改行ですが、上では2つの改行文字に変更

セルがタブで区切られているので、拡張子を.tsv(タブ区切りの値)にしている

# jsonモジュール

# loads関数を用いてJSONを読み込む

In [10]:
string_of_json_data = '{"name": "Zophie", "isCat": true, "mineCaught": 0, "felineIQ": null}'

In [11]:
import json
json_data_as_python_value = json.loads(string_of_json_data)
json_data_as_python_value

{'name': 'Zophie', 'isCat': True, 'mineCaught': 0, 'felineIQ': None}

JSONデータを格納した文字列をPythonの値に変更するには json モジュールの loads 関数に変換したい値を入れることでできる

loadsは load string の略

# dumps関数を用いてJSONを書き出す

In [12]:
python_value = {'name': 'Zophie', 'isCat': True, 'mineCaught': 0, 'felineIQ': None}

In [13]:
import json
string_of_json_data = json.dumps(python_value)
string_of_json_data

'{"name": "Zophie", "isCat": true, "mineCaught": 0, "felineIQ": null}'

pythonの値をJSON形式のデータにするには jsonモジュールの dumps 関数に変換したい値を入れることでできる

dumpsは dump string の略