# タブ区切りテキスト

* [files/amino_acids_table.txt](files/amino_acids_table.txt) はアミノ酸の 1 文字表記、3 文字表記、名称、分子式、分子量 (g/mol) をタブ（`\t`）で区切ったファイルである

## シンプルな読み込み方法

In [2]:
with open('files/amino_acids_table.txt') as file:
    for i, line in enumerate(file):
        if i >= 5:
            break
        print(line.rstrip().split('\t'))

['I', 'Ile', 'Isoleucine', 'C6H13NO2', '131.1736']
['L', 'Leu', 'Leucine', 'C6H13NO2', '131.1736']
['K', 'Lys', 'Lysine', 'C6H14N2O2', '146.1882']
['M', 'Met', 'Methionine', 'C5H11NO2S', '149.2124']
['F', 'Phe', 'Phenylalanine', 'C9H11NO2', '165.1900']


* `rstrip` に何も引数を渡さなければ末尾の空白文字を全て削除できる

## `csv` モジュール

In [84]:
import csv

with open('files/amino_acids_table.txt') as file:
    reader = csv.reader(file, delimiter='\t')
    print(reader)
    for i, row in enumerate(reader):
        if i >= 5:
            break
        print(row)

<_csv.reader object at 0x7fc48103f828>
['I', 'Ile', 'Isoleucine', 'C6H13NO2', '131.1736']
['L', 'Leu', 'Leucine', 'C6H13NO2', '131.1736']
['K', 'Lys', 'Lysine', 'C6H14N2O2', '146.1882']
['M', 'Met', 'Methionine', 'C5H11NO2S', '149.2124']
['F', 'Phe', 'Phenylalanine', 'C9H11NO2', '165.1900']


* csv モジュールを使ってもよい
    * http://docs.python.jp/3/library/csv.html
    * https://docs.python.org/3/library/csv.html （日本語）
* `delimiter=` 引数で区切り文字を指定する
* 特に csv ファイルを書き出す際には、「コンマを含んだデータをコンマ区切りファイルに書き出す」などのコーナーケースに対応しているこのモジュールを使った方がよい

In [32]:
import csv

amino_acids = {}

with open('files/amino_acids_table.txt') as file:
    reader = csv.reader(file, delimiter='\t')
    for row in reader:
        amino_acids[row[0]] = {'sym3': row[1], 'name': row[2],
                               'formula': row[3], 'weight': float(row[4])}

print(amino_acids['A'])
print(amino_acids['K']['name'])
print(amino_acids['W']['formula'])

{'name': 'Alanine', 'formula': 'C3H7NO2', 'sym3': 'Ala', 'weight': 89.0935}
Lysine
C11H12N2O2


* csv ファイルをパースして辞書にする例