# 6. 辞書

---

## 6.1 辞書について

<br>

ある複数の要素を紐づけて、その組み合わせを格納した変数を**辞書**と言います。  
辞書は**キー**と**値**から構成されます。  
キーと値の組み合わせを辞書に代入した後、キーを指定すると、それに対応する値を返してくれます。  
以下のようにして辞書にキーと値を代入します。  
```python
辞書の作成
変数名 = {キー1:値1, キー2:値2,　キー3:値3}
```

キーと値の組み合わせはコロン`:`で繋ぎ、それぞれの組み合わせはカンマ`,`で区切ります。  
この組み合わせは何個でも代入することができます。  

多くの遺伝子には複数の転写産物が存在し、その転写産物にはIDがつけられています。  
キーをGene Symbol、値にrefSeq IDを紐づけた辞書を例として作成してみます。  

In [1]:
genes_dict = {'TP53': 'NM_000546', 'EGFR': 'NM_001346897', 'MYC': 'NM_001354870', 'CDKN1A': 'NM_000389'}
print(genes_dict)

作成した辞書型の変数`genes_dict`を`print()`で出力すると、辞書の中身が表示されます。
> <注>これらの遺伝子の転写産物は上記以外にも存在しますが、ここでは例として一つだけ使用しています。

---

## 6.2 辞書からキー、値を取り出す

<br>

キーを指定して、そのキーに紐づけられた要素を取得することができます。  
辞書の変数に`[キーの名前]`をつけます。

```
値の取り出し方
変数名[キーの名前]
```

例えば、辞書型変数`genes_dict`から、キー`EGFR`に対応する値を取得するには以下のようにします。

In [2]:
value = genes_dict['EGFR']
print(value)

NM_001346897


キーに`'EGFR'`を指定することで、EGFRの転写産物ID`NM_001346897`を取得できました。
<br>

<br>  
辞書を使っていると、ある一つのキーや値だけでなく、全てのキーや値を取り出して使いたいと思うことがしばしばあります。
辞書からすべてのキーを取り出したいときには、辞書型のメソッド（辞書型のデータを処理する関数)である`keys( )`を使用します。

```python
keys()メソッドの使い方
辞書型変数名.keys()
```

In [3]:
for key in genes_dict.keys():
    print(key)

TP53
EGFR
MYC
CDKN1A


for文を使い、`keys()`で辞書`genes_dict`のキーをひとつずつ取り出し、`print()`で出力しました。

<br>

辞書からすべての要素を取り出したいときには、`values()`メソッドを使用します。

In [4]:
for value in genes_dict.values():
    print(value)

NM_000546
NM_001346897
NM_001354870
NM_000389


for文を使い、`values()`で辞書`genes_dict`の要素をひとつずつ取り出し、`print()`で出力しました。

---

## 6.3 辞書からキーや要素を取り出してリスト形式にする

<br>

`keys()`や`values()`で返されるデータは`dict_keys`という形式のものです。

In [5]:
c = genes_dict.keys()
print('キー', c)
print('型', type(c))

キー dict_keys(['TP53', 'EGFR', 'MYC', 'CDKN1A'])
型 <class 'dict_keys'>


`type()`関数を使うと、変数がどのような型であるかを調べることができます。  
`keys()`で返されるデータは`dict_keys`という型であると教えてくれます。  
<br>

もしキーの情報をリストに変更したければ、`list()`関数を使用します。  

In [6]:
d = list(c)
print(d)
print(type(d))

['TP53', 'EGFR', 'MYC', 'CDKN1A']
<class 'list'>
