<img src="https://lh3.googleusercontent.com/pw/AM-JKLVhTn_UySwMdfMwXvoq8l3VN7IkrY9cwtH2YJVMxAlMznUBWC9IpFtgPRIyfAXru4oykkYD-1WjWi0Ao5XgkB9JICvzDBcfn0L_5X2_KOOppsURK5DfSifCC-s7Vx5oQrBUn_BNWn_hfAPdhlVbKQGE=w1097-h235-no?authuser=0" alt="2021年度ゲノム情報解析入門" height="100px" align="middle">

# Pythonの基礎


## はじめに

　**Python** には、数値計算（ベクトルや行列の計算）や、統計解析、機械学習（Machine Learning）、深層学習（Deep Learning）、グラフ描画など、データ解析用の追加パッケージ（ライブラリ）が豊富に揃っています。そのため、データ解析の分野で最も使われているプログラミング言語です。最近では、ゲノム解析でよく使われるようになってきています。

　この実習テキストでは、短いDNA配列を使って、Pythonの基礎を学んでいきます。


## 今回の実習内容
1. DNA配列を表示する
1. DNA配列に呼び出し名を付ける
1. DNA配列の長さを調べる
1. DNA配列を繋げる
1. DNA配列を切り出す
1. DNA配列を一文字ずつ取り出す
1. DNA配列に特定の配列があるか調べる
1. 特定の配列があるとき、DNA配列を表示する

---

## 1. DNA配列を表示する
　プログラムを使って、DNA配列（文字列）を表示してみましょう。`print`関数というものを使用すると、文字列を表示（出力）できます。

```python
# print関数の書き方
print("<文字列>")
```



In [None]:
# 例
print("ATAGAATTCT")

### 実習1

　print関数を使って、次のDNA配列（文字列）を画面に表示させてください。
 
```
GAATTC
```

#### 解答例

In [None]:
print("GAATTC")

### 「関数」とは  

　特定の機能を持ったコードのことを **関数 (Function)** と言います。 `print`関数は、「文字列や数値などの値（プログラミング用語で**引数**）が渡されると、それを画面に表示する」機能を持ったものです。Pythonには、`print`関数以外にも多くの関数があります。また、独自の関数を作成することも可能です。
 
<img src="https://lh3.googleusercontent.com/pw/ACtC-3d1dYl5Bv3sNkYyXOUJ6r5rH8BNbKylMXBO3eDldtuDAo2Enaip_fJYat293BpjZdOXSjHxh1Xt6KTqH2K_q6Bev04LqjyxmMLd025hqqwe7UcBEPsC4lKrVj59nxSGgJj8pwmVftzHTde-mz4uLA7v=w1487-h725-no?authuser=0" alt="function" height="200px">

### print関数に複数の値を渡す

　関数に与える値を **引数 (Argument)** と言いますが、関数によっては複数の値（引数）を与えることができます。その場合、それぞれの引数を、第1引数、第2引数、・・・、と呼びます。

　print関数には、複数の値を渡すことが可能です。カンマ（`,`）を使って、データを列挙すればOKです。

<img src="https://lh3.googleusercontent.com/pw/ACtC-3f9XZyF-YkTFloUXujVKGvf9NX0Fv_g_0qvZVEnF5ZZ3knUINKcDXwelJEjE_Y6CF4fXhq6YFIjOj3-FOWt8UH-_Ym-ha8ebHE_iepKl3w2xYn7rN9Vv5pZTgQGmcmHgB3G-mU8dvyk5jlWgqFp-7Ez=w1610-h268-no?authuser=0" alt="arguments" height="80px">


In [None]:
print("Welcome", "to", "python", "world")

### クオテーション

　Pythonでは、文字列を必ずクオテーションで挟む必要があります。

　クオテーションは、**シングルクオテーション**（`'`） と **ダブルクオテーション**（`"`）のどちらも使用可能です。ただし、ひとつの文字列に使うクオテーションは同じものでなければなりません。

　なお、クオテーションで挟まない場合、後ほど学ぶ「変数」として認識されてしまいます。


In [None]:
print('Kyoto')  # シングルクオテーション
print("University") # ダブルクオテーション

In [None]:
print('Agriculture") # シングルとダブルの併用はNG

### プログラム中のコメント

　ここまでのプログラムの例でも使用してきましたが、プログラムの中にコメント（説明文やメモ）などを差し込むことが可能です。ハッシュ記号（`#`）を使うと、ハッシュ記号からその行末までは、プログラムとして認識されず、スキップされます。

In [None]:
# print("Hello")  # 次の一行はプログラムとして実行されません。
print("Python")  # これはプログラムとして実行されます

## 2. DNA配列に呼び出し名を付ける

　DNA配列 `ATAGAATTCT` に `rice` という呼び出し名を付けてみましょう。

　下記のコードセルには、(1) 1行目でDNA配列に`rice`という呼び出し名を付けて、(2) 2行目で呼び出し名に設定されたDNA配列を表示させる、といったプログラムが書かれています。

In [None]:
rice = "ATAGAATTCT"
print(rice)

　呼び出し名を付けることをプログラミング用語で **変数を設定する（宣言する、定義する）** と言います。また、呼び出し名のことを **変数名** と言い、変数名に対応する文字列などのことを **値** と言います。上述の例では、`rice`が変数名で、`"ATAGAATTCT"`が値です。

```python
# 変数を設定する
変数名 = <値（文字列など）>
```

　変数に設定した値は変数名を使って何度でも取り出せます。また、同じ名前の変数を再設定することで、対応する値を何度でも入れ替えられます。

In [None]:
# 値は何度でも取り出し可能
rice = "ATAGAATTCT"  # 変数を設定
print(rice)
print(rice)
print(rice)

In [None]:
# 値は何度でも入れ替え可能
rice = "ATA"      # 変数を設定
print(rice)
rice = "GAA"  # 変数を再設定（上書き）
print(rice)
rice = "TTCT"  # 変数を再設定（上書き）
print(rice)

### 実習2

　次のプログラムを変更して、`GAATTC`を値にした変数を設定してください。

In [None]:
rice = "ATAGAATTCT"

print(rice)
print("GAATTC")
print(rice, "GAATTC")
print("GAATTC", rice)

#### 解答例

In [None]:
rice = "ATAGAATTCT"
cake = "GAATTC"

print(rice)
print(cake)
print(rice, cake)
print(cake, rice)

### 変数設定のイコール記号`=`について

　変数の設定で使われているイコール記号 `=` は、"等しい"という意味で使われていません。右辺の値を左辺の変数名に **代入**（登録）する、といった意味合いで使われています。今のところあまり意識する必要はありませんが、変数設定のイコール記号は「イコール（等しい）の意味ではない」と覚えておいてください。

<img src="https://lh3.googleusercontent.com/pw/ACtC-3dXnLTVmks3JyRY6n-uMz9kkfdqIx2mlKDkqtbQFob7EURWPVJPp5q91463mPlpvNO4OYHBbaHaAuookELsZqVCjV_kMh_An50sxuFr0QpmAmycrJV6zuN3I7sRVip4mPDo85QOiTrPP2h9bieYMcRL=w1493-h737-no?authuser=0" alt="set_variable" height="200px">

### 変数名のルール

　変数は、以下のルールに従って、任意の名前を付けることが可能です。
- 使える文字は、半角英数のアルファベットと数字、アンダースコア
  - 例) `ABC_abc_123`は可
  - 例) `ABC-abc-123`は不可
- 数字から始まる変数名は不可  
  - 例) `123_ABC_abc`は不可
  - 例) アンダーバーから始まる変数`_123_ABC_abc`は可
- Pythonが定義している [予約語](https://docs.python.org/ja/3/reference/lexical_analysis.html#keywords) は使用不可
  - 例） `for`、`if`、`class`などは不可
  - 例） `forA`、`ifB`、`classC`などは可

### 変数名を`print`関数で表示する

　変数名を`print`関数の引数にすると、変数の中身が出力されます。変数名自体を出力したい場合にはどのようにすれば良いでしょうか？　答えは、変数名自体を「文字列」として`print`関数に認識させればOKです。変数名をクオテーションで挟んだものを`print`関数に渡します。

In [None]:
rice = "ATA"
print("rice")

## 3. DNA配列の長さを調べる

　DNA配列の長さ（塩基数）を調べてみましょう。`len`関数というものを使います。

```python
# len関数の書き方
len("<文字列>")
```

　`len`関数は与えられた値の文字数を調べる関数です。下記のプログラムでは、`len`関数で調べた結果を`print`関数で出力しています。

In [None]:
# 例1
print(len("ATAGAATTCT"))

In [None]:
# 例2: 変数を使った場合
rice = "ATAGAATTCT"
riceL = len(rice)
print(riceL)

### 実習3
　変数`wheat`に代入されているDNA配列の塩基数を`len`関数で調べて、出力してください。

In [None]:
wheat = "ACAGAAATACCCAATATCTTGTTCTAGCAAGATATTGGGTATTTCTGTCT"


#### 解答例

In [None]:
wheat = "ACAGAAATACCCAATATCTTGTTCTAGCAAGATATTGGGTATTTCTGTCT"
wheatL = len(wheat)
print(wheatL)

## 4. DNA配列を繋げる

　2つのDNA配列（文字列）を繋げて、ひとつのDNA配列してみましょう。文字列同士の結合は、文字列と文字列の足し算でできます。

```python
# 文字列を繋げる（結合する）
"<文字列1>" + "<文字列2>"
```

In [None]:
# 例1
print("ATAGAATTCT" + "GAATTC")

In [None]:
# 例2: 変数を使った場合(1)
rice = "ATAGAATTCT"
cake = "GAATTC"
print(rice + cake)

In [None]:
# 例3: 変数を使った場合(2)
rice = "ATAGAATTCT"
cake = "GAATTC"
rice_cake = rice + cake
print(rice_cake)

### 同じ文字列を複数回直列に繋げる

　ここでは、同じ文字列5個を直列に繋げてみましょう。ここでは2通りの方法を紹介します。

　まずは、上で習った文字列の足し算を使う方法です。

In [None]:
# 文字列の足し算をつかう方法
rice = "TTCAGGAA"
print(rice + rice + rice + rice + rice)

　文字列の掛け算を使うと、もっと簡単に上と同じことができます。

In [None]:
# 文字列の掛け算をつかう方法
rice = "TTCAGGAA"
print(rice * 5)

### 実習4

　変数`s1`、`s2`、`s3`、`s4`、`s5`のそれぞれには、10塩基のDNA配列が入っています。それらを文字列を自由に繋げて、50塩基以上の長さのDNA配列を作ってください。

<small>＊ 一度も使用しない変数があっても構いません。</small>

In [None]:
s1 = "ACAGAAATAC"
s2 = "CCAATATCTT"
s3 = "GTTCTAGCAA"
s4 = "GATATTGGGT"
s5 = "ATTTCTGTCT"


#### 解答例

In [None]:
s1 = "ACAGAAATAC"
s2 = "CCAATATCTT"
s3 = "GTTCTAGCAA"
s4 = "GATATTGGGT"
s5 = "ATTTCTGTCT"

# 80塩基のDNA配列
long_s = s5 + s4 + s3 + s2 + s1 + s4 + s5 + s1

print(long_s)      # DNA配列を出力
print(len(long_s))  # DNA配列の長さを出力

## 5. DNA配列を切り出す

　DNA配列の一部分を切り出す方法を学びます。

### 任意の1塩基を切り出す

　任意の1塩基だけを切り出す方法から学びましょう。Pythonでは、文字列中の各文字に位置番号が振られています。その位置番号は、先頭の文字が0番、次の文字が1番、その次が2番、・・・のように振られています。この先頭から数える番号は、**0番から始まっている**ことに注意してください。

　また、文字列の最後尾から数える位置番号も設定されています。最後尾の文字が-1番、その前の文字が-2番、さらに前の文字が-3番、・・・のように番号が振られています。

　この位置番号のことを **インデックス（添字; Index）** と言います。

　任意の1文字を切り出すためには、そのインデックスを指定することになります。

```python
# 書き方: 1文字だけを切り出す
"<文字列>"[インデックス]
```

<img src="https://lh3.googleusercontent.com/pw/ACtC-3fBBp4s6Ck3dFa7RCY2QDzvU14YHQpPvmHtJgsiXI_0VmLcKqJwnGK5_UvkAa_0mGjByLJ-2Bl8BtOeaxh0bTuCAMhALmbGacUyPQKVaZA73N_6pwinXzuQQbH7TDAhgpzQz8WuF6ugL142y7CPwt-4=w1738-h606-no?authuser=0" alt="str_index" height="150px">

In [None]:
# 例1
# "2番目"　の塩基を切り出す
print("ATAGAATTCT"[2])

In [None]:
# 例2: 変数を使った場合
rice = "ATAGAATTCT"
print(rice[2])

### 実習5-1

　変数`wheat`には、50塩基のDNA配列が入っています。最後尾の1塩基`T`を取り出してください。

In [None]:
wheat = "ACAGAAATACCCAATATCTTGTTCTAGCAAGATATTGGGTATTTCTGTCT"


#### 解答例

In [None]:
wheat = "ACAGAAATACCCAATATCTTGTTCTAGCAAGATATTGGGTATTTCTGTCT"
print(wheat[49]) # 先頭からの番号を指定
print(wheat[-1]) # 最後尾からの番号を指定

### 範囲指定で複数塩基を切り出す

　次に、範囲指定で複数塩基をまとめて切り出す方法を学びます。こちらも位置番号を指定することになりますが、位置番号の解釈が少し異なります。

```python
# 書き方: 範囲指定で複数文字を切り出す
"<文字列>"[開始位置:終点位置]
```

　文字そのものの位置番号（インデックス）を指定するというよりも、文字と文字の間にある見えない"壁"に番号が振られていて、その番号を指定すると考えれば理解しやすいです。

　この範囲指定で文字列を切り出すことを **スライス (slice)** と言います。

<img src="https://lh3.googleusercontent.com/pw/ACtC-3feZBG8qm3g_bGLxk1TT9Hw77dmAgjp4A3_3ebN8v8KRUrpoO-5-ZE5d2l-GsBGn0L2gxobKoSwyNP84fExE0RLuZcI87T4RzSC7s-jBpbYqy5ZH9ABii5PMLkUO32YjXYM_jJkJGzd6G8S3HXkzQUW=w1738-h666-no?authuser=0" alt="str_slice" height="150px">

In [None]:
# 例
rice = "ATAGAATTCT"
print(rice[2:5])

### 実習5-2

　変数wheatに入っているDNA配列の「3番目から9番目まで」の7塩基`GAAATAC`を切り出してください。なお、この"3番目"や"9番目"は、Pythonの「0番スタート」の数え方による番号です。


In [None]:
wheat = "ACAGAAATACCCAATATCTTGTTCTAGCAAGATATTGGGTATTTCTGTCT"


#### 解答例

In [None]:
wheat = "ACAGAAATACCCAATATCTTGTTCTAGCAAGATATTGGGTATTTCTGTCT"
print(wheat[3:10])

## 6. DNA配列を一文字ずつ取り出す

　DNA配列のすべての文字を精査したいとき、どのようにすれば良いでしょうか？　"先頭から一文字ずつ取り出して調べる"といったことができれば実現できそうです。

　ここでは、DNA配列の先頭の塩基から一文字ずつ取り出して表示する方法を学びます。

　一文字ずつ順番に取り出すには、**`for`構文（ループ構文、繰り返し構文）**というものを使います。

```python
# 書き方: 一文字ずつ取り出して表示する
# - forの行末に「コロン(:)」を忘れないように注意してください。
# - for構文のなかの処理を表すためには「字下げ」が必要です。
for 変数 in "<文字列>":
  print(変数)
```

<img src="https://lh3.googleusercontent.com/pw/ACtC-3fuCWvJRS4gYy0EGjCKtka1cjlRf2RtXMw7mv1f6DangBHD7uG_cEvzVwduJzFBfHFmSwg15tHRdYGveZ1aXuMslAx7D9m0X_fEQSXPPMAsuM6J4d5fItd6v1aLOTPne77V1r2yZQPwmv80jEuRahqC=w1979-h883-no?authuser=0" alt="for_syntax" height="250px">


In [None]:
# 例1
for i in "ATAGAATTCT":
  print(i)

In [None]:
# 例2: 変数を使った場合
rice = "ATAGAATTCT"
for i in rice:
  print(i)

　`for`構文のなかの処理（上記の例の場合は`print(i)`）であることを示すために、`print(i)`のところは「半角スペース2個分」が字下げされています。この字下げは、半角スペース2個か4個分が一般的です。
 

### 実習6

　変数wheatに入っているDNA配列の「3番目から9番目まで」の7塩基`GAAATAC`を切り出して、一文字ずつ順番に表示してください。なお、この"3番目"や"9番目"は、Pythonの「0番スタート」の数え方による番号です。

In [None]:
wheat = "ACAGAAATACCCAATATCTTGTTCTAGCAAGATATTGGGTATTTCTGTCT"


#### 解答例

In [None]:
wheat = "ACAGAAATACCCAATATCTTGTTCTAGCAAGATATTGGGTATTTCTGTCT"
for i in wheat[3:10]:
  print(i)

### 「タブ」キーを使って簡単に字下げができる

　Google Colabでは入力補完機能で勝手に字下げされる場合もありますが、その字下げを削除しまった場合、自分で入力する必要があります。そのようなときには、「スペース」キーを2回か4回叩いても良いですが、「tab」キーを使うと簡単に字下げできます。

### 同じ処理を任意の回数繰り返す

　さきほど文字列に対して`for`構文を使いました。`for`構文は、文字列を一文字ずつ取り出すためだけに使われるものではありません。同じ処理を何回か繰り返したいときにも使います。

　字下げがなくなったところからは、`for`構文の外側（`for`構文が終わった後）の処理です。

```python
# 書き方: 同じ処理を任意の回数繰り返す
for 変数 in range(繰り返し回数):
  処理1
  処理2
  　:
  処理N
処理M # for構文が終わった後の処理
```

In [None]:
# Helloを5回表示して、最後にGoodbyeを1回表示する
for i in range(5):
  print("Hello", i)
print("Goodbye")

## 7. DNA配列中に特定の配列があるか調べる

　ある生物のゲノム配列を持っているとします。そのゲノム配列中に、特定の塩基配列が含まれているか知りたい場合、どのようにしたら良いでしょうか？

　ここでは、DNA配列中に特定の配列があるかを調べる方法を学びます。簡単なコードで実現可能です。

```python
# 書き方: 文字列中に特定の文字列があるか調べる
"<調べたい文字列>" in "<調べる対象の文字列>"
```

In [None]:
# 例1
print("GAATTC" in "ATAGAATTCT")

In [None]:
# 例2: 変数を使った場合
rice = "ATAGAATTCT"
cake = "GAATTC"
print(cake in rice)

　特定の文字列が含まれているとき「True」が出力され、含まれていないとき「False」が出力されます。

### 実習7

　変数wheatのDNA配列に`GAATTC`が含まれているか調べてください。

In [None]:
wheat = "ACAGAAATACCCAATATCTTGTTCTAGCAAGATATTGGGTATTTCTGTCT"
cake = "GAATTC"


#### 解答例

In [None]:
wheat = "ACAGAAATACCCAATATCTTGTTCTAGCAAGATATTGGGTATTTCTGTCT"
cake = "GAATTC"
print(cake in wheat)

## 8. 特定の配列があるとき、DNA配列を表示する

　最後に、与えられた情報にしたがって、異なる処理をおこなう方法を勉強します。使用するのは、**`if`構文（条件分岐構文）**です。

```python
# 書き方: 条件分岐
if 条件1:
  処理1
elif 条件2:
  処理2
else:
  処理3
```

`if`構文の各節の設置ルール
- `if`節は、`if`構文の最初の節として必須です。
- `elif`節は、`if`節以外の条件を設定したいときに使用します。`if`節以降に、任意の回数（0回以上）を設定できます。
- `else`節は、`if`節や`elif`節の条件に合わなかった場合の処理をおこないたいときに使用します。`if`構文の最後の節に設置できます。省略することも可能です。

<img src="https://lh3.googleusercontent.com/pw/ACtC-3fLpwUsnktp9SnsalwyGuc6GwKzSPS2ONyde9VLqmBXaT7Y_7s1DGIPN2JxqIe5kBaK-lfQL2RR-rFyta3Z5iZC9kwgHhZCK8FnPTtuMo-75_Wv9qORcgwNW0USPRK8YcpApQBa1sGfGblT6vG7uOMn=w1270-h862-no?authuser=0" alt="if_syntax" height="250px">


In [None]:
# 例
rice = "ATAGAATTCT"

if "TTAA" in rice:
  print("TTAA is found in rice sequence.")

elif "GAATTC" in rice:
  print("GAATTC is found in rice sequence.")

else:
  print("Not found")


### 実習8

　変数wheatのDNA配列に`GAATTC`が含まれている場合には「Found」を出力し、含まれていない場合には「Not found」を出力するプログラムを作成してください。

In [None]:
wheat = "ACAGAAATACCCAATATCTTGTTCTAGCAAGATATTGGGTATTTCTGTCT"


#### 解答例

In [None]:
wheat = "ACAGAAATACCCAATATCTTGTTCTAGCAAGATATTGGGTATTTCTGTCT"

if "GAATTC" in wheat:
  print("Found")

else:
  print("Not found")



### 比較演算子

　ここで、**比較演算子**というものを少し勉強しましょう。

　例えば、下記のような条件を設定したい場合に、比較演算子を使います。
- AとBは同じDNA配列であるか
- AとBのDNA配列の長さは同じか
- AよりBのDNA配列の方が長いか

おもな比較演算子:
- AとBは等しい `A == B` （文字列の比較も可能）   
<small>**イコール記号が2つであることに注意してください。**</small>
- AとBは等しくない `A != B` （文字列の比較も可能）
- AはBより大きい `A > B`
- AはBより小さい `A < B`
- AはB以上 `A >= B`
- AはB以下 `A <= B`

In [None]:
A = "ATG"
B = "ATG"

# AとBは等しいか？
if A == B:
  print("True")
else:
  print("False")

In [None]:
A = "ATG"
B = "ATG"

# AとBは等しくないか？
if A != B:
  print("True")
else:
  print("False")

In [None]:
A = len("ATGC")
B = len("ATG")

# AはBより小さいか？
if A < B:
  print("True")
else:
  print("False")

### for構文とif構文を組み合わせる

　for構文中でif構文を使うと、より複雑な自動化処理をおこなえます。

以下の例では、与えられた文字列に対して、次の処理をおこなっています。
- 例1: 相補鎖上の塩基を順番に表示する
- 例2: 例1で読み上げている塩基を繋いだ文字列を作る
- 例3: 例2で作った文字列を逆さにして、相補鎖配列（reverse complementary sequence）にする

In [None]:
# 例1: 相補鎖上の塩基を順番に表示する
rice = "ATAGAATTCT"
for i in rice:
  if i == "A":
    print("T")
  elif i == "T":
    print("A")
  elif i == "G":
    print("C")
  elif i == "C":
    print("G")
  else:
    print("N")

In [None]:
# 例2: 例1で読み上げている塩基を繋いだ文字列を作る
rice = "ATAGAATTCT"

rice_comp = "" # 空の文字列を用意する

for i in rice:
  if i == "A":
    rice_comp = rice_comp + "T"
  elif i == "T":
    rice_comp = rice_comp + "A"
  elif i == "G":
    rice_comp = rice_comp + "C"
  elif i == "C":
    rice_comp = rice_comp + "G"
  else:
    rice_comp = rice_comp + "N"

# 出来上がった文字列を表示
print(rice_comp)

In [None]:
# 例3: 相補鎖配列（reverse complementary sequence）を表示する
rice = "ATAGAATTCT"

rice_comp = "" # 空の文字列を用意する

for i in rice:
  if i == "A":
    rice_comp = rice_comp + "T"
  elif i == "T":
    rice_comp = rice_comp + "A"
  elif i == "G":
    rice_comp = rice_comp + "C"
  elif i == "C":
    rice_comp = rice_comp + "G"
  else:
    rice_comp = rice_comp + "N"
    
# 出来上がった文字列を表示
print(rice_comp)

# 文字列を逆さにし、相補鎖配列（reverse complementary sequence）をにする
rice_revcomp = rice_comp[::-1]
print(rice_revcomp)

　例3の22行目のコードで使われている`[::-1]`は、「5. DNA配列を切り出す」で勉強したスライス機能です。

　詳しい説明は省きますが、最初から最後までの文字列を切り出し、それを後ろから1文字ずつ並べ直しています。
```python
[(最初から):(最後まで):-1(後ろから1文字ずつ)]
```



---
## まとめ

　今回の実習では、短いDNA配列を使って、Pythonの基礎を勉強しました。
- `print`関数（文字列の出力）や`len`関数（文字列の長さの取得）
- 変数の設定
- 文字列の結合、切り出し
- `for`構文（繰り返し処理）、`if`構文（条件分岐処理）

　今回学んだことだけでも、下記のようなゲノム解析をおこなえます。
- ゲノム配列の塩基数を調べる
- 一部の塩基配列を取り出す
- 各塩基を精査する
- 任意の塩基配列が含まれているかどうかを調べる

　しかし、数千万塩基〜数十億塩基のゲノム配列をプログラム上にコピー＆ペーストするというのは現実的な方法ではありません。通常のゲノム解析では、ゲノム情報が書きこまれたファイルを読み込んで、なんらかの解析をおこないます。

　次回は、Biopythonライブラリを使って、次世代シーケンサーから出力されるファイル（FASTQ形式ファイル）を読み込み、多量の塩基配列データの処理を自動化する方法を勉強します。