## 4.5 制御構文  
 if文、for文、while文といった制御構文について確認していく。まず、前提として、ここで説明する制御構文 (制御フロー) は以下のような形で記載される。if文を例にとると  

~~~
if 条件:
   コード1  
   コード2  
   ...  
~~~

というような形で入力される。こうすることで、if文などによって実際に処理されるコードが、字下げにより、__コードブロック__として認識され、処理される。  
 ただし、ご自身でJupyter Notebook にこれらのコードを入力していくと、改行と同時に自動的にインデントが入る。そこから改行してもインデントが入った状態が継続される。(これは、高機能なエディタ等でPythonコードを入力しても同様のこととなったりする)。「自分でわざわざさらにインデントを足す」という作業は必要ない。


##### 4.5.1 if 文  
if文は、条件分岐のための構文。次の文を実行してみる。

In [2]:
gene_set1 = {'chr': 1, 'pos': 324, 'ref' : 'c', 'var': 't'}

if gene_set1['pos'] >= 300:
    print('above 300')

above 300


辞書型gene_set1のposが300を超えていたら、above 300と出力する。  
gene_set1 のpos の数値を、例えば250に書き換えて再実行してみると何も表示されない、というのがわかると思います。  

さて、ここでelifとelseを書き加えてみる。これで「もし...なら」「さもなくば、もし・・・・なら」「どれでもなかったら・・・・」という分岐を作ることができる。Jupyter Notebookでは、この際のインデントは自動で入る。この字下げを行うことで、実行文 (ここではprint()の行) がブロック化されて扱われることになる。

list1 の型を確認する。

In [3]:
gene_set1 = {'chr': 1, 'pos': 324, 'ref' : 'c', 'var': 't'}

if gene_set1['pos'] >= 300: #もしposが300以上なら
    print('above 300')

elif gene_set1['pos'] >= 200: #さもなくば、もし200以上なら
    print('above 200')

else: #そのどれでもなかったら
    print('under 200')

above 300


'pos': 324 の部分をいろいろ書き換えてためしてみてください。

__参考7: 論理演算__
  
先ほどは、シンプルにgene_set1['pos']の値で条件分けをしていた。ですが、例えば、 x >= 300 かつ y>=200なら... といった複数の条件を組み合わせることも考えられる。論理演算によって、このような操作が可能となる。

In [4]:
x=350
y=250

if x >= 300 and y > 200:
    print('sucess')

elif x >= 300 or y > 200:
    print('half sucess')

sucess


条件1 and 条件2とすることで、両方ともTrueの場合に条件を満たしたと判断される。条件1 or 条件2とすることで、片方 (もしくは両方) がTrue の場合に条件を満たしたと判断される。xとyの値を変化させて試してみてください。さらに not (否定) もある。

In [5]:
x=150
y=150

if not x >= 300 and not y >= 200:
    print('sucess')

sucess


こうすることで x >= 300 「ではなく」、かつ y>= 200 「ではない」 ときのみ True と判断がされる。

### 4.5.2 for文章  
~~~
for 変数 in データの並び (list)など:
    処理2
    処理2
~~~

とすることで、データの並び分だけ反復処理を行う。例えば、リストはこのデータの並びとして使うことができる。ここでも for の次の行のインデントを忘れないように。

In [8]:
for_iter = ['gene_01', 'gene_02', 'gene_03']

for gene in for_iter:
    print(gene, ' is tested')

gene_01  is tested
gene_02  is tested
gene_03  is tested


タプルなども使用可能。先ほどの入力をコピペして、角カッコ[]のところだけ丸カッコ()に変えてみる。

In [9]:
for_iter = ('gene_01', 'gene_02', 'gene_03')

for gene in for_iter:
    print(gene, ' is tested')

gene_01  is tested
gene_02  is tested
gene_03  is tested


集合型もできるが、順序の保証はない。

In [10]:
for_iter = {'gene_01', 'gene_02', 'gene_03'}

for gene in for_iter:
    print(gene, ' is tested')

gene_02  is tested
gene_01  is tested
gene_03  is tested


文字列もできる

In [11]:
for_iter = 'atgcATGC'

for gene in for_iter:
    print(gene, ' is tested')

a  is tested
t  is tested
g  is tested
c  is tested
A  is tested
T  is tested
G  is tested
C  is tested


「10回繰り返す」という場合は数列を作る range()関数を使うと便利。例えば、for文のinのところにrange(10)と入れることで、0から9で計10回繰り返される。

In [13]:
for_range = range(10)

for gene in for_range:
    print(gene, ' is tested')

0  is tested
1  is tested
2  is tested
3  is tested
4  is tested
5  is tested
6  is tested
7  is tested
8  is tested
9  is tested


__参考8: 「イテレータ」「イタラブル」といった用語について__

~~~
for 変数 in データの並び (list)など:
    処理2
    処理2
~~~
  
「データの並び(list)など」という微妙な言い方をしている。
多くの場合には、listなどが入ることになるが、データそのものだけではなく、「データの並びを生成可能なものが入る」と理解しておくと良い。  
シンプルな「並び」だけではなく、それらを生成する機能を持ったもの (1回ずつ取り出していけるもの)を入力することもできる。
例えば、zip()関数。for x,y in zip(data1, data2):
~~~
nums = [1, 10, 1000]
chars = ['Z', 'B', 'Y']
symbols = ['-', '^', '#']

for n, l, s in zip(nums, chars, symbols):
    print(n, l, s)

以下出力
1 Z -
10 B ^
1000 Y #
~~~  

このように「1回ずつ取り出していけるもの」を「イテラブル (なオブジェクト)」という。そして、for文のin以下の部分では、「イタラブル」なものを受け取り、そこから「イタレータ」という「1つずつ値を取り出せる機構」を生成して、それを用いて for ループを回している。イタラブル、イタレータという言葉はよく耳にすることになると思います。

イタラブルブル: nums, chars, symbols  
イタレータ: zip(nums, chars, symbols)



### 4.5.3 while文  

~~~
while 条件式:
    処理1
    処理2
~~~

とすることで「条件式が真の間は」処理を繰り返すという構文。

In [5]:
check_number = 0
while check_number <= 8:
    print('check_number = ', check_number)
    check_number = check_number + 1

check_number =  0
check_number =  1
check_number =  2
check_number =  3
check_number =  4
check_number =  5
check_number =  6
check_number =  7
check_number =  8


「check_numberが8以下の場合は、その数を表示して、さらに1を足せ」という命令になっている。これにより「ある条件が満たすようなるまでは処理を続ける」という操作が可能になる。

### 4.5.4 リスト内包表記  
for文などを学んだところで、リスト内包表記について学ぶ。リスト内包表記は、リストの各要素に関数を適用することで新しいリストを取得する、特殊な表記方法である。

~~~
[式 for 変数 in リスト if 条件]
~~~

という形式で記述する。

In [6]:
list_test = [1, 9, 8, 4]
list_test

[1, 9, 8, 4]

In [9]:
list_comp = [x * 2 for x in list_test] #ifの部分は省略されている
list_comp

[2, 18, 16, 8]

[x * 2 for x in list_test] の部分を右から見ていく。 for x in list_test の部分で、for 変数 in リスト形式で、list_test から1つずつ要素を取り出す。先ほどのfor 文と同じ形式である。次に x * 2 で取り出した値 x * 2をしている。さらにこれに条件を加えてみる。

In [11]:
list_comp = [x * 2 for x in list_test if x != 8]
list_comp

[2, 18, 8]

x != 8 (xが8ではないもの)　の条件を追加した。そのため [1,9,8,4]のうち[1,9,4]が条件にあう数値となり、その2倍が新たなリストとして生成された。

## 自作関数

### 4.6.1 自作関数の基本  
他の多くのプログラミング言語と同様に Python には、一定の処理をまとめて記述するものとして __関数__ という機能が用意されている。そして、「組み込み関数」のほかに、自分で関数 (自作関数) を定義することもできる。  
  
~~~
def 関数名(引数リスト):  
    処理
~~~  

関数はこのように記載する。defはdefine (定義する) の意味。コードを書いて確認する。

In [13]:
def say_hello(x):
    print('hello', x)

これで関数 say_hello() が作成できた。これを実行する。

In [14]:
say_hello('Jannet')

hello Jannet


'Jannet' という文字列が関数に引数として渡され、文字列を加工した結果が返された。上記の例では、関数の()内に引数を渡しているが、キーワードを指定する方法もある。

In [20]:
def say_helloandtime(name, time):
    print('hello', name)
    print('clock', time)

この関数には name, time の二つの引数が渡されている。キーワードとして渡す場合には以下のようになる。

In [21]:
say_helloandtime(name='Jannet', time=3)

hello Jannet
clock 3


それぞれ name と time を指定して値を渡している。引き渡し順を変えても同じ結果が得られる。

In [22]:
say_helloandtime(time=3, name='Jannet')

hello Jannet
clock 3


戻り値 (関数が処理の結果として返す値) の指定には return を用いる。

In [23]:
def check_name():
    return 'Jannet'

check_name() #実行してみる

'Jannet'

実行されたらJannetという名前 (str型文字列) と常に返す。これを print()関数 に組み込む。

In [24]:
print('hello', check_name())

hello Jannet


check_name()関数は、文字列Jannet を戻り値としている。print()関数の中でその関数が呼び出されている。returnでは、複数の値を戻すこともできる。

In [26]:
def check_name2():
    return 'Jannet', 'Andy'


x, y = check_name2() #実行してみる

print('hello', x, 'and', y)

hello Jannet and Andy


check_name2()では Jannet と Andy, 2つの文字列が返され、最初の値がx, 次の値がyに代入される。

### 4.6.2 可変長引数  
可変長引数というタイプの引数の渡し方についても見ておく。

In [27]:
def func_args(*args):
    print('args:', args)
    print('args[1]:', args[1])

func_args(1,2,3,4,5)

args: (1, 2, 3, 4, 5)
args[1]: 2


まず、*argsについて。仮引数 (args) の頭にアスタリスク (*) をつけることで、数を定めずに引数をいくつも渡すことができる。渡された引数はタプルとして保存され、関数内部で参照できる。実際にargs[1]の数値も出力している。

In [29]:
def func_kwargs(**kwargs):
    print('kwargs:', kwargs)
    print('kwargs[a]:', kwargs['a'])

func_kwargs(a=1,b=2,c=3,d=4,e=5)

kwargs: {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}
kwargs[a]: 1


次に、**kwargsについて。アスタリスクを2つつけることで、数を定めずにキーワード引数を渡すことができる、渡された引数は辞書型 (キーと値の組)として保存され、同じように関数内部で参照できる。

## 4.7 モジュールのimport  
Pythonではすでに作成されているコードを再利用する仕組みがある。

In [31]:
import datetime

特に帰ってくるメッセージはないが、これでdatetimeモジュールがimportされた。これは時間などを扱う標準モジュールの一つである。

In [33]:
print(datetime.datetime.now())

2025-05-28 17:19:39.842601


今の時間が出力された。今は、既存のモジュールをimportしたが、このimportを使い自分の書いたコードを同様にimportすることもできる。  

<span style="font-size: 200%; color: red;">test_module1.py を自分で書くか？動きを見ていてもらうか？</span> 

test_module1.py
~~~ 
def say_hello_module(x):
    print('hello_module,', x)
~~~  

test_module1.py は、今実行しているjupyter notebook と同じフォルダに保存する。

In [36]:
import test_module1   #'.py'は入れない。

表示上は何も変わらないが、エラーが出ないということはimport できている。

In [37]:
test_module1.say_hello_module('Sara')

hello_module, Sara


先ほど実行した datetime モジュールをimportしたときと同じやり方で、自作モジュールも import し、そのモジュール内の関数 say_hello_module()を呼び出している。  
このtest_module1 と書くのが毎回面倒な場合は、次のように書くこともできる。

In [39]:
import test_module1 as test1

test1.say_hello_module('john')

hello_module, john


test_module1 を as test1 としてimportしたことになる。

このtest_module1 モジュールの say_hello_module() は、以下のようにも書ける。

In [41]:
from test_module1 import say_hello_module
say_hello_module('Aya')

hello_module, Aya


~~~
from モジュール名 import 対象
~~~

とすることで、直接中身を叩けるようになった。さらに、as を使うこともできる

In [42]:
from test_module1 import say_hello_module as say_h
say_h('Betty')

hello_module, Betty


今後、Python をバイオインフォマティックスで扱っていく上で、関連するモジュールをいくつもimportして使っていくことになる。Numpy, pandasなどはもちろんのこと、SeqIOなどゲノム配列を使用するために便利なツールみないなものも必要に応じてimportして使っていくことになる。