<a href="https://colab.research.google.com/github/SotaYoshida/Lecture_DataScience/blob/2021/notebooks/Python_chapter3_Function.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#関数と戻り値(返り値), 変数のスコープ

[この章の目的]
プログラム内での関数と戻り値,スコープの概念を獲得する。

このノートでは、Pythonにおける関数の定義と、  
関数が返す値[戻り値(返り値とも呼ぶ)]と、  
ややテクニカルですが重要な点である変数のスコープについて説明します。  




##関数の定義

既に現れた```print```や```len```などはPythonに備え付けられた[組み込み関数]と呼ばれるものの一種です。  
以下に示すように、組み込み関数とは別にユーザーが独自の関数を定義することができます。

たとえば

In [None]:
p1 = [2.0, 4.0, -5.0]
p2 = [1.0, 3.0, -4.0]
#...
p100 = [5.5,-2.0, 3.0]

といったようなリスト(ある点の$x,y,z$座標だと思ってください)が  
たくさん(たとえば100個)あったときに、  
任意の２つの点の距離を求める操作が必要だったとします。  

そんなとき${}_{100}C_2=4995$通りに対して毎回

In [None]:
d_1_2 = ( (p1[0] - p2[0])**2 + (p1[1] - p2[1])**2 + (p1[2] - p2[2])**2 ) ** 0.5

などと書くのは面倒です。

何回も必要になる処理は、関数として定義しておけば呼び出して簡単に使うことができます。  

任意の長さが3の数値リストに対して  
3次元空間での距離を計算する関数を自作してみましょう。

In [None]:
def calc_d(l1,l2):           
    return ( (l1[0] - l2[0])**2 + (l1[1] - l2[1])**2 + (l1[2] - l2[2])**2 ) ** 0.5

t = calc_d(p1,p2) 
print("点1",p1, "と点2", p2, "の距離は", t, "です")

点1 [2.0, 4.0, -5.0] と点2 [1.0, 3.0, -4.0] の距離は 1.7320508075688772 です


calc_dは自作した関数の名前で、関数名の後ろのカッコには引数(ひきすう)を指定します。  

リスト(```l1```)とリスト(```l2```)を突っ込んだときに距離を計算して  
```return```する(返す)という一連の操作を```def```(defineの略)した、  
というのが上のコードで行っていることです。  

コロン(:)以下の操作はインデントされていて、  
どこまでが関数のブロックかわかるようになっています。  
(ブロックについては```if```や```for```を思い出してください)


使用する際には、この関数```calc_d()```に必要な引数(変数,今の場合リスト)  
```l1,l2```を指定して使います。  
引数は一般に関数の中だけで使う変数名なので、  
関数に入れる際にl1,l2という名前にあわせる必要はありません。


In [None]:
print(calc_d(p1,p100)) #←これでも使えるし
print(calc_d([20.0, 1.0,-5.0], [-2.0, 3.0,5.5])) #←などとしても使える

10.594810050208546
24.45914961727002


上の例のように100個の点の3次元座標に対応するリストがある場合,


In [None]:
import random 
lists = [ [ random.gauss(0,1), random.gauss(0,1), random.gauss(0,1) ] for i in range(100)] #座標点をランダムに100個作っている
hit = 0
for j in range(100):
    for i in range(j+1,100): 
        distance = calc_d( lists[j], lists[i])
        #print(j,i, distance) # 4950回文の計算結果をprintすると邪魔なのでコメントアウトした
        hit += 1 
print(hit) #回数だけ表示しよう
#上のjのループ内で、iはj+1から99までを回る。 j+1= 100つまり j=99のとき range(j+1,100)はちゃんと空になる
#つまり、長さ100のリストにindex=100でアクセス(範囲外参照)したりすることはない。

4950


などとすれば、全組み合わせ(${}_{100}C_2$)に対して距離を計算することが出来る。  


引数は通常関数の中で行う操作に必要な変数を指定します。  
上の例では２つのリストを引数としました。


関数内の操作に関数外からの情報(インプット)が必要ない場合は  
引数なしの関数でも構いませんし、  
関数の外に値を渡す(アウトプット)必要がなければ  
return文を明示的に書かなくても大丈夫です。  
return文がない場合は```None```(値なし)が返されます。

幾つか例を作って、挙動を理解してみましょう。


In [None]:
def name(): #引数なしで、ただ以下の文字列を表示する関数
    print("私は田中です")

def myname(namae): #引数namaeを使って、以下の文字列を表示する関数
    print("私は"+str(namae)+"です")

def myname_return(namae): #　myname()で表示させた文字列自体を返す関数
    return "私は"+str(namae)+"です"

print("name()の実行→", name()) ## name()が実行されたあとにココのprint文が実行される。

print("myname()の返り値→", myname("吉田"))

print("myname_return()の返り値→", myname_return("吉田"))

私は田中です
name()の実行→ None
私は吉田です
myname()の返り値→ None
myname_return()の返り値→ 私は吉田です


戻り値```return```は単一の値や文字列に限らず、  
複数の値でも可能ですし、リストを返すことも出来ます。

先程の自作関数```calc_d```の場合、戻り値はfloat(実数値)ですが

In [None]:
def calc_d_print(l1,l2):
    return "距離は"+str( ( (l1[0] - l2[0])**2 + (l1[1] - l2[1])**2 + (l1[2] - l2[2])**2 ) ** 0.5  )+"です"

def zahyo_and_d(l1,l2):
    d = calc_d(l1,l2) #関数の中で、先程の自作関数を呼んでいる
    return [l1,l2],d #座標を結合したリストと距離を返す

ret = calc_d_print(p1,p2)
print("関数calc_d_print→", ret,type(ret))


ret = zahyo_and_d(p1,p2)
print("関数zahyo→ ", ret,type(ret))
print("座標の結合リスト",ret[0],"距離",ret[1])

関数calc_d_print 距離は1.7320508075688772です <class 'str'>
関数zahyo:  ([[2.0, 4.0, -5.0], [1.0, 3.0, -4.0]], 1.7320508075688772) <class 'tuple'> 座標の結合リスト [[2.0, 4.0, -5.0], [1.0, 3.0, -4.0]] 距離 1.7320508075688772


といったように、様々な返り値を持つ関数を定義できます。


関数を定義するときに、  
引数にデフォルト値(とくに値を指定しなければこの値が選ばれる)を  
設定することも出来ます。


In [None]:
#数値リストの要素のp乗和を計算する関数
def sump(tmp,p=2): 
    return sum([tmp[i]**p for i in range(len(tmp))])

list1 = [10.0,20.0,30.0,40.0]
print("default", sump(list1)) #pを指定しなければp=2が選ばれる
print("p=1", sump(list1,p=1)) 
print("p=2", sump(list1,2)) 
print("p=3", sump(list1,3))  #

default 3000.0
p=1 100.0
p=2 3000.0
p=3 100000.0


今の場合、引数を指定する際に$p=$　は書いても欠かなくてもOKですが、  
デフォルト値が複数設定されている関数を作った場合には、  
どの変数を指定しているのかを明示的にするため、  
$p=3$などと引数に入力します。


関数を定義することで作業を"パッケージ化"し、コードを簡略化することができます。
「繰り返しの操作は関数にする」ことを心がけましょう。


## 変数のスコープについて

以下の内容は、これまで学習したfor文や関数のインデントとも関連した話題です。  
非常に重要な反面、初学者がつまづきやすい点でもあります。

一般に、プログラミングでは[グローバル変数]と[ローカル変数]と呼ばれるものがあります。  
その名(global/local)が示すとおり、  
グローバル変数とはどこからでも参照できる変数で、  
ローカル変数とは、ある有効範囲(たとえば関数内)のみで参照できる変数です。

例を見ながら理解していきましょう。


In [None]:
a = 2
list1 = [10.0,20.0,30.0,40.0]

のように、関数内での代入などではない場合、変数はグローバル変数として定義されます。

そのため、一度定義されれば関数に引数として渡さなくても参照することができます

In [None]:
def testfunc():
    print(a)

a = 2
testfunc()

2


一方、関数の中で定義(代入)されるローカル変数は、関数の外で参照することはできません。  
(注: あとで説明するように関数内でglobal変数であることを宣言すれば関数の外でも参照できます)

以下のコードを実行して,関数の中で定義された変数abcdをprintしようとしてもエラーが起こってしまいます。

In [None]:
def testfunc():
    abcd = 1.000
testfunc()
print(abcd)

NameError: ignored

では、次のコードを実行すると、最後に表示されるaはどうなるでしょうか？  
2でしょうか？それとも5でしょうか？

In [None]:
def testfunc():
    a = 5
a= 2
testfunc()
print(a)

2


となり```a```の値は更新されません。  
これは、testfuncの中で定義されている```a```は、  
関数の内部で定義(代入)される変数であるため、  
ローカル変数とみなされて処理が行われるためです。

実際、idをprintさせてみると、関数の内と外とでidが異なることも分かります。

In [None]:
def testfunc():
    a = 5
    print("関数の内部", a, id(a))
    
a= 2 
print("関数の実行前", a, id(a))
testfunc()
print("関数の実行後", a, id(a)) 

関数の実行前 2 94412437125664
関数の内部 5 94412437125760
関数の実行後 2 94412437125664


一方で、

In [None]:
def testfunc():
    global abc, a #global変数の宣言
    abc = 5
    a += 2

a=2
print("実行前")
print("a",a , id(a))
testfunc()
print("実行後")
print("a", a, id(a))  #別の変数として再定義されていることが分かる
print("abc", abc)

実行前
a 2 94412437125664
94412437125728
実行後
a 4 94412437125728
abc 5


といったように、関数の中で使う変数をグローバル変数として宣言すれば、  
関数の外でもその変数を使うことができます。

ただし、このようなコードの書き方は、処理が複雑化してくると  
どこでその変数が定義されたり更新されたりしているかがわかりづらく、  
予期しない挙動の原因にもなりますのであまりオススメしません。  
[関数には引数として変数を渡して、必要な戻り値を取得する]というコードを書くのがあくまで基本です。

global変数の宣言を使うべき場合としては...コードの中で一度計算して、  
二度と変更する必要が無いような値にのみ使うようにしましょう。


関数を用いる際に、変数のスコープに関して混乱を避ける方法としては...

メインプログラムと関数内とで変数の命名規則を区別しておく:   
たとえば...メインコード(global変数)で使うリストの名前の区別には数字を使う、  
関数の引数にはアルファベットを使うなどの工夫がオススメです。

In [None]:
def func_join(listA,listB): #リストを結合して返す関数
    return listA + listB 

list1 = [ 2.0,30.0,18.0]
list2 = [ 9.0,4.0,8.0]
nlist = func_join(list1,list2)

#### $\clubsuit$ 関数内でのリスト更新


上では、数値(float)と関数を例に説明しましたが、  
リストの場合はもう少し挙動が複雑です。

In [None]:
def func_update_list(in_list):
    in_list[0] = "AAA"

tmp = [ "SS", 1,2,3]
print("実行前", tmp, id(tmp), id(tmp[0]))
func_update_list(tmp)
print("実行後", tmp,id(tmp),id(tmp[0])) 

実行前 ['SS', 1, 2, 3] 139900671706048 139900671819888
実行後 ['AAA', 1, 2, 3] 139900671706048 139900672697328
実行前 ['SS', 1, 2, 3] 139900671707888 139900671819888
実行後 ['AAA', 1, 2, 3] 139900671707888 139900672697328


リストオブジェクト自体のidは引き継がれていて、  
リスト内要素(0番目)の更新が反映されていることがわかります。

In [None]:
def func_update_list(in_list):
    in_list[0] = "AAA" 
    in_list = ["BBB", 0,1,2]  ##ココはローカル変数扱い
    return in_list

tmp = [ "SS", 1,2,3]
print("実行前", tmp, id(tmp), id(tmp[0]))
ret = func_update_list(tmp)
print("実行後", tmp,id(tmp),id(tmp[0])) 
print("ret", ret,id(ret),id(ret[0])) 

実行前 ['SS', 1, 2, 3] 139900671827312 139900672968496
実行後 ['AAA', 1, 2, 3] 139900671827312 139900672697328
ret ['BBB', 0, 1, 2] 139900671867152 139900673209136


# LICENSE


Copyright (C) 2021 Sota Yoshida

[ライセンス:クリエイティブ・コモンズ 4.0 表示 (CC-BY 4.0)](https://creativecommons.org/licenses/by/4.0/deed.ja)