# Chapter 3 內建資料結構、函式和檔案

## Function Introduction

### 函式使用時機點：你預期一些程式碼會被重複使用，就可以寫成一個函式。

In [1]:
def my_function(x,y,z=1.5):
    if z > 1:
        return z*(x+y)
    else:
        return z/(x+y)

### x, y為位置參數(positional parameter), z為關鍵字參數(keyword parameter)，關鍵字參數必須出現在位置參數後面。

In [2]:
my_function(10,20,5)

150

In [3]:
my_function(14,18,0.2)

0.00625

In [4]:
my_function(10,20) #系統會自動將數字按照順序給位置參數，而關鍵參數由於已經有定義值，運算就可以順利進行。

45.0

In [5]:
my_function(z=0.2, y=100, x=100) #也可以直接寫出每個參數的名稱，就不需要在乎順序。

0.001

### Global Scope v.s. Local Scope

### 在函式內的變數屬於Local Scope，出了函式外就不可以使用，Global Scope為函式外的變數，可以被不同的公式所取用，不會消失。

In [6]:
def func():

### 因為在函式裡面，這裡的a為local scope，函式結束即消失。

    a=[]
    for i in range(5):
        a.append(i)
    return a 

In [7]:
func()

[0, 1, 2, 3, 4]

### 因為在函式外面，這裡的a為global scope，並不會消失。

In [8]:
a=[]
def func():
    for i in range(5):
        a.append(i)
    return a 

In [9]:
func()

[0, 1, 2, 3, 4]

### 函式的好處：可以回傳多個值。

In [10]:
def f():
    a=5
    b=6
    c=7
    return a,b,c
a,b,c=f()

In [11]:
print(a,b,c) 

5 6 7


In [12]:
def f():
    a=6
    b=7
    c=8
    return {'a':a, 'b':b, 'c':c}

### 可以寫成dict的型態。

In [13]:
f()

{'a': 6, 'b': 7, 'c': 8}

### 函式即物件: 透過def設定函式，也可以透過for迴圈，巧妙的將不同的函式集合起來使用，使函式變成迴圈中的一個元素。

### 使用sub()函式前記得先import re。

### re.sub(pattern, repl, string, count=0, flags=0)¶
### pattern：代表要被置換的str/list。repl:要被取代成什麼？ 
### string: 要變動的那個value。 count:想要置換幾次。沒有寫代表全部都要換。 flags代表要不要啟動這個功能，0表示啟動，1表示關閉。

### strip()移除前後空格 ; sub()移除符號 ; title()開頭要大寫。

### 先定義clean_strings這個function，用來清理不同的字串。

In [14]:
import re

def clean_strings(strings):
    result=[]
    for value in strings:
        value= value.strip()
        value= re.sub('[!#?]','',value)
        value= value.title()
        result.append(value)
    return result

### 給予clean_strings一個list，讓他有值可以運作。

In [15]:
country=['!Taiwan','JAPAN?','spain#','?new zeaLAND','  iceland ']

clean_strings(country)

['Taiwan', 'Japan', 'Spain', 'New Zealand', 'Iceland']

### 上面的寫法為把所有的函式都包含在一個函式內去做使用。下面會介紹把函式當成物件，集合起來成為一個List，會讓函式的增加、減少更有彈性。

In [16]:
### 定義一個可以移除標點符號的函式remove_punctuation。
import re

def remove_punctuation(value):
    return re.sub('[!#?]','',value)


### 設定一個list，包含三個funciton。
clean_ops=[str.strip,remove_punctuation,str.title]


### 設定一個函式，讓list可以套用clean_ops內的每一個函式。
def clean_strings(strings, ops):
    result=[]
    for value in strings:
        for function in ops:
            value=function(value)
        result.append(value)
    return result

In [17]:
country=['!Taiwan','JAPAN?','spain#','?new zeaLAND','  iceland ']

clean_strings(country,clean_ops)

['Taiwan', 'Japan', 'Spain', 'New Zealand', 'Iceland']

### map(function, list): 可以讓list內每一個值執行function的功能，最精美的寫法。

In [18]:
country=['!Taiwan','Japan?','Spain#','?New Zealand','Iceland##']

import re

def remove_punctuation(value):
    return re.sub('[!#?]','',value)

for x in map(remove_punctuation,country):
    print(x)


Taiwan
Japan
Spain
New Zealand
Iceland


### 匿名Lambda函式

In [19]:
def short_function(x):
    return x*2

In [20]:
short_function(5)

10

### equiv_anon 可以替換為其他的文字。
### lambda可以直接拿來定義函式，比def return精簡許多。

In [21]:
equiv_anon=lambda x: x*2

In [22]:
equiv_anon(10)

20

In [23]:
def apply_to_list(some_list,f):
    return [f(x) for x in some_list]
ints=[4,0,1,5,6]
apply_to_list(ints, lambda x:x*2)

[8, 0, 2, 10, 12]

In [24]:
strings=['tv','lamp','sofa','kitchen']
strings.sort(key=lambda x: len(set(list(x))))

In [25]:
strings

['tv', 'lamp', 'sofa', 'kitchen']

### 柯里化（currying): 是一個計算機科學術語，代表只給現有函式加上部份變數，之後衍生出新函式的動作。

In [26]:
def add_number(x,y):
    return x+y

### 如果只提供一個value給add_number，會衍生出一個新的函式add_five。

In [27]:
add_five=lambda y:add_number(5,y)

### 這代表add_number的第二個參數ｙ被柯里化。

### functools 內的partial 可以簡化柯里化的流程，也就是更快速定義一個新的函式。

In [28]:
from functools import partial

In [29]:
add_five=partial(add_number,5)

In [30]:
add_five(100)

105

### [補充說明] format()用法

In [31]:
print('This article is written by {}.'.format('Python'))

This article is written by Python.


### format常與print做搭配，print的內容可以放置大括號{}，句末再加上.format()，就可以定義{}內要填入的內容囉！

In [32]:
a='{},{},{} are the keys to success.'
print(a.format('Positivity',' persistence', ' and bravery'))

Positivity, persistence, and bravery are the keys to success.


### {0},{1} 代表forma的index()。

In [33]:
print('{1},{0} are nice learning process.'.format(' Coursera','Udemy'))

Udemy, Coursera are nice learning process.


### 產生器(generator): 是產生一個新疊代物件的簡便方式，產生器可以回傳多個結果序列。

### 疊代器協定 （itrtator protovol): 一種讓物件可以疊代的通運方法。

### 使用for迴圈，可以將dict帶入Python直譯器，傳出一個又一個的物件。

In [34]:
some_dict={'a':1,'b':2,'c':3,'d':4,'e':5}

for key in some_dict:
    print(key)

a
b
c
d
e


### iterator 是迭代器，舉凡map(), list(), tuple() 等可以讓元素一起變動的函式，都可以稱作iterator。

In [35]:
dict_iterator=iter(some_dict)

In [36]:
dict_iterator

<dict_keyiterator at 0x7fddc91b3ef0>

In [37]:
list(dict_iterator)

['a', 'b', 'c', 'd', 'e']

### def 中的return每次只能回傳一個值，如果要一次回傳多值，則需改為yield。

### 觀察return()在squares()的回傳值個數。

In [38]:
def squares(n=10):
    print('Generating squares from 1 to {0}'.format(n**2))
    for i in range(1,n+1):
        return i**2

squares()

Generating squares from 1 to 100


1

### yield()對於函式squares()為元素產生器()，故單純呼叫gen不會有值出現，需要搭配for迴圈，讓值顯示出來。

In [39]:
def squares(n=10):
    print('Generating squares from 1 to {}'.format(n**2))
    for i in range(1,n+1):
        yield i**2

In [40]:
gen=squares()
gen

<generator object squares at 0x7fddc91bf190>

In [41]:
for x in gen:
    print(x, end=' ')

Generating squares from 1 to 100
1 4 9 16 25 36 49 64 81 100 

### 產生器述句(Generator Expression): 最簡易的方式製作產生器，需寫在小括號（）內。

### 原先透過def yield製作generator，需要比較長的語法。

In [42]:
def _make_gen(): 
    for x in range(11):
        yield x **2
        
gen=_make_gen()
gen

<generator object _make_gen at 0x7fddc91bf510>

### 現在透過小括號，可以直接快速產出一個generator。

In [43]:
gen=(x**2 for x in range(11))
gen

<generator object <genexpr> at 0x7fddc91bf3c0>

In [44]:
for x in gen:
    print(x)

0
1
4
9
16
25
36
49
64
81
100


### 器述句（Generator Expression)的方便之處在於可以直接進行sum, dict, tuple等函式運算。

In [45]:
sum(x**2 for x in range(11))

385

In [46]:
dict((i,i**2) for i in range(6))

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25}

### itertools Module 模組內的groupby(): 可以接受任一list, function當參數，依照函式回傳值將序列中連續元素進行分組。

### groupby()運作方式： group_by(iterable, func_key)

In [47]:
import itertools

### first_letter是一個function，裡面的值為元素的index=0。

In [48]:
first_letter=lambda x:x[0]

names=['Adam','Alan','Wes','Will','Albert','Steven']

for letter, names in itertools.groupby(names,first_letter):
    print(letter, list(names))

A ['Adam', 'Alan']
W ['Wes', 'Will']
A ['Albert']
S ['Steven']


### 錯誤與例外處理: try, except

In [49]:
float('2.5678')

2.5678

In [50]:
float('a')

ValueError: could not convert string to float: 'a'

### 為了在ValueError的發生時，有對應的說明視窗出現，可以使用try, except。

In [51]:
def attempt_float(x):
    try:
        return float(x)
    except:
        return x

In [52]:
attempt_float('a')

'a'

### 不過，除了ValueError，可能也會有TypeError，可以多捕捉不同型態的Error，給予對應的說明。

In [53]:
def attempt_float(x):
    try:
        return float(x)
    except (TypeError, ValueError):
        return x

In [54]:
attempt_float((1,2))

(1, 2)

### finally(): 如果try()執行失敗，就使用finally()

### else(): 只要try()執行成功，else()後面也會被執行。