# python函数的定义，用法，以及小技巧


## 1. 函数的定义
    函数是可以重复利用的代码段，掌握函数的用法是进行模块化编程的关键，也是实质上的理解计算机编程逻辑不可或缺的基础。
    函数什么时候有用呢？自然就是有一段功能我们可能需要反复利用的时候就可以考虑用函数封装它。
    然后就只需每次调用call这个函数即可。

In [2]:
# 比如我们要完成一个任务，指定任意两个数字，计算并得到他们的和，与差，然后计算和差之乘积
# 这样的任务我们可以简单的先计算和，再计算差，最后相称得到结果。
# 这样我们如果要对（2，3）， （5，6）， （7， 8）等等进行这样的计算，每次我们都要重复写这三个
# 步骤，非常的没有效率而且占用空间。而由于每次我们需要执行的功能其实是一样的，我们只需要把功能
# 封装成函数，然后只需要每次给函数不同的输入参数就可以了。

In [4]:
# 如果不进行函数处理：
a, b = 2, 3
diff = a - b
sum_ = a + b
res = diff * sum_
print(res)
a, b = 5, 6
diff = a - b
sum_ = a + b
res = diff * sum_
print(res)
# 以此类推

-5
-11


In [6]:
# 函数化处理：
def sum_diff_prod(a, b):
    return (a + b) * (a - b)
print(sum_diff_prod(2,3), sum_diff_prod(5, 6), sum_diff_prod(7, 8))


-5 -11 -15


In [8]:
#  现在我们来看函数的定义， 函数需要用关键字def来定义，函数名称
# 一般根据惯例python中函数名称小写，多个单词用下划线隔开，函数名称后必须加括号（）表示这是一个可以被call的函数。
# （）内部存放形式参数，这些形式参数会被传递到函数体内部，函数可以有具体的返回值，返回值会被外部获取，如果没有写return，函数默认返回None类型。

# 例：求和两个数
def add(a, b): # <- a, b 是形式参数，进入函数使用可
    return a + b # 返回了函数结果
print(add(10, 20)) # add()返回的结果直接作为print的输入了

30


In [11]:
# eg：函数进行一些操作但是不显式返回任何对象
def just_print(s):
    print(s)
res = just_print("This returns None")  # 打印字符串，但是返回None给res
print(type(res))

This returns None
<class 'NoneType'>


In [13]:
# 练习：创建一个函数，用来计算任意给定的两个整数的最大公约数。并且返回这个数。比如 func(3, 9) = > 3

## 函数的执行逻辑


In [None]:
# 在函数声明时，python并不会去执行这个函数，（不会去call这个函数）

In [29]:
# 函数在python内是一个function对象（后面一次课我们会介绍什么是对象和面向对象编程）
# 声明后，python只会记住这个函数的入口，即这个函数名字表示的引用。把这个函数的功能代码放在内存里，等待被call。
type(just_print) #-》 注意这里不要写成just_print(), 括号的含义其实是call，也就是执行函数并且获取返回值。所以类型会变成返回的结果的类型，比如这里的None。

function

In [30]:
type(just_print("This is a call"))

This is a call


NoneType

In [35]:
# call了函数之后，python的解释器会把参数带着一起传入函数内部，开始执行函数内部的代码，然后结束后退出函数的call的入口位置，继续下一步。
# 所以这意味着，如果函数内部出现错误，不执行前是无法知道的：

def bugged_func():
    var1 # var1没定义过，python根本无法执行。但是也不会报错。
    

In [36]:
bugged_func() # call这个函数了，开始执行，会报错

NameError: name 'var1' is not defined

## 变量的作用域

In [14]:
# 一个python文件在python的解释器中其实就是一个module，一个文件夹就是一个package。
# 在一个python程序中，通常有一个程序主文件，一般就是我们执行的那个文件。
# 在主文件中定义的变量我们叫做全局变量，即它们在主文件的剩下的任何地方都可以被访问。这个访问范围我们叫做作用域。程序中变量的作用域非常重要。我们后续会看到。
# 然而函数体的定义把一个作用域分割成了两个，即函数内部，和函数外部。

In [15]:
# 例： 在jupyter notebook中没有主文件的说法，但是可以简单认为这个notebook所有的单元格都是主文件的一部分。

# 声明一个全局变量
x = 3 # x 是一个整数变量3（的引用，python中使用对象都是通过引用，我们暂时不深入解释引用）
def  add_one(a):
    # this function add 1 on inputed var x
    print('global x', x) # 测试是否可以访问全局变量
    a += 1 # +=, -= *=  这类运算符按照从左到右顺序执行，相当于先+1，再把结果=赋值给左侧。
add_one(5)


global x 3


In [16]:
# 上面的例子可见，x即使再函数内部也可以使用，现在我们重复上面的过程，这次我们再内部重新声明一个x，看看函数执行后，会有什么影响？
# 声明一个全局变量
x = 3 # x 是一个整数变量3（的引用，python中使用对象都是通过引用，我们暂时不深入解释引用）
def  add_one(a):
    # this function add 1 on inputed var x
    x = 10 # 重新定一个x，值为10，和全局的x=3不同，思考：这里的x和外头的x是一个东西吗？
    print('internal x', x)
    a += 1 # +=, -= *=  这类运算符按照从左到右顺序执行，相当于先+1，再把结果=赋值给左侧。
add_one(5)
print('global x', x) # 在函数外检查一次x的值到底是多少？

internal x 10
global x 3


In [38]:
# 上面的例子我们发现两个x其实是独立的。原理是，在函数的内部进行定义变量定义的时候，这个变量的作用域只局限于这个函数内部。
# 所以内部定义的x=10，打印出来也是x=10，但是当函数体结束执行回到主文件后，此时函数内部的x的作用域就结束了
# 相当于所有函数内部的东西的生命周期都结束了。此时我们再打印x，结果自然就是原来的全局的x=3。
# 虽然两个x看上去都叫x，但是实际上在python的执行过程中，他们对应的底层操作是完全不同的两个东西，这就是作用域的用途。
# 我们可以用id（）函数查看运行时这两个x的内存地址，会发现他们根本是两个东西。
x = 3 # x 是一个整数变量3（的引用，python中使用对象都是通过引用，我们暂时不深入解释引用）
def  add_one(a):
    # this function add 1 on inputed var x
    x = 10 # 重新定一个x，值为10，和全局的x=3不同
    print('internal x address', id(x))
    a += 1 # +=, -= *=  这类运算符按照从左到右顺序执行，相当于先+1，再把结果=赋值给左侧。
add_one(5)
print('global x address', id(x)) # ->  两个x的地址完全不同，不是一个对象！！

internal x address 4342530576
global x address 4342530352


In [39]:
# 可是为什么前一个例子里，可以在add_one里面打印一个全局量的值呢？
# 那是因为python在执行一个函数内部代码时，如果出现了一个未被定义的量时，会先跳回全局空间里看看是否有对应的量，如果有则默认载入那个量
# 所以会默认找到已经在函数外定义的全局的那个x=3，只有当函数内部有重新的定义时，才会在局部载入一个local的x=10。


# 思考：既然函数内部所有的变量声明都是local的，只存在函数内部，那万一需要在函数内部声明一个全局量怎么办呢？
# --》 使用global关键字。
# global关键字先声明一个引用，表明这个是个全局引用（此时不需要赋值，后续再赋值即可）


def  add_one(a):
    # this function add 1 on inputed var x
    
    # 我们想在内部声明一个全局量x
    global var #   这步在全局空间里加入一个x，但是暂时还不知道x是什么，相当于只起了个名字占个坑。
    var = 20 # 给实际的定义。全局量
    print('internal var address', id(var))
    a += 1 # +=, -= *=  这类运算符按照从左到右顺序执行，相当于先+1，再把结果=赋值给左侧。
add_one(5)
print('global var address', id(var)) # ->  两个x的地址完全相同，因为都是只声明了一个全局的x在函数内部。

# 思考并尝试：把上面的global var 行删除，在执行，看看会有什么错误？

internal var address 4342530896
global var address 4342530896


In [37]:
# 删除global行：
def  add_one(a):
    # this function add 1 on inputed var x
    var_local = 30 # 定义local变量
    print('internal var address', id(var_local))
    a += 1 # +=, -= *=  这类运算符按照从左到右顺序执行，相当于先+1，再把结果=赋值给左侧。
add_one(5)
print('global var address', id(var_local)) # ->  两个x的地址完全相同，因为都是只声明了一个全局的x在函数内部。


internal var address 4342531216


NameError: name 'var_local' is not defined

In [None]:
# undefined, 因为我们从来没有在外部定义过var_local, 而函数结束后，local变量已经全部释放了。

## 函数的传参

In [42]:
# 函数需要参数（空参数也是参数），一般有两种参数，位置参数positional arguments，和关键字参数keyword arguements,也叫default arguments，因为这种参数在定义时需要给定默认值。
# 以便在没有明确给出具体值时仍然能用默认值进行计算。
# 位置参数必须全部放在关键字参数前，否则会报错

# 例如：


# 错误写法
def do_something(a, c=0, b, d=0):
    pass

SyntaxError: non-default argument follows default argument (1320574147.py, line 9)

In [51]:
#正确写法
def do_something(a, b, c=0, d=0):
    print(a, b, c, d)

In [52]:
# 在传入参数时，一般位置参数直接把外部的实参放在对应的顺序位置上即可，而关键字参数必须要用等号表示传入。例如：
#  正确用法：
do_something(1, 2, c=3, d=4)

1 2 3 4


In [53]:
# 位置参数也可以用等号表示传入参数，避免有时忘记参数位置顺序导致的错误
#正确写法
do_something(a=1, b=2, c=3, d=4)
# 但是此时仍必须保持位置参数在前，比如下面的写法时错误的：

1 2 3 4


In [54]:
do_something(a=1, 2, c=3, d=4)

SyntaxError: positional argument follows keyword argument (3704913400.py, line 1)

In [56]:
# 此外，传参也可以省略关键字参数的等号=，但此时相当于把关键字参数认为是顺序参数，所以一定要注意顺序，否则程序容易出错
do_something(1, 2, 3, d=4) # 省略c=，但是相当于把3默认为给c的参数

1 2 3 4


In [57]:
# 虽然python可以智能的进行这些是识别，但是尽量按照最严谨的方法，严格区分顺序参数和关键字参数的用法为佳。

In [58]:
# *符号和**符号。
# python的函数传参常会见到类似于*args和**kwargs两种表示，那他们分别是什么意思呢？
# 对于*符号，这个符号意味着这个函数此时可以接受任意数量的顺序参数，这些参数进入函数内部后会被打包成一个由arg标记的tuple。进而可以在函数内部使用，比如：
def func(*args):
    print(type(args), len(args))
    print([ _ for _ in args])
    

In [59]:
# 由于*的存在，func中的顺序参数可以有任意个,这特别适合函数输入参数不能提前确定的情况。比如输入一些数字计算和的时候，如果不知道要输入多少个数字，则无法写出具体的形式参数的数量
func(1,2,3,4,"Apple", True)

<class 'tuple'> 6
[1, 2, 3, 4, 'Apple', True]


In [63]:
# 这特别适合函数输入参数不能提前确定的情况。比如输入一些数字计算和的时候，如果不知道要输入多少个数字，则无法写出具体的形式参数的数量,例如：
def get_sum(*args):
    res = 0
    for i in args:
        res += i
    return res

print(get_sum(1,2,3,4,5), get_sum(1,1,1,1,1,1,1,1,1,1,1,1,1,1,))

15 14


In [64]:
# 对于**符号，和*类似的，指代的是函数此时可以接受数量不限个的关键字参数
# 这些关键字参数，由于是以形式参数=实际参数的形式进入函数的，特别的类似于字典的key-value pair
# 函数内这些关键字参数会被封装在kwargs的dict里，需要调用时只需要根据字典的使用规则来即可，例如：

def count_strings(**kwargs):
    # return how many strings has been inputed in this functions
    c = 0
    for key, value in kwargs.items():
        if type(value) == str:
            c += 1
    return c

In [66]:
c = count_strings(p1=1,p2=2,p3=3,p4="Apple") # 注意此时必须要用关键字参数哦
print(c)

1
