# 2.3 函数和模块

<img src="./imgs/2.3.png" width=400 height=300>

很多时候，Python程序中的语句都会组织成函数的形式。

**函数是完成特定功能的一个语句组，可以将其作为一个单位使用，并且给它命名。** 这样，我们就可以通过函数名在程序的不同地方多次执行该语句组（这通常叫做函数调用），却不需要在所有地方都重复编写这些语句。另外，每次使用函数时可以提供不同的参数作为输入，以便对不同的数据进行处理；函数处理后，还可以将相应的结果反馈给我们。

## 2.3.1 函数

函数包括自定义函数和系统自带函数(内置函数)。自定义函数顾名思义为用户自己编写的函数；而系统自带函数即Python中内置的函数，比如之前使用过的range函数就是内置函数的一种。

### 1. 调用函数

Python内置了很多有用的函数，我们可以直接调用。**要调用一个函数，首先需要知道函数的名称和所需参数。函数参数的作用是将数据传递给函数使用**，有关参数的内容将在后文详细介绍。

每个函数的用法可以直接从Python的官方网站查看说明文档，也可以在命令行中通过help(abs)或者abs？查看abs函数的帮助信息。

In [1]:
help(abs) #abs函数：返回参数的绝对值

Help on built-in function abs in module builtins:

abs(x, /)
    Return the absolute value of the argument.



In [5]:
abs?

In [2]:
#abs(num):求num的绝对值
print(abs(-11))
print(abs(100))
print(abs(-12.34))

11
100
12.34


In [3]:
#调用函数的时候，如果传入的参数数量不对，会报TypeError（类型错误）的错误
#如下图所示，Python会明确地告诉你：abs()有且仅有1个参数，但你给出了两个
abs(1,-1)

TypeError: abs() takes exactly one argument (2 given)

In [4]:
#如果传入的参数数量是对的，但参数类型不能被函数所接受，也会报TypeError的错误
abs('a')

TypeError: bad operand type for abs(): 'str'

#### 常用内置函数
附使用文档根据需要自行了解：https://docs.python.org/3/library/functions.html

|函数名	|函数功能
| :-: | :-: |
id()	|获取对象的内存地址
float()	|将整数和字符串转换成浮点数
bin(),oct(),hex()	|将十进制数转为二进制、八进制、十六进制
eval()	|转为十进制
Int()	|将一个字符串或数字转换为整型
type()	|返回对象的类型
del()	|删除变量/对象函数
abs()	|返回绝对值
sum()	|对序列进行求和计算
max()	|返回给定参数的最大值
min()	|返回给定参数的最小值
pow(x,y)|	求x的y次方，x^y
round()	|四舍五入
str()	|转换为字符串
len()	|获取字符串长度
lower()	|返回一个字符串中大写字母转化成小写字母的字符串
upper()	|返回一个字符串中小写字母转化成大写字母的字符串
swapcase()	|返回字符串中的大写字母转小写，小写字母转大写的字符串
capitalize()	|返回字符串中的首字母大写，其余小写的字符串
str2.count(str1,start,end])	|返回str1在str2中出现的次数，可以指定一个范围，若不指定则默认查找整个字符串
str2.find(str1,start,end)	|从左往右检测str2，返回str1第一次出现在str2中的下标,若找不到则返回-1，可以指定查询的范围，若不指定则默认查询整个字符串
strip()	|移除字符串头尾指定的字符（默认为空格或换行符）或字符序列
split()	|通过指定分隔符对字符串进行切片，如果参数 num 有指定值，则分隔 num+1 个子字符串
sorted()	|对所有可迭代的对象进行排序操作
reversed()	|反转序列，生成一个新的序列
zip()	|用于将可迭代的对象作为参数，将对象中对应的元素打包成一个个元组，然后返回由这些元组组成的列表
enumerate()	|用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列，同时列出数据和数据下标，一般用在 for 循环当中。


### 2. 自定义函数

当我们自己定义一个函数时，通常使用def语句，其语法形式示例代码如下：

<font size=3><center>def &lt;函数名&gt;(&lt;形参表&gt;):</center></font>

<font size=3><center>&lt;函数体&gt;</center></font>

注意：

    1. 函数名可以是任何有效的Python标识符。
    2. 形参表是调用该函数时传递给它的值，可以由多个或多个参数组成，当有多个参数时各个参数由逗号分隔。
    3. 函数体是函数每次被调用时执行的代码，可以由一个语句或多个语句组成，函数体需要写成正确的缩进格式。
    4. 圆括号后面的冒号是必不可少的，否则会导致语法错误。

#### （1）return的含义

**return语句的作用是结束函数调用，并将结果返回给调用者。不过，对于函数来说，该语句是可选的，并且可以出现在函数体的任意位置**
如果没有return语句，那么该函数就在函数体结束位置将控制权返回给调用方。（不带表达式的return相当于返回 None）

下面是一个函数定义实例：

In [6]:
def pos_num(num):
    if num>0:
        return num
    else:
        return

函数体内部的语句在执行时，一旦执行到return，函数就执行完毕，并将结果返回。因此，函数内部通过条件判断和循环可以实现非常复杂的逻辑。**如果没有return语句，函数执行完毕后也会返回结果，只是结果为None。return None也可以简写为return**。

In [8]:
pos_num(1) #传入参数为1，大于零，所以返回参数本身

1

In [7]:
b=pos_num(9)
print(b)

9


In [8]:
pos_num(-1)#传入参数为-1，不大于零，所以返回None

#### （2）空函数与pass语句

如果需要定义一个什么事也不做的空函数，可以使用pass语句

In [8]:
def nop():
    pass

pass可以用来作为占位符，比如目前还没有想好如何写该函数的代码，就可以先放一个pass，让代码能运行起来

In [9]:
def  non_adult(age):
    if age>=18:
        #pass
#如果缺少了pass，代码运行就会有语法错误

IndentationError: expected an indented block (1130329048.py, line 4)

#### （3）返回多个值

返回的多个值的形式：return a,b 即返回a的值和b的值，且以括号的形式给出

示例：

In [10]:
def n_profit(a,b,n):
    na=a*n
    nb=b*n
    return na,nb

In [11]:
n_profit(100,200,12)

(1200, 2400)

### 3. 参数
#### （1）形参和实参
在**定义函数**时函数名后面圆括号中的变量名称叫做”形式参数”，简称为”形参”。
在**调用函数**时，函数名后面圆括号中的变量名称叫做”实际参数”，简称为”实参”。

In [12]:
#我们定义的函数将传给它的数值增1，然后将增加后的值返回给调用者
def add(x):
    x=x+1
    return x

#定义函数时括号中的“x”即为形参，调用add函数时传入的变量2就是实参。
add(2) 

3

定义函数时需要确认参数的名字和位置，对于函数的调用者来说，只需要知道如何传递正确的参数，以及函数将返回什么样的值就能够调用该函数。   
Python的函数定义非常简单，但灵活度却非常大。**除了正常定义的必传参数外，还可以使用缺省参数、可变参数和关键字参数，使得函数定义出来的接口，不但能处理复杂的参数，还可以简化调用者的代码**。 详情可参考该文档：https://www.jianshu.com/p/98f7e34845b5

必传参数：平时最常用的，必传确定数量的参数  
缺省参数：在调用函数时可以传也可以不传，如果不传将使用默认值（也被称为默认参数）  
可变参数：可变长度参数  
关键字参数：长度可变，但是需要以kv对形式传参  

#### （2）函数的必传参数
必须传递，且位置必须与形参一一对应,缺一不可。

示例如下：

In [13]:
def power(x,y): #必传参数x和y 该函数返回结果为x的y次方
    return x**y

***当我们调用上述power函数时计算5的2次方时，必须依次传入5，2***

In [14]:
power(5,2)

25

***如果传入参数和形参位置不对应，就无法得到正确结果***

In [15]:
power(2,5) 

32

***如果传入参数有缺失会报错***

In [16]:
power(5)

TypeError: power() missing 1 required positional argument: 'y'

#### （3）缺省参数

在定义函数时，我们可以**用赋值符号给某些形参指定默认值**，这样当调用该函数的时候，如果调用方没有为该参数提供值的话，则使用默认值；如果调用该函数的时候为该参数提供了值，则使用调用方提供的值——像这样的参数我们称之为缺省参数。

In [9]:
def power_2(x,n=2):       #设置定义函数的默认参数
    s=1
    while n>0:
        s=s*x
        n=n-1
    return s
power_2(5)#这样，当我们调用power_2(5)时，相当于调用power(5,2)

25

In [10]:
#而对于n>2的其他情况，就必须明确地传入n的数值，比如power_2(5,3)
power_2(5,3) 

125

**需要注意的是缺省参数在形式参数表中的位置，即缺省参数必须在所有标准参数之后定义**  

以下是函数含有多个缺省参数时传递参数的示例，可进行对比理解。

In [19]:
def f(arg1,arg2=2,arg3=3):
    print('arg1=', arg1)
    print('arg2=', arg2)
    print('arg3=', arg3)

In [20]:
#示例A
f(10)

arg1= 10
arg2= 2
arg3= 3


In [21]:
f(10,17)

arg1= 10
arg2= 17
arg3= 3


In [22]:
f(10,17,22)

arg1= 10
arg2= 17
arg3= 22


现在对上述代码做一些解释：

**示例A：** 通过f（10）进行函数调用时，因为arg1没有缺省值，必须为它提供实参，所以f（10）中的实参10将传递给形参arg1；又因为只有一个传入参数，即没有给缺省参数arg2和arg3传递实参，所以它们采用默认值2和3。

**示例B：** 用了f（10，10）来调用函数，传入了两个参数，第一个实参10按顺序传递给arg1，第二个参数17传递给arg2，由于没有给arg3传递实参，所以采用默认值3

**示例C：** 用了f（10，10，10）来调用函数，传入了三个实参，所以10，17，22分别传递给arg1，arg2，arg3

***使用缺省参数的好处在于：如果某个参数大部分情况下都取某个固定的值，那么就可以为这个参数定义一个默认值，这样在以后使用这个函数时带来很大的便利；如果偶尔情况有变，还可以给它传递更适合的值。***

#### （3）可变参数和关键词参数

在Python函数中，还可以定义可变参数。顾名思义，**可变参数就是传入的参数个数是可变的，可以是1个、2个到任意个，还可以是0个**。可变参数的定义形式是星号+参数，例如下面的形式中：*args就是定义的可变参数

<font size=3><center>def &lt;函数名&gt;(&lt;arg1,*args&gt;):</center></font>

<font size=3><center>&lt;函数体&gt;</center></font>



可变参数允许你传入0个或任意个参数，这些可变参数在函数调用时自动组装为一个tuple,而**关键字参数允许你传入0个或任意个含参数名的参数，这些关键字参数在函数内部自动组装为一个dict**。可变参数的定义形式是两个星号+参数，例如下面的形式中：\*\*args就是定义的关键词参数

<font size=3><center>def &lt;函数名&gt;(&lt;arg1,**kwargs&gt;):</center></font>

<font size=3><center>&lt;函数体&gt;</center></font>

可参考以下文档进行学习：https://www.jianshu.com/p/98f7e34845b5

### 4. 局部变量和全局变量

在Python中的任何变量都有其特定的作用域，在函数内部定义的变量一般只能在该函数内部使用，这些**只能在程序的特定部分使用的变量我们称之为局部变量**；同理，**能够为整个程序所使用的变量成为全局变量**。

上面是从空间的角度来考察变量的局部性和全局性，如果从时间的角度来看，不妨简单地认为在程序运行的整个过程中，**全局变量一直占据着内存，并且它的值可以供所有函数访问**；而**局部变量则是只有在其所在函数被调用时才给它分配内存，当函数返回时，其所占内存就会被释放，所以它只能供其所在的函数所访问**——换句话说，当某个函数退出时，其局部变量原先所占的内存将被分配给其它函数的局部变量。

In [1]:
globalInt=9   #定义了一个全局变量globalInt，该变量将在整个程序中有效

#定义了一个函数myAdd()，并在这个函数中定义了一个局部变量localInt，该局部变量只能在函数myAdd()中有效   
def myAdd():
    localInt=3
    return globalInt+localInt

print(myAdd())

print(globalInt)

print(localInt) 

12
9


NameError: name 'localInt' is not defined

上述代码的执行结果表明：

自定义函数myAdd()既可以访问局部变量localInt，也可以使用在外部定义的全局变量globalInt，所以调用该函数时返回的结果为12。

然后打印了全局变量globalInt的值，其为9，这说明它全局可用。

最后打印局部变量localInt时遇到了错误，**错误提示说”localInt”没有被定义，这是因为局部变量localInt只能在定义它的函数myAdd()中有效（或者说可见），而超出函数范围之外的代码是看不到它的，根据先定义后使用的原则，Python解释器会认为该程序使用了未定义的变量名。**

**小节练习6：给定两个列表list1 和 list2，定义一个函数，使其能够输出列表list1的元素和，list2的元素和，以及两个列表元素和的差值的绝对值**

***考察知识点：内置函数的使用、自定义函数、函数的调用***

In [11]:
list1 = [13,2,76,45,5,39,18]
list2 = [5,22,17,93,48,26,3]
#your code 定义函数
def test(a,b):
    
    return sum(a),sum(b),abs(sum(a)-sum(b))

In [12]:
#your code 调用函数
test(list1,list2)

(198, 214, 16)

## 2.3.2 模块

### 1. 模块的定义

**模块是一个包含了已经定义的函数和变量的文件，模块的文件名一般以.py为扩展名。Python模块其实也是一个Python文件**。
首先它是一个文件的概念，里面放着代码，然后Python模块的另外一个含义就是“名字空间”，名字空间从字面意思理解就是存放名字的地方，我们把模块里面定义的方法或者变量的内容，当做模块的属性。也可以按照面向对象的方法来理解，因为Python是面向所有对象的语言，把模块当作对象，里面定义的方法和变量就是模块的属性，下次在程序的其他地方调用模块的属性或者方法的话，则可以直接通过模块名.属性名或者方法名来调用。

**模块有下面的几种特性：**
①模块语句在第一次导入的时候就执行了。在代码的任何地方导入一个模块，它都会生成一个空对象，然后从头到尾执行模块里面的语句。比如你在模块里面定义了def语句，或者赋值语句，系统会先生成模块对象的属性，然后存储到模块的名字空间里；

②如果想查看模块里面的属性，可以通过dir()的方法。例如，Pandas是一个模块，dir(Pandas)就可以查询Pandas的属性。

③模块里的变量和函数里的变量不太一样，模块里的变量在模块第一次导入以后就可以使用了，而函数里的变量是在函数运行的时候才能够使用。 模块名就是不包含扩展名的Python文件名，且该文件与当前文件在同一个文件夹中。使用模块中的函数时，函数名前要有模块名再加一个点号”.”。

例如，编写两个模块文件，前一个模块有一个求最大值的函数，后一个模块文件要使用前面的模块文件中的求最大值函数。前一个模板的示例代码如下：

### 2. 模块的调用

#### (1) 使用import调用模块

模块的特性决定了在程序中只要导入了一个模块，就可以引用它的任何公共的函数、类或属性。 **用import语句导入模块，就是在当前的名称空间中建立了一个到该模块的引用.这种引用必须使用全称**，也就是说，当使用在被导入模块中定义的函数时，必须包含模块的名字。所以不能只使用函数名，而**应该使用 模块名.函数名的形式来保证模块调用的正确**。示例代码如下：

In [13]:
import module_max

In [14]:
module_max.funcMax(9,37)#使用模块名.函数名

37

In [15]:
module_max.funcMin(9,37) 

9

In [16]:
funcMax(9,37) #不能直接使用函数名

NameError: name 'funcMax' is not defined

#### (2) 使用from语句调用模块

from 模块名 import 函数名

from 模块名 import 函数名1，函数名2

或者from 模块名 import *

这种方法与使用import调用函数的**区别是：函数被直接导入到本地名字空间去了，所以即使不加上模块名的限定也可以直接使用**。 上述的“\*”表示，该模块的所有函数都被导入到当前的名称空间。 但是需要注意的是：**如果模块包含的属性和方法与你的某个模块同名，你必须使用“模块名.属性名” 来避免名字冲突**。

In [18]:
from module_max import funcMax
funcMax(9,37) #该种方式下可以直接使用函数名调用

37

In [19]:
from module_max import *

#### (3) 内建函数import()

除了前面两种导入模块的方法以外，我们还可以使用内建函数 import() 来导入模块。两者的区别是，import 后面跟的是模块名，而import() 的参数是一个字符串。例如，import Pandas 等价于import('Pandas')。另外，**import不能导入以数字开头和包含空格的模块，而函数import()可以**

### 3. 作用域

作用域是指变量的生效范围，例如局部变量、全局变量描述的就是不同的生效范围。也就是说，在Python中变量的作用域是由它在源代码中的位置决定的。

在下面这段代码中，if子句并没有引入一个局部作用域，变量i仍然处在全局作用域中，因此，变量i对于接下来的print语句是可见的，打印结果为0。

In [33]:
if True:
    i=0
print(i)

0


i = 8是一个名字绑定操作，它在函数f的局部作用域中引入了新的变量i，屏蔽了全局变量i.因此f内部的print语句看到的是局部变量i，f外部的print语句看到的是全局变量i。
调用f时打印的是函数内部局部变量i的值8，在f外打印的是全局变量i的值0

In [34]:
i=0
def f():
    i=8
    print(i)
f()
print(i)

8
0


在下面这个例子当中，函数f中的变量i是局部变量，但是在print语句使用它的时候，它还未被绑定到任何对象之上，所以抛出异常。

In [35]:
i=0
def f():
    print(i)
    i=0
f()

UnboundLocalError: local variable 'i' referenced before assignment

In [36]:
#注意上面一步已经定义过i=0,这里需要删除
del i  #如果上面一步i=0代码未执行，则不需要删除i
print(i)
i=0

NameError: name 'i' is not defined

不论是以交互的方式运行，还是以脚本文件的方式运行，结果都显示：NameError: name ‘i’is not defined。这里的输出结果又与上一个例子不同，这是因为它在顶级作用域（模块作用域）的缘故。对于模块代码而言，代码在执行之前，没有经过什么预处理，但是对于函数体而言，代码在运行之前已经经过了一个预处理，因此不论名字绑定发生在作用域的那个位置，它都能感知出来。Python虽然是一个静态作用域语言，但是名字查找确实动态发生的，因此直到运行的时候，才会发现名字方面的问题。

### 4. 第三方模块的安装

在Ananconda中，安装第三方模块主要有两种方式：pip install和conda install，目前官方推荐使用pip install的方法。

#### (1) 使用pip install

使用Jupyter Notebook安装第三方模块，只需要在命令提示符或者Anaconda Prompt (Anaconda3)中输入pip install 加上第三方包的名称即可。

当我们试图加载一个模块时，Python会在指定的路径下搜索对应的.py文件，如果找不到，就会报错，例如下面的代码：

In [20]:
import mymodule 

ModuleNotFoundError: No module named 'mymodule'

In [22]:
import jieba #已经安装过的模块不会报错

In [23]:
jieba.lcut('解释器会搜索当前目录')

Building prefix dict from the default dictionary ...
Dumping model to file cache C:\Users\wangpc\AppData\Local\Temp\jieba.cache
Loading model cost 0.715 seconds.
Prefix dict has been built successfully.


['解释器', '会', '搜索', '当前目录']

在默认情况下，Python解释器会搜索当前目录、所有已安装的内置模块和第三方模块，搜索路径存放在sys模块的path变量中：

In [24]:
import sys
sys.path #会在以下路径进行搜索

['E:\\ipython\\0 Python Data Analysis\\Part I Python Basics',
 'D:\\Anaconda3\\python38.zip',
 'D:\\Anaconda3\\DLLs',
 'D:\\Anaconda3\\lib',
 'D:\\Anaconda3',
 '',
 'C:\\Users\\wangpc\\AppData\\Roaming\\Python\\Python38\\site-packages',
 'D:\\Anaconda3\\lib\\site-packages',
 'D:\\Anaconda3\\lib\\site-packages\\pip-21.1-py3.8.egg',
 'D:\\Anaconda3\\lib\\site-packages\\win32',
 'D:\\Anaconda3\\lib\\site-packages\\win32\\lib',
 'D:\\Anaconda3\\lib\\site-packages\\Pythonwin',
 'D:\\Anaconda3\\lib\\site-packages\\IPython\\extensions',
 'C:\\Users\\wangpc\\.ipython']

如果我们要添加自己的搜索目录，有两种方法：

方法1：直接修改sys.path，添加要搜索的目录，如下：

In [53]:
import sys
sys.path.append('/Users/Michael/my_py_scripts')#这种方法是在运行时修改，运行结束后失效。

方法2：设置环境变量Path，该环境变量的内容会被自动添加到模块搜索路径中。设置方式与设置Path环境变量类似。注意只需要添加你自己的搜索路径，Python自己本身的搜索路径不受影响。设置方法：https://blog.csdn.net/sirok_e/article/details/100050324

#### (2) 使用conda install
conda 是一个开源的软件包管理系统和环境管理系统，用于安装多个版本的软件包及其依赖关系，并在它们之间轻松切换。 Conda 是为 Python 程序创建的，适用于 Linux，OSX 和Windows，也可以打包和分发其他软件。

conda是一个与语言无关的跨平台环境管理器。对于用户，最显著的区别可能是这样的：pip在任何环境中安装Python包; conda安装在conda环境中装任何包。

#### (3) 使用清华镜像下载第三方模块
用户可通过清华镜像源下载第三方模块，下载速度会有较大提升，将清华镜像库设置为默认地址：**将以下代码在命令行下执行**