# 文件操作
Python内置了一个open()方法，可以对文件进行读写操作。

## 打开文件

open()方法的返回值是一个file对象，可以将它赋值给一个变量（文件句柄）。

其基本语法格式为:
f = open(filename, mode, encode)
- filename: 文件路径或文件描述符
- mode：打开模式，默认是只读r
r:
w:
a:
r+:
w+:
a+:
rb:
wb:
ab:
rb+:
wb+:
ab+:
- encode:默认是utf8，如果读取utf8的文件需要指定编码格式

## 文件对象操作

 ### f.read(size)

读取一定大小的数据, 然后作为字符串或字节对象返回。size是一个可选的数字类型的参数，用于指定读取的数据量。当size被忽略了或者为负值，那么该文件的所有内容都将被读取并且返回。



### f.readline()

从文件中读取一行n内容。换行符为'\n'。如果返回一个空字符串，说明已经已经读取到最后一行。这种方法，通常是读一行，处理一行的情况下使用。

### f.readlines()

将文件中所有的行，一行一行全部读入一个列表内，按顺序一个一个作为列表的元素，并返回这个列表。readlines方法会一次性将文件全部读入内存，所以也存在一定的弊端。但是它有个好处，每行都保存在列表里，可随意存取。

### 遍历文件

实际情况中，我们会将文件对象作为一个迭代器来使用。

#打开一个文件f = open("1.txt", "r")for line in f:print(line, end='')# 关闭打开的文件f.close()

这个方法很简单, 不需要将文件一次性读出，但是同样没有提供一个很好的控制，与readline方法一样只能前进，不能回退。

几种不同的读取和遍历文件的方法比较：

如果文件很小，read()一次性读取最方便；

如果不能确定文件大小，反复调用read(size)比较保险；

如果是配置文件，调用readlines()最方便。普通情况，使用for循环更好，速度更快。

### f.write()

使用write()可以完成向文件写入数据。

### f.tell()

返回文件读写指针当前所处的位置，它是从文件开头开始算起的字节数。一定要注意了，是字节数，不是字符数。

### f.seek()

如果要改变位置指针的位置, 可以使用f.seek(offset, from_what)方法。seek()经常和tell()方法配合使用。

from_what的值，如果是0表示从文件开头计算，如果是1表示从文件读写指针的当前位置开始计算，2表示从文件的结尾开始计算，默认为0，例如：

offset：表示偏移量。

seek(x,0) ：从起始位置即文件首行首字符开始移动 x 个字符。
seek(x,1) ：表示从当前位置往后移动x个字符。
seek(-x,2)：表示从文件的结尾往前移动x个字符。

### f.close()

关闭文件对象。当处理完一个文件后，调用f.close()来关闭文件并释放系统的资源。文件关闭后，如果尝试再次调用该文件对象，则会抛出异常。忘记调用close()的后果是数据可能只写了一部分到磁盘，剩下的丢失了，或者更糟糕的结果。

## with

with关键字用于Python的上下文管理器机制。为了防止open这一类文件打开方法，在操作过程出现异常或错误，或者最后忘了执行close方法，文件非正常关闭等可能导致文件泄露、破坏的问题。

Python提供了with这个上下文管理器机制，保证文件会被正常关闭。不需要再写close语句。

# 函数
函数是组织好的、可以重复使用的、用来实现单一功能的代码。

把实现一定功能的代码块集合到一起，方便重复使用。（简洁、高效）

## 自定义函数

自定义函数格式：
```
def 函数名(参数1,参数2,....):
    函数体
return 返回值
```
Tips:
- def是define的引文缩写
- 函数名能尽量表达函数的功能
- 函数名的命名应符合命名规则
- 参数是可选项
- return 返回值是可选项，默认返回None
- 一旦return函数立马结束并返回结果

In [1]:
def circle_area(r):
    # 求圆的面积
    area = 3.14 * r **2
    return area

## 调用函数

In [2]:
def say_hello():
    # 打招呼
    print('Hello')
    
def max(x,y):
    if x>=y:
        print(x)
    else:
        print(y)

In [3]:
# 无参数函数的调用
say_hello()

Hello


In [4]:
# 有参数函数的调用方式1: 
max(10,20)

20


In [5]:
# 有参数函数的调用方式2: 
max(y=12,x=21)

21


## 函数返回值

In [41]:
# 没有return，默认返回None
def func():
    pass
s = func()
print(s,type(s))
# return 没有指定值也会返回None
def func1():
    return
s = func1()
print(s,type(s))

None <class 'NoneType'>
None <class 'NoneType'>


In [34]:
#  有一个return值
def func():
    a = 100
    return a
s = func()
print(s,type(s))

100 <class 'int'>


In [36]:
# 有多个return值，会返回 一个元组
def func():
    a = 100
    b = 200
    return a,b
s = func()
print(s,type(s))

(100, 200) <class 'tuple'>


In [38]:
# 函数一旦return会立马结束，后面的代码不会再执行
def func():
    a = 100
    return a
    print(200)
print(func())

100


为什么要return呢？直接打印出来不就可以了吗？

因为我们可以把返回的值存储到变量中，放其他时候调用

## 函数的参数
函数中代码执行时需要的数据。

函数参数能够增加函数的通用性，针对相同的数据处理逻辑，能够是适应更多的数据。

### 形参和实参

- 形式参数：定义函数时，函数名后面圆括号中的变量，简称“形参”。形参只在函数内部有效

- 实际参数：调用函数时，函数名后面圆括号中的变量，简称 “实参”。

In [6]:
def func(name):
    print(name)
func('tom')

tom


上面示例中，name是形参，函数执行需要这些数据，但这些数据不是具体的。

在函数调用时，'tom',这是一个真实的数据，真实的、存在的数据。

### 参数定义

#### 位置参数
函数调用执行时，实参按照形参的先后顺序（位置）依次赋值

In [8]:
def subtraction(x,y):
    # 求两个数的差
    s = x - y
    return s

In [7]:
# 函数调用时，位置参数必须传值，否则会报错误
subtraction()

TypeError: subtraction() missing 2 required positional arguments: 'x' and 'y'

In [9]:
# 函数调用时，实参会按顺序依次赋值给形参
print(subtraction(10,4))
print(subtraction(4,10))

6
-6


#### 默认参数
函数声明中，某个参数可以直接赋值，该形式参数就是默认参数。

默认参数可以在调用时不传递数据，使用默认数据进行运算。

In [None]:
def printinfo( name, age=18 ):
   "打印信息"
   print ("名字: ", name)
   print ("年龄: ", age)
   return

In [None]:
# 如果某个形参在大多数情况下都是一个值，那么可以给这个形参一个默认值，函数调用如下
printinfo('Tom')

In [None]:
# 从上面的示例可以看出，默认参数简化了函数的调用，不用每次调用时传递所有的参数
# 如果要修改默认参数的值，直接赋值即可，如
printinfo('Tom',28)

有多个默认参数时，调用的时候，既可以按顺序提供默认参数也可以不按顺序提供部分默认参数。当不按顺序提供部分默认参数时，需要把参数名写上。

#### 可变参数
可以通过符号*，生命某个可以接受多个数据的可变参数。可变参数可以接受0~n个数据

In [None]:
def calc(*numbers):
    sum = 0
    for n in numbers:
        sum = sum + n * n
    return sum
print(calc(1,2,3,3,3,3,2,2,1,3,4,3))

定义可变参数和定义一个list或tuple参数相比，仅仅在参数前面加了一个*号。在函数内部，参数numbers接收到的是一个tuple，因此，函数代码完全不变。但是，调用该函数时，可以传入任意个参数，包括0个参数

#### 关键字参数
可以通过**，生命某个可以接受多个key-value键值对数据，并且自动转换成字典

In [5]:
def func(a,**kwargs):
    print(f'a 的值是{a}')
    print(f'kwargs 的值是{kwargs}',type(kwargs))
func(10,k1='v1',k2='v2')

a 的值是10
kwargs 的值是{'k1': 'v1', 'k2': 'v2'} <class 'dict'>


#### 万能参数

In [None]:
def func(*args,**kwargs):
    pass

*args可以接受任意多个的单个数据


**kwargs可以接受任意多个的key-value键值对数据

#### 参数组合

在Python中定义函数，可以用位置参数、默认参数、可变参数、关键字参数和命名关键字参数，这5种参数都可以组合使用。但是请注意，参数定义的顺序必须是：位置参数、默认参数、可变参数、命名关键字参数和关键字参数。

## 全局变量和局部变量

### 全局变量
在函数外边定义的变量叫做全局变量

全局变量能够在所有的函数中进行访问

In [11]:
a = 100 
def f1():
    print(a)
def f2():
    print(a)
f1()
f2()# 函数f1和f2虽然没有定义变量a，但可以使用全局变量a

100
100


In [12]:
a = 50 # 全局变量
def func():
    a = 100 # 局部变量
    print(a)
func()
print(a) # 当局部变量与全局变量重名时，函数内部会优先使用局部变量，而且函数内部重新赋值不会影响全局变量的值

100
50


In [14]:
# 修改全局变量
a = 50 # 全局变量
def func():
    global a # 通过global，将函数中的变量a转成全局变量
    a = 100 # 此时变量a赋值会覆盖掉全局中定义时候的值
    print(a)
func()
print(a) 

100
100


### 局部变量
局部变量，就是在函数内部定义的变量

其作用范围是这个函数内部，即只能在这个函数中使用，在函数的外部是不能使用的

In [10]:
def func():
    a = 100
    print(f'函数内部打印变量a：{a}')
func()
print(a)#函数外部打印变量a报NameError的异常，说明变量a只在函数内部有效

函数内部打印变量a：100


NameError: name 'a' is not defined

注意:局部变量的作用，为了临时保存数据需要在函数中定义变量来进行存储,
当函数调用时，局部变量被创建，当函数调用完成后这个变量就不能够使用了

In [17]:
a = 100
def func():
    a=200
    nonlocal a
    
    print(a)
func()
print(a)

SyntaxError: name 'a' is assigned to before nonlocal declaration (271028236.py, line 4)

### 非局部变量

In [30]:
def foo():
    x = 0
    def wraper():
        x += 1
        print(f'x={x}')
    for i in range(3):
        wraper()
foo()

UnboundLocalError: local variable 'x' referenced before assignment

执行函数foo后，在嵌套的函数wrap中抛出如下异常：UnboundLocalError: local variable 'x' referenced before assignment.

意思是局部变量x在使用前未被赋值

这句话本身不难理解，但是问题在于x不是已经在foo函数内已经被赋值了吗，为什么还有上面提示呢？

原因在于：函数内的变量一旦被修改，就会变为局部变量，所以x第一次就出现在等号右侧自然就有问题。

换句话说，如果在wrap内仅仅是读取x，就不会有问题，x被解释为全局变量：

In [20]:
def foo():
    x = 0
    def wraper():
        print(f'x={x}')
    for i in range(3):
        wraper()
foo()

x=0
x=0
x=0


所以，解释器为了解决以上问题，引入了nonlocal关键字，显示的声明x不是局部变量，所以就往外寻找x，然后在foo内被找到：

In [21]:
def foo():
    x = 0
    def wraper():
        nonlocal x
        x += 1
        print(f'x={x}')
    for i in range(3):
        wraper()
foo()

x=1
x=2
x=3


nonlocal型变量一般用于函数嵌套中，修改外部函数的局部变量，只会影响向外的一层（拥有相同变量名的一层）

### 变量作用域
Python的作用域一共有4中，分别是：
- L （Local） 局部作用域
- E （Enclosing） 闭包函数外的函数中
- G （Global） 全局作用域
- B （Built-in） 内建作用域

In [31]:
global_var = 0         #全局作用域
def outer():
    enclosing_var = 1    #闭包函数外的函数中
    def inner():
        local_var = 2            #局部作用域

在查找变量时，会以 L –> E –> G –>B 的规则查找，即：在局部找不到，便会去局部外的局部找（例如闭包），再找不到就会去全局找，再者去内建中找。

Python除了def/class/lambda 外，其他如: if/elif/else/try/except for/while并不能改变其作用域。定义在他们之内的变量，外部还是可以访问。

In [22]:
if True:
    a = 100
print(a) # if 中定义的变量外部还可以访问

100


在 def/class/lambda内进行赋值，就变成了其局部的作用域，局部作用域会覆盖全局作用域，但不会影响全局作用域。

In [24]:
g = 100
def func():
    g= 50
    return g
print(func())
print(g) # 局部作用域会覆盖全局作用域，但不会影响全局作用域

50
100


In [29]:
var = 1
def func():
    var = var+1
    return var
func()

UnboundLocalError: local variable 'var' referenced before assignment

在未被赋值之前引用的错误！为什么？因为在函数的内部，**解释器探测到var被重新赋值了，所以var成为了局部变量**，但是在没有被赋值之前就想使用var，便会出现这个错误。

解决的方法是在函数内部添加 global var 但运行函数后全局的var也会被修改。

## 递归函数

## 匿名函数lambda

lambda函数是指一类无需定义标识符（函数名）的函数或子程序。lambda函数可以接收任意多个参数（包括可选参数）并且返回单个表达式的值。

![%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507150747.png](attachment:%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507150747.png)

匿名函数的要点：
- lambda表达式不能包含命令
- 包含的表达式不能超过一个

使用场景：
- 临时使用依次函数（只用一次）
- 不需要内容的函数
- 泛函数编程利用lambda表达式

In [43]:
l = [('ab',110),('ce',10),('ae',30),('vde',103),]# 按照元组第二个值排序
sorted(l,key=lambda x:x[1])

[('ce', 10), ('ae', 30), ('vde', 103), ('ab', 110)]

## 练习

### 
编写一个函数，判断三个能不能构成三角形;如果可以构成三角形那么是什么样的三角形？（等边三角形，等腰三角，普通三角形）

### 
![%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507144002.png](attachment:%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507144002.png)

### 
![%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507144027.png](attachment:%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507144027.png)

### 
![%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507144038.png](attachment:%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507144038.png)

### 
![%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507144050.png](attachment:%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507144050.png)

### 
![%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507145220.png](attachment:%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507145220.png)

### 
![%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507145230.png](attachment:%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507145230.png)

### 
![%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507145817.png](attachment:%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507145817.png)

### 
![%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507145827.png](attachment:%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507145827.png)

### 
![%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507145847.png](attachment:%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507145847.png)

### 
![%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507145907.png](attachment:%E5%BE%AE%E4%BF%A1%E6%88%AA%E5%9B%BE_20220507145907.png)

# 模块、包、库

## 模块module
python模块，是一个以.py结尾的python文件，包含了python对象定义和python语句。

模块让你能够有逻辑地组织你的python代码段，把相关的代码分配到一个模块里能让你的代码更好用、更易懂。

模块能定义函数，类和变量，模块里也能包含可执行的代码。

使用模块有什么好处？

最大的好处是大大提高了代码的可维护性；其次，编写代码不必从零开始。当一个模块编写完毕，就可以被其他地方引用，我们在编写程序的时候，也经常引用其他模块，包含python内置的模块和来自第三方的模块。

使用模块还可以避免函数名和变量名冲突。相同名字的函数和变量完全可以分别存在不同的模块中，因此，我们自己在编写模块时，不必考虑名字会与其他模块冲突。但是也要注意，尽量不要与内置函数名字冲突。

## 包package
为了组织好模块，将多个模块分打成一个包。

包是一个分层次的文件目录结构，它定义了一个由模块及子包，和子包下的子包等组成的python的应用环境。

简单来说，包就是文件夹，但该文件下必须存在\_\_init__.py文件，该文件的内容可以为空。\_\_init__.py用于标识当前文件夹是一个包。

## 库library
库的概念是具有相关功能模块的集合。这也正是python的一大特色之一，即具有强大的标准库，还有第三方库以及自定义模块。

python中的库是借用其他编程语言的概念，没有特别具体的定义，python库着重强调其功能性。

在python中，具有某些功能的模块和包都可以被称作库，模块有诸多函数组成，包由诸多模块机构化组成，库中也可以包含包、模块和函数。

![mokuai.png](attachment:mokuai.png)

## 导入库

### 导入方式一
导入时直接导入库名，使用时需要 __*库名.变量*__ 的形式调用

In [1]:
import random
random.randint(1,10) 

7

### 导入方式二
导入时只导入库某几个功能,未导入的功能在调用时会报NameError的异常

In [7]:
from random import randint,random
print(randint(1,10))
print(random())

3
0.3059484650829859


In [3]:
choice([1,2,3,4])

NameError: name 'choice' is not defined

### 导入方式三
导入时使用星号\*,导入库中所有功能，调用时不需要使用库名

In [4]:
from random import *
randint(1,10)

1

In [6]:
choice([1,2,3,4])

4

### 别名
导入时如果出现变量名冲突，可以使用别名

In [10]:
from random import randint
randint = 10 # 应为该变量与导入的randint名字重复，所以会覆盖掉导入的变量值,这样就容易导致出现异常
print(type(randint))
randint(1,10)

<class 'int'>


TypeError: 'int' object is not callable

In [12]:
from random import randint as rint # 通过as关键字，将randint重命名，后面调用时使用新的名字
randint = 10 
print(type(randint))
print(rint(1,10))

<class 'int'>
6


## 模块的查找

### 几个概念

- 绝对路径 absolute path: 全路径。如，"C:\Users\P0182449\PycharmProjects\examOnline\account\tests.py"
- 相对路径 relative path: 相对于某个目录的路径。如，".\examOnline\account\tests.py"

.  代表当前目录

.. 代表上级目录

### 查找路径

In [18]:
import sys
print(sys.path)# 通过此指令来查看当前解释器查找模块的路径

['D:\\material', 'c:\\users\\p0182449\\appdata\\local\\programs\\python\\python38\\python38.zip', 'c:\\users\\p0182449\\appdata\\local\\programs\\python\\python38\\DLLs', 'c:\\users\\p0182449\\appdata\\local\\programs\\python\\python38\\lib', 'c:\\users\\p0182449\\appdata\\local\\programs\\python\\python38', '', 'c:\\users\\p0182449\\appdata\\local\\programs\\python\\python38\\lib\\site-packages', 'c:\\users\\p0182449\\appdata\\local\\programs\\python\\python38\\lib\\site-packages\\win32', 'c:\\users\\p0182449\\appdata\\local\\programs\\python\\python38\\lib\\site-packages\\win32\\lib', 'c:\\users\\p0182449\\appdata\\local\\programs\\python\\python38\\lib\\site-packages\\Pythonwin']


![image.png](attachment:image.png)

![image.png](attachment:image.png)

## if \_\_name__ == '\_\_main__'
主要用于模块测试

一般情况下，当我们写完自定义的模块之后，都会写一个测试代码，检验一些模块中各个功能是否能够成功运行。例如，创建一个 candf.py 文件，并编写如下代码：

![image.png](attachment:image.png)

在 candf.py 模块文件的基础上，在同目录下再创建一个 demo.py 文件，并编写如下代码：

![image-2.png](attachment:image-2.png)

可以看到，Python解释器将模块（candf.py）中的测试代码也一块儿运行了，这并不是我们想要的结果。想要避免这种情况的关键在于，要让 Python 解释器知道，当前要运行的程度代码，是模块文件本身，还是导入模块的其它程序。

为了实现这一点，就需要使用 Python 内置的系统变量 \_\_name__，它用于标识所在模块的模块名。例如，在 demo.py 程序文件中，添加如下代码：

![image.png](attachment:image.png)

可以看到，当前运行的程序，其 \_\_name__ 的值为 \_\_main__，而导入到当前程序中的模块，其 \_\_name__ 值为自己的模块名。

因此，if \_\_name__ == '\_\_main__': 的作用是确保只有单独运行该模块时，此表达式才成立，才可以进入此判断语法，执行其中的测试代码；反之，如果只是作为模块导入到其他程序文件中，则此表达式将不成立，运行其它程序时，也就不会执行该判断语句中的测试代码。

# 异常处理

# 常用模块

# 正则表达式