# 第七章 模块

1. Python 程序由模块组成。一个模块对应 python 源文件，一般后缀名是：.py。

2. 模块由语句组成。运行 Python 程序时，按照模块中语句的顺序依次执行。

3. 语句是 Python 程序的构造单元，用于创建对象、变量赋值、调用函数、控制语句等。

函数类似，模块也分为标准库模块和用户自定义模块。

Python 标准库提供了操作系统功能、网络通信、文本处理、文件处理、数学运算等基
本的功能。比如：random(随机数)、math(数学运算)、time(时间处理)、file(文件处理)、
os(和操作系统交互)、sys(和解释器交互)等。

另外，Python 还提供了海量的第三方模块，使用方式和标准库类似。功能覆盖了我们
能想象到的所有领域，比如：科学计算、WEB 开发、大数据、人工智能、图形系统等

In [None]:
__doc__,__name__,__main__

In [54]:
#导入 math 模块，并通过 help()查看 math 模块的 API
import math
# help(math)

import 语句的基本语法格式如下：

import 模块名#导入一个模块

import 模块 1，模块 2… #导入多个模块

import 模块名 as 模块别名 #导入模块并使用新名字

from 模块名 import 成员 1，成员 2，…

import 导入的是模块。from...import 导入的是模块中的一个函数/一个类,无需加模块名。

重新加载一个模块：importlib.reload()

包(package)=模块(module)+子包(subpackage)

Python 标准库的主要功能有：

1. 文本处理，包含文本格式化、正则表达式匹配、文本差异计算与合并、Unicode 支
持，二进制数据处理等功能

2. 文件处理，包含文件操作、创建临时文件、文件压缩与归档、操作配置文件等功能

3. 操作系统功能，包含线程与进程支持、IO 复用、日期与时间处理、调用系统函数、
日志（logging）等功能

4. 网络通信，包含网络套接字，SSL 加密通信、异步网络通信等功能

5. 网络协议，支持 HTTP，FTP，SMTP，POP，IMAP，NNTP，XMLRPC 等多种网
络协议，并提供了编写网络服务器的框架

6. W3C 格式支持，包含 HTML，SGML，XML 的处理

7. 其它功能，包括国际化支持、数学运算、HASH、Tkinter 等

目前学过的有：random、math、time、file、os、sys 等模块。可以通过 random 模
块实现随机数处理、math 模块实现数学相关的运算、time 模块实现时间的处理、file 模块
实现对文件的操作、OS 模块实现和操作系统的交互、sys 模块实现和解释器的交互。

# 第八章 文件操作（IO）

文件分为文本文件和二进制文件两大类

文本文件的写入一般就是三个步骤：
1. 创建文件对象
2. 写入数据
3. 关闭文件对象

windows 操作系统默认的编码是 GBK，Linux 操作系统默认的编码是 UTF-8。当我们
用 open()时，调用的是操作系统打开的文件，默认的编码是 GBK。

In [33]:
#解决中文乱码,encoding="utf-8"
f=open(r'a.txt','a',encoding="utf-8")
f.write('中文\n程序员')
f.close()

write()/writelines()写入数据
write(a)：把字符串 a 写入到文件中
writelines(b)：把字符串列表写入文件中，不添加换行符

In [19]:
#文本写入操作
f = open(r'a.txt','w')
# s='尚学堂\n 百战程序员\n尚学'
s = ["高淇\n","高老三\n","高老四\n"]
#f.write(s)#字符串
f.writelines(s)#字符串列表
f.close()

In [22]:
# 有问题，没有close，信息也能写入，并没有报错
#结合异常机制 finally 确保关闭文件对象
try:
    f=open(r'b.txt','a')
    t='swtswt'
    f.write(t)
except BaseException as e:
    print(e)
finally:
    f.close()

In [31]:
#with 关键字（上下文管理器）可以自动管理上下文资源
#不论什么原因跳出 with 块，都能确保文件正确的关闭，
#并且可以在代码块执行完毕后自动还原进入该代码块时的现场。
with open(r'a.txt','r') as f:
#     print(f.read())
    print(f.readline())
    print(f.readlines())

高淇

['高老三\n', '高老四\n']


文件的读取一般使用如下三个方法：
1. read([size])
从文件中读取 size 个字符，并作为结果返回。如果没有 size 参数，则读取整个文件。
读取到文件末尾，会返回空字符串。
2. readline()
读取一行内容作为结果返回。读取到文件末尾，会返回空字符串。
3. readlines()
文本文件中，每一行作为一个字符串存入列表中，返回该列表

In [37]:
#读取一个文件前 4 个字符
#注意乱码问题
with open(r'a.txt','r',encoding="GBK") as f:
    print(f.read(4))

高淇
高


In [39]:
#文件较小，一次将文件内容读入到程序中
with open(r'a.txt','r',encoding="GBK") as f:
    print(f.read())

高淇
高老三
高老四



In [45]:
#按行读取一个文件
with open(r'a.txt','r',encoding="GBK") as f:
    while True:
        line = f.readline()
        if not line:
            break
        else:
            print(line,end=' ')

高淇
 高老三
 高老四
 

In [46]:
#使用迭代器（每次返回一行）读取文本文件
with open(r'a.txt','r',encoding="GBK") as f:
    for i in f:
        print(i,end=' ')

高淇
 高老三
 高老四
 

In [60]:
#有问题？
#为文本文件每一行的末尾增加行号
with open("a.txt","r",encoding="GBK") as f:
    lines = f.readlines()
    lines = [ line.rstrip()+" #"+str(index+1)+"\n" for index,line in
enumerate(lines)] #推导式生成列表
with open("a.txt","w",encoding="GBK") as f:
    f.writelines(lines)

TypeError: 'str' object is not callable

二进制文件的读取和写入
f = open(r"d:\a.txt", 'wb') #可写的、重写模式的二进制文件对象

f = open(r"d:\a.txt", 'ab') #可写的、追加模式的二进制文件对象

f = open(r"d:\a.txt", 'rb') #可读的二进制文件对象

In [None]:
#读取图片文件，实现文件的拷贝
with open('aa.gif', 'rb') as f:
    with open('aa_copy.gif', 'wb') as w:
        for line in f.readlines():
            w.write(line)
print('图片拷贝完成！')

In [67]:
#tell()返回文件指针的当前位置
with open("a.txt","r",encoding="GBK") as f:
    print('文件名是：{}'.format(f.name))
    print(f.tell())
    
    print('读取的内容是：{}'.format(f.readline()))
    print(f.tell())
    
#     f.seek(0,0)
    print('读取的内容是：{}'.format(f.readline()))
    print(f.tell())

文件名是：a.txt
0
读取的内容是：高淇

6
读取的内容是：高老三

14


In [41]:
#文件任意位置操作
with open(r'a.txt','r') as f:
    print(f.name)
    print(f.tell())
    
    print(f.readline())
    print(f.tell())
    
    print(f.readline())
    print(f.seek(0,0))
    print(f.tell())
    print(f.readline())

a.txt
0
高淇

6
高老三

0
0
高淇



序列化我们使用：

pickle.dump(obj, file) obj 就是要被序列化的对象，file 指的是存储的文件

pickle.load(file) 从 file 读取数据，反序列化成对象

In [68]:
#将对象序列化到文件中
import pickle
with open(r'b.txt','wb') as f:
    a1 = "高淇"
    a2 = 234
    a3 = [20,30,40]   
    
    pickle.dump(a1,f)
    pickle.dump(a2,f)
    pickle.dump(a3,f)

In [72]:
#将获得的数据反序列化成对象
with open(r'b.txt','rb') as f:
    print(pickle.load(f))
    print(pickle.load(f))
    print(pickle.load(f))

高淇
234
[20, 30, 40]


sv(Comma Separated Values)是逗号分隔符文本格式，常用于数据交换、Excel
文件和数据库数据的导入和导出。

与 Excel 文件不同，CSV 文件中：
值没有类型，所有值都是字符串;
不能指定字体颜色等样式;
不能指定单元格的宽高，不能合并单元格;

In [50]:
#csv.reader 对象于从 csv 文件读取数据
import csv

with open(r'b.csv') as f:
    a_csv = csv.reader(f)#创建 csv 对象,它是一个包含所有数据的列表，每一行为一个元素
    headers = next(a_csv)#获得列表对象，包含标题行的信息
    print(headers)
    
    for line in a_csv:#循环打印各行内容
        print(line)

['姓名', '年龄', '工作', '薪水']
['高淇', '18', '程序员', '50000']
['高老三', '19', '测试工程师', '20000']
['高老五', '20', '人工智能开发', '50000']


In [85]:
##csv.writer 对象写一个 csv 文件
import csv
headers = ["工号","姓名","年龄","地址","月薪"]
rows = [("1001","高淇",18,"西三旗 1 号院","50000"),("1002","高八",19,"西三旗 1 号院","30000")]

#newline,避免写入时候添加空行
with open(r'b.csv','w',newline='') as f:
    k=csv.writer(f)
    k.writerow(headers)
    k.writerows(rows)

os 模块-调用操作系统命令

os 模块：创建、删除目录、获取文件信息等

os.path 模块提供了目录相关（路径判断、路径切分、路径连接、文件夹遍历）的操作

In [87]:
#os.system 可以帮助我们直接调用系统的命令
#记事本之前要关闭
import os
os.system("notepad.exe")

0

In [89]:
os.system("ping www.baidu.com")

0

In [88]:
#运行安装好的微信
os.startfile(r"C:\Program Files (x86)\Tencent\WeChat\WeChat.exe")

In [90]:
print(os.name)

nt


In [91]:
#print(os.stat('a.txt'))
print(os.stat('a.txt'))

os.stat_result(st_mode=33206, st_ino=8162774324785476, st_dev=2799652831, st_nlink=1, st_uid=0, st_gid=0, st_size=22, st_atime=1676964496, st_mtime=1676964496, st_ctime=1676961435)


In [92]:
print(os.stat('a.csv'))

os.stat_result(st_mode=33206, st_ino=1688849860444602, st_dev=2799652831, st_nlink=1, st_uid=0, st_gid=0, st_size=97, st_atime=1676975468, st_mtime=1676975468, st_ctime=1676273658)


使用 walk()递归遍历所有文件和目录

shutil 模块是 python 标准库中提供的，主要用来做文件和文件夹的拷贝、移动、删除等；还可以做
文件和文件夹的压缩、解压缩操作。

os 模块提供了对目录或文件的一般操作。shutil 模块作为补充，提供了移动、复制、压缩、解压等操
作，这些 os 模块都没有提供。

递归的缺陷
简单的程序是递归的优点之一。但是递归调用会占用大量的系统堆栈，内存耗用多，在递
归调用层次多时速度要比循环慢的多，所以在使用递归时要慎重。

In [100]:
#使用递归求 n!
def f(n):
    if n==1:
        return 1
    else:
        return n*f(n-1)
    
for i in range(1,10):
    print(i,'!=',f(i))
    

1 != 1
2 != 2
3 != 6
4 != 24
5 != 120
6 != 720
7 != 5040
8 != 40320
9 != 362880


# 第九章 异常和错误

所谓异常处理，就是指程序在出现问题时依然可以正确的执行剩余的程序，而
不会因为异常而终止程序执行。

try...except 是最常见的异常处理结构

try...except...else 结构增加了“else 块”。如果 try 块中没有抛出异常，则执行 else 块。如果
try 块中抛出异常，则执行 except 块，不执行 else 块。

try...except...finally 结构中，finally 块无论是否发生异常都会被执行；通常用来释放 try 块中
申请的资源。

由于 return 有两种作用：结束方法运行、返回值。我们一般不把 return 放到异常处理结构
中，而是放到方法最

with 上下文管理可以自动管理资源，在 with 代码块执行完毕后自动还原进入该代码之前的
现场或上下文。不论何种原因跳出 with 块，不论是否有异常，总能保证资源正常释放。极
大的简化了工作，在文件操作、网络通信相关的场合非常常用。

In [103]:
#使用 Traceback 模块打印异常信息
import traceback

try:
    print('step1')
    num=3/0
except:
    traceback.print_exc()

step1


Traceback (most recent call last):
  File "C:\Users\Administrator\AppData\Local\Temp\ipykernel_17696\3334319332.py", line 6, in <module>
    num=3/0
ZeroDivisionError: division by zero


In [105]:
#使用 traceback 将异常信息写入日志文件
#coding=utf-8
import traceback
try:
    print("step1")
    num = 1/0
except:
    with open("a.log","a") as f:
        traceback.print_exc(file=f)

step1


In [112]:
#自定义异常类一般都是运行时异常，通常继承 Exception 或其子类即可。命名一般以 Error、Exception 为后缀。
class AgeError(Exception):
    
    def __init__(self,errorInfo):
        Exception.__init__(self)
        self.errorInfo=errorInfo
    def __str__(self):
        return str(self.errorInfo)+'年龄错误'
    
if __name__=='__main__':
    age=int(input())
    if age<1 or age>150:
        raise AgeError(age)
    else:
        print(age)

178


TypeError: 'str' object is not callable

In [114]:
#coding=utf-8
#测试自定义异常类
class AgeError(Exception): #继承 Exception
    def __init__(self,errorInfo):
        Exception.__init__(self)
        self.errorInfo = errorInfo
    def __str__(self):
        return str(self.errorInfo)+",年龄错误！应该在 1-150 之间"
############测试代码################
if __name__=='__main__': #如果为 True，则模块是作为独立文件运行，可以执行测试代码
    age = int(input("输入一个年龄:"))
    if age<1 or age>150:
        raise AgeError(age)
    else:
        print("正常的年龄：",age)

输入一个年龄:178


TypeError: 'str' object is not callable

In [None]:
d