## 简介

PDF是文档常用格式，使用Python包PyPDF2可以对PDF文档实现批量、迅速的操作，包括提取文字、切分或合并PDF文件、创建annotation、加密和解密等。本文将介绍PyPDF2包的安装及简单使用方式。
PyPDF的GitHub项目官网：py-pdf/PyPDF2: A pure-python PDF library capable of splitting, merging, cropping, and transforming the pages of PDF files

项目地址：https://github.com/py-pdf/pypdf/tree/main

安装：`pip install pypdf2`

In [1]:
from pypdf import PdfReader

## 获取pdf文件的元信息

In [2]:
reader = PdfReader("documents/吉利博越.pdf")
meta = reader.metadata
print(len(reader.pages))

190


In [3]:
meta

{'/Author': 'pz',
 '/CreationDate': 'D:20160309105126Z',
 '/Creator': 'FrameMaker 9.0',
 '/Title': '<4E4C2D33D3C3BBA7CAD6B2E12E626F6F6B>',
 '/Producer': 'iLovePDF',
 '/ModDate': 'D:20210912034746Z'}

In [5]:
# 有些信息可能为空
print(meta.author)
print(meta.creator)
print(meta.producer)
print(meta.subject)
print(meta.title)

pz
FrameMaker 9.0
iLovePDF
None
<4E4C2D33D3C3BBA7CAD6B2E12E626F6F6B>


## 获取文本内容

In [13]:
# 按照从上往下，从左到右提取文本内容
first_page=reader.pages[0]
print(first_page.extract_text(0))

前言
尊敬的用户：
感谢您对吉利汽车的信任，选择了具有优良安全性、舒适性、动力性和经济性的吉利汽
车，我们期待着以优质的产品和服务为您的工作和生活带来乐趣。
首次使用前请阅读并遵守本手册的内容，将帮助您更好的了解、使用吉利汽车，使您的
新车在今后使用中技术状况良好，始终保持最佳性能。您对您的车辆了解的越多，就越能享受
到驾驶该车辆的安全性和趣味性。
若您在使用过程中发现一些问题，请就近与本公司授权的吉利汽车服务站联系，服务站
将在保养、维修方面向您提供优质的服务，请您务必按本手册中的保养规定按期完成保养工作。
本手册提供了所有车型的相关信息，由于车型配置不同，本手册的说明与您所购车辆的
实际配置可能会有差别，请以实际接收的车辆为准。
本手册属于整车的一个组成部分，出售或出借车辆时，请将本手册一并转交给新车主。
本手册中的所有资料均为出版时的最新资料，今后如有改动，将按照相关规定进行补充
通知。
祝您快乐人生，吉利相伴！
浙江吉利控股集团汽车销售有限公司
2016 年1月
版权所有。 如未经浙江吉利控股集团汽车销售有限公司书面同意， 不得转载或复印本手册的任
何内容。
注：本手册封面车型图片仅供参考，具体以实车为准。
www.carobook.com


In [21]:
# 按照布局模式提取文本，从结果来看就是pdf上页面内容看上去是什么，提取出来就是什么
print(first_page.extract_text(extraction_mode="layout"))

                                                                                        前言



尊敬的用户：
           感谢您对吉利汽车的信任，选择了具有优良安全性、舒适性、动力性和经济性的吉利汽
车，我们期待着以优质的产品和服务为您的工作和生活带来乐趣。
           首次使用前请阅读并遵守本手册的内容，将帮助您更好的了解、使用吉利汽车，使您的
新车在今后使用中技术状况良好，始终保持最佳性能。您对您的车辆了解的越多，就越能享受
到驾驶该车辆的安全性和趣味性。
           若您在使用过程中发现一些问题，请就近与本公司授权的吉利汽车服务站联系，服务站
将在保养、维修方面向您提供优质的服务，请您务必按本手册中的保养规定按期完成保养工
作。
           本手册提供了所有车型的相关信息，由于车型配置不同，本手册的说明与您所购车辆的
实际配置可能会有差别，请以实际接收的车辆为准。
           本手册属于整车的一个组成部分，出售或出借车辆时，请将本手册一并转交给新车主。
           本手册中的所有资料均为出版时的最新资料，今后如有改动，将按照相关规定进行补充
通知。
           祝您快乐人生，吉利相伴！




                                                                                                                     浙江吉利控股集团汽车销售有限公司
                                                                                                                                                                       2016       年                             1       月




版权所有。如未经浙江吉利控股集团汽车销售有限公司书面同意，不得转载或复印本手册的任
何内容。










In [20]:
first_page.extract_text(extraction_mode="layout")

'                                                                                        前言\n\n\n\n尊敬的用户：\n           感谢您对吉利汽车的信任，选择了具有优良安全性、舒适性、动力性和经济性的吉利汽\n车，我们期待着以优质的产品和服务为您的工作和生活带来乐趣。\n           首次使用前请阅读并遵守本手册的内容，将帮助您更好的了解、使用吉利汽车，使您的\n新车在今后使用中技术状况良好，始终保持最佳性能。您对您的车辆了解的越多，就越能享受\n到驾驶该车辆的安全性和趣味性。\n           若您在使用过程中发现一些问题，请就近与本公司授权的吉利汽车服务站联系，服务站\n将在保养、维修方面向您提供优质的服务，请您务必按本手册中的保养规定按期完成保养工\n作。\n           本手册提供了所有车型的相关信息，由于车型配置不同，本手册的说明与您所购车辆的\n实际配置可能会有差别，请以实际接收的车辆为准。\n           本手册属于整车的一个组成部分，出售或出借车辆时，请将本手册一并转交给新车主。\n           本手册中的所有资料均为出版时的最新资料，今后如有改动，将按照相关规定进行补充\n通知。\n           祝您快乐人生，吉利相伴！\n\n\n\n\n                                                                                                                     浙江吉利控股集团汽车销售有限公司\n                                                                                                                                                                       2016       年                             1       月\n\n\n\n\n版权所有。如未经浙江吉利控股集团汽车销售有限公司书