In [None]:
# Anaconda 默认不包含 docx工具包，需要执行以下脚本进行安装
# 如果本地没有安装工具包，请去掉“#”，再执行
# !pip install -i https://mirrors.aliyun.com/pypi/simple/ python-docx

# 1、导入包并创建一个 Word 文档对象

In [None]:
# 从docx 工具包中导入要使用的对象
from docx import Document
# 字号、大小单位：pt(点数或磅)、px(像素)、inch(英寸)、cm(厘米)
from docx.shared import Pt,Inches 
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT # 段落对齐

# Document 不包含文件路径就是在内存中创建 Word 对象
document = Document()

# 2、创建一个简单的表格

In [None]:
# 增加一个表格，有 0 行 2 列
table = document.add_table(rows=0, cols=2)

# data_list 列表中包含4个子列表，就是4行数据（第一行就是字段名分别是“对象”、“说明”）
# 子列表包含2个元素就是2个列 
data_list = [
    ['对象', '说明'],
    ['Document', '表示整个文档'],
    ['Paragraph', '表示段落（每一次回车会产生新段落）'],
    ['Run', '表示相同样式的文本延续']
]

# 遍历 data_list 列表（3行2列）
# name:对象 desc:说明
for name, desc in data_list:
    # 增加一行，并获取单元格列表
    row_cells = table.add_row().cells
    # 写入数据
    row_cells[0].text = name
    row_cells[1].text = desc

save_file = r'.\files\Word表格和图片.docx'
# 保存内存中的document对象到文件
document.save(save_file)

# 3、合并单元格的表格

In [None]:
# 增加一行，并获取单元格列表（准备合并单元格）
m_cells = table.add_row().cells
# 第一列[0]、到第二列[1]单元格合并为一个单元格
m_cell = m_cells[0].merge(m_cells[1])
# 获取单元格的第一个[0]段落对象
m_cell_p = m_cell.paragraphs[0]
# 增加文字块内容
m_cell_p.add_run('Document 对象包含多个Paragraph')

# 保存内存中的document对象到文件
document.save(save_file)

# 4、增加图片

In [None]:
# 增加的分页也是一个段落（开始新的一页）
document.add_page_break()
# 增加图片，指定图片的文件路径，指定宽度
document.add_picture(r'.\images\Word对象结构图.png',width=Inches(4))

# 保存内存中的document对象到文件
document.save(save_file)

# 查看文档结构

In [None]:
# 导入读取docx文档结构函数
from docx_ext import read_docx
read_docx(docx_file)

# 思考题

1、尝试为创建表格的功能封装为一个函数，使得代码更简洁（不考虑合并单元格）。提示：参数为列表中的列表

2、用已学到的知识点完成一个有表格和图片的Word文档

In [None]:
# 思考题第 1 题答案（注意答案不是唯一的，仅仅作为参考）
def create_table(records):
    """
    使用方法：create_table(data_list)
    :param records: 数据列表（列表中的列表）
    :return:
    """
    # 取第一行的列名
    col_names = records[0]
    # 增加一个表格，有 0 行 len(col_names) 列
    new_table = document.add_table(rows=0, cols=len(col_names))

    # 循环遍历 data_list 列表
    for row_index, item in enumerate(records):
        # 增加一行，并获取单元格列表
        new_cells = new_table.add_row().cells
        # 循环遍历列索引
        for col_index, col_name in enumerate(col_names):
            # 写入每列的数据
            new_cells[col_index].text = item[col_index]