# python-pptx 库快速入门

`python-pptx` 是一个用于创建和修改 PowerPoint (.pptx) 文件的 Python 库。它允许用户通过代码动态生成演示文稿，适合自动化报告、演示和其他需要生成 PPT 的场景。

以下是对 `python-pptx` 库的介绍以及如何将其抽象与 PowerPoint 母版中的内容、布局等概念对应起来的说明。

###  `python-pptx` 库简介

- **安装**：

```bash
  pip install python-pptx
```

- **功能**：
  - 创建新的 PowerPoint 文件。
  - 修改现有的 PPTX 文件。
  - 添加文本框、图片、图表、表格等各种元素。
  - 自定义幻灯片的布局和格式。

### `python-pptx` 库抽象与母版中的概念对应

在 `python-pptx` 中，可以将一些抽象概念与 PowerPoint 母版中的内容和布局对应起来：

- **母版（Master Slide）**：
  - 在 `python-pptx` 中，可以通过 `presentation.slide_master` 来访问母版。母版包含了幻灯片的基本格式和样式，可以定义统一的外观。

- **布局（Layouts）**：
  - 使用 `presentation.slide_layouts` 可以访问不同的幻灯片布局，例如标题幻灯片、内容幻灯片等。每种布局都有预定义的占位符，可以用于快速插入内容。

- **内容类型（Content Types）**：
  - 对应于文本框、图片、图表等内容类型，可以使用 `add_textbox()`、`add_picture()`、`add_table()`、`add_chart()` 等方法来添加这些元素。

---

## `python-pptx` 库核心 数据结构与方法

在 `python-pptx` 库中，主要的数据结构和方法帮助用户创建和修改 PowerPoint 演示文稿。以下是对上述代码中使用的数据结构和方法的详细介绍，包括 `Presentation`、`SlideLayout`、`Slide`、`Shape`、`Placeholder` 和 `TextFrame` 等。

### 1. `Presentation` 类

- **概述**：

`Presentation` 是 `python-pptx` 中的核心类，用于表示一个 PowerPoint 演示文稿。

- **构造方法**：

创建一个新的空演示文稿。

```python
presentation = Presentation()
```

如果要打开现有的 PPTX 文件，可以传递文件路径：

```python
presentation = Presentation("existing_file.pptx")
```

保存 PPTX 文件：

```python
presentation.save("example_presentation.pptx")
```

In [1]:
from pptx import Presentation
from pptx.util import Inches

In [2]:
# 创建一个新的 PowerPoint 文件
presentation = Presentation()

# 保存 PPTX 文件
presentation.save("empty_presentation.pptx")

In [3]:
# 打开现有的 PPTX 文件，可以传递文件路径
presentation = Presentation("../outputs/ChatPPT_Demo.pptx")

# 保存刚打开的 PPTX 文件
presentation.save("ChatPPT_Demo.pptx")

### 2. `SlideLayout` 布局

`SlideLayout` 表示一个幻灯片的布局，包含一组预定义的占位符和格式设置，定义了幻灯片的基本结构。

**获取布局**：

`presentation.slide_layouts`：这是一个布局列表，包含了所有可用的幻灯片布局。


**单个布局**:

```python
slide_layout = presentation.slide_layouts[0]  # 标题幻灯片布局
slide_layout = presentation.slide_layouts[1]  # 内容幻灯片
```

In [4]:
template = Presentation("../templates/MasterTemplate.pptx")

In [5]:
template.slide_layouts

<pptx.slide.SlideLayouts at 0x11365b130>

In [6]:
slide_layout = template.slide_layouts[0]
slide_layout

<pptx.slide.SlideLayout at 0x11365b940>

In [7]:
slide_layout.name

'Title Only'

In [8]:
for s in template.slide_layouts:
    print(s.name)

Title Only
Title and Content
Title and Picture 1
Title, Content, and Picture
Title and 2 Column 1
Tilte and Content 1 


In [9]:
slide_layout = template.slide_layouts[-2]

In [10]:
slide_layout.name

'Title and 2 Column 1'

### 3. `Placeholder` 占位符

`Placeholder` 是一个重要的概念，用于指示幻灯片中应该放置的内容类型（如标题、内容、图片等）。

每个布局和页面都有预定义的占位符列表（`placeholders`），可以用来快速添加内容。

![placeholder](../images/placeholder.png)

- **属性**：
  - `name`：占位符的名称（如标题、内容）。

- **示例**：

```python
title = slide.placeholders[0]  # 获取标题占位符
content = slide.placeholders[1]  # 获取内容占位符
```

In [11]:
for p in slide_layout.placeholders:
    print(p.name)

Title 1
Content Placeholder 4
Content Placeholder 4
Footer Placeholder 4
Slide Number Placeholder 5


In [12]:
# LayoutPlaceholder 类型
type(slide_layout.placeholders[0])

pptx.shapes.placeholder.LayoutPlaceholder


### 【深入理解】Placeholder 类的继承关系（UML 类图）

在 UML 类图中，我们通常使用以下符号来表示类之间的关系：

- 正方形表示类名。
- 三个部分的矩形表示类的属性和方法。
- 箭头表示关系，如继承、关联、聚合和组合。

在这个UML类图中：

- **Placeholder** 是一个抽象的基类，包含了所有占位符共有的属性和方法。
- **MasterPlaceholder** 继承自 **Placeholder**，添加了 `name` 属性，并提供了 `add_slide` 方法。
- **LayoutPlaceholder** 继承自 **MasterPlaceholder**，添加了用于插入内容的方法，如 `insert_picture` 和 `insert_table`。
- **PicturePlaceholder** 和 **TablePlaceholder** 都是 **LayoutPlaceholder** 的子类，它们分别添加了用于设置图片和表格的特定方法，如 `set_picture` 和 `set_table`。



```
+-------------------+
|     Placeholder     |
+-------------------+
| - idx            |
| - shape_type     |
+-------------------+
| + method1()      |
| + method2()      |
+-------------------+
          ^
          |
+-------------------+
|     MasterPlaceholder |
+-------------------+
| - name            |
+-------------------+
| + add_slide()    |
+-------------------+
          ^
          |
+-------------------+
|     LayoutPlaceholder |
+-------------------+
| + insert_picture() |
| + insert_table()   |
+-------------------+
          |
          +-------------------+
          |                   |
          |                   |
          v                   v
+-------------------+     +-------------------+
|   PicturePlaceholder |     |    TablePlaceholder |
+-------------------+     +-------------------+
| + set_picture()  |     | + set_table()     |
+-------------------+     +-------------------+
```


请注意，这个类图是简化的，实际的Python-pptx库中的类可能包含更多的属性和方法。此外，UML类图通常包含更多的细节，如可见性（如 `+` 表示公共，`-` 表示私有）和关系类型（如泛化、实现、关联、依赖等）。在这个简化的示例中，只展示了泛化（继承）关系，并且所有的属性和方法都被假设为公共的。

### 4. `Slide` 幻灯片

`Slide` 表示 PowerPoint 演示文稿中的一张幻灯片。

- **属性**：
  - `shapes`：返回该幻灯片中的所有形状，包括文本框、图像、图表等。
  - `slide_layout`：返回该幻灯片的布局对象，指示使用的布局类型。
  
- **方法**：
  - `shapes.add_shape()`：在t 特定幻灯片上添加一个形状（例如，矩形或圆形）。
  
- **示例**：

```python
slide = presentation.slides.add_slide(slide_layout)  # 添加一张幻灯片
```

#### `Shape` 形状

- **概述**：`Shape` 表示幻灯片中的一个形状，可以是文本框、图片、图表、SmartArt、表格等。每个 `Shape` 对象都具有位置、大小和样式属性。

- **属性**：
  - `name`: 形状名称，对应 placeholder。
  - `left`、`top`、`width`、`height`：定义形状的位置和尺寸。
  - `text`：如果是文本框，可以访问或修改其内容。
  
- **方法**：
  - `add_textbox(left, top, width, height)`：用于在幻灯片上添加一个文本框。
  - `add_picture(image_path, left, top, width=None, height=None)`：用于添加图片。
  
- **示例**：

  ```python
  textbox = slide.shapes.add_textbox(Inches(1), Inches(1), Inches(5), Inches(2))  # 添加文本框
  ```

In [13]:
presentation = Presentation("../outputs/ChatPPT Demo.pptx")

In [14]:
slide = presentation.slides[0]

In [15]:
slide.shapes[0].text

'ChatPPT Demo'

In [16]:
# 打印每页形状名称
for idx, slide in enumerate(presentation.slides):
    print(f"slide id:{idx}")
    for shape in slide.shapes:
        print(f"shape name:{shape.name}")

slide id:0
shape name:Title 1
slide id:1
shape name:Title 1
shape name:Content Placeholder 2
slide id:2
shape name:Title 1
shape name:Content Placeholder 2
shape name:Picture Placeholder 3
slide id:3
shape name:Title 1
shape name:Content Placeholder 2
shape name:Picture Placeholder 3


### ChatPPT Demo.pptx 文件

![slides](../images/slides.png)
  

In [17]:
# 打印每页形状 名称和文本，如果是非文本（如 PlaceholderPicture）将会报错
for idx, slide in enumerate(presentation.slides):
    print(f"[slide id]:{idx}")
    for shape in slide.shapes:
        print(f"shape name:{shape.name}")
        print(f"shape text:{shape.text}")
        print("\n")

[slide id]:0
shape name:Title 1
shape text:ChatPPT Demo


[slide id]:1
shape name:Title 1
shape text:2024 业绩概述


shape name:Content Placeholder 2
shape text:
总收入增长15%
市场份额扩大至30%


[slide id]:2
shape name:Title 1
shape text:业绩图表


shape name:Content Placeholder 2
shape text:
OpenAI 利润不断增加


shape name:Picture Placeholder 3


AttributeError: 'PlaceholderPicture' object has no attribute 'text'

### 【深入理解】Presentation 和 SlideMaster 类继承关系的 UML 类图

在这个 UML 类图中：

1. **`Presentation`** 类是顶层对象，它包含多个 `Slides` 对象。
2. **`Slides`** 类是一个幻灯片集合，通过它可以添加或访问单独的 `Slide` 对象。
3. **`Slide`** 类代表单个幻灯片，它包含形状（`Shapes`）和占位符（`SlidePlaceholders`），并且它通过布局（`SlideLayout`）来定义外观。
4. **`SlideMaster`** 类包含多个 `SlideLayouts`，它定义了幻灯片的母版布局。
5. **`SlideLayout`** 类定义了幻灯片的布局结构，其中有占位符和形状。
6. **`Shape`** 类代表幻灯片中的形状或文本框等内容。


```
+------------------------+
|      Presentation      |
+------------------------+
| - slides: Slides       |
| - slide_masters: SlideMasters |
| - slide_layouts: SlideLayouts |
| - core_properties: CoreProperties |
+------------------------+
| + save(file: str)                       |
+------------------------+
           |
           v
+--------------------+
|       Slides       |
+--------------------+
| - slides: Slide[]  |
+--------------------+
| + add_slide(layout: SlideLayout) -> Slide |
| + get(slide_id: int) -> Slide | None      |
+--------------------+
           |
           v
+--------------------+
|       Slide        |
+--------------------+
| - slide_id: int    |
| - shapes: Shapes   |
| - placeholders: SlidePlaceholders |
| - slide_layout: SlideLayout       |
+--------------------+
| + add_shape(shape: Shape)         |
| + add_picture(image: Picture)     |
| + add_table(rows: int, cols: int) |
+--------------------+
           |
           v
+--------------------+
|    SlideMaster     |
+--------------------+
| - slide_layouts: SlideLayouts[]  |
+--------------------+
| + get_by_name(name: str) -> SlideLayout |
| + index(slide_layout: SlideLayout) -> int |
+--------------------+
           |
           v
+--------------------+
|   SlideLayouts     |
+--------------------+
| - layouts: SlideLayout[] |
+--------------------+
| + remove(slide_layout: SlideLayout)      |
+--------------------+
           |
           v
+--------------------+
|   SlideLayout      |
+--------------------+
| - placeholders: SlidePlaceholders[] |
| - shapes: Shapes[]                  |
| - slide_master: SlideMaster          |
+--------------------+
           |
           v
+--------------------+
|      Shape         |
+--------------------+
| - name: str        |
| - fill: FillFormat |
| - line: LineFormat |
+--------------------+
| + add_textbox(left, top, width, height)  |
| + add_picture(image_file: str)           |
+--------------------+
```


In [18]:
# 完整打印 Slides 每一页的所有属性
for s in presentation.slides:
    print(f"Slide ID: {s.slide_id}")
    print(f"  Layout: {s.slide_layout}")
    print(f"  Shapes: {len(s.shapes)} shapes")
    print(f"  Placeholders: {len(s.placeholders)} placeholders")

    print("  Shape Details:")
    for shape in s.shapes:
        print(f"    - Shape Name: {shape.name}, Type: {shape.shape_type}")

    print("  Placeholder Details:")
    for placeholder in s.placeholders:
        print(f"    - Placeholder ID: {placeholder.placeholder_format.idx}, Type: {placeholder.placeholder_format.type}")

    print("\n")  # Adding a new line between slides for better readability

Slide ID: 256
  Layout: <pptx.slide.SlideLayout object at 0x113688e50>
  Shapes: 1 shapes
  Placeholders: 1 placeholders
  Shape Details:
    - Shape Name: Title 1, Type: PLACEHOLDER (14)
  Placeholder Details:
    - Placeholder ID: 0, Type: TITLE (1)


Slide ID: 257
  Layout: <pptx.slide.SlideLayout object at 0x10caf1ed0>
  Shapes: 2 shapes
  Placeholders: 2 placeholders
  Shape Details:
    - Shape Name: Title 1, Type: PLACEHOLDER (14)
    - Shape Name: Content Placeholder 2, Type: PLACEHOLDER (14)
  Placeholder Details:
    - Placeholder ID: 0, Type: TITLE (1)
    - Placeholder ID: 10, Type: OBJECT (7)


Slide ID: 258
  Layout: <pptx.slide.SlideLayout object at 0x113658bb0>
  Shapes: 3 shapes
  Placeholders: 3 placeholders
  Shape Details:
    - Shape Name: Title 1, Type: PLACEHOLDER (14)
    - Shape Name: Content Placeholder 2, Type: PLACEHOLDER (14)
    - Shape Name: Picture Placeholder 3, Type: PLACEHOLDER (14)
  Placeholder Details:
    - Placeholder ID: 0, Type: TITLE (1)
    -

#### 输出说明：
1. **Slide ID**: 每张幻灯片的唯一标识符。
2. **Layout**: 使用的幻灯片布局对象。
3. **Shapes**: 输出该幻灯片中的形状数量，并列出每个形状的详细信息（名称和类型）。
4. **Placeholders**: 输出该幻灯片中的占位符数量，并列出每个占位符的 `ID` 和类型。

---

### 新增一页内容

In [19]:
# 使用 Slide_ID 获取指定页面
last_slide_layout = presentation.slides.get(slide_id=259).slide_layout

# 新增一页幻灯片
new_slide = presentation.slides.add_slide(last_slide_layout)

In [20]:
# 总页数变成了 5
len(presentation.slides)

5

In [21]:
# 修改新增页标题

In [22]:
new_slide.shapes[0].name

'Title 1'

In [23]:
new_slide.shapes[0].text = "测试新增页面标题"

In [24]:
presentation.save("ChatPPT_update.pptx")

## 添加页面内容的方法

### 文本`TextFrame`

- **概述**：`TextFrame` 表示一个文本框，包含文本和相关的格式设置。每个 `TextFrame` 可以包含多段文本。
- **属性**：
  - `text`：获取或设置文本框的文本内容。
  - `paragraphs`：返回文本框中的所有段落，允许对每段进行单独格式化。
- **示例**：

```python
text_frame = textbox.text_frame  # 获取文本框的文本框架
text_frame.text = "这是一段文本"  # 设置文本内容
```

#### **文本框**

在幻灯片上添加一个文本框：`add_textbox(left, top, width, height)`

```python
left = Inches(1)  # 位置
top = Inches(1)
width = Inches(5)
height = Inches(2)
textbox = slide.shapes.add_textbox(left, top, width, height)
text_frame = textbox.text_frame  # 获取文本框内容
text_frame.text = "这是一段文本"
```

#### **段落 `Paragraph`**

- **概述**：`Paragraph` 表示 `TextFrame` 中的单个段落。
- **属性**：
  - `text`：获取或设置段落的文本内容。
  - `font`：获取段落的字体设置，可以进行字体样式、大小和颜色的调整。
- **示例**：

```python
paragraph = text_frame.add_paragraph()  # 添加新段落
paragraph.text = "这是新的段落内容。"  # 设置段落文本
```

#### **字体 `Font`**

- **概述**：`Font` 表示字体样式，允许用户设置文本的字体样式、大小、颜色等。
- **属性**：
  - `name`：设置字体名称。
  - `size`：设置字体大小（使用 `Pt` 单位）。
  - `bold`、`italic`、`underline`：设置字体的粗体、斜体和下划线样式。
- **示例**：

```python
from pptx.util import Pt, RGBColor

run = paragraph.add_run()  # 添加文本运行
run.text = "这是加粗的文本。"
run.font.bold = True  # 设置为粗体
run.font.size = Pt(16)  # 设置字体大小
run.font.color.rgb = RGBColor(255, 0, 0)  # 设置字体颜色为红色
```

### 新增文本（整合以上方法）

In [25]:
from pptx.util import Inches, Pt
from pptx.dml.color import RGBColor


# 添加文本内容幻灯片
slide_layout = presentation.slide_layouts[-1]
slide = presentation.slides.add_slide(slide_layout)


# 打印新增页属性
print(f"Slide ID: {slide.slide_id}")
print(f"  Layout: {slide.slide_layout}")
print(f"  Shapes: {len(slide.shapes)} shapes")
print(f"  Placeholders: {len(slide.placeholders)} placeholders")

print("  Shape Details:")
for shape in slide.shapes:
    print(f"    - Shape Name: {shape.name}, Type: {shape.shape_type}")

print("  Placeholder Details:")
for placeholder in slide.placeholders:
    print(f"    - Placeholder ID: {placeholder.placeholder_format.idx}, Type: {placeholder.placeholder_format.type}")

Slide ID: 261
  Layout: <pptx.slide.SlideLayout object at 0x1138f9ba0>
  Shapes: 2 shapes
  Placeholders: 2 placeholders
  Shape Details:
    - Shape Name: Title 1, Type: PLACEHOLDER (14)
    - Shape Name: Content Placeholder 2, Type: PLACEHOLDER (14)
  Placeholder Details:
    - Placeholder ID: 0, Type: TITLE (1)
    - Placeholder ID: 14, Type: OBJECT (7)


In [26]:
# 填充原有布局中的占位符（标题和文本）
title = slide.shapes.title
title.text = "python-pptx 新增文本内容示例"
content = slide.placeholders[14]
content.text = "填充原有的文本占位符"

In [27]:
# 新增文本框
left = Inches(6)
top = Inches(5)
width = Inches(5)
height = Inches(1)
textbox = slide.shapes.add_textbox(left, top, width, height)
text_frame = textbox.text_frame
text_frame.text = "额外的文本框内容"

# 格式化文本
paragraph = text_frame.add_paragraph()  # 添加新段落
paragraph.text = "这是一个新的段落。"  # 设置段落文本

# 设置字体
run = paragraph.add_run()  # 添加文本运行
run.text = " 这部分是加粗的文本。"  # 设置文本内容
run.font.bold = True  # 设置为粗体
run.font.size = Pt(16)  # 设置字体大小
run.font.color.rgb = RGBColor(255, 0, 0)  # 设置字体颜色为红色

# 保存 PPTX 文件
presentation.save("ChatPPT_append_text.pptx")

### 添加其他格式内容

- **图片**：
  - `add_picture(image_path, left, top, width=None, height=None)`：在幻灯片上添加图片。
    ```python
    slide.shapes.add_picture("image.png", left, top, width, height)
    ```

- **表格**：
  - `add_table(rows, cols, left, top, width, height)`：添加表格。
    ```python
    table = slide.shapes.add_table(rows, cols, left, top, width, height).table
    ```

- **图表**：
  - `add_chart(chart_type, x, y, cx, cy, data)`：添加图表，`data` 是一个用于生成图表的数据源。



#### Homework: 使用 `python-pptx`  自动生成 PowerPoint 文件，内容包括文本、图片、表格和图表