## python 操作Word文档

- 安装 python-docx模块
    利用 python-docx 模块，Python 可以创建和修改 Word 文档，它带有.docx 文件
    扩展名。运行 pip install python-docx，可以安装该模块。


    如果你没有 Word 软件，LibreOffice Writer 和 OpenOffice Writer 都是免费的替
    代软件，它们可以在 Windows、OS X 和 Linux 上打开.docx 文件。可以分别从
    https://www.libreoffice.org 和 http://openoffice.org 下载它们。python-docx 的完整文档
    在 https://python-docx.readthedocs.org/。尽管有针对 OS X 平台的 Word 版本，但本
    章将使用 Windows 平台的 Word。
    
    和纯文本相比，.docx 文件有很多结构。这些结构在 python-docx 中用 3 种不同
    的类型来表示。在最高一层，Document 对象表示整个文档。Document 对象包含
    一个 Paragraph 对象的列表，表示文档中的段落（用户在 Word 文档中输入时，如
    果按下回车，新的段落就开始了）。每个 Paragraph 对象都包含一个 Run 对象的列
    表。图 13-4 中的单句段落有 4 个 Run 对象。
    
    Word 文档中的文本不仅仅是字符串。它包含与之相关的字体、大小、颜色和
    其他样式信息。在 Word 中，样式是这些属性的集合。一个 Run 对象是相同样式文
    本的延续。当文本样式发生改变时，就需要一个新的 Run 对象

In [4]:
# 读取word文档
import docx
doc = docx.Document("./Document/text.docx")
len(doc.paragraphs)
full_text = []
for text in doc.paragraphs:
    full_text.append(text.text)
text_str = "\n".join(full_text)
print(text_str)

Word 和其他文字处理软件利用样式，保持类似类型的文本在视觉展现上一致，
并易于修改。例如，也许你希望将内容段落设置为 11 点，Times New Roman，左对
齐，右边不对齐的文本。可以用这些设置创建一种样式，将它赋给所有的文本段落。
然后，如果稍后想改变文档中所有内容段落的展现形式，只要改变这种样式，所有
段落都会自动更新。


### 写入Word文档
- 
    要创建自己的.docx 文件，就调用 docx.Document()，返回一个新的、空白的 Word
    Document 对象。Document 对象的 add_paragraph()方法将一段新文本添加到文档中，
    并返回添加的 Paragraph 对象的引用。在添加完文本之后，向 Document 对象的 save()
    方法传入一个文件名字符串，将 Document 对象保存到文件
    
- 设置标题的对齐方式参考文档  https://www.cnblogs.com/z123zero/archive/2019/04/25/10770097.html

In [22]:
import docx
from docx.oxml.ns import qn
from docx.shared import Inches
from docx.enum.text import WD_ALIGN_PARAGRAPH
doc = docx.Document()
# 设置字体样式
doc.styles['Normal'].font.name = u'宋体'
doc.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')
# 设置标题
title = doc.add_heading("Document Title",0)  # 标题
# 标题居中
title.alignment = WD_ALIGN_PARAGRAPH.CENTER
# 添加文本
doc.add_paragraph("hello,world!\nThis is the second Paragraph!")
# 添加段落
doc.add_paragraph("""Word 和其他文字处理软件利用样式，保持类似类型的文本在视觉展现上一致，
并易于修改。例如，也许你希望将内容段落设置为 11 点，Times New Roman，左对
齐，右边不对齐的文本。可以用这些设置创建一种样式，将它赋给所有的文本段落。
然后，如果稍后想改变文档中所有内容段落的展现形式，只要改变这种样式，所有
段落都会自动更新。""",)
# 保存文档
doc.save("./Document/hello_world.docx")

## word 里面添加图像
- Document 对象有一个 add_picture()方法，让你在文档末尾添加图像。

    第一个参数是一个字符串，表示图像的文件名。可选的 width 和 height 关键字
    参数，将设置该图像在文档中的宽度和高度。如果省略，宽度和高度将采用默认值，
    即该图像的正常尺寸。
    你可能愿意用熟悉的单位来指定图像的高度和宽度，诸如英寸或厘米。所以在指
    定 width 和 height 关键字参数时，可以使用 docx.shared.Inches()和docx.shared.Cm()函数。

In [24]:
import docx
from docx.oxml.ns import qn
from docx.shared import Inches
from docx.enum.text import WD_ALIGN_PARAGRAPH
doc = docx.Document()
# 设置字体样式
doc.styles['Normal'].font.name = u'宋体'
doc.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')
# 设置标题
title = doc.add_heading("Document Title",0)  # 标题
# 标题居中
title.alignment = WD_ALIGN_PARAGRAPH.CENTER
# 添加文本
doc.add_paragraph("hello,world!\nThis is the second Paragraph!")
# 添加段落
doc.add_paragraph("""Word 和其他文字处理软件利用样式，保持类似类型的文本在视觉展现上一致，
并易于修改。例如，也许你希望将内容段落设置为 11 点，Times New Roman，左对
齐，右边不对齐的文本。可以用这些设置创建一种样式，将它赋给所有的文本段落。
然后，如果稍后想改变文档中所有内容段落的展现形式，只要改变这种样式，所有
段落都会自动更新。""",)
# 添加图片
doc.add_picture("./Document/picture.jpg")
# 保存文档
doc.save("./Document/hello_world.docx")

In [None]:
# 设置标题
title_ = document.add_heading(level=0)
# 标题居中
title_.alignment = WD_ALIGN_PARAGRAPH.CENTER
# 添加标题内容
title_run = title_.add_run(title)
# 设置标题字体大小
title_run.font.size = Pt(14)
# 设置标题西文字体
title_run.font.name = 'Times New Roman'
# 设置标题中文字体
title_run.element.rPr.rFonts.set(qn('w:eastAsia'), '微软雅黑')

In [25]:
# 复制Word文档
import docx
doc = docx.Document("./Document/hello_world.docx")
doc.save("./Document/hello_world_copy.docx")

### 用python 复制文件的方法

- 参考文档https://www.cnblogs.com/keeptg/p/10944109.html

In [27]:
# 用python 复制文件的方法
import shutil
source = "./Document/hello_world_copy.docx"
target = "./hello.docx"
try:
    shutil.copy(source,target)
except Exception as e:
    print(e)

In [34]:
1 and 2

2