## Importando o pacote

In [2]:
!pip install python-docx

Collecting python-docx
  Downloading python-docx-0.8.11.tar.gz (5.6 MB)
Building wheels for collected packages: python-docx
  Building wheel for python-docx (setup.py): started
  Building wheel for python-docx (setup.py): finished with status 'done'
  Created wheel for python-docx: filename=python_docx-0.8.11-py3-none-any.whl size=184605 sha256=c34fee55ae7051556489a8ed76a57adb3b00ce6c87ec833c19a369df4e1ac7ba
  Stored in directory: c:\users\lucas\appdata\local\pip\cache\wheels\32\b8\b2\c4c2b95765e615fe139b0b17b5ea7c0e1b6519b0a9ec8fb34d
Successfully built python-docx
Installing collected packages: python-docx
Successfully installed python-docx-0.8.11


In [6]:
from docx import Document

## Criando um novo documento

In [7]:
documento = Document()

## Abrindo um documento existente

In [5]:
arquivo = open('arquivo_existente.docx', 'rb')

documento = Document(arquivo)

arquivo.close()

In [12]:
documento = Document('arquivo_existente.docx')

## Salvando um arquivo

In [43]:
documento.save('arquivo_salvo2.docx')

## Adicionar um cabeçalho (Título)
Podemos adicionar títulos/cabeçalhos (heading) através do método add_heading().  
Tal método aceita dois parâmetros, sendo eles, respectivamente:

- **text:** O texto a ser inserido como cabeçalhos;  
- **level:** O nível de identação do cabeçalho, indo de 0 até 9, tendo como padrão o valor 1.

In [23]:
documento.add_heading('Título do documento',0)

<docx.text.paragraph.Paragraph at 0x23a99027a90>

## Adicionando um parágrafo
Podemos adicionar parágrafos (textos) através do método add_paragraph().  
Tal método aceita dois parâmetros, sendo eles, respectivamente:

- **text:** O texto a ser inserido como parágrafo;  
- **style:** Estilo do texto a ser adicionado:
    - Normal;
    - Citação;
    - Listas.

In [24]:
documento.add_paragraph('Eu sou um exemplo de texto')

<docx.text.paragraph.Paragraph at 0x23a9801c820>

In [26]:
documento.add_paragraph('Item 1', style = 'List Number')
documento.add_paragraph('Item 2', style = 'List Number')
documento.add_paragraph('Item 3', style = 'List Number')
documento.add_paragraph('Item 4', style = 'List Number')

<docx.text.paragraph.Paragraph at 0x23a9803e940>

## Inserir citações

In [27]:
documento.add_paragraph('Minha citação intensa', style = 'Intense Quote')
documento.add_paragraph('Minha citação normal', 'Quote')

<docx.text.paragraph.Paragraph at 0x23a9803e5b0>

## Objeto paragraph
Todo texto que adicionarmos no nosso documento, serão do tipo Paragraph

In [31]:
paragrafo = documento.add_paragraph('Eu sou um parágrafo')
titulo = documento.add_heading('Eu sou um título')

In [30]:
type(paragrafo)

docx.text.paragraph.Paragraph

In [32]:
type(titulo)

docx.text.paragraph.Paragraph

- **text:** O texto do parágrafo
- **style:** É o estilo do parágrafo
- **paragraph_format:** A formatação do parágrafo
- **font:** A fonte atual do parágrafo 
- **runs:** Lista todas as run (parte) desse nosso texto

## Estilizar com negrito e itálico
Eu sou um {o que ele é} (negrito para título e itálico para parágrafo)

**add_run( )** => adiciona uma nova run no texto

In [36]:
titulo = documento.add_heading('Eu sou um ')
titulo.add_run('título').bold=True

paragrafo = documento.add_paragraph('Eu sou um ')
paragrafo.add_run('parágrafo').italic=True

## Objeto Run

In [39]:
titulo = documento.add_heading('Eu sou um super')
run_titulo = titulo.add_run(' título')
run_titulo.bold = True
run_titulo.italic = True

## Estilizando a fonte

1. size: Tamanho
2. color: Cor da fonte
3. name: O nome (ex: arial)

In [41]:
from docx.shared import Pt, RGBColor

In [42]:
paragrafo = documento.add_paragraph()
run = paragrafo.add_run('Eu serei estilizado')
fonte = run.font
fonte.name = 'Corbel'
fonte.size = Pt(18)
fonte.color.rgb = RGBColor(255,0,0)

## Exemplo customizando as fontes

In [50]:
documento2 = Document()

In [51]:
paragrafo = documento2.add_paragraph()
run = paragrafo.add_run('Eu sou a primeira linha do paragráfo\n')
run2 = paragrafo.add_run('E eu sou a segunda!\n')
run3 = paragrafo.add_run('Eu sou a última, mas não menos importante')

fonte1 = run.font
fonte1.name = 'Verdana'
fonte1.size = Pt(8)
fonte1.color.rgb = RGBColor(188,40,20)

fonte2 = run2.font
fonte2.name = 'Arial'
fonte2.size = Pt(14)
fonte2.color.rgb = RGBColor(0,0,0)

fonte3 = run3.font
fonte3.name = 'Times New Roman'
fonte3.size = Pt(12)
fonte3.color.rgb = RGBColor(40,40,255)

In [53]:
documento2.save('testandoFontes3.docx')

## Editando o alinhamento do parágrafo

In [54]:
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT

CENTER;  
DISTRIBUTE;  
JUSTIFY;  
JUSTIFY_HI;  
JUSTIFY_LOW;  
JUSTIFY_MED;  
LEFT;  
RIGHT;  
THAI_JUSTIFY;  

In [56]:
paragrafo = documento2.add_paragraph('Testando alinhamentos\n')
run = paragrafo.add_run('Testando o alinhamento')

paragrafo.paragraph_format.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER

In [57]:
documento2.save('testandoAlinhamento.docx')

## Criando nossos próprios estilos

In [1]:
from docx.enum.style import WD_STYLE_TYPE

In [9]:
estilo = documento.styles.add_style('EstiloEditado', WD_STYLE_TYPE.PARAGRAPH)

### Editando nossos estilos

In [15]:
from docx import Document
from docx.shared import Pt, RGBColor
from docx.enum.style import WD_STYLE_TYPE
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT



estilo = documento.styles.add_style('EstiloEditado', WD_STYLE_TYPE.PARAGRAPH)

fonte = estilo.font
fonte.name = 'Corbel'
fonte.size = Pt(25)
fonte.color.rgb = RGBColor(127,255,127)
fonte.bold = True
fonte.italic = True

estilo.paragraph_format.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER

<docx.text.run.Run at 0x22387e7afa0>

### Aplicando Estilos

In [19]:
documento = Document()

estilo = documento.styles.add_style('EstiloEditado', WD_STYLE_TYPE.PARAGRAPH)

fonte = estilo.font
fonte.name = 'Corbel'
fonte.size = Pt(16)
fonte.color.rgb = RGBColor(127,255,127)
fonte.bold = True
fonte.italic = True

estilo.paragraph_format.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER

paragrafo = documento.add_paragraph()
paragrafo.style = documento.styles['EstiloEditado']
paragrafo.add_run('Eu sou um paragrafo com estilo editado')

documento.save('estilo_proprio2.docx')

## Inserindo imagens

**add_picture()** é o método utilizado para adicionar imagens

1. image_path_or_stream => obrigatório: Local ou Stream da Imagem (obrigatório)
2. width => largura da imagem (opcional)
3. height => altura da imagem (opcional)

**from docx.shared import Inches** => modificar o tamanho da imagem

In [20]:
from docx.shared import Inches

In [21]:
documento.add_picture('manutd.png') # tamanho original da imagem

<docx.shape.InlineShape at 0x22387e8aaf0>

In [23]:
documento.add_picture('manutd.png', width = Inches(2)) # Editamos a largura
documento.save('adicionando imagem.docx')

In [25]:
documento.add_picture('manutd.png', height = Inches(10)) # Editamos a altura
documento.save('adicionando imagem.docx')

In [26]:
documento.add_picture('manutd.png', height = Inches(5), width = Inches(2)) # Editamos a largura e a altura
documento.save('adicionando imagem.docx')

## Inserindo Tabelas

Adicionamos tabelas com o **add_table()**

Linhas, Colunas, Célula => 'Dados' da tabela

1. rows => linhas -> **add_row()**  
    1.1 cells => célula
2. cols => colunas -> **add_column()**


In [28]:
nome_sobrenome_idade = [
    ['Lucas', 'Rosa', 27], # linha 1
    ['Luana', 'Giusto', 33],
    ['Augusto', 'Japa', 24]
]

In [29]:
documento = Document()

tabela = documento.add_table(rows=1, cols=3) # Adiciona apenas uma linha (título) e 3 colunas
celulas_titulo = tabela.rows[0].cells # pegamos as células de uma linha da tabela (0, a do título)

celulas_titulo[0].text = 'Nome'
celulas_titulo[1].text = 'Sobrenome'
celulas_titulo[2].text = 'Idade'

In [30]:
for linha in nome_sobrenome_idade:
    print(linha)

['Lucas', 'Rosa', 27]
['Luana', 'Giusto', 33]
['Augusto', 'Japa', 24]


In [31]:
for nome, sobrenome, idade in nome_sobrenome_idade:
    print(nome)
    print(sobrenome)
    print(idade)

Lucas
Rosa
27
Luana
Giusto
33
Augusto
Japa
24


In [32]:
for nome, sobrenome, idade in nome_sobrenome_idade:
    celulas_nova_linha = tabela.add_row().cells
    celulas_nova_linha[0].text = nome
    celulas_nova_linha[1].text = sobrenome
    celulas_nova_linha[2].text = str(idade)

In [33]:
documento.save('criando tabelas.docx')

## Quebra de página (inserir nova página)

Adicionamos uma nova página usando **add_page_break()**

In [34]:
documento = Document()

documento.add_paragraph('Primeira página')
documento.add_page_break()
documento.add_paragraph('Segunda página')

documento.save('duas páginas.docx')

## Desafio final: Criando um documento completo do ZERO

In [35]:
from docx import Document
from docx.shared import Pt, RGBColor, Inches
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT
from docx.enum.style import WD_STYLE_TYPE

In [36]:
documento = Document()

In [37]:
titulo = documento.add_heading(level=0)
titulo.add_run('Integrando o ')
titulo.add_run('Python ').italic=True
titulo.add_run('com o ')
titulo.add_run('Word').italic=True

In [38]:
documento.add_paragraph('Nós aprendemos:')

documento.add_paragraph('Inserir Títulos', style='List Number')
documento.add_paragraph('Inserir Parágrafos', style='List Number')
documento.add_paragraph('Customizar Textos', style='List Number')
documento.add_paragraph('Criar Estilos', style='List Number')
documento.add_paragraph('Trabalhamos com Imagens', style='List Number')
documento.add_paragraph('Trabalhamos com Tabelas', style='List Number')
documento.add_paragraph('E muito mais', style='List Number')

<docx.text.paragraph.Paragraph at 0x22387e8a4c0>

In [39]:
documento.add_page_break()

<docx.text.paragraph.Paragraph at 0x22387e69700>

In [40]:
titulo = documento.add_heading('Caso você tenha alguma dificuldade, ')
run_titulo = titulo.add_run('lembre-se sempre:')
run_titulo.italic = True
run_titulo.bold = True

In [41]:
documento.add_paragraph('A prática leva a perfeição, com treino e força de vontade, nada te impedirá!','Quote')
documento.add_paragraph('Mas caso tenha alguma dúvida nesse processo, a ByLearn estará sempre aqui :)', 'Intense Quote')

<docx.text.paragraph.Paragraph at 0x22389e8afa0>

In [42]:
documento.add_page_break()

<docx.text.paragraph.Paragraph at 0x2238ae860d0>

In [43]:
paragrafo = documento.add_paragraph('Geralmente usamos o Word para escrever relatórios e muitas vezes é algo padronizado')
run = paragrafo.add_run('\nNesses casos o Python pode te ajudar a automatizar este processo')

fonte = run.font
fonte.name = 'Corbel'
fonte.size = Pt(18)
fonte.color.rgb = RGBColor(0,0,30)

In [44]:
paragrafo = documento.add_paragraph()
run = paragrafo.add_run('Mas e quanto aos relatórios com padrões de formatação (Identidade Visual)?')
paragrafo.paragraph_format.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER

In [45]:
estilo = documento.styles.add_style('EstilinhoDesafio', WD_STYLE_TYPE.PARAGRAPH)
fonte = estilo.font
fonte.name = 'Verdana'
fonte.size = Pt(15)
fonte.color.rgb = RGBColor(0,0,90)
estilo.paragraph_format.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
fonte.bold = True
fonte.italic = True

In [46]:
paragrafo = documento.add_paragraph()
paragrafo.style = documento.styles['EstilinhoDesafio']
paragrafo.add_run('Sempre problemas, podemos tirar o nosso próprio estilo facilmente :)')

<docx.text.run.Run at 0x22389e8aa00>

In [47]:
documento.add_page_break()

<docx.text.paragraph.Paragraph at 0x2238ae86310>

In [48]:
pacote_office = [
    ['Word', 10],
    ['Excel',9],
    ['Power Point',9],
    ['Access',3],
    ['OneNote',3]
]

In [50]:
tabela = documento.add_table(rows=1, cols=2)
titulo_tabela = tabela.rows[0].cells
titulo_tabela[0].text = 'Software do Office'
titulo_tabela[1].text = 'Prioridade de uso'

In [51]:
for nome, prioridade in pacote_office:
    nova_linha = tabela.add_row().cells
    nova_linha[0].text = nome
    nova_linha[1].text = str(prioridade)

In [52]:
documento.add_page_break()

<docx.text.paragraph.Paragraph at 0x22387e696a0>

In [53]:
documento.add_picture('manutd.png')

<docx.shape.InlineShape at 0x22387e8ad60>

In [54]:
documento.save('desafio final.docx')

## Desafio Final - Código Único

In [56]:
# Importando as bibliotecas para serem utilizadas
from docx import Document
from docx.shared import Pt, RGBColor, Inches
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT
from docx.enum.style import WD_STYLE_TYPE

# Criando um novo documento docx
documento = Document()

# Adicionando o título e personalizando partes separadas
titulo = documento.add_heading(level=0)
titulo.add_run('Integrando o ')
titulo.add_run('Python ').italic=True
titulo.add_run('com o ')
titulo.add_run('Word').italic=True

# Adicionando um parágrafo
documento.add_paragraph('Nós aprendemos:')

# Adicionando uma lista de conteúdos aprendidos durante este curso
documento.add_paragraph('Inserir Títulos', style='List Number')
documento.add_paragraph('Inserir Parágrafos', style='List Number')
documento.add_paragraph('Customizar Textos', style='List Number')
documento.add_paragraph('Criar Estilos', style='List Number')
documento.add_paragraph('Trabalhamos com Imagens', style='List Number')
documento.add_paragraph('Trabalhamos com Tabelas', style='List Number')
documento.add_paragraph('E muito mais', style='List Number')

# adicionando uma nova página em branco
documento.add_page_break()

# Adicionando textos como referências
titulo = documento.add_heading('Caso você tenha alguma dificuldade, ')
run_titulo = titulo.add_run('lembre-se sempre:')
run_titulo.italic = True
run_titulo.bold = True

documento.add_paragraph('A prática leva a perfeição, com treino e força de vontade, nada te impedirá!','Quote')
documento.add_paragraph('Mas caso tenha alguma dúvida nesse processo, a ByLearn estará sempre aqui :)', 'Intense Quote')

# adicionando uma nova página em branco
documento.add_page_break()

# adicionando texto personalizado
paragrafo = documento.add_paragraph('Geralmente usamos o Word para escrever relatórios e muitas vezes é algo padronizado')
run = paragrafo.add_run('\nNesses casos o Python pode te ajudar a automatizar este processo')

# setando a personalização do texto
fonte = run.font
fonte.name = 'Corbel'
fonte.size = Pt(18)
fonte.color.rgb = RGBColor(0,0,30)

# adicionando o título do texto personalizado
paragrafo = documento.add_paragraph()
run = paragrafo.add_run('Mas e quanto aos relatórios com padrões de formatação (Identidade Visual)?')
paragrafo.paragraph_format.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER

# adicionando o texto personalizado
estilo = documento.styles.add_style('EstilinhoDesafio', WD_STYLE_TYPE.PARAGRAPH)
fonte = estilo.font
fonte.name = 'Verdana'
fonte.size = Pt(15)
fonte.color.rgb = RGBColor(0,0,90)
estilo.paragraph_format.alignment = WD_PARAGRAPH_ALIGNMENT.JUSTIFY
fonte.bold = True
fonte.italic = True

paragrafo = documento.add_paragraph()
paragrafo.style = documento.styles['EstilinhoDesafio']
paragrafo.add_run('Sempre problemas, podemos criar o nosso próprio estilo facilmente :)')

# adicionando uma nova página em branco
documento.add_page_break()

# adicionando uma lista para ser adicionada em uma tabela
pacote_office = [
    ['Word', 10],
    ['Excel',9],
    ['Power Point',9],
    ['Access',3],
    ['OneNote',3]
]

# adicionando a primeira linha da tabela
tabela = documento.add_table(rows=1, cols=2)
titulo_tabela = tabela.rows[0].cells
titulo_tabela[0].text = 'Software do Office'
titulo_tabela[1].text = 'Prioridade de uso'

# adicionando os dados na tabela através de uma lista
for nome, prioridade in pacote_office:
    nova_linha = tabela.add_row().cells
    nova_linha[0].text = nome
    nova_linha[1].text = str(prioridade)

# adicionando uma nova página em branco
documento.add_page_break()

# adicionando uma imagem
documento.add_picture('manutd.png', width = Inches(3))

# salvando o arquivo
documento.save('desafio final.docx')

In [57]:
dir(docx)

['Document',
 'ImagePart',
 'RT',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__path__',
 '__spec__',
 '__version__',
 'api',
 'blkcntnr',
 'compat',
 'dml',
 'document',
 'enum',
 'exceptions',
 'image',
 'opc',
 'oxml',
 'package',
 'parts',
 'section',
 'settings',
 'shape',
 'shared',
 'styles',
 'table',
 'text']

# Trabalhando com arquivos existentes
## Ler um arquivo

In [58]:
from docx import Document
documento = Document('desafio final.docx')

## Lendo os parágrafos

In [59]:
for paragrafo in documento.paragraphs:
    print(paragrafo.text)

Integrando o Python com o Word
Nós aprendemos:
Inserir Títulos
Inserir Parágrafos
Customizar Textos
Criar Estilos
Trabalhamos com Imagens
Trabalhamos com Tabelas
E muito mais


Caso você tenha alguma dificuldade, lembre-se sempre:
A prática leva a perfeição, com treino e força de vontade, nada te impedirá!
Mas caso tenha alguma dúvida nesse processo, a ByLearn estará sempre aqui :)


Geralmente usamos o Word para escrever relatórios e muitas vezes é algo padronizado
Nesses casos o Python pode te ajudar a automatizar este processo
Mas e quanto aos relatórios com padrões de formatação (Identidade Visual)?
Sempre problemas, podemos criar o nosso próprio estilo facilmente :)







Podemos também recuperar parágrafos dependendo do estilo dele.

O python-docx salva todos os estilos lidos

In [60]:
for paragrafo in documento.paragraphs:
    if paragrafo.style.font.bold:
        print('\nO parágrafo abaixo está em negrito:')
        print(paragrafo.text)


O parágrafo abaixo está em negrito:
Caso você tenha alguma dificuldade, lembre-se sempre:

O parágrafo abaixo está em negrito:
Mas caso tenha alguma dúvida nesse processo, a ByLearn estará sempre aqui :)

O parágrafo abaixo está em negrito:
Sempre problemas, podemos criar o nosso próprio estilo facilmente :)


### Lendo as tabelas

In [67]:
dados_tabela = []

for tabelas in documento.tables:
    for i, linha in enumerate(tabelas.rows):
        texto = (cell.text for cell in linha.cells)
        
        if i == 0:
            chaves = tuple(texto)
            continue
            
        linha_dict = dict(zip(chaves,texto))
        dados_tabela.append(linha_dict)

In [68]:
print(dados_tabela)

[{'Software do Office': 'Word', 'Prioridade de uso': '10'}, {'Software do Office': 'Excel', 'Prioridade de uso': '9'}, {'Software do Office': 'Power Point', 'Prioridade de uso': '9'}, {'Software do Office': 'Access', 'Prioridade de uso': '3'}, {'Software do Office': 'OneNote', 'Prioridade de uso': '3'}]


In [69]:
print(dados_tabela[0])

{'Software do Office': 'Word', 'Prioridade de uso': '10'}


## Lendo as imagens

In [70]:
for imagem in documento.inline_shapes:
    print('Nome do arquivo:',imagem._inline.graphic.graphicData.pic.nvPicPr.cNvPr.name)
    print('Tamanho (em centímetros):',imagem.height.cm,'x', imagem.width.cm)

Nome do arquivo: manutd.png
Tamanho (em centímetros): 7.62 x 7.62


# Documentação oficial do docx

link: https://python-docx.readthedocs.io/en/latest/