# Word e PDF - Python - Salamance

In [None]:
#!pip install pandas python-docx openpyxl docx2pdf tqdm


In [7]:
import pandas as pd
import docx
import os

# Nome do arquivo Excel e Word
excel_file = "dados.xlsx"
word_file = "documento_com_tabela.docx"

# 1. Carregar os dados do Excel usando pandas
try:
    df = pd.read_excel(excel_file)


    # 2. Criar um novo documento Word (ou carregar um existente)
    doc = docx.Document()
    doc.add_heading('Relatório de Dados do Excel', 0)

    # 3. Adicionar a tabela ao documento Word
    # Define o número de linhas e colunas com base no DataFrame
    # +1 para incluir a linha de cabeçalho
    num_rows = df.shape[0] + 1
    num_cols = df.shape[1]
    table = doc.add_table(rows=num_rows, cols=num_cols)
    table.style = 'Table Grid' # Aplica um estilo básico para visualização

    # 4. Preencher o cabeçalho da tabela com os nomes das colunas do Excel
    for j, column_name in enumerate(df.columns):
        table.cell(0, j).text = str(column_name)

    # 5. Preencher as células da tabela com os dados do DataFrame
    for i in range(df.shape[0]):
        for j in range(df.shape[-1]):
            # Converte o valor para string antes de inserir na célula do Word
            table.cell(i + 1, j).text = str(df.values[i, j])

    # 6. Salvar o documento Word
    doc.save(word_file)

    print(f"Documento '{word_file}' criado com sucesso, contendo a tabela do Excel.")

except Exception as e:
    print(f"Erro: O arquivo '{excel_file}' não foi encontrado.", e)



#! Passos para executar o script:

# 1.  **Prepare o arquivo Excel**: Crie um arquivo `dados.xlsx` com dados.
# 2.  **Salve o script**: Salve o código acima em um arquivo Python (`.py`) no mesmo diretório (ex: `automatiza.py`).
# 3.  **Execute o script**: Abra o terminal ou prompt de comando, navegue até o diretório e execute:
#     ```bash
#     python automatiza.py
#     ```

# Após a execução, um novo arquivo Word chamado `documento_com_tabela.docx` será gerado, contendo os dados do seu arquivo Excel formatados como uma tabela.


Erro: O arquivo 'dados.xlsx' não foi encontrado. [Errno 2] No such file or directory: 'dados.xlsx'


# Relatorio Template - Perdas Duplas + Tabela Excel

In [8]:
import pandas as pd
from docx import Document
from docx.enum.section import WD_SECTION
from docx.shared import Inches
import os
from docx2pdf import convert

def adicionar_pagina_e_tabela(doc_path: str, excel_path: str, output_docx_path: str):
    """
    Abre o documento Word, adiciona uma nova seção/página no final, 
    e insere o cabeçalho e a tabela do Excel.
    """
    doc = Document(doc_path)
    
    # 1. Adiciona uma quebra de seção (força uma nova página)
    # Isso garante que o novo conteúdo comece em uma página do zero.
    nova_secao = doc.add_section(WD_SECTION.NEW_PAGE)
    
    # Você pode ajustar as margens da nova seção se necessário (opcional)
    nova_secao.top_margin = Inches(1)
    nova_secao.bottom_margin = Inches(1)
    nova_secao.left_margin = Inches(1)
    nova_secao.right_margin = Inches(1)

    # 2. Adiciona o cabeçalho
    doc.add_heading('Dados da Tabela do Excel', level=1)

    # 3. Carrega os dados do Excel
    df = pd.read_excel(excel_path)
    
    # 4. Adiciona a tabela ao final do documento (que agora é a nova página)
    rows, cols = df.shape
    table = doc.add_table(rows + 1, cols)
    table.style = 'Table Grid' # Aplica um estilo visual básico

    # Preenche o cabeçalho da tabela
    for j, column_name in enumerate(df.columns):
        table.cell(0, j).text = str(column_name)

    # Preenche os dados
    for i in range(rows):
        for j in range(cols):
            table.cell(i + 1, j).text = str(df.values[i, j])

    # Salva o documento Word modificado
    doc.save(output_docx_path)
    print(f"Documento Word modificado salvo em '{output_docx_path}'.")
    return output_docx_path

def converter_docx_para_pdf(docx_path: str, pdf_path: str):
    """
    Converte o arquivo DOCX final para PDF.
    Requer Microsoft Office instalado.
    """
    try:
        convert(docx_path, pdf_path)
        print(f"Conversão para PDF concluída com sucesso! Arquivo salvo em '{pdf_path}'.")
    except Exception as e:
        print(f"Erro na conversão para PDF. Certifique-se que o Microsoft Office está instalado. Erro: {e}")




# Execução - Relátorio Automate

In [None]:
# --- Execução Principal (Programação Funcional) ---
if __name__ == "__main__":
    # Nomes dos arquivos (certifique-se de que existem)
    template_word_path = r"C:\Users\pedrovictor.veras\OneDrive - Operador Nacional do Sistema Eletrico\Documentos\ESTAGIO_ONS_PVRV_2025\GitHub\Palkia-PDF-extractor\src\BulbassaurQT6-ETL\sistema-ferramentas-RPA-desktop\app\assets\docs\Lista de Contingências Duplas - Copia.docx" 
    excel_data_path = r"C:\Users\pedrovictor.veras\OneDrive - Operador Nacional do Sistema Eletrico\Documentos\ESTAGIO_ONS_PVRV_2025\GitHub\Palkia-PDF-extractor\src\BulbassaurQT6-ETL\sistema-ferramentas-RPA-desktop\app\assets\planilhas_PLC\perdas_duplas_ETL_corrigido.xlsx"
    output_word_path = "documento_final.docx"
    output_pdf_path = "relatorio_PLC_perdas_duplas.pdf"

    # 1. Modificar o documento Word (adicionar nova página e tabela)
    if os.path.exists(template_word_path) and os.path.exists(excel_data_path):
        docx_gerado = adicionar_pagina_e_tabela(
            template_word_path, 
            excel_data_path, 
            output_word_path
        )
        
        # 2. Converter o DOCX final para PDF
        converter_docx_para_pdf(docx_gerado, output_pdf_path)
    else:
        print("Erro: Arquivo de template Word ou Excel não encontrado.")
        print(f"Verifique se '{template_word_path}' e '{excel_data_path}' existem.")


In [None]:
import pandas as pd
from docx import Document
from docx.enum.section import WD_SECTION
from docx.shared import Inches
import os
from docx2pdf import convert

def adicionar_pagina_e_tabela(doc_path: str, excel_path: str, output_docx_path: str):
    """
    Abre o documento Word, adiciona uma nova seção/página no final, 
    e insere o cabeçalho e a tabela do Excel.
    """
    print(f"Abrindo documento Word template: {doc_path}")
    try:
        doc = Document(doc_path)
    except Exception as e:
        print(f"ERRO ao abrir o documento Word. Verifique o caminho e as permissões. Detalhes: {e}")
        raise

    # 1. Adiciona uma quebra de seção (força uma nova página no final do documento)
    nova_secao = doc.add_section(WD_SECTION.NEW_PAGE)
    
    # Você pode ajustar as margens da nova seção se necessário (opcional)
    nova_secao.top_margin = Inches(1)
    nova_secao.bottom_margin = Inches(1)
    nova_secao.left_margin = Inches(1)
    nova_secao.right_margin = Inches(1)

    # 2. Adiciona o cabeçalho na nova página
    doc.add_heading('Relatório de Perdas Duplas (Dados do Excel)', level=1)
    doc.add_paragraph("Abaixo estão os dados extraídos da planilha Excel:")

    # 3. Carrega os dados do Excel
    df = pd.read_excel(excel_path)
    
    # 4. Adiciona a tabela ao final do documento (que agora é a nova página)
    rows, cols = df.shape
    # Adiciona 1 linha para o cabeçalho
    table = doc.add_table(rows + 1, cols)
    table.style = 'Table Grid' # Aplica um estilo visual básico

    # Preenche o cabeçalho da tabela
    for j, column_name in enumerate(df.columns):
        table.cell(0, j).text = str(column_name)

    # Preenche os dados
    for i in range(rows):
        for j in range(cols):
            table.cell(i + 1, j).text = str(df.values[i, j])

    # Salva o documento Word modificado
    doc.save(output_docx_path)
    print(f"Documento Word modificado salvo em '{output_docx_path}'.")
    return output_docx_path

def converter_docx_para_pdf(docx_path: str, pdf_path: str):
    """
    Converte o arquivo DOCX final para PDF.
    REQUER Microsoft Office (Word) instalado na máquina Windows.
    """
    print(f"Iniciando conversão de DOCX para PDF: {docx_path} -> {pdf_path}")
    try:
        # A função convert gerencia a automação do MS Office
        convert(docx_path, pdf_path)
        print(f"Conversão para PDF concluída com sucesso! Arquivo salvo em '{pdf_path}'.")
    except Exception as e:
        print(f"ERRO na conversão para PDF. Certifique-se que o Microsoft Office está instalado e funcionando.")
        print(f"Detalhes do erro: {e}")
        # Re-lança o erro para interromper a execução se a conversão falhar
        raise

# --- Execução Principal ---
if __name__ == "__main__":
    # --- DEFINIÇÃO DOS CAMINHOS EXATOS FORNECIDOS ---
    # Usando r"" para tratar as strings como raw strings e evitar problemas com backslashes
    template_word_path = r"C:\Users\pedrovictor.veras\OneDrive - Operador Nacional do Sistema Eletrico\Documentos\ESTAGIO_ONS_PVRV_2025\GitHub\Palkia-PDF-extractor\src\BulbassaurQT6-ETL\sistema-ferramentas-RPA-desktop\app\assets\docs\Lista de Contingências Duplas - Copia.docx" 
    excel_data_path = r"C:\Users\pedrovictor.veras\OneDrive - Operador Nacional do Sistema Eletrico\Documentos\ESTAGIO_ONS_PVRV_2025\GitHub\Palkia-PDF-extractor\src\BulbassaurQT6-ETL\sistema-ferramentas-RPA-desktop\app\assets\planilhas_PLC\perdas_duplas_ETL_corrigido.xlsx"
    
    # Nomes dos arquivos de saída (salvos no diretório de execução do script)
    output_word_path = "documento_final_gerado.docx"
    output_pdf_path = "relatorio_PLC_perdas_duplas.pdf"

    # Verificação de existência dos arquivos de entrada
    if os.path.exists(template_word_path) and os.path.exists(excel_data_path):
        print("Arquivos de entrada encontrados. Iniciando processamento...")
        try:
            # 1. Modificar o documento Word (adicionar nova página e tabela)
            docx_gerado_path = adicionar_pagina_e_tabela(
                template_word_path, 
                excel_data_path, 
                output_word_path
            )
            
            # 2. Converter o DOCX final para PDF
            converter_docx_para_pdf(docx_gerado_path, output_pdf_path)
            
        except Exception as e:
            print(f"\nO processamento principal falhou. Verifique os erros.")
            print(e)

    else:
        print("\nERRO CRÍTICO: Um ou ambos os arquivos de entrada não foram encontrados.")
        print(f"Status Template Word: {os.path.exists(template_word_path)}")
        print(f"Status Excel Data: {os.path.exists(excel_data_path)}")
        print("Por favor, verifique se os caminhos estão corretos e acessíveis.")



Arquivos de entrada encontrados. Iniciando processamento...
Abrindo documento Word template: C:\Users\pedrovictor.veras\OneDrive - Operador Nacional do Sistema Eletrico\Documentos\ESTAGIO_ONS_PVRV_2025\GitHub\Palkia-PDF-extractor\src\BulbassaurQT6-ETL\sistema-ferramentas-RPA-desktop\app\assets\docs\Lista de Contingências Duplas - Copia.docx
ERRO ao abrir o documento Word. Verifique o caminho e as permissões. Detalhes: Package not found at 'C:\Users\pedrovictor.veras\OneDrive - Operador Nacional do Sistema Eletrico\Documentos\ESTAGIO_ONS_PVRV_2025\GitHub\Palkia-PDF-extractor\src\BulbassaurQT6-ETL\sistema-ferramentas-RPA-desktop\app\assets\docs\Lista de Contingências Duplas - Copia.docx'

O processamento principal falhou. Verifique os erros.
Package not found at 'C:\Users\pedrovictor.veras\OneDrive - Operador Nacional do Sistema Eletrico\Documentos\ESTAGIO_ONS_PVRV_2025\GitHub\Palkia-PDF-extractor\src\BulbassaurQT6-ETL\sistema-ferramentas-RPA-desktop\app\assets\docs\Lista de Contingência