In [20]:
import PyPDF2

class Novopdf:
    '''
    Classe para a criação de novos Pdf's a partir da fusão de vários.
    Iniciação da classe onde são pedidos os parâmetros: Dicionário de PDF's (dic_pdf) a fundir e o nome do futuro PDF (nome_pdf). 
    A ordem de construção do novo pdf é designado: 1º pela ordem dos documentos carregados, 2º pela ordem das páginas dentro dos documentos carregados.
    '''
    def __init__(self, dic_pdf, nome_pdf):
        self.dicionario_docs = dic_pdf        # Dicionário de pdf's a fundir (Chave: nome/localização do pdf, Valor: lista com as páginas pretendidas).
        try:
            assert nome_pdf[-4:] == '.pdf', f'O ficheiro "{nome_pdf}" tem que terminar com a extensão ".pdf"'   # Condição para que o parâmetro nome_pdf tenha a extensão necessária para a criação de um ficheiro PDF.
            self.nome_pdf = nome_pdf          # Nome do PDF a criar.
        except AssertionError:                               # Exceção ao erro para quando o nome do ficheiro de saída é inválido
            print(f'O nome do ficheiro "{nome_pdf}" não é válido. \nCertifique-se que é do tipo string e que termina com a extensão ".pdf"')
        self.output_pdf = PyPDF2.PdfWriter()
        self.intermedio_pdf = PyPDF2.PdfWriter()
        #self.fusao()                          # Chamada do método para fundir os ficheiros desejados automaticamente aquando da istanciação do objeto.
            
    def fusao(self):
        '''
        Método para a fusão das páginas selecionadas.
        Vai iterar cada PDF pesente no dicionário e selecionar as páginas pretendidas a juntar ao documento final.
        '''
        try:    
            for pdf in self.dicionario_docs.keys():               # Iteração dos documentos presentes no dicionário considerando apenas o nome da chave.   
                input_pdf = PyPDF2.PdfReader(pdf)                 # Abertura de cada um dos documentos a extrair as páginas.
                for pagina in self.dicionario_docs[pdf]:          # Iteração pela lista das páginas pedidas.
                    assert pagina >= 0, 'Indices das páginas começam em 0.'   # Condição para que a inserção dos números das páginas comecem em 0.            
                    pagina_pdf = input_pdf.pages[pagina]            
                    self.output_pdf.add_page(pagina_pdf)          # Adição da página do PDF ao documento
        except FileNotFoundError:                                 # Exceção ao erro de quando o ficheiro não é encontrado.
            print(f'O ficheiro "{pdf}" não existe. \nPor favor escreva o nome correto, o caminho completo do ficheiro ou garanta que o ficheiro tem a extensão ".pdf".')
        except (IndexError, AssertionError):                      # Exceção ao erro de quando o indice da página a carregar não existe.
            print(f'A página {pagina} do ficheiro "{pdf}" não existe. \nNOTA: OS indices começam por 0.')
        except AttributeError:                                    # Exceção ao erro quando o tipo de chave do dicionário não é do tipo string.                                  
            print(f'O nome do ficheiro "{pdf}" tem que ser do tipo texto.') 
        except TypeError:                                         # Exceção ao tipo dos indices inseridos, terão que ser do tipo inteiro.
            print(f'Os indices das páginas do ficheiro "{pdf}" a carregar terão que ser do tipo inteiro.')
        return self.output_pdf
            
    def watermark(self, paginas, watermark_doc, wm_page = 0):
        '''
        Método para a inserção da marca de água nas páginas selecionadas.
        Recebe 2 parâmetros obrigatórios: paginas-> Número das páginas a juntar a marca de água, watermark_doc -> Documento a retirar a marca de água
        Parâmetro opcional: wm_page -> Número da página onde está a marca de água (Por defeito a página a considerar é a primeira)
        '''
        try:
            doc_marca_agua = PyPDF2.PdfReader(watermark_doc)
            assert wm_page < len(doc_marca_agua.pages), 'Página não existe'   # Criação de um erro para que a página da marca de água exista no documento.
            marca_agua = doc_marca_agua.pages[wm_page]         # Carregamento da página que contém a marca de água
            total_paginas = len(self.output_pdf.pages)
            assert max(paginas) < total_paginas, 'Index incorreto'            # Criação de um erro para que as páginas pretendidas com marca de água existam no documento a fundir.
            for pagina in range(total_paginas):                                 # Carregamento de todas as páginas pelo seu número de index extraidas.
                if pagina in paginas:                                           # Condição para selecionar as páginas que irão conter a marca de água, através do seu index.
                    self.output_pdf.pages[pagina].merge_page(marca_agua)           # Adição da marca de água ás páginas pretendidas
                    self.intermedio_pdf.add_page(self.output_pdf.pages[pagina])      # Adição das páginas com marca de água ao PDF final.
                else:                                                           
                    self.intermedio_pdf.add_page(self.output_pdf.pages[pagina])      # Adição das páginas sem marca de água ao PDF final.
            self.output_pdf = self.intermedio_pdf                             # Reatribuição de variável para caso exista a fusão de documentos sem marca de água.
            return self.output_pdf
        except FileNotFoundError:                                           # Exceção ao erro de quando o ficheiro não é encontrado.
            print(f'O ficheiro "{watermark_doc}" não existe. \nPor favor escreva o nome correto, o caminho completo do ficheiro ou garanta que o ficheiro tem a extensão ".pdf".')
        except AssertionError as error:                                     # Exceção ao erro de asserção de quando o indice da página a carregar não existe.
            if 'Página não existe' in str(error):
                print(f'A página {wm_page} do ficheiro "{watermark_doc}" não existe. \nRelembrar que os indices começam em 0.')
            elif 'Index incorreto' in str(error):                            # Exceção ao erro de asserção de quando o indice de páginas a carregar não existem no documento a fundir.
                print(f'A página {max(paginas)} a colocar com marca de água não existe no documento. \nA última página do documento a fundir é {total_paginas-1}. \nRelembrar que os indices começam em 0')
        except TypeError:
            print('As páginas a colocar marca de água terão que ser números inteiros dentro de uma lista.')
    
    def criar_pdf(self):
        '''
        Método para criar o PDF final e para fechar os ficheiros
        '''
        self.output_pdf.close()                        # Encerramento do ficheiro intermédio
        self.intermedio_pdf.close()                         # Encerramento do ficheiro final
        self.output_pdf.write(self.nome_pdf)
        print('Ficheiro criado com sucesso.')
        return self.nome_pdf
        

Tratamento dos erros na def fusao() está feita.
Tratamento dos erros na def watermark() está feita.

In [25]:
pdf = Novopdf({'pdf_exemplo.pdf':[0], 'pdf_exemplo2.pdf':[0,1,2], 'pdf_exemplo3.pdf':[2,5]}, 'pdf_final.pdf')
pdf.fusao()
pdf.watermark([0, 2, 4], 'pdf_watermark.pdf')
pdf.criar_pdf()

Ficheiro criado com sucesso.


'pdf_final.pdf'