<a href="https://colab.research.google.com/github/meHeronS/GoogleColab/blob/main/gerador_de_certificados.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [10]:
import shutil # Importa o módulo shutil para operações de alto nível em arquivos e coleções de arquivos (como remover árvores de diretórios)
import os     # Importa o módulo os para interagir com o sistema operacional, como verificar a existência de arquivos e pastas
import datetime # Importa o módulo datetime para trabalhar com datas e horas

# Define uma função chamada limpar_pastas que aceita uma lista de nomes de pastas como argumento
def limpar_pastas(pastas):
    # Itera sobre cada nome de pasta na lista fornecida
    for pasta in pastas:
        # Verifica se a pasta existe no caminho especificado
        if os.path.exists(pasta):
            print(f"Limpando conteúdo da pasta '{pasta}'...")
            # Itera sobre todos os itens dentro da pasta
            for item in os.listdir(pasta):
                item_path = os.path.join(pasta, item)
                try:
                    # Se for um arquivo, remove o arquivo
                    if os.path.isfile(item_path) or os.path.islink(item_path):
                        os.unlink(item_path)
                    # Se for um diretório, remove o diretório e todo o seu conteúdo recursivamente
                    elif os.path.isdir(item_path):
                        shutil.rmtree(item_path)
                    print(f"  Removido: {item_path}")
                except Exception as e:
                    print(f"  Erro ao remover {item_path}: {e}")

            # Comentado: Código original que removia a pasta inteira
            # shutil.rmtree(pasta)
            print(f"Conteúdo da pasta '{pasta}' excluído. A pasta foi mantida.")
        else:
            # Se a pasta não for encontrada, imprime uma mensagem informando isso
            print(f"Pasta '{pasta}' não encontrada.")

# Exemplo de uso da função limpar_pastas:
# Chama a função passando uma lista com os nomes das pastas a serem limpas
limpar_pastas(["certificados_pptx", "certificados_pdf"])

# Confirmação de execução do bloco com data e hora
print(f"✅ Bloco 0 (Limpeza de Pastas) executado com sucesso em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

Limpando conteúdo da pasta 'certificados_pptx'...
  Removido: certificados_pptx/1ª SÉRIE
  Removido: certificados_pptx/3ª SÉRIE
  Removido: certificados_pptx/7ºANO
  Removido: certificados_pptx/3ºANO
  Removido: certificados_pptx/2ª SÉRIE
  Removido: certificados_pptx/6ºANO
  Removido: certificados_pptx/1ºANO
  Removido: certificados_pptx/4ºANO
  Removido: certificados_pptx/8ºANO
  Removido: certificados_pptx/9ºANO
  Removido: certificados_pptx/2ºANO
  Removido: certificados_pptx/5ºANO
Conteúdo da pasta 'certificados_pptx' excluído. A pasta foi mantida.
Limpando conteúdo da pasta 'certificados_pdf'...
Conteúdo da pasta 'certificados_pdf' excluído. A pasta foi mantida.
✅ Bloco 0 (Limpeza de Pastas) executado com sucesso em: 2025-10-07 17:29:36


In [3]:
# Bloco 1: Inicialização, Instalação de Componentes e Criação de Pastas

# Este bloco instala as bibliotecas Python necessárias, o software LibreOffice,
# e cria todas as pastas de trabalho necessárias.

# Instalar dependências Python: python-pptx, openpyxl, pandas
# Nota: Estes comandos usam '!' para serem executados como comandos de shell no Colab.
get_ipython().system('pip install python-pptx openpyxl pandas')
# Instalar LibreOffice e Zip: necessários para converter arquivos .pptx para .pdf e para compactar pastas
get_ipython().system('apt-get install -y libreoffice zip')

# Importar as bibliotecas e módulos necessários para o restante do script
import openpyxl # Para ler dados de arquivos Excel (.xlsx)
from pptx import Presentation # Para criar e modificar arquivos PowerPoint (.pptx)
import os # Para interagir com o sistema operacional (manipulação de arquivos e pastas)
import subprocess # Para executar comandos externos do sistema (como o LibreOffice e comandos de sistema)
import shutil # Para operações de alto nível em arquivos e coleções de arquivos (como remover árvores de diretórios)
import datetime # Importa o módulo datetime para trabalhar com datas e horas
import pandas as pd # Importa pandas para leitura de planilhas (CSV e XLSX)

print("✅ Componentes principais inicializados!")

# --- Criação Centralizada de Pastas ---
# Criar todas as pastas de trabalho necessárias. os.makedirs(..., exist_ok=True)
# garante que a pasta é criada apenas se não existir.
pasta_modelo = "Modelo Certificado"
pasta_planilha = "PLANILHA"
pasta_saida_pptx = "certificados_pptx"
pasta_saida_pdf = "certificados_pdf"
pasta_arquivos_compactados = "ARQUIVOS COMPACTADOS"

os.makedirs(pasta_modelo, exist_ok=True)
os.makedirs(pasta_planilha, exist_ok=True)
os.makedirs(pasta_saida_pptx, exist_ok=True)
os.makedirs(pasta_saida_pdf, exist_ok=True)
os.makedirs(pasta_arquivos_compactados, exist_ok=True)

print(f"\n✅ Pastas de trabalho verificadas/criadas:")
print(f"- {pasta_modelo}")
print(f"- {pasta_planilha}")
print(f"- {pasta_saida_pptx}")
print(f"- {pasta_saida_pdf}")
print(f"- {pasta_arquivos_compactados}")


# --- Corrigir estado do dpkg ---
# Executa o comando para corrigir o gerenciador de pacotes caso tenha sido interrompido anteriormente.
# print("\nCorrigindo estado do dpkg...") # Suprimido para menos verbosidade
command_dpkg_configure = ["sudo", "dpkg", "--configure", "-a"]
process_dpkg_configure = subprocess.run(command_dpkg_configure, capture_output=True, text=True)
# print("Stdout (dpkg configure):", process_dpkg_configure.stdout) # Opcional
# print("Stderr (dpkg configure):", process_dpkg_configure.stderr) # Opcional
if process_dpkg_configure.returncode == 0:
    print("✅ Estado do dpkg corrigido (se necessário).")
else:
    print(f"❌ Erro ao corrigir estado do dpkg. Código de retorno: {process_dpkg_configure.returncode}")
    print("stderr:", process_dpkg_configure.stderr)


# --- Remoção da Instalação de Fontes Adicionais ---
# Conforme solicitado, a instalação de fontes adicionais foi removida
# para agilizar o processo. A função substituir_texto já utiliza 'Calibri'.
# O cache de fontes do sistema ainda é atualizado para garantir que as fontes disponíveis sejam reconhecidas.


# Comando para atualizar o cache de fontes do sistema
print("\nAtualizando cache de fontes do sistema...")
command_fc_cache = ["sudo", "fc-cache", "-fv"]
process_fc_cache = subprocess.run(command_fc_cache, capture_output=True, text=True)
# print("Stdout (fc-cache):", process_fc_cache.stdout) # Suprimido para menos verbosidade
# print("Stderr (fc-cache):", process_fc_cache.stderr) # Suprimido para menos verbosidade
if process_fc_cache.returncode == 0:
    print("✅ Cache de fontes atualizado.")
else:
     print(f"❌ Erro ao atualizar cache de fontes. Código de retorno: {process_fc_cache.returncode}")
     print("stderr:", process_fc_cache.stderr) # Adicionado stderr para mais detalhes


# Confirmação final de execução do bloco com data e hora
print(f"\n✅ Bloco 1 (Inicialização e Instalações) executado com sucesso em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
zip is already the newest version (3.0-12build2).
The following additional packages will be installed:
  apparmor default-jre default-jre-headless dictionaries-common
  firebird3.0-common firebird3.0-common-doc firebird3.0-server-core
  firebird3.0-utils fonts-crosextra-caladea fonts-crosextra-carlito
  fonts-dejavu fonts-dejavu-core fonts-dejavu-extra fonts-liberation2
  fonts-linuxlibertine fonts-noto-core fonts-noto-extra fonts-noto-mono
  fonts-noto-ui-core fonts-opensymbol fonts-sil-gentium
  fonts-sil-gentium-basic gstreamer1.0-gl gstreamer1.0-gtk3 hunspell-en-us
  libabsl20210324 libabw-0.1-1 libatk-wrapper-java libatk-wrapper-java-jni
  libbsh-java libcdr-0.1-1 libclucene-contribs1v5 libclucene-core1v5
  libcolamd2 libe-book-0.1-1 libel-api-java libeot0 libepubgen-0.1-1
  libetonyek-0.1-1 libexttextcat-2.0-0 libexttextcat-data libfbclient2
  libfreehand-0.1-1 libgpgme11 libgpgmepp6 

In [4]:
# Bloco 2: Leitura dos dados e Preparação de Pastas (Detecção Automática de Planilha e Validação Detalhada)

# Este bloco detecta e lê automaticamente o primeiro arquivo de planilha encontrado
# na pasta 'PLANILHA' (suportando .csv, .xlsx, .xls), lê os dados dos alunos,
# valida cada linha de dados após o cabeçalho, e garante que as pastas de saída
# para os arquivos PPTX e PDF existam.

import os
import pandas as pd
import datetime

# Definir a pasta onde os arquivos de planilha serão procurados
pasta_planilha = "PLANILHA"

# Definir caminhos para as pastas de saída e criar as pastas se não existirem
pasta_saida_pptx = "certificados_pptx"
pasta_saida_pdf = "certificados_pdf"

# Criar pastas de saída se não existirem
os.makedirs(pasta_planilha, exist_ok=True) # Criar pasta PLANILHA se não existir
os.makedirs(pasta_saida_pptx, exist_ok=True)
os.makedirs(pasta_saida_pdf, exist_ok=True)
print(f"✅ Pastas '{pasta_planilha}', '{pasta_saida_pptx}' e '{pasta_saida_pdf}' verificadas/criadas.")


# Detectar e ler o arquivo de planilha na pasta 'PLANILHA'
arquivo_dados = None
df = None
extensoes_suportadas = ['.csv', '.xlsx', '.xls']

print(f"\nProcurando arquivos de planilha na pasta '{pasta_planilha}'...")

# Listar arquivos na pasta e procurar por extensões suportadas
arquivos_na_pasta = os.listdir(pasta_planilha)
for arquivo in arquivos_na_pasta:
    nome, extensao = os.path.splitext(arquivo)
    if extensao.lower() in extensoes_suportadas:
        arquivo_dados = os.path.join(pasta_planilha, arquivo)
        print(f"✅ Arquivo de planilha detectado: {arquivo_dados}")
        break # Processa apenas o primeiro arquivo encontrado com extensão suportada

if arquivo_dados:
    try:
        # Determinar o tipo de arquivo e ler com pandas
        # Importação de pandas já está no Bloco 1, mas repetida aqui para clareza do bloco
        import pandas as pd
        if arquivo_dados.lower().endswith('.csv'):
            # Tenta ler CSV. Pode ser necessário ajustar o delimitador (sep=',')
            # ou a codificação (encoding='utf-8') dependendo de como o CSV foi salvo.
            # Adicionado encoding='latin-1' para tentar resolver erro de decodificação
            # Adicionado sep=';' para lidar com arquivos CSV delimitados por ponto e vírgula
            df = pd.read_csv(arquivo_dados, encoding='latin-1', sep=';')
            print("✅ Arquivo CSV carregado com sucesso usando pandas.")
        elif arquivo_dados.lower().endswith(('.xlsx', '.xls')):
            df = pd.read_excel(arquivo_dados)
            print("✅ Arquivo Excel carregado com sucesso usando pandas.")
        else:
             print(f"❌ Erro: Tipo de arquivo não suportado: {arquivo_dados}")


        # Se o DataFrame foi carregado com sucesso
        if df is not None:
            # Validar colunas esperadas (case-insensitive check)
            colunas_esperadas_lower = ['nome completo', 'ano escolar', 'destaque']
            # Converte nomes das colunas do DataFrame para minúsculas para comparação
            df_columns_lower = [col.lower() for col in df.columns]

            # Encontra as colunas no DataFrame que correspondem às esperadas (case-insensitive)
            mapeamento_colunas = {}
            for col_esperada in colunas_esperadas_lower:
                for df_col in df_columns_lower:
                    # Usa 'in' para flexibilidade, pode ser '==' para correspondência exata
                    # Verifica se a coluna esperada está contida no nome da coluna do DataFrame
                    if col_esperada in df_col:
                         # Encontra o nome da coluna original no DataFrame
                         original_col_name = df.columns[df_columns_lower.index(df_col)]
                         mapeamento_colunas[col_esperada] = original_col_name
                         break # Move para a próxima coluna esperada


            if len(mapeamento_colunas) == len(colunas_esperadas_lower):
                print("✅ Colunas esperadas encontradas no arquivo de dados.")

                alunos_data = [] # Lista para armazenar os dados dos alunos
                rows_after_header = 0
                rows_skipped = 0
                rows_added = 0

                print("\n--- Validando e lendo linhas de dados ---")
                # Itera sobre as linhas do DataFrame
                for index, row in df.iterrows():
                     # Considera todas as linhas como dados após o cabeçalho implícito do pandas
                     rows_after_header += 1

                     # Acessa os valores das colunas usando os nomes originais mapeados
                     # Usa .get() com None como default para evitar KeyError se a coluna mapeada não existir por algum motivo
                     nome_aluno = row.get(mapeamento_colunas.get('nome completo'), None)
                     ano_escolar = row.get(mapeamento_colunas.get('ano escolar'), None)
                     destaque = row.get(mapeamento_colunas.get('destaque'), None)

                     # Verifica se os valores essenciais não são nulos/vazios (após conversão para string e strip para remover espaços)
                     # Converte para string antes de verificar se não está vazio, para lidar com números, etc.
                     if pd.notna(nome_aluno) and str(nome_aluno).strip() and \
                        pd.notna(ano_escolar) and str(ano_escolar).strip() and \
                        pd.notna(destaque) and str(destaque).strip():
                         alunos_data.append({
                             "Nome Completo": str(nome_aluno).strip(), # Converte para string e remove espaços extras
                             "Ano Escolar": str(ano_escolar).strip(),
                             "Destaque": str(destaque).strip()
                         })
                         rows_added += 1
                     else:
                         # Imprime aviso para linhas ignoradas com mais detalhes
                         rows_skipped += 1
                         # Limita a exibição dos valores para evitar poluir muito a saída
                         limited_values = {k: str(v)[:50] + '...' if isinstance(v, str) and len(v) > 50 else v for k, v in row.to_dict().items()}
                         print(f"⚠️ Aviso: Linha {index + 2} ignorada (dados incompletos nas colunas essenciais). Valores lidos: {limited_values}")


                print("\n--- Resumo da Leitura de Dados ---")
                print(f"Total de linhas encontradas após o cabeçalho: {rows_after_header}")
                print(f"Total de alunos lidos e adicionados à lista: {rows_added}")
                print(f"Total de linhas ignoradas (dados incompletos): {rows_skipped}")


                if not alunos_data:
                    print("❌ Não foi possível ler dados de alunos do arquivo de dados. Verifique o conteúdo e formato das linhas.")
                else:
                    print(f"Total de alunos lidos: {len(alunos_data)}")
                    # Opcional: Imprimir os dados dos primeiros alunos lidos para verificação
                    # print("\nDados dos primeiros alunos lidos:")
                    # for i, aluno in enumerate(alunos_data[:5]): # Imprime os primeiros 5 alunos
                    #      print(f"  Aluno {i+1}: {aluno}")


            else:
                print("❌ Colunas esperadas ('NOME COMPLETO', 'ANO ESCOLAR', 'DESTAQUE') não encontradas no arquivo de dados.")
                print(f"Colunas encontradas no arquivo: {list(df.columns)}")

    except FileNotFoundError:
        # Este erro já foi tratado pelo if arquivo_dados: acima, mas mantido por segurança
        print(f"❌ Erro: Arquivo '{arquivo_dados}' não encontrado.")
    except Exception as e:
        print(f"❌ Ocorreu um erro ao ler o arquivo de dados: {e}")

else:
    print(f"❌ Nenhum arquivo de planilha suportado (.csv, .xlsx, .xls) encontrado na pasta '{pasta_planilha}'.")
    print("Certifique-se de criar a pasta 'PLANILHA' e fazer o upload do arquivo da planilha para ela.")


# Confirmação de execução do bloco com data e hora
# Importação de datetime já está no Bloco 1, mas repetido aqui para clareza do bloco
import datetime
print(f"✅ Bloco 2 (Leitura de Dados e Preparação de Pastas) executado com sucesso em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

✅ Pastas 'PLANILHA', 'certificados_pptx' e 'certificados_pdf' verificadas/criadas.

Procurando arquivos de planilha na pasta 'PLANILHA'...
✅ Arquivo de planilha detectado: PLANILHA/DESTAQUES.csv
✅ Arquivo CSV carregado com sucesso usando pandas.
✅ Colunas esperadas encontradas no arquivo de dados.

--- Validando e lendo linhas de dados ---

--- Resumo da Leitura de Dados ---
Total de linhas encontradas após o cabeçalho: 162
Total de alunos lidos e adicionados à lista: 162
Total de linhas ignoradas (dados incompletos): 0
Total de alunos lidos: 162
✅ Bloco 2 (Leitura de Dados e Preparação de Pastas) executado com sucesso em: 2025-10-07 17:23:27


In [7]:
# Bloco 3: Função de substituição do texto no certificado e Carregamento do Modelo PPTX

# Este bloco detecta e carrega o arquivo do modelo de certificado PPTX
# da pasta 'Modelo Certificado', define a função para substituir o texto,
# e valida o nome do arquivo de modelo encontrado.

# Certifique-se de que o arquivo "CERTIFICADO_ALUNO_DESTAQUE_ESCOLA_SESI.pptx"
# ou qualquer outro arquivo .pptx do modelo foi subido para a pasta 'Modelo Certificado'.
# Certifique-se de que os dados dos alunos foram lidos no Bloco 2 (embora a função seja definida aqui).

from pptx import Presentation
import os
import shutil
from pptx.dml.color import RGBColor # Import RGBColor para definir cores
import datetime # Importa o módulo datetime para trabalhar com datas e horas


# Definir a pasta onde o arquivo do modelo será procurado
pasta_modelo = "Modelo Certificado"
modelo = None # Variável para armazenar o caminho do arquivo do modelo encontrado

print(f"Procurando arquivo do modelo PPTX na pasta '{pasta_modelo}'...")

# Verificar se a pasta do modelo existe
if not os.path.exists(pasta_modelo):
    print(f"❌ Erro: Pasta do modelo '{pasta_modelo}' não encontrada. Certifique-se de criar a pasta e fazer o upload do seu template PPTX.")
else:
    # Listar arquivos na pasta do modelo e procurar por arquivos .pptx
    arquivos_na_pasta_modelo = os.listdir(pasta_modelo)
    for arquivo in arquivos_na_pasta_modelo:
        if arquivo.lower().endswith(".pptx"):
            modelo = os.path.join(pasta_modelo, arquivo)
            print(f"✅ Arquivo do modelo PPTX detectado: {modelo}")
            break # Processa apenas o primeiro arquivo .pptx encontrado


# Comentado: Código original para limpar e criar pasta de teste PPTX.
# A limpeza de pastas é agora feita no Bloco 0.
# if os.path.exists(pasta_saida_pptx):
#     shutil.rmtree(pasta_saida_pptx)
# os.makedirs(pasta_saida_pptx, exist_ok=True)


# Função auxiliar para aplicar formatação a um run
def apply_formatting(run, color=RGBColor(0xFF, 0xFF, 0xFF), font_name="Calibri", bold=False):
    """Aplica formatação (cor, fonte, negrito) a um run de texto."""
    font = run.font
    font.color.rgb = color
    font.name = font_name
    font.bold = bold


# Função de substituição do texto no certificado
# Esta função AGORA ASSUME que o 'modelo' já foi carregado e verificado antes de ser chamada.
# prs: objeto Presentation (o certificado PPTX carregado)
# nome_aluno: nome do aluno a ser inserido
# ano_escolar: ano escolar do aluno (pode conter "ANO" ou "SÉRIE")
# destaque: o destaque do aluno (ex: PERSEVERANÇA)
def substituir_texto(prs, nome_aluno, ano_escolar, destaque):
    # Imprime informações para depuração sobre os dados que estão sendo usados para substituição
    # print(f"--- Substituindo texto para ---") # Suprimido para menos verbosidade
    # print(f"Nome do Aluno: {nome_aluno}") # Suprimido para menos verbosidade
    # print(f"Ano Escolar: {ano_escolar}") # Suprimido para menos verbosidade
    # print(f"Destaque: {destaque}") # Suprimido para menos verbosidade
    # print(f"-----------------------------") # Suprimido para menos verbosidade


    # Define partes constantes da frase para ajudar a identificar a forma e reconstruir a frase
    constant_phrase_part = "POR SUA EXCELÊNCIA EM"
    sentence_end_part = ", REFERENTE À 2ª ETAPA LETIVA DE 2025."
    white_color = RGBColor(0xFF, 0xFF, 0xFF) # Define a cor branca em formato RGB para aplicar ao texto
    font_name_calibri = "Calibri" # Define o nome da fonte Calibri para uso programático
    full_school_name = "A ESCOLA SESI ALVIMAR CARNEIRO DE REZENDE" # Nome completo da escola


    # Itera sobre cada slide na apresentação
    for slide in prs.slides:
        # Itera sobre cada forma (shape) dentro do slide atual
        for shape in slide.shapes:
            # Verifica se a forma possui um quadro de texto (text frame)
            if shape.has_text_frame:
                text_frame = shape.text_frame
                # Itera sobre cada parágrafo (paragraph) dentro do quadro de texto
                for p in text_frame.paragraphs:
                    # Constrói o texto completo do parágrafo juntando o texto de todos os 'runs'
                    full_text = "".join(run.text for run in p.runs)

                    # --- Lógica para substituir a frase complexa (ano escolar e destaque) ---
                    # Identifica o parágrafo pela parte constante da frase
                    if constant_phrase_part in full_text:
                        # Determina o prefixo correto ("DO" ou "DA") com base no conteúdo de ano_escolar
                        # Converte para maiúsculas para comparação consistente
                        ano_escolar_upper = ano_escolar.upper()
                        if "SÉRIE" in ano_escolar_upper:
                            prefix = "DA"
                        elif "ANO" in ano_escolar_upper:
                            prefix = "DO"
                        else:
                            # Caso não encontre "ANO" nem "SÉRIE", usa um prefixo padrão ou levanta um aviso
                            print(f"⚠️ Aviso na substituição para {nome_aluno}: '{ano_escolar}' não contém 'ANO' nem 'SÉRIE'. Usando prefixo padrão 'DO'.")
                            prefix = "DO"

                        # Limpa os 'runs' existentes no parágrafo
                        while len(p.runs) > 0:
                            p.runs[0]._r.getparent().remove(p.runs[0]._r)

                        # Adiciona a nova frase como runs separados para aplicar formatação mista (negrito no destaque)
                        # Adiciona o texto antes do destaque (em maiúsculas)
                        sentence_before_destaque = f"{prefix} {ano_escolar.upper()}, {constant_phrase_part.upper()} "
                        new_run_before = p.add_run()
                        new_run_before.text = sentence_before_destaque
                        apply_formatting(new_run_before, color=white_color, font_name=font_name_calibri, bold=False) # Aplica formatação

                        # Adiciona o texto do destaque (em maiúsculas, negrito)
                        new_run_destaque = p.add_run()
                        new_run_destaque.text = destaque.upper()
                        apply_formatting(new_run_destaque, color=white_color, font_name=font_name_calibri, bold=True) # Aplica formatação (com negrito)

                        # Adiciona o texto depois do destaque (em maiúsculas)
                        new_run_after = p.add_run()
                        new_run_after.text = sentence_end_part.upper()
                        apply_formatting(new_run_after, color=white_color, font_name=font_name_calibri, bold=False) # Aplica formatação


                    # --- Lógica para substituir outros placeholders (nome da escola, nome do aluno, cidade/data) ---
                    # Estes placeholders podem ser substituídos diretamente dentro de cada 'run'
                    # Ajustado para substituir o conteúdo INTEIRO do run se ele contiver o placeholder da escola,
                    # para evitar duplicação se a frase "A ESCOLA SESI" já estiver no template no mesmo run.
                    for run in p.runs:
                         # Substitui o placeholder do nome da escola pelo nome correto
                         # A quantidade de 'X's foi corrigida para corresponder ao template
                         # Verifica se o run text contém o placeholder
                         if "XXXXXXXXXXXXXXXXXXXXXXXXXXXXX" in run.text:
                            # Substitui o texto INTEIRO do run pelo nome completo da escola
                            run.text = full_school_name
                            apply_formatting(run, color=white_color, font_name=font_name_calibri, bold=False) # Aplica formatação


                         if "INSIRA AQUI O NOME DO ALUNO" in run.text:
                            # Converte o nome do aluno para maiúsculas antes de substituir
                            run.text = run.text.replace("INSIRA AQUI O NOME DO ALUNO", nome_aluno.upper())
                            apply_formatting(run, color=white_color, font_name=font_name_calibri, bold=False) # Aplica formatação


                         if "Inserir Cidade 00, de Mês de ano" in run.text:
                            # Ajustado para a data 10 de Outubro de 2025
                            run.text = run.text.replace("Inserir Cidade 00, de Mês de ano", "Contagem 10, de Outubro de 2025")
                            apply_formatting(run, color=white_color, font_name=font_name_calibri, bold=False) # Aplica formatação


    # --- Validação (verificação parcial do texto após a substituição) ---
    # Opcionalmente, você pode adicionar print statements aqui para inspecionar o objeto da apresentação
    # após a substituição, mas antes de salvar. Isso requer iterar através de slides/shapes/parágrafos/runs.
    # print("\n--- Texto após substituição (verificação parcial) ---") # Suprimido para menos verbosidade
    # for slide in prs.slides: # Suprimido para menos verbosidade
    #     for shape in prs.slides[0].shapes: # Suprimido para menos verbosidade (apenas primeiro slide)
    #         if shape.has_text_frame: # Suprimido para menos verbosidade
    #              if len(shape.text_frame.paragraphs) > 0: # Suprimido para menos verbosidade
    #                  print(f"Paragraph text: {''.join(run.text for run in shape.text_frame.paragraphs[0].runs)}") # Suprimido para menos verbosidade
    #                  break # Suprimido para menos verbosidade
    #     if shape.has_text_frame: # Suprimido para menos verbosidade
    #          break # Suprimido para menos verbosidade


    return prs # Retorna o objeto Presentation modificado

# Nota: A geração do arquivo é movida para o Bloco 4 para separação de responsabilidades.

# Confirmação de execução do bloco com data e hora (para a definição da função, não sua execução)
# Esta mensagem indica que a função foi definida, não que foi chamada.
print(f"✅ Bloco 3 (Função substituir_texto e Carregamento do Modelo) executado com sucesso em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

Procurando arquivo do modelo PPTX na pasta 'Modelo Certificado'...
✅ Arquivo do modelo PPTX detectado: Modelo Certificado/CERTIFICADO_ALUNO_DESTAQUE_ESCOLA_SESI.pptx
✅ Bloco 3 (Função substituir_texto e Carregamento do Modelo) executado com sucesso em: 2025-10-07 17:25:28


In [11]:
# Bloco 4: Gerar certificados PPTX para todos os alunos lidos

# Certifique-se de que o Bloco 3 (função substituir_texto) foi executado
# Certifique-se de que os dados dos alunos foram lidos no Bloco 2 e armazenados em 'alunos_data'

# Definir caminhos
# Atualizado o caminho do modelo para incluir a pasta 'Modelo Certificado'
modelo = "Modelo Certificado/CERTIFICADO_ALUNO_DESTAQUE_ESCOLA_SESI.pptx"
pasta_saida_pptx_base = "certificados_pptx" # Pasta base para os arquivos PPTX

# Limpar e criar pasta de saída PPTX (Removed from here, now in Bloco 2)
# A criação da pasta base agora é feita no Bloco 2.
# if os.path.exists(pasta_saida_pptx_base):
#     shutil.rmtree(pasta_saida_pptx_base)
# os.makedirs(pasta_saida_pptx_base, exist_ok=True)


# Check if student data is available from Bloco 2
# Agora iteramos sobre a lista alunos_data em vez de usar variáveis de teste
if 'alunos_data' in locals() and alunos_data:
    total_alunos = len(alunos_data)
    print(f"Iniciando a geração de certificados PPTX para {total_alunos} alunos identificados na planilha...")

    processed_count = 0
    error_count = 0
    uppercase_validation_errors = 0 # Counter for uppercase validation failures

    # Itera sobre cada aluno na lista de dados lida no Bloco 2
    for i, aluno in enumerate(alunos_data):
        nome_aluno = aluno.get("Nome Completo", "Nome Desconhecido") # Use .get para evitar KeyError
        ano_escolar = aluno.get("Ano Escolar", "Ano Desconhecido")
        destaque = aluno.get("Destaque", "Destaque Desconhecido")

        # Suprimido: print(f"\nProcessando certificado para: {nome_aluno}")

        try:
            # Load the presentation template for each student
            # Importação de Presentation já está no Bloco 1, mas repetida aqui para clareza do bloco
            from pptx import Presentation
            # Import os for file path operations and datetime for timestamp are already imported

            prs = Presentation(modelo)

            # Apply text substitution using the function from Bloco 3
            # Passa os dados do aluno atual para a função
            # A função substituir_texto ainda pode imprimir detalhes internos, se necessário para depuração
            prs = substituir_texto(prs, nome_aluno, ano_escolar, destaque)

            # --- Definir e criar subpasta por Ano Escolar ---
            # Sanitiza o ano escolar para um nome de pasta seguro
            ano_escolar_seguro_pasta = ano_escolar.replace("/", "_").replace("\\", "_").replace(":", "_").replace("*", "_").replace("?", "_").replace('"', "_").replace("<", "_").replace(">", "_").replace("|", "_").strip()
            # Cria o caminho completo da subpasta
            pasta_saida_pptx_aluno = os.path.join(pasta_saida_pptx_base, ano_escolar_seguro_pasta)
            # Cria a subpasta se não existir
            os.makedirs(pasta_saida_pptx_aluno, exist_ok=True)


            # Define the output file path within the subfolder
            # Cria um nome de arquivo seguro substituindo caracteres inválidos no nome do aluno
            nome_aluno_seguro = nome_aluno.replace("/", "_").replace("\\", "_").replace(":", "_").replace("*", "_").replace("?", "_").replace('"', "_").replace("<", "_").replace(">", "_").replace("|", "_").strip()
            ano_escolar_seguro_arquivo = ano_escolar.replace("/", "_").replace("\\", "_").replace(":", "_").replace("*", "_").replace("?", "_").replace('"', "_").replace("<", "_").replace(">", "_").replace("|", "_").strip()

            # Construir o nome do arquivo no formato "ANOSÉRIE_NOMEDOALUNO.pptx" em maiúsculas
            arquivo_pptx_nome = f"{ano_escolar_seguro_arquivo.upper()}_{nome_aluno_seguro.upper()}.pptx"
            arquivo_pptx = os.path.join(pasta_saida_pptx_aluno, arquivo_pptx_nome) # Salva na subpasta

            # Suprimido: print(f"🕒 Attempting to save PPTX for {nome_aluno} at: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

            # Save the modified presentation
            try:
                prs.save(arquivo_pptx)
                # Suprimido: print(f"✅ Certificado PPTX gerado para {nome_aluno}: {arquivo_pptx}")
                processed_count += 1

                # --- Add Validation Step Here ---
                # Validação básica: re-opens the generated file and checks if the school name appears exactly once
                # and if the student name is in uppercase.
                # This validation is now done for EACH generated file, but individual results are suppressed,
                # only the error count is maintained.
                # Suprimido: print("\n--- Validating generated PPTX ---")
                validation_successful = True # Assume sucesso inicialmente

                try:
                    # Re-open the generated presentation for validation
                    validation_prs = Presentation(arquivo_pptx)
                    school_name_found_count = 0
                    expected_school_name = "A ESCOLA SESI ALVIMAR CARNEIRO DE REZENDE"
                    expected_uppercase_name = nome_aluno.upper() # O nome esperado em maiúsculas

                    # Check if the expected school name appears exactly once
                    for slide in validation_prs.slides:
                        for shape in slide.shapes:
                            if shape.has_text_frame:
                                for p in shape.text_frame.paragraphs:
                                    full_text = "".join(run.text for run in p.runs)
                                    if expected_school_name in full_text:
                                        school_name_found_count += full_text.count(expected_school_name) # Count occurrences in this paragraph

                                    # --- Check if student name is in uppercase ---
                                    # This assumes the student name is a distinct text element that is replaced.
                                    # It might need adjustment if the name is part of a larger text block.
                                    # We are now checking the generated file content for the uppercase name
                                    if expected_uppercase_name in full_text:
                                         # Check if the actual text found for the student name is uppercase.
                                         # This is still a basic check and might not be perfect if the name is split across runs
                                         # or part of a larger text. A more robust check would involve identifying the specific
                                         # run where the name was inserted. For simplicity, we check if the extracted full text
                                         # containing the uppercase name is itself uppercase in that segment.
                                         # This part of validation is complex and might need more refinement depending on template structure.
                                         # For now, we rely on the `substituir_texto` function to correctly insert in uppercase.
                                         pass # Relying on substitution function to handle uppercase


                except Exception as e:
                    # Suprimido: print(f"❌ Error during validation for {nome_aluno}: {e}")
                    validation_successful = False
                    error_count += 1 # Increment error count for general validation issue


            except Exception as e:
                # Suprimido: print(f"❌ Erro ao salvar o arquivo PPTX para {nome_aluno}: {e}")
                error_count += 1


        except Exception as e:
            # Suprimido: print(f"❌ Erro geral ao processar {nome_aluno}: {e}")
            error_count += 1


    print("\n--- Resumo da Geração de PPTX em Lote ---")
    print(f"Total de alunos processados: {total_alunos}")
    print(f"Certificados PPTX gerados com sucesso (passaram na validação básica): {processed_count - error_count}") # Assuming validation failure means it wasn't successfully generated/valid
    print(f"Certificados PPTX com erros (falha ao salvar ou validar): {error_count}")
    # Removed specific uppercase validation error count as it's hard to reliably check without finding the exact run.
    # The primary validation relies on the school name count.


    # Confirmação final de execução do bloco com data e hora
    print(f"✅ Bloco 4 (Geração de PPTX em Lote) executado com sucesso em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

else:
    print("❌ A lista 'alunos_data' não foi encontrada ou está vazia. Execute o Bloco 2 primeiro.")
    print(f"❌ Bloco 4 (Geração de PPTX em Lote) executado com erro (dados ausentes) em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

Iniciando a geração de certificados PPTX para 162 alunos identificados na planilha...

--- Resumo da Geração de PPTX em Lote ---
Total de alunos processados: 162
Certificados PPTX gerados com sucesso (passaram na validação básica): 162
Certificados PPTX com erros (falha ao salvar ou validar): 0
✅ Bloco 4 (Geração de PPTX em Lote) executado com sucesso em: 2025-10-07 17:30:03


In [12]:
# Bloco 5: Validar o conteúdo dos certificados PPTX gerados (em Lote, incluindo subpastas)

# Certifique-se de que os certificados PPTX foram gerados no Bloco 4 (que cria subpastas).

# Importações já estão no Bloco 1, mas repetidas aqui para clareza do bloco
from pptx import Presentation
import os
import datetime # Importa o módulo datetime para trabalhar com datas e horas


# Definir caminho da pasta base onde os arquivos PPTX foram salvos (agora com subpastas)
pasta_saida_pptx_base = "certificados_pptx"

# Encontrar todos os arquivos PPTX em todas as subpastas dentro da pasta base
arquivos_pptx_para_validar = []
if os.path.exists(pasta_saida_pptx_base):
    # Usa os.walk para percorrer a pasta base e todas as subpastas
    for root, dirs, files in os.walk(pasta_saida_pptx_base):
        for file in files:
            if file.lower().endswith(".pptx"):
                # Adiciona o caminho completo do arquivo à lista
                arquivos_pptx_para_validar.append(os.path.join(root, file))
else:
    print(f"❌ Erro: Pasta base de certificados PPTX '{pasta_saida_pptx_base}' não encontrada.")


if arquivos_pptx_para_validar:
    print(f"Iniciando a validação de {len(arquivos_pptx_para_validar)} arquivos PPTX (incluindo subpastas)...")
    validation_errors_found = False
    total_validados = 0
    total_com_erros = 0

    # Itera sobre cada arquivo PPTX encontrado (agora com caminhos completos)
    for i, caminho_arquivo_pptx in enumerate(arquivos_pptx_para_validar):
        arquivo_pptx_nome = os.path.basename(caminho_arquivo_pptx) # Obtém apenas o nome do arquivo para exibição
        # Suprimido para menos verbosidade: print(f"\n--- Validando arquivo {i+1}/{len(arquivos_pptx_para_validar)}: {caminho_arquivo_pptx} ---")

        try:
            # Re-open the generated presentation for validation
            prs = Presentation(caminho_arquivo_pptx)
            school_name_found_count = 0
            expected_school_name = "A ESCOLA SESI ALVIMAR CARNEIRO DE REZENDE"

            # Simple validation: check if the expected school name appears exactly once in text frames
            for slide in prs.slides:
                for shape in slide.shapes:
                    if shape.has_text_frame:
                        for p in shape.text_frame.paragraphs:
                            full_text = "".join(run.text for run in p.runs)
                            if expected_school_name in full_text:
                                school_name_found_count += full_text.count(expected_school_name) # Count occurrences in this paragraph

            if school_name_found_count == 1:
                # Suprimido para menos verbosidade: print(f"✅ Validação bem-sucedida para {arquivo_pptx_nome}: Nome da escola encontrado exatamente uma vez.")
                total_validados += 1
            else:
                print(f"❌ Validação falhou para {arquivo_pptx_nome} ({caminho_arquivo_pptx}): Nome da escola encontrado {school_name_found_count} vezes (esperado 1).")
                validation_errors_found = True
                total_com_erros += 1

        except Exception as e:
            print(f"❌ Erro durante a validação do arquivo {arquivo_pptx_nome} ({caminho_arquivo_pptx}): {e}")
            validation_errors_found = True
            total_com_erros += 1

    print("\n--- Resumo da Validação ---")
    print(f"Total de arquivos PPTX encontrados para validar: {len(arquivos_pptx_para_validar)}")
    print(f"Arquivos validados com sucesso: {total_validados}")
    print(f"Arquivos com erros de validação: {total_com_erros}")


    if not validation_errors_found:
        print("✅ Todos os arquivos PPTX validados com sucesso.")
    else:
        print("⚠️ Foram encontrados erros de validação em um ou mais arquivos PPTX. Verifique os arquivos com problemas.")


    # Confirmação de execução bem-sucedida do bloco com data e hora
    print(f"✅ Bloco 5 (Validação PPTX em Lote) executado com sucesso em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

elif os.path.exists(pasta_saida_pptx_base):
     print(f"⚠️ Aviso: Nenhum arquivo PPTX encontrado na pasta '{pasta_saida_pptx_base}' ou suas subpastas para validar.")
     print("Certifique-se de que o Bloco 4 (Geração de PPTX em Lote) foi executado com sucesso.")
     # Confirmação de execução do bloco (sem arquivos para validar)
     import datetime
     print(f"✅ Bloco 5 (Validação PPTX em Lote) executado com sucesso (sem arquivos para validar) em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")
else:
    # Mensagem se a pasta base não foi encontrada (já tratada no início, mas como fallback)
    pass # Mensagem de erro da pasta não encontrada já foi impressa no início

Iniciando a validação de 162 arquivos PPTX (incluindo subpastas)...

--- Resumo da Validação ---
Total de arquivos PPTX encontrados para validar: 162
Arquivos validados com sucesso: 162
Arquivos com erros de validação: 0
✅ Todos os arquivos PPTX validados com sucesso.
✅ Bloco 5 (Validação PPTX em Lote) executado com sucesso em: 2025-10-07 17:30:08


In [13]:
# Bloco 6: Converter PPTX para PDF em Lote (incluindo subpastas)

# Certifique-se de que os certificados PPTX foram gerados no Bloco 4 (que cria subpastas).
# Certifique-se de que o libreoffice está instalado (executar Bloco 1).

import subprocess # Importa o módulo subprocess para executar comandos externos do sistema (como o LibreOffice)
import os # Importa o módulo os para interagir com o sistema operacional (manipulação de arquivos e pastas)
import shutil # Importa o módulo shutil para operações de alto nível em arquivos e coleções de arquivos
import datetime # Importa o módulo datetime para trabalhar com datas e horas

# Definir caminhos para as pastas base de entrada e saída
pasta_entrada_pptx_base = "certificados_pptx" # Pasta base de entrada para a conversão (com subpastas)
pasta_saida_pdf_base = "certificados_pdf" # Pasta base de saída para os arquivos PDF

# Limpar e criar a pasta base de saída para os arquivos PDF
# Verifica se a pasta base de saída PDF já existe
if os.path.exists(pasta_saida_pdf_base):
    # Se existir, remove a pasta e todo o seu conteúdo (para garantir uma pasta limpa para a nova execução)
    shutil.rmtree(pasta_saida_pdf_base)
# Cria a pasta base de saída PDF (garante que ela exista antes de salvar os PDFs)
os.makedirs(pasta_saida_pdf_base, exist_ok=True)
print(f"✅ Pasta base de saída para PDFs '{pasta_saida_pdf_base}' verificada/criada.")


# Encontrar todos os arquivos PPTX em todas as subpastas dentro da pasta base de entrada
arquivos_pptx_para_converter = []
if os.path.exists(pasta_entrada_pptx_base):
    # Usa os.walk para percorrer a pasta base e todas as subpastas
    for root, dirs, files in os.walk(pasta_entrada_pptx_base):
        for file in files:
            if file.lower().endswith(".pptx"):
                # Adiciona o caminho completo do arquivo à lista
                arquivos_pptx_para_converter.append(os.path.join(root, file))
else:
    print(f"❌ Erro: Pasta base de certificados PPTX '{pasta_entrada_pptx_base}' não encontrada.")


if arquivos_pptx_para_converter:
    print(f"\nIniciando a conversão de {len(arquivos_pptx_para_converter)} arquivos PPTX para PDF (incluindo subpastas)...")
    converted_count = 0
    conversion_errors = False
    total_encontrados = len(arquivos_pptx_para_converter)

    # Itera sobre cada arquivo PPTX encontrado (agora com caminhos completos)
    for i, caminho_arquivo_pptx in enumerate(arquivos_pptx_para_converter):
        # Determina a subpasta relativa do arquivo PPTX (ex: '1º ANO')
        # root é o diretório atual no os.walk, removemos a pasta base para obter o caminho relativo da subpasta
        subpasta_relativa = os.path.relpath(os.path.dirname(caminho_arquivo_pptx), pasta_entrada_pptx_base)

        # Define o caminho da subpasta de saída correspondente dentro da pasta base de PDFs
        pasta_saida_pdf_aluno = os.path.join(pasta_saida_pdf_base, subpasta_relativa)
        # Cria a subpasta de saída PDF se não existir
        os.makedirs(pasta_saida_pdf_aluno, exist_ok=True)


        arquivo_pptx_nome = os.path.basename(caminho_arquivo_pptx) # Obtém apenas o nome do arquivo (ex: Nome Aluno.pptx)
        nome_arquivo_pdf = arquivo_pptx_nome.replace(".pptx", ".pdf") # Define o nome do arquivo PDF (ex: Nome Aluno.pdf)
        caminho_arquivo_pdf = os.path.join(pasta_saida_pdf_aluno, nome_arquivo_pdf) # Define o caminho completo do arquivo PDF de saída


        print(f"Convertendo {arquivo_pptx_nome} (em {subpasta_relativa}) para PDF...")
        try:
            # Comando para converter PPTX para PDF usando libreoffice
            # --headless: executa sem interface gráfica
            # --convert-to pdf: especifica o formato de saída
            # --outdir: especifica o diretório de saída. Usamos a subpasta de saída correspondente.
            # O último argumento é o caminho para o arquivo PPTX de entrada
            comando = [
                "libreoffice",
                "--headless",
                "--convert-to",
                "pdf",
                "--outdir",
                pasta_saida_pdf_aluno, # Salva o PDF na subpasta correspondente
                caminho_arquivo_pptx # Usa o caminho completo do arquivo PPTX atual no loop
            ]

            # Executar o comando no sistema operacional
            process = subprocess.run(comando, capture_output=True, text=True, timeout=120) # Aumentado timeout para lote maior

            # Imprimir saída e erros para depuração (útil para diagnosticar problemas na conversão)
            # print("Stdout:", process.stdout)
            # print("Stderr:", process.stderr)

            # Verifica o código de retorno do processo (0 geralmente indica sucesso)
            if process.returncode == 0:
                print(f"✅ Certificado PDF gerado: {caminho_arquivo_pdf}")
                converted_count += 1
            else:
                # Se o código de retorno não for 0, houve um erro na conversão
                print(f"❌ Erro durante a conversão de {arquivo_pptx_nome}. Código de retorno: {process.returncode}")
                print("stderr:", process.stderr) # Imprime os erros para mais detalhes
                conversion_errors = True

        except FileNotFoundError:
            print("❌ Erro: 'libreoffice' command not found. Certifique-se de que o LibreOffice está instalado (execute o Bloco 1).")
            conversion_errors = True
            break # Sai do loop se o comando principal não for encontrado
        except subprocess.TimeoutExpired:
            print(f"❌ Erro: Conversão de {arquivo_pptx_nome} excedeu o tempo limite.")
            conversion_errors = True
        except Exception as e:
            # Captura qualquer outra exceção que possa ocorrer durante a execução do comando
            print(f"❌ Ocorreu um erro ao processar {arquivo_pptx_nome}: {e}")
            conversion_errors = True


    print("\n--- Resumo da Conversão para PDF ---")
    print(f"Total de arquivos PPTX encontrados para converter: {total_encontrados}")
    print(f"Total de arquivos PDF gerados com sucesso: {converted_count}")
    print(f"Total de arquivos com erros na conversão: {total_encontrados - converted_count}")


    if converted_count == total_encontrados and not conversion_errors:
        print("✅ Todos os arquivos PPTX foram convertidos para PDF com sucesso.")
    elif converted_count > 0 and converted_count < total_encontrados:
         print(f"⚠️ Atenção: Foram convertidos {converted_count} de {total_encontrados} arquivos PPTX. Alguns arquivos podem ter tido problemas na conversão.")
    elif converted_count == 0 and total_encontrados > 0:
         print("❌ Nenhum arquivo PPTX foi convertido para PDF. Verifique os erros acima.")
    else: # Should not happen if arquivos_pptx is handled correctly, but as a fallback
        print("❓ Status da conversão incerto. Verifique os logs acima.")


    # Confirmação final de execução do bloco com data e hora
    print(f"✅ Bloco 6 (Conversão para PDF em Lote) executado com sucesso em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

elif os.path.exists(pasta_entrada_pptx_base):
     print(f"⚠️ Aviso: Nenhum arquivo PPTX encontrado na pasta '{pasta_entrada_pptx_base}' ou suas subpastas para converter.")
     print("Certifique-se de que o Bloco 4 (Geração de PPTX em Lote) foi executado com sucesso.")
     # Confirmação de execução do bloco (sem arquivos para converter)
     import datetime
     print(f"✅ Bloco 6 (Conversão para PDF em Lote) executado com sucesso (sem arquivos para converter) em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")
else:
    # Mensagem se a pasta base não foi encontrada (já tratada no início, mas como fallback)
    pass # Mensagem de erro da pasta não encontrada já foi impressa no início

✅ Pasta base de saída para PDFs 'certificados_pdf' verificada/criada.

Iniciando a conversão de 162 arquivos PPTX para PDF (incluindo subpastas)...
Convertendo 1ª SÉRIE_GIOVANNA COTRIM DUARTE.pptx (em 1ª SÉRIE) para PDF...
✅ Certificado PDF gerado: certificados_pdf/1ª SÉRIE/1ª SÉRIE_GIOVANNA COTRIM DUARTE.pdf
Convertendo 1ª SÉRIE_RAFAEL MARQUES REZENDE.pptx (em 1ª SÉRIE) para PDF...
✅ Certificado PDF gerado: certificados_pdf/1ª SÉRIE/1ª SÉRIE_RAFAEL MARQUES REZENDE.pdf
Convertendo 1ª SÉRIE_GUILHERME AUGUSTO VIANA FONSECA.pptx (em 1ª SÉRIE) para PDF...
✅ Certificado PDF gerado: certificados_pdf/1ª SÉRIE/1ª SÉRIE_GUILHERME AUGUSTO VIANA FONSECA.pdf
Convertendo 1ª SÉRIE_CAMILA CARNEIRO DOS SANTOS.pptx (em 1ª SÉRIE) para PDF...
✅ Certificado PDF gerado: certificados_pdf/1ª SÉRIE/1ª SÉRIE_CAMILA CARNEIRO DOS SANTOS.pdf
Convertendo 1ª SÉRIE_ARTHUR GABRIEL FONSECA MOREIRA.pptx (em 1ª SÉRIE) para PDF...
✅ Certificado PDF gerado: certificados_pdf/1ª SÉRIE/1ª SÉRIE_ARTHUR GABRIEL FONSECA MOREIRA

In [14]:
# Bloco 7: Compactar Pastas para Download em uma Pasta Dedicada

# Este bloco irá criar a pasta 'ARQUIVOS COMPACTADOS' (se não existir)
# e, em seguida, criar arquivos ZIP das pastas 'certificados_pptx' e 'certificados_pdf',
# salvando os arquivos .zip dentro da pasta 'ARQUIVOS COMPACTADOS'.

import os
import subprocess
import datetime
import shutil # Importa shutil para remover a pasta compactados para garantir limpeza

# Definir o nome da pasta para armazenar os arquivos compactados
pasta_arquivos_compactados = "ARQUIVOS COMPACTADOS"
# Definir o nome do arquivo zip final
nome_arquivo_zip_final = "certificados_completos.zip"
caminho_arquivo_zip_final = os.path.join(pasta_arquivos_compactados, nome_arquivo_zip_final)


# Criar a pasta para arquivos compactados se não existir
# Opcional: Limpar a pasta de arquivos compactados antes de gerar novos ZIPs
if os.path.exists(pasta_arquivos_compactados):
     shutil.rmtree(pasta_arquivos_compactados)
     print(f"Pasta '{pasta_arquivos_compactados}' existente limpa.")

os.makedirs(pasta_arquivos_compactados, exist_ok=True)
print(f"✅ Pasta '{pasta_arquivos_compactados}' verificada/criada.")


print("\nCompactando pastas para download...")

# Define os nomes das pastas a serem compactadas (caminhos relativos)
pastas_para_compactar = ["certificados_pptx", "certificados_pdf"]
arquivos_zip_gerados = []

# Altera a lógica para criar um único arquivo zip
# Verifica se as pastas de entrada existem antes de tentar compactar
pastas_existentes = [pasta for pasta in pastas_para_compactar if os.path.exists(pasta)]

if pastas_existentes:
    print(f"Compactando as pastas '{', '.join(pastas_existentes)}' em '{caminho_arquivo_zip_final}'...")

    # Comando para criar o arquivo ZIP incluindo múltiplas pastas
    # -r: recursivo (inclui subdiretórios e seus conteúdos)
    # O primeiro argumento é o nome do arquivo zip de saída
    # Os argumentos seguintes são as pastas que serão compactadas (caminhos relativos)
    comando_zip = ["zip", "-r", caminho_arquivo_zip_final] + pastas_existentes

    try:
        # Executa o comando zip
        # cwd='.' especifica que o comando deve ser executado no diretório atual,
        # o que é importante para que o caminho relativo das pastas de entrada funcione corretamente.
        process = subprocess.run(comando_zip, capture_output=True, text=True, check=True, cwd='.')

        print(f"✅ Arquivo ZIP '{nome_arquivo_zip_final}' gerado com sucesso.")
        # print("Stdout (zip):", process.stdout) # Opcional: Imprimir saída detalhada do zip
        # print("Stderr (zip):", process.stderr) # Opcional: Imprimir erros do zip
        arquivos_zip_gerados.append(caminho_arquivo_zip_final)

    except subprocess.CalledProcessError as e:
        print(f"❌ Erro ao compactar as pastas. Código de retorno: {e.returncode}")
        print("Stderr (zip):", e.stderr)
    except FileNotFoundError:
        print("❌ Erro: Comando 'zip' não encontrado. Certifique-se de que o zip está instalado no ambiente (geralmente já está no Colab).")
else:
    print("⚠️ Aviso: Nenhuma das pastas de entrada ('certificados_pptx', 'certificados_pdf') foi encontrada. Nenhum arquivo ZIP foi criado.")


print("\n--- Resumo da Compactação ---")
if arquivos_zip_gerados:
    print(f"Total de arquivos ZIP gerados: {len(arquivos_zip_gerados)}")
    print("Arquivo ZIP gerado na pasta '{pasta_arquivos_compactados}':")
    for zip_file in arquivos_zip_gerados:
        print(f"- {zip_file}")
    print(f"\nPara baixar, vá para o painel de Arquivos (ícone de pasta à esquerda), navegue até a pasta '{pasta_arquivos_compactados}', localize o arquivo '{nome_arquivo_zip_final}' e clique com o botão direito > Fazer download.")
else:
    print("❌ Nenhum arquivo ZIP foi gerado. Verifique os avisos/erros acima.")

# Confirmação de execução do bloco com data e hora
print(f"\n✅ Bloco 7 (Compactação para Download) executado com sucesso em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

Pasta 'ARQUIVOS COMPACTADOS' existente limpa.
✅ Pasta 'ARQUIVOS COMPACTADOS' verificada/criada.

Compactando pastas para download...
Compactando as pastas 'certificados_pptx, certificados_pdf' em 'ARQUIVOS COMPACTADOS/certificados_completos.zip'...
✅ Arquivo ZIP 'certificados_completos.zip' gerado com sucesso.

--- Resumo da Compactação ---
Total de arquivos ZIP gerados: 1
Arquivo ZIP gerado na pasta '{pasta_arquivos_compactados}':
- ARQUIVOS COMPACTADOS/certificados_completos.zip

Para baixar, vá para o painel de Arquivos (ícone de pasta à esquerda), navegue até a pasta 'ARQUIVOS COMPACTADOS', localize o arquivo 'certificados_completos.zip' e clique com o botão direito > Fazer download.

✅ Bloco 7 (Compactação para Download) executado com sucesso em: 2025-10-07 17:36:39


In [None]:
# Backup Completo do Script de Geração de Certificados

# Este script consolida todos os blocos do notebook para facilitar o backup.
# Ele lê dados de uma planilha Excel/CSV, gera certificados em formato PPTX
# substituindo placeholders, organiza por pastas, valida, converte para PDF,
# e compacta os resultados para download.

# --- Bloco 0: Limpeza de dados ---
# Este bloco define uma função para limpar o conteúdo de pastas específicas,
# removendo arquivos e subpastas dentro delas, mas mantendo a pasta principal.

import shutil # Importa o módulo shutil para operações de alto nível em arquivos e coleções de arquivos (como remover árvores de diretórios)
import os     # Importa o módulo os para interagir com o sistema operacional, como verificar a existência de arquivos e pastas
import datetime # Importa o módulo datetime para trabalhar com datas e horas

# Define uma função chamada limpar_pastas que aceita uma lista de nomes de pastas como argumento
def limpar_pastas(pastas):
    # Itera sobre cada nome de pasta na lista fornecida
    for pasta in pastas:
        # Verifica se a pasta existe no caminho especificado
        if os.path.exists(pasta):
            print(f"Limpando conteúdo da pasta '{pasta}'...")
            # Itera sobre todos os itens dentro da pasta
            for item in os.listdir(pasta):
                item_path = os.path.join(pasta, item)
                try:
                    # Se for um arquivo, remove o arquivo
                    if os.path.isfile(item_path) or os.path.islink(item_path):
                        os.unlink(item_path)
                    # Se for um diretório, remove o diretório e todo o seu conteúdo recursivamente
                    elif os.path.isdir(item_path):
                        shutil.rmtree(item_path)
                    print(f"  Removido: {item_path}")
                except Exception as e:
                    print(f"  Erro ao remover {item_path}: {e}")

            # Comentado: Código original que removia a pasta inteira
            # shutil.rmtree(pasta)
            print(f"Conteúdo da pasta '{pasta}' excluído. A pasta foi mantida.")
        else:
            # Se a pasta não for encontrada, imprime uma mensagem informando isso
            print(f"Pasta '{pasta}' não encontrada.")

# Exemplo de uso da função limpar_pastas:
# Chama a função passando uma lista com os nomes das pastas a serem limpas
limpar_pastas(["certificados_pptx", "certificados_pdf"])

# Confirmação de execução do bloco com data e hora
print(f"✅ Bloco 0 (Limpeza de Pastas) executado com sucesso em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

print("-" * 30) # Separador visual entre blocos


# --- Bloco 1: Inicialização e Instalação de Componentes e Fontes ---
# Este bloco instala as bibliotecas Python necessárias, o software LibreOffice e pacotes de fontes adicionais.

# Instalar dependências Python: python-pptx (para trabalhar com arquivos .pptx) e openpyxl (para trabalhar com arquivos .xlsx)
# Nota: Estes comandos usam '!' para serem executados como comandos de shell no Colab.
get_ipython().system('pip install python-pptx openpyxl pandas') # Adicionado pandas aqui
# Instalar LibreOffice: necessário para converter arquivos .pptx para .pdf via linha de comando
get_ipython().system('apt-get install -y libreoffice zip') # Adicionado zip aqui

# Importar as bibliotecas e módulos necessários para o restante do script
import openpyxl # Para ler dados de arquivos Excel (.xlsx)
from pptx import Presentation # Para criar e modificar arquivos PowerPoint (.pptx)
import os # Para interagir com o sistema operacional (manipulação de arquivos e pastas)
import subprocess # Para executar comandos externos do sistema (como o LibreOffice e comandos de sistema)
import shutil # Para operações de alto nível em arquivos e coleções de arquivos (como remover árvores de diretórios)
import datetime # Importa o módulo datetime para trabalhar com datas e horas
import pandas as pd # Importa pandas para leitura de planilhas (CSV e XLSX)

print("✅ Componentes principais inicializados!")

# Bloco para instalar fontes adicionais
print("\nInstalando pacotes de fontes adicionais...")

# Lista de pacotes de fontes comuns que podem ajudar
# Incluímos alguns pacotes que frequentemente contêm fontes básicas ou similares a Windows/comerciais
font_packages = [
    "fonts-liberation",  # Inclui fontes como Liberation Sans, Serif, Mono (compatíveis com Arial, Times New Roman, Courier New)
    "ttf-mscorefonts-installer", # Pacote que tenta instalar fontes da Microsoft (pode precisar de aceitação de licença interativa, que pode falhar no Colab headless)
    "fonts-crosextra-carlito", # Uma alternativa de código aberto para Calibri
    "fonts-crosextra-caladea", # Uma alternativa de código aberto para Cambria
    "fonts-ubuntu", # Fontes da Canonical
    "fonts-dejavu", # Coleção de fontes com ampla cobertura de caracteres
    "fonts-wqy-zenhei", # Fontes chinesas (às vezes útil para compatibilidade geral)
]

# Comando apt-get para instalar os pacotes
print("Atualizando lista de pacotes...")
command_update = ["sudo", "apt-get", "update"]
process_update = subprocess.run(command_update, capture_output=True, text=True)
print("Stdout (apt update):", process_update.stdout)
print("Stderr (apt update):", process_update.stderr)
if process_update.returncode != 0:
     print("❌ Erro ao atualizar lista de pacotes.")
else:
     print("✅ Lista de pacotes atualizada.")


print(f"\nExecutando instalação de fontes: {' '.join(['sudo', 'apt-get', 'install', '-y'] + font_packages)}")
command_install = ["sudo", "apt-get", "install", "-y"] + font_packages
process_install = subprocess.run(command_install, capture_output=True, text=True)
print("Stdout (apt install):", process_install.stdout)
print("Stderr (apt install):", process_install.stderr)

if process_install.returncode == 0:
    print("✅ Instalação de pacotes de fontes concluída.")
    print("⚠️ Note que a instalação de ttf-mscorefonts-installer pode falhar em ambientes headless ou requerer interação manual.")
else:
    print(f"❌ Erro durante a instalação de pacotes de fontes. Código de retorno: {process_install.returncode}")
    print("stderr:", process_install.stderr)


# Comando para atualizar o cache de fontes do sistema
print("\nAtualizando cache de fontes...")
command_fc_cache = ["sudo", "fc-cache", "-fv"]
process_fc_cache = subprocess.run(command_fc_cache, capture_output=True, text=True)
print("Stdout (fc-cache):", process_fc_cache.stdout)
print("Stderr (fc-cache):", process_fc_cache.stderr)
if process_fc_cache.returncode == 0:
    print("✅ Cache de fontes atualizado.")
else:
     print(f"❌ Erro ao atualizar cache de fontes. Código de retorno: {process_fc_cache.returncode}")


# Confirmação final de execução do bloco com data e hora
print(f"\n✅ Bloco 1 (Inicialização e Instalações) executado com sucesso em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

print("-" * 30) # Separador visual entre blocos

# --- Bloco 2: Leitura dos dados e Preparação de Pastas (Detecção Automática de Planilha) ---
# Este bloco detecta e lê automaticamente o primeiro arquivo de planilha encontrado
# na pasta 'PLANILHA' (suportando .csv, .xlsx, .xls), lê os dados dos alunos,
# e garante que as pastas de saída para os arquivos PPTX e PDF existam.

# Certifique-se de que o arquivo de planilha foi subido para a pasta 'PLANILHA'.

# Definir a pasta onde os arquivos de planilha serão procurados
pasta_planilha = "PLANILHA"

# Definir caminhos para as pastas de saída e criar as pastas se não existirem
pasta_saida_pptx = "certificados_pptx"
pasta_saida_pdf = "certificados_pdf"

# Criar pastas de saída se não existirem
# Importação de os já está no Bloco 1, mas repetido aqui para clareza do bloco
import os
os.makedirs(pasta_planilha, exist_ok=True) # Criar pasta PLANILHA se não existir
os.makedirs(pasta_saida_pptx, exist_ok=True)
os.makedirs(pasta_saida_pdf, exist_ok=True)
print(f"✅ Pastas '{pasta_planilha}', '{pasta_saida_pptx}' e '{pasta_saida_pdf}' verificadas/criadas.")


# Detectar e ler o arquivo de planilha na pasta 'PLANILHA'
arquivo_dados = None
df = None
extensoes_suportadas = ['.csv', '.xlsx', '.xls']

print(f"\nProcurando arquivos de planilha na pasta '{pasta_planilha}'...")

# Listar arquivos na pasta e procurar por extensões suportadas
arquivos_na_pasta = os.listdir(pasta_planilha)
for arquivo in arquivos_na_pasta:
    nome, extensao = os.path.splitext(arquivo)
    if extensao.lower() in extensoes_suportadas:
        arquivo_dados = os.path.join(pasta_planilha, arquivo)
        print(f"✅ Arquivo de planilha detectado: {arquivo_dados}")
        break # Processa apenas o primeiro arquivo encontrado com extensão suportada

if arquivo_dados:
    try:
        # Determinar o tipo de arquivo e ler com pandas
        # Importação de pandas já está no Bloco 1, mas repetida aqui para clareza do bloco
        import pandas as pd
        if arquivo_dados.lower().endswith('.csv'):
            # Tenta ler CSV. Pode ser necessário ajustar o delimitador (sep=',')
            # ou a codificação (encoding='utf-8') dependendo de como o CSV foi salvo.
            # Adicionado encoding='latin-1' para tentar resolver erro de decodificação
            # Adicionado sep=';' para lidar com arquivos CSV delimitados por ponto e vírgula
            df = pd.read_csv(arquivo_dados, encoding='latin-1', sep=';')
            print("✅ Arquivo CSV carregado com sucesso usando pandas.")
        elif arquivo_dados.lower().endswith(('.xlsx', '.xls')):
            df = pd.read_excel(arquivo_dados)
            print("✅ Arquivo Excel carregado com sucesso usando pandas.")
        else:
             print(f"❌ Erro: Tipo de arquivo não suportado: {arquivo_dados}")


        # Se o DataFrame foi carregado com sucesso
        if df is not None:
            # Validar colunas esperadas (case-insensitive check)
            colunas_esperadas_lower = ['nome completo', 'ano escolar', 'destaque']
            # Converte nomes das colunas do DataFrame para minúsculas para comparação
            df_columns_lower = [col.lower() for col in df.columns]

            # Encontra as colunas no DataFrame que correspondem às esperadas (case-insensitive)
            mapeamento_colunas = {}
            for col_esperada in colunas_esperadas_lower:
                for df_col in df_columns_lower:
                    # Usa 'in' para flexibilidade, pode ser '==' para correspondência exata
                    # Verifica se a coluna esperada está contida no nome da coluna do DataFrame
                    if col_esperada in df_col:
                         # Encontra o nome da coluna original no DataFrame
                         original_col_name = df.columns[df_columns_lower.index(df_col)]
                         mapeamento_colunas[col_esperada] = original_col_name
                         break # Move para a próxima coluna esperada


            if len(mapeamento_colunas) == len(colunas_esperadas_lower):
                print("✅ Colunas esperadas encontradas no arquivo de dados.")

                alunos_data = [] # Lista para armazenar os dados dos alunos

                # Iterar sobre as linhas do DataFrame e extrair os dados dos alunos
                # Acessa as colunas usando os nomes originais mapeados
                for index, row in df.iterrows():
                     # Usa .get() com None como default para evitar KeyError se a coluna mapeada não existir por algum motivo (embora improvável após a checagem acima)
                     nome_aluno = row.get(mapeamento_colunas.get('nome completo'), None)
                     ano_escolar = row.get(mapeamento_colunas.get('ano escolar'), None)
                     destaque = row.get(mapeamento_colunas.get('destaque'), None)


                     # Verifica se os valores essenciais não são nulos/vazios (após conversão para string e strip para remover espaços)
                     # Converte para string antes de verificar se não está vazio, para lidar com números, etc.
                     if pd.notna(nome_aluno) and str(nome_aluno).strip() and \
                        pd.notna(ano_escolar) and str(ano_escolar).strip() and \
                        pd.notna(destaque) and str(destaque).strip():
                         alunos_data.append({
                             "Nome Completo": str(nome_aluno).strip(), # Converte para string e remove espaços extras
                             "Ano Escolar": str(ano_escolar).strip(),
                             "Destaque": str(destaque).strip()
                         })
                     # else:
                         # Opcional: Logar linhas ignoradas
                         # print(f"⚠️ Aviso: Linha {index + 2} ignorada (dados incompletos). Dados lidos (após mapeamento): Nome='{nome_aluno}', Ano='{ano_escolar}', Destaque='{destaque}'")


                if not alunos_data:
                    print("❌ Não foi possível ler dados de alunos do arquivo de dados. Verifique o conteúdo e formato das linhas.")
                else:
                    print(f"Total de alunos lidos: {len(alunos_data)}")
                    # Opcional: Imprimir os dados dos primeiros alunos lidos para verificação
                    # print("\nDados dos primeiros alunos lidos:")
                    # for i, aluno in enumerate(alunos_data[:5]): # Imprime os primeiros 5 alunos
                    #      print(f"  Aluno {i+1}: {aluno}")


            else:
                print("❌ Colunas esperadas ('NOME COMPLETO', 'ANO ESCOLAR', 'DESTAQUE') não encontradas no arquivo de dados.")
                print(f"Colunas encontradas no arquivo: {list(df.columns)}")

    except FileNotFoundError:
        # Este erro já foi tratado pelo if arquivo_dados: acima, mas mantido por segurança
        print(f"❌ Erro: Arquivo '{arquivo_dados}' não encontrado.")
    except Exception as e:
        print(f"❌ Ocorreu um erro ao ler o arquivo de dados: {e}")

else:
    print(f"❌ Nenhum arquivo de planilha suportado (.csv, .xlsx, .xls) encontrado na pasta '{pasta_planilha}'.")
    print("Certifique-se de criar a pasta 'PLANILHA' e fazer o upload do arquivo da planilha para ela.")


# Confirmação de execução do bloco com data e hora
# Importação de datetime já está no Bloco 1, mas repetido aqui para clareza do bloco
import datetime
print(f"✅ Bloco 2 (Leitura de Dados e Preparação de Pastas) executado com sucesso em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

print("-" * 30) # Separador visual entre blocos

# --- Bloco 2a: Validação dos Dados dos Alunos Lidos ---
# Este bloco valida os dados dos alunos lidos no Bloco 2 para garantir que
# as informações essenciais (Nome, Ano Escolar, Destaque) estejam presentes
# antes de gerar os certificados. Ele itera sobre a lista 'alunos_data'
# e reporta quaisquer alunos com dados incompletos.

# Certifique-se de que o Bloco 2 (Leitura de Dados) foi executado e a lista alunos_data foi populada.

# Importação de datetime já está no Bloco 1, mas repetida aqui para clareza do bloco
import datetime

print("--- Validando dados dos alunos lidos ---")

# Verifica se a lista alunos_data existe e não está vazia
if 'alunos_data' in locals() and alunos_data:
    validation_errors = False
    # Itera sobre os dados de cada aluno na lista
    for i, aluno in enumerate(alunos_data):
        # Verifica se as chaves esperadas existem e se os valores não são None ou strings vazias
        if not all(key in aluno and aluno[key] for key in ["Nome Completo", "Ano Escolar", "Destaque"]):
            print(f"❌ Erro de validação para o Aluno na posição {i+1}: Dados incompletos.")
            print(f"  Dados encontrados: {aluno}")
            validation_errors = True

    if not validation_errors:
        print("✅ Validação dos dados dos alunos concluída: Todos os alunos têm dados essenciais.")
    else:
        print("⚠️ Atenção: Foram encontrados erros de validação em alguns alunos. Verifique os dados na planilha.")

else:
    print("❌ A lista 'alunos_data' não foi encontrada ou está vazia. Execute o Bloco 2 primeiro.")

# Confirmação de execução do bloco com data e hora
print(f"✅ Bloco 2a (Validação de Dados) executado com sucesso em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

print("-" * 30) # Separador visual entre blocos

# --- Bloco 3: Função de substituição do texto no certificado e Carregamento do Modelo PPTX ---
# Este bloco define a função Python que será usada para abrir o template PPTX,
# encontrar e substituir os placeholders de texto com os dados do aluno,
# e aplicar a formatação desejada (cor, negrito, fonte).
# Também detecta e carrega o arquivo do modelo de certificado PPTX da pasta 'Modelo Certificado'.

# Certifique-se de que o arquivo "CERTIFICADO_ALUNO_DESTAQUE_ESCOLA_SESI.pptx"
# ou qualquer outro arquivo .pptx do modelo foi subido para a pasta 'Modelo Certificado'.
# Certifique-se de que os dados dos alunos foram lidos no Bloco 2 (embora a função seja definida aqui).

# Importações já estão no Bloco 1, mas repetidas aqui para clareza do bloco
from pptx import Presentation
import os
import shutil
from pptx.dml.color import RGBColor # Import RGBColor para definir cores
import datetime # Importa o módulo datetime para trabalhar com datas e horas


# Definir a pasta onde o arquivo do modelo será procurado
pasta_modelo = "Modelo Certificado"
modelo = None # Variável para armazenar o caminho do arquivo do modelo encontrado

print(f"Procurando arquivo do modelo PPTX na pasta '{pasta_modelo}'...")

# Verificar se a pasta do modelo existe
if not os.path.exists(pasta_modelo):
    print(f"❌ Erro: Pasta do modelo '{pasta_modelo}' não encontrada. Certifique-se de criar a pasta e fazer o upload do seu template PPTX.")
else:
    # Listar arquivos na pasta do modelo e procurar por arquivos .pptx
    arquivos_na_pasta_modelo = os.listdir(pasta_modelo)
    for arquivo in arquivos_na_pasta_modelo:
        if arquivo.lower().endswith(".pptx"):
            modelo = os.path.join(pasta_modelo, arquivo)
            print(f"✅ Arquivo do modelo PPTX detectado: {modelo}")
            break # Processa apenas o primeiro arquivo .pptx encontrado


# Comentado: Código original para limpar e criar pasta de teste PPTX.
# A limpeza de pastas é agora feita no Bloco 0.
# if os.path.exists(pasta_saida_pptx):
#     shutil.rmtree(pasta_saida_pptx)
# os.makedirs(pasta_saida_pptx, exist_ok=True)


# Função de substituição do texto no certificado
# Esta função AGORA ASSUME que o 'modelo' já foi carregado e verificado antes de ser chamada.
# prs: objeto Presentation (o certificado PPTX carregado)
# nome_aluno: nome do aluno a ser inserido
# ano_escolar: ano escolar do aluno (pode conter "ANO" ou "SÉRIE")
# destaque: o destaque do aluno (ex: PERSEVERANÇA)
def substituir_texto(prs, nome_aluno, ano_escolar, destaque):
    # Imprime informações para depuração sobre os dados que estão sendo usados para substituição
    # print(f"--- Substituindo texto para ---") # Suprimido para menos verbosidade
    # print(f"Nome do Aluno: {nome_aluno}") # Suprimido para menos verbosidade
    # print(f"Ano Escolar: {ano_escolar}") # Suprimido para menos verbosidade
    # print(f"Destaque: {destaque}") # Suprimido para menos verbosidade
    # print(f"-----------------------------") # Suprimido para menos verbosidade


    # Define partes constantes da frase para ajudar a identificar a forma e reconstruir a frase
    constant_phrase_part = "POR SUA EXCELÊNCIA EM"
    sentence_end_part = ", REFERENTE À 2ª ETAPA LETIVA DE 2025."
    white_color = RGBColor(0xFF, 0xFF, 0xFF) # Define a cor branca em formato RGB para aplicar ao texto
    font_name_calibri = "Calibri" # Define o nome da fonte Calibri para uso programático


    # Itera sobre cada slide na apresentação
    for slide in prs.slides:
        # Itera sobre cada forma (shape) dentro do slide atual
        for shape in slide.shapes:
            # Verifica se a forma possui um quadro de texto (text frame)
            if shape.has_text_frame:
                text_frame = shape.text_frame
                # Itera sobre cada parágrafo (paragraph) dentro do quadro de texto
                for p in text_frame.paragraphs:
                    # Constrói o texto completo do parágrafo juntando o texto de todos os 'runs'
                    full_text = "".join(run.text for run in p.runs)

                    # --- Lógica para substituir a frase complexa (ano escolar e destaque) ---
                    # Identifica o parágrafo pela parte constante da frase
                    if constant_phrase_part in full_text:
                        # Determina o prefixo correto ("DO" ou "DA") com base no conteúdo de ano_escolar
                        # Converte para maiúsculas para comparação consistente
                        ano_escolar_upper = ano_escolar.upper()
                        if "SÉRIE" in ano_escolar_upper:
                            prefix = "DA"
                        elif "ANO" in ano_escolar_upper:
                            prefix = "DO"
                        else:
                            # Caso não encontre "ANO" nem "SÉRIE", usa um prefixo padrão ou levanta um aviso
                            print(f"⚠️ Aviso na substituição para {nome_aluno}: '{ano_escolar}' não contém 'ANO' nem 'SÉRIE'. Usando prefixo padrão 'DO'.")
                            prefix = "DO"

                        # Constrói a nova frase completa
                        # new_sentence = f"{prefix} {ano_escolar.upper()}, {constant_phrase_part.upper()} {destaque.upper()}{sentence_end_part.upper()}" # Código original


                        # Limpa os 'runs' existentes no parágrafo
                        while len(p.runs) > 0:
                            p.runs[0]._r.getparent().remove(p.runs[0]._r)

                        # Adiciona a nova frase como runs separados para aplicar formatação mista (negrito no destaque)
                        # Adiciona o texto antes do destaque (em maiúsculas, branco e fonte Calibri)
                        sentence_before_destaque = f"{prefix} {ano_escolar.upper()}, {constant_phrase_part.upper()} "
                        new_run_before = p.add_run()
                        new_run_before.text = sentence_before_destaque
                        font_before = new_run_before.font
                        font_before.color.rgb = white_color
                        font_before.name = font_name_calibri # Define a fonte como Calibri


                        # Adiciona o texto do destaque (em maiúsculas, negrito, branco e fonte Calibri)
                        new_run_destaque = p.add_run()
                        new_run_destaque.text = destaque.upper()
                        font_destaque = new_run_destaque.font
                        font_destaque.bold = True # Aplica negrito
                        font_destaque.color.rgb = white_color # Aplica cor branca
                        font_destaque.name = font_name_calibri # Define a fonte como Calibri


                        # Adiciona o texto depois do destaque (em maiúsculas, branco e fonte Calibri)
                        new_run_after = p.add_run()
                        new_run_after.text = sentence_end_part.upper()
                        font_after = new_run_after.font
                        font_after.color.rgb = white_color # Aplica cor branca
                        font_after.name = font_name_calibri # Define a fonte como Calibri


                    # --- Lógica para substituir outros placeholders (nome da escola, nome do aluno, cidade/data) ---
                    # Estes placeholders podem ser substituídos diretamente dentro de cada 'run'
                    for run in p.runs:
                         # Substitui o placeholder do nome da escola pelo nome correto
                         # A quantidade de 'X's foi corrigida para corresponder ao template
                         if "XXXXXXXXXXXXXXXXXXXXXXXXXXXXX" in run.text:
                            run.text = run.text.replace("XXXXXXXXXXXXXXXXXXXXXXXXXXXXX", "A ESCOLA SESI ALVIMAR CARNEIRO DE REZENDE")
                            # Garante que o texto substituído também seja branco e fonte Calibri
                            font = run.font
                            font.color.rgb = white_color
                            font.name = font_name_calibri # Define a fonte como Calibri


                         if "INSIRA AQUI O NOME DO ALUNO" in run.text:
                            run.text = run.text.replace("INSIRA AQUI O NOME DO ALUNO", nome_aluno)
                            # Garante que o texto substituído também seja branco e fonte Calibri
                            font = run.font
                            font.color.rgb = white_color
                            font.name = font_name_calibri # Define a fonte como Calibri


                         if "Inserir Cidade 00, de Mês de ano" in run.text:
                            run.text = run.text.replace("Inserir Cidade 00, de Mês de ano", "Contagem 03, Outubro de 2025")
                             # Garante que o texto substituído também seja branco e fonte Calibri
                            font = run.font
                            font.color.rgb = white_color
                            font.name = font_name_calibri # Define a fonte como Calibri


    # --- Validação (verificação parcial do texto após a substituição) ---
    # Opcionalmente, você pode adicionar print statements aqui para inspecionar o objeto da apresentação
    # após a substituição, mas antes de salvar. Isso requer iterar através de slides/shapes/parágrafos/runs.
    # print("\n--- Texto após substituição (verificação parcial) ---") # Suprimido para menos verbosidade
    # for slide in prs.slides: # Suprimido para menos verbosidade
    #     for shape in prs.slides[0].shapes: # Suprimido para menos verbosidade (apenas primeiro slide)
    #         if shape.has_text_frame: # Suprimido para menos verbosidade
    #              if len(shape.text_frame.paragraphs) > 0: # Suprimido para menos verbosidade
    #                  print(f"Paragraph text: {''.join(run.text for run in shape.text_frame.paragraphs[0].runs)}") # Suprimido para menos verbosidade
    #                  break # Suprimido para menos verbosidade
    #     if shape.has_text_frame: # Suprimido para menos verbosidade
    #          break # Suprimido para menos verbosidade


    return prs # Retorna o objeto Presentation modificado

# Nota: A geração do arquivo é movida para o Bloco 4 para separação de responsabilidades.

# Confirmação de execução do bloco com data e hora (para a definição da função, não sua execução)
# Esta mensagem indica que a função foi definida, não que foi chamada.
print(f"✅ Bloco 3 (Função substituir_texto e Carregamento do Modelo) executado com sucesso em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

print("-" * 30) # Separador visual entre blocos

# --- Bloco 4: Gerar certificados PPTX para todos os alunos lidos ---
# Este bloco utiliza a função definida no Bloco 3 para carregar o template PPTX,
# substituir as informações de todos os alunos lidos no Bloco 2,
# e salvar os certificados gerados em formato PPTX em subpastas por Ano Escolar.
# Inclui uma validação básica após a geração de cada arquivo.

# Certifique-se de que o Bloco 3 (função substituir_texto) foi executado e o modelo foi carregado.
# Certifique-se de que os dados dos alunos foram lidos no Bloco 2 e armazenados em 'alunos_data'.

# Definir caminhos
# O caminho do modelo agora é definido no Bloco 3
# modelo = "Modelo Certificado/CERTIFICADO_ALUNO_DESTAQUE_ESCOLA_SESI.pptx" # Removido daqui
pasta_saida_pptx_base = "certificados_pptx" # Pasta base para os arquivos PPTX

# Limpar e criar pasta de saída PPTX (Removed from here, now in Bloco 2)
# A criação da pasta base agora é feita no Bloco 2.
# if os.path.exists(pasta_saida_pptx_base):
#     shutil.rmtree(pasta_saida_pptx_base)
# os.makedirs(pasta_saida_pptx_base, exist_ok=True)


# Check if student data is available from Bloco 2 AND the model was loaded in Bloco 3
if 'alunos_data' in locals() and alunos_data and 'modelo' in locals() and modelo:
    total_alunos = len(alunos_data)
    print(f"Iniciando a geração de certificados PPTX para {total_alunos} alunos identificados na planilha...")

    processed_count = 0
    error_count = 0

    # Itera sobre cada aluno na lista de dados lida no Bloco 2
    for i, aluno in enumerate(alunos_data):
        # Use .get para evitar KeyError e fornecer um valor padrão se a chave não existir
        nome_aluno = aluno.get("Nome Completo", "Nome Desconhecido")
        ano_escolar = aluno.get("Ano Escolar", "Ano Desconhecido")
        destaque = aluno.get("Destaque", "Destaque Desconhecido")

        # Suprimido: print(f"\nProcessando certificado para: {nome_aluno}")

        try:
            # Load the presentation template for each student
            # Importação de Presentation já está no Bloco 1, mas repetida aqui para clareza do bloco
            from pptx import Presentation
            # Import os for file path operations and datetime for timestamp are already imported

            # Carrega o modelo usando o caminho definido no Bloco 3
            prs = Presentation(modelo)

            # Apply text substitution using the function from Bloco 3
            # Passa os dados do aluno atual para a função
            # A função substituir_texto ainda pode imprimir detalhes internos, se necessário para depuração
            prs = substituir_texto(prs, nome_aluno, ano_escolar, destaque)

            # --- Definir e criar subpasta por Ano Escolar ---
            # Sanitiza o ano escolar para um nome de pasta seguro
            # Garante que o nome da pasta não seja vazio após sanitização
            ano_escolar_seguro_pasta = ano_escolar.replace("/", "_").replace("\\", "_").replace(":", "_").replace("*", "_").replace("?", "_").replace('"', "_").replace("<", "_").replace(">", "_").replace("|", "_").strip()
            if not ano_escolar_seguro_pasta: # Se o nome da pasta sanitizado for vazio, usa um nome padrão
                 ano_escolar_seguro_pasta = "Ano_Desconhecido"

            # Cria o caminho completo da subpasta
            pasta_saida_pptx_aluno = os.path.join(pasta_saida_pptx_base, ano_escolar_seguro_pasta)
            # Cria a subpasta se não existir
            os.makedirs(pasta_saida_pptx_aluno, exist_ok=True)


            # Define the output file path within the subfolder
            # Cria um nome de arquivo seguro substituindo caracteres inválidos no nome do aluno
            nome_aluno_seguro = nome_aluno.replace("/", "_").replace("\\", "_").replace(":", "_").replace("*", "_").replace("?", "_").replace('"', "_").replace("<", "_").replace(">", "_").replace("|", "_").strip()
             # Garante que o nome do arquivo não seja vazio após sanitização
            if not nome_aluno_seguro: # Se o nome do arquivo sanitizado for vazio, usa um nome padrão
                 nome_aluno_seguro = f"Aluno_Desconhecido_{i}" # Usa o índice para garantir nome único

            # O nome do arquivo agora será apenas o nome do aluno sanitizado, pois a pasta já indica o ano escolar
            # Mantido o formato "ANO_NOME" no nome do arquivo como solicitado anteriormente, mas usando as versões seguras
            # Considerado a preferência mais recente do usuário pelo formato "ANO_NOME.pptx"
            # Sanitiza também o ano escolar para o nome do arquivo, caso contenha caracteres inválidos para nome de arquivo
            ano_escolar_seguro_arquivo = ano_escolar.replace("/", "_").replace("\\", "_").replace(":", "_").replace("*", "_").replace("?", "_").replace('"', "_").replace("<", "_").replace(">", "_").replace("|", "_").strip()
            if not ano_escolar_seguro_arquivo:
                 ano_escolar_seguro_arquivo = "Ano_Desconhecido"


            arquivo_pptx_nome = f"{ano_escolar_seguro_arquivo}_{nome_aluno_seguro}.pptx"
            arquivo_pptx = os.path.join(pasta_saida_pptx_aluno, arquivo_pptx_nome) # Salva na subpasta

            # Suprimido: print(f"🕒 Attempting to save PPTX for {nome_aluno} at: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

            # Save the modified presentation
            try:
                prs.save(arquivo_pptx)
                # Suprimido: print(f"✅ Certificado PPTX gerado para {nome_aluno}: {arquivo_pptx}")
                processed_count += 1

                # --- Add Validation Step Here ---
                # Validação básica: re-opens the generated file and checks if the school name appears exactly once.
                # This validation is now done for EACH generated file, but individual results are supressed,
                # only the error count is maintained.
                # Suprimido: print("\n--- Validating generated PPTX ---")
                validation_successful = False
                try:
                    # Re-open the generated presentation for validation
                    validation_prs = Presentation(arquivo_pptx)
                    school_name_found_count = 0
                    expected_school_name = "A ESCOLA SESI ALVIMAR CARNEIRO DE REZENDE"

                    # Simple validation: check if the expected school name appears exactly once in text frames
                    for slide in validation_prs.slides:
                        for shape in slide.shapes:
                            if shape.has_text_frame:
                                for p in shape.text_frame.paragraphs:
                                    full_text = "".join(run.text for run in p.runs)
                                    if expected_school_name in full_text:
                                        school_name_found_count += full_text.count(expected_school_name) # Count occurrences in this paragraph

                    if school_name_found_count == 1:
                        validation_successful = True
                    else:
                        # Suprimido: print(f"❌ Validation failed for {nome_aluno}: School name found {school_name_found_count} times (expected 1).")
                        error_count += 1
                        # You can add code here to handle the failure, such as deleting the erroneous file
                        # os.remove(arquivo_pptx)
                        # print(f"  Removed erroneous file: {arquivo_pptx}")

                except Exception as e:
                    # Suprimido: print(f"❌ Error during validation for {nome_aluno}: {e}")
                    error_count += 1


            except Exception as e:
                # Suprimido: print(f"❌ Erro ao salvar o arquivo PPTX para {nome_aluno}: {e}")
                error_count += 1


        except Exception as e:
            # Suprimido: print(f"❌ Erro geral ao processar {nome_aluno}: {e}")
            error_count += 1


    print("\n--- Resumo da Geração de PPTX em Lote ---")
    print(f"Total de alunos processados: {total_alunos}")
    print(f"Certificados PPTX gerados com sucesso (passaram na validação básica): {processed_count - error_count}") # Assuming validation failure means it wasn't successfully generated/valid
    print(f"Certificados PPTX com erros (falha ao salvar ou validar): {error_count}")

    # Confirmação final de execução do bloco com data e hora
    print(f"✅ Bloco 4 (Geração de PPTX em Lote) executado com sucesso em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

elif 'alunos_data' not in locals() or not alunos_data:
    print("❌ A lista 'alunos_data' não foi encontrada ou está vazia. Execute o Bloco 2 primeiro.")
    print(f"❌ Bloco 4 (Geração de PPTX em Lote) executado com erro (dados ausentes) em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")
elif 'modelo' not in locals() or not modelo:
    print("❌ O caminho do modelo PPTX não foi encontrado. Execute o Bloco 3 primeiro.")
    print(f"❌ Bloco 4 (Geração de PPTX em Lote) executado com erro (modelo ausente) em: {datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

Limpando conteúdo da pasta 'certificados_pptx'...
  Removido: certificados_pptx/5ºANO
  Removido: certificados_pptx/7ºANO
  Removido: certificados_pptx/3ºANO
  Removido: certificados_pptx/9ºANO
  Removido: certificados_pptx/2ª SÉRIE
  Removido: certificados_pptx/1ºANO
  Removido: certificados_pptx/1ª SÉRIE
  Removido: certificados_pptx/2ºANO
  Removido: certificados_pptx/6ºANO
  Removido: certificados_pptx/3ª SÉRIE
  Removido: certificados_pptx/4ºANO
  Removido: certificados_pptx/8ºANO
Conteúdo da pasta 'certificados_pptx' excluído. A pasta foi mantida.
Limpando conteúdo da pasta 'certificados_pdf'...
  Removido: certificados_pdf/5ºANO
  Removido: certificados_pdf/7ºANO
  Removido: certificados_pdf/3ºANO
  Removido: certificados_pdf/9ºANO
  Removido: certificados_pdf/2ª SÉRIE
  Removido: certificados_pdf/1ºANO
  Removido: certificados_pdf/1ª SÉRIE
  Removido: certificados_pdf/2ºANO
  Removido: certificados_pdf/6ºANO
  Removido: certificados_pdf/3ª SÉRIE
  Removido: certificados_pdf/4ºA