# AUTODOCS COMPLETO

Este projeto foi desenvolvido sob demanda para a empresa Metrocasa, com o objetivo de automatizar processos repetitivos.

O script apresentado realiza o download de arquivos no sistema ANAPRO e faz o reupload dos arquivos compactados para a nuvem do OneDrive, seguindo as diretrizes de uma planilha base.

Para facilitar a leitura e compreensão, o código foi reformulado no formato de um notebook, servindo como uma demonstração de conhecimento. No entanto, para aplicação em produção, recomenda-se a refatoração do código e sua posterior compilação para um executável. Além disso, a adição de caixas de diálogo e mensagens informativas pode melhorar significativamente a experiência do usuário.

# Carregar todas as bibliotecas


In [None]:
import time
import pandas as pd
import os
import shutil
import tkinter as tk
from tkinter import filedialog
import zipfile


from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.chrome.service import Service

from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC


from selenium.webdriver.chrome.options import Options
# Configurar opções do Chrome
chrome_options = Options()
chrome_options.add_argument("--start-maximized")



servico = Service(ChromeDriverManager().install())

navegador = webdriver.Chrome(service=servico, options=chrome_options)



# Carregar informações bases

O primeiro passo será carregar os dados da planilha DADOS.xlsx contendo as informações de empreendimento, unidade, nome do cliente e número do processo ANAPRO.

In [None]:
# Caminho do arquivo Excel
## A planilha DADOS.xlsx precisa estar no mesmo diretório do código. Nela deve conter as instruções base para.
## DADOS.xlsx deve conter 3 colunas: EMPREEND, CHV, PROCESSO.
## EMPREEND = Nome do empreendimento
## CHV = Nome do cliente + Unidade
## Endereço do processo no sistema ANAPRO

### Esses dados podem ser facilmente reescritos para ser compativeis com as planilhas de relatórios do Anapro para criar um sistema completamente autonomo
caminho_arquivo = "DADOS.xlsx"

# Caminho da pasta onde as pastas devem estar
## Complemente o endereço endereço de diretório 
caminho_base = r"*\OneDrive - CONSTRUTORA METROCASA SA\2 - EMPREENDIMENTOS  - CLIENTES (ATUALIZADO)"

def selecionar_diretorio():
    root = tk.Tk()
    root.withdraw()  # Oculta a janela principal do Tkinter
    diretorio = filedialog.askdirectory(title='Selecione um diretório')
    return diretorio

# Utilize a janela de dialogo para o usuário selecionar o diretorio da nuvem onde serão armazenados as documentações.
caminho_base = selecionar_diretorio()
print(f'Diretório selecionado: {caminho_base}')


In [None]:
# Ler o arquivo Excel
df = pd.read_excel(caminho_arquivo)

In [None]:
# Função que simula a fórmula do Excel para extrair o numero do processo na coluna de endereçamento e criar uma nova coluna com "Arquivo do Processo" + o numero do processo
def arquivo_nome(row):
    # Extrair o valor à direita do "=" na coluna C2
    parte_direita = row['PROCESSO'].split('=')[-1]  # pega a parte após o "="
    return "Arquivos do Processo " + parte_direita

# Aplica a função em cada linha criando uma nov
df['ARQUIVO_NOME'] = df.apply(arquivo_nome, axis=1)

# Verificador

Iremos percorrer todos os arquivos no diretório da núvem para comprar com os Arquivos do Processo afim de saber quais já estão na nuvem e quais ainda faltam colocar. Isso evita o problema de duplicidade.

In [None]:
# Verificar se a coluna ARQUIVO_NOME existe
if "ARQUIVO_NOME" not in df.columns:
    raise ValueError("A coluna 'ARQUIVO_NOME' não foi encontrada no arquivo Excel.")

# Criar um dicionário para armazenar os resultados
resultados = {}

# Criar um conjunto com todas as pastas existentes dentro do caminho_base (incluindo subpastas)
pastas_existentes = set()

In [None]:
for raiz, diretorios, _ in os.walk(caminho_base):
    for diretorio in diretorios:
        caminho_completo = os.path.join(raiz, diretorio)
        pastas_existentes.add((diretorio, caminho_completo))  # Guarda o nome e o caminho completo


In [None]:
# Percorrer os nomes das pastas na planilha e verificar se existem no conjunto
for nome_pasta in df["ARQUIVO_NOME"].dropna().astype(str):
    encontrado = False
    caminho_encontrado = ""

    for pasta, caminho in pastas_existentes:
        if nome_pasta == pasta:
            encontrado = True
            caminho_encontrado = caminho
            break  # Para assim que encontrar a primeira ocorrência

    resultados[nome_pasta] = {"STATUS": "Encontrada" if encontrado else "Não Encontrada",
                               "CAMINHO_ENCONTRADO": caminho_encontrado if encontrado else "N/A"}

In [None]:
# Criar um DataFrame com os resultados
resultado_df = pd.DataFrame.from_dict(resultados, orient="index").reset_index()
resultado_df.rename(columns={"index": "ARQUIVO_NOME"}, inplace=True)

caminho_saida = "resultado_pastas_com_subpastas.xlsx"
resultado_df.to_excel(caminho_saida, index=False)

print(f"\nArquivo '{caminho_saida}' salvo com o status das pastas e seus caminhos.")

In [None]:
# Verificar valores únicos e suas contagens na coluna STATUS
print(resultado_df["STATUS"].value_counts())

In [None]:
# Vamos comparar df BASE com resultado_df de varredura e remover as linhas de df BASE que foram encontradas na verredura

def remover_linhas_comuns(resultado_df, df):
    df_filtrado = df[~df['ARQUIVO_NOME'].isin(resultado_df['ARQUIVO_NOME'])]
    return df_filtrado


resultado_df = pd.DataFrame({'ARQUIVO_NOME': ['file1.txt', 'file2.txt']})
df = pd.DataFrame({'ARQUIVO_NOME': ['file1.txt', 'file2.txt', 'file3.txt', 'file4.txt']})
df_atualizado = remover_linhas_comuns(resultado_df, df)

# Baixar os arquivos

Com o Dataframe Base contendo apenas os processos de clientes que ainda não estão na nuvem, iremos baixar os arquivos faltantes

In [None]:
# Cria uma coluna para marcar o que será baixado e armazena em forma de lista para aumentar a performance

df['DOWNLOAD'] = 0


processos_nao_baixados = df[df["DOWNLOAD"] == 0]["PROCESSO"].tolist()
processos_nao_baixados

In [None]:
navegador.get('https://metrocasa.anapro.com.br/')
espera = WebDriverWait(navegador, 600)  # Tempo máximo de espera de 60 segundos
segundo_botao = espera.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="aspnetForm"]/div[4]/div[3]/div/div[3]/b')))
navegador.minimize_window()


for index, link_download in enumerate(processos_nao_baixados):
    # Copiar o link para a área de transferência
    
    print(f"Acessando: {link_download}")

    navegador.get(link_download)
    navegador.find_element('xpath','//*[@id="ctl00_conteudo_wucDocumentacao_btnBaixarTudo"]').click()
    espera = WebDriverWait(navegador, 60)  # Tempo máximo de espera de 60 segundos
    segundo_botao = espera.until(EC.element_to_be_clickable((By.XPATH, '//*[@id="ctl00_conteudo_msgResultado"]/a')))
    segundo_botao.click()
    
    # Marcar o processo como baixado na planilha
    df.loc[df["PROCESSO"] == link_download, "DOWNLOAD"] = 1
    print(f"Download concluído: {link_download}")


# Salvar o DataFrame atualizado
df.to_excel("DADOS_ATUALIZADOS.xlsx", index=False)

print("Todos os downloads foram realizados e a planilha foi atualizada!")

In [None]:
df_baixados = df[df["DOWNLOAD"] == 1]

# Descomprime os zips

In [None]:
def extrair_zips_em_pastas(base_path):
    """
    Encontra e extrai todos os arquivos .zip dentro do diretório "PROCESSOS",
    criando uma pasta para cada um com o mesmo nome do arquivo.
    Se o diretório "PROCESSOS" não existir, ele será criado.
    
    :param base_path: Caminho base onde está a pasta "PROCESSOS"
    """
    processos_path = os.path.join(base_path, "PROCESSOS")
    
    if not os.path.exists(processos_path):
        os.makedirs(processos_path)
        print(f"Diretório criado: {processos_path}")
        return
    
    for arquivo in os.listdir(processos_path):
        if arquivo.lower().endswith(".zip"):
            zip_path = os.path.join(processos_path, arquivo)
            pasta_destino = os.path.join(processos_path, os.path.splitext(arquivo)[0])
            
            os.makedirs(pasta_destino, exist_ok=True)
            
            with zipfile.ZipFile(zip_path, 'r') as zip_ref:
                zip_ref.extractall(pasta_destino)
            
            print(f"Extraído: {zip_path} -> {pasta_destino}"

# ORGANIZAR OS ARQUIVOS 

In [None]:
# CRIA AS PASTAS DOS CLIENTES

base_directory = r"*\PROCESSOS"

# Garantir que o diretório base existe
os.makedirs(base_directory, exist_ok=True)

# Criar pastas para cada nome único da coluna CHV
for nome_pasta in df["CHV"].dropna().unique():  # Remove valores NaN e pega os únicos
    pasta_path = os.path.join(base_directory, str(nome_pasta))  # Caminho completo da pasta
    os.makedirs(pasta_path, exist_ok=True)  # Cria a pasta se não existir

print("Pastas criadas com sucesso!")

In [None]:
# CRIA AS PASTAS DOS EMPREENDIMENTOS

# Garantir que o diretório base existe
os.makedirs(base_directory, exist_ok=True)

# Criar pastas para cada nome único da coluna EMPREEND
for nome_pasta in df["EMPREEND"].dropna().unique():  # Remove valores NaN e pega os únicos
    pasta_path = os.path.join(base_directory, str(nome_pasta))  # Caminho completo da pasta
    os.makedirs(pasta_path, exist_ok=True)  # Cria a pasta se não existir

print("Pastas criadas com sucesso!")

In [None]:
# COLOCA OS PROCESSOS NAS RESPECTIVAS PASTAS DOS CLIENTES


for _, row in df.iterrows():
    nome_pasta = str(row["CHV"])  # Nome da pasta correspondente
    nome_arquivo = str(row["ARQUIVO_NOME"])  # Nome do arquivo

    # Caminho da pasta correspondente ao EMPREEND
    pasta_destino = os.path.join(base_directory, nome_pasta)

    # Caminho do arquivo de origem
    arquivo_origem = os.path.join(base_directory, nome_arquivo)

    # Caminho do arquivo de destino dentro da pasta correta
    arquivo_destino = os.path.join(pasta_destino, nome_arquivo)

    # Verifica se o arquivo existe antes de mover
    if os.path.exists(arquivo_origem):
        shutil.move(arquivo_origem, arquivo_destino)
        print(f"Movido: {nome_arquivo} → {pasta_destino}")
    else:
        print(f"Arquivo não encontrado: {arquivo_origem}")

print("Todos os arquivos foram organizados nas pastas correspondentes!")

In [None]:
# COLOCA OS CLIENTES NAS RESPECTIVAS PASTAS DOS EMPREENDIMENTOS

for _, row in df.iterrows():
    nome_pasta = str(row["EMPREEND"])  # Nome da pasta correspondente
    nome_arquivo = str(row["CHV"])  # Nome do arquivo

    # Caminho da pasta correspondente ao EMPREEND
    pasta_destino = os.path.join(base_directory, nome_pasta)

    # Caminho do arquivo de origem
    arquivo_origem = os.path.join(base_directory, nome_arquivo)

    # Caminho do arquivo de destino dentro da pasta correta
    arquivo_destino = os.path.join(pasta_destino, nome_arquivo)

    # Verifica se o arquivo existe antes de mover
    if os.path.exists(arquivo_origem):
        shutil.move(arquivo_origem, arquivo_destino)
        print(f"Movido: {nome_arquivo} → {pasta_destino}")
    else:
        print(f"Arquivo não encontrado: {arquivo_origem}")

print("Todos os arquivos foram organizados nas pastas correspondentes!")

# Mover os docs para a nuvem

Aqui os arquivos que foram colocados em seus respectivos empreendimentos, cliente+unidade e número do processo são movidos para a nuvem do OneDrive.

Por motivos de privacidade organizacional esse trecho do código foi retirado para pode ser facilmente escrito de acordo com a necessidade ou os arquivos podem ser movidos manualmente para evitar qualquer pontualidade com endereçamento de diretorio

# Verificar todos os arquivos novamente

Verifica se os arquivos com os numeros dos processos foram colocados na nuvem

In [None]:
for raiz, diretorios, _ in os.walk(caminho_base):
    for diretorio in diretorios:
        caminho_completo = os.path.join(raiz, diretorio)
        pastas_existentes.add((diretorio, caminho_completo))  # Guarda o nome e o caminho completo

# Percorrer os nomes das pastas na planilha e verificar se existem no conjunto
for nome_pasta in df["ARQUIVO_NOME"].dropna().astype(str):
    encontrado = False
    caminho_encontrado = ""

    for pasta, caminho in pastas_existentes:
        if nome_pasta == pasta:
            encontrado = True
            caminho_encontrado = caminho
            break  # Para assim que encontrar a primeira ocorrência

    resultados[nome_pasta] = {"STATUS": "Encontrada" if encontrado else "Não Encontrada",
                               "CAMINHO_ENCONTRADO": caminho_encontrado if encontrado else "N/A"}

# Criar um DataFrame com os resultados
resultado_df = pd.DataFrame.from_dict(resultados, orient="index").reset_index()
resultado_df.rename(columns={"index": "ARQUIVO_NOME"}, inplace=True)