# Padr√µes Arquiteturais de Software - Engenharia de Software II

In [None]:
# C√©lula 1: Instala√ß√£o de Depend√™ncias
# Descomente e execute se necess√°rio.
# 'radon' √© para a an√°lise de depend√™ncias/complexidade em Python.
# Troque 'radon' por 'madge' se for um projeto JS/TS.

!pip install openai huggingface_hub sentence-transformers scikit-learn numpy
!pip install radon

print("Bibliotecas prontas. (Execute !pip install ... se necess√°rio)")

Bibliotecas prontas. (Execute !pip install ... se necess√°rio)


In [None]:
from google.colab import drive
drive.mount('/content/drive')

MessageError: Error: credential propagation was unsuccessful

In [None]:
# C√©lula 2: Imports e Configura√ß√£o Inicial
import os
import subprocess
import json
import shutil
from openai import OpenAI
from sentence_transformers import SentenceTransformer
from sklearn.cluster import KMeans
import numpy as np
import warnings
from radon.cli import CCHarvester # Para an√°lise de complexidade/depend√™ncia Python

# Suprimir avisos
warnings.filterwarnings("ignore", category=UserWarning, module="sklearn")

# --- 1. CONFIGURA√á√ÉO DA API HUGGING FACE ---
# !! IMPORTANTE !! Substitua pela sua API Key.
HF_API_KEY = "SUA_API_KEY_AQUI"

if HF_API_KEY == "SUA_API_KEY_AQUI":
    print("="*50)
    print("!! ALERTA: Por favor, insira sua API Key do Hugging Face na C√©lula 2 !!")
    print("="*50)

client = OpenAI(
    base_url="https://router.huggingface.co/v1",
    api_key=HF_API_KEY,
)

# --- 2. CONFIGURA√á√ÉO DO MODELO ---
# Escolha um modelo de chat dispon√≠vel no Hugging Face
# "meta-llama/Llama-3.1-8B-Instruct",
# "deepseek-ai/DeepSeek-V3.2-Exp",
# "zai-org/GLM-4.6",
MODELO_HF = "Qwen/Qwen2.5-7B-Instruct"

# --- 3. CONFIGURA√á√ÉO DO REPOSIT√ìRIO (!! IMPORTANTE !!) ---
# !! MUDE AQUI !!
REPO_URL = "https://github.com/unclecode/crawl4ai.git" # Exemplo: FastAPI (Python)
REPO_PATH = "repositorio_clonado"

# !! MUDE AQUI !!
# Filtro de linguagem para o Passo 4 (Embedding)
CODE_FILE_EXTENSION = ".py"
# Filtro de pastas a ignorar (otimiza a an√°lise)
IGNORE_DIRS = {'node_modules', '.git', '.vscode', '__pycache__', 'venv', 'docs', 'tests', 'examples'}

# --- 4. FUN√á√ÉO HELPER PARA CHAMAR A LLM ---
#       Esta fun√ß√£o ir√° determinar os pap√©is da LLM e informa-la do prompt
#       em quest√£o, depois retornar a resposta ao mesmo. Tudo isso com error handling
def analisar_com_llm(prompt_sistema, prompt_usuario):
    """
    Fun√ß√£o auxiliar para fazer chamadas √† API do Hugging Face
    usando a interface do OpenAI.
    """
    print("--- ü§ñ Chamando LLM para an√°lise... ---")
    # if HF_API_KEY == "SUA_API_KEY_AQUI":
    #     print("!! ERRO: API Key n√£o configurada. Pulando chamada... !!")
    #     return "(API Key n√£o configurada)"

    try:
        completion = client.chat.completions.create(
            model=MODELO_HF,
            messages=[
                {"role": "system", "content": prompt_sistema},
                {"role": "user", "content": prompt_usuario},
            ],
            temperature=0.1,
        )
        resposta = completion.choices[0].message.content
        print("--- ‚úÖ An√°lise da LLM recebida. ---")
        return resposta
    except Exception as e:
        print(f"--- ‚ùå Erro ao chamar a LLM: {e} ---")
        return f"(Erro na chamada da API: {e})"

print("Configura√ß√£o inicial conclu√≠da.")

In [None]:
# C√©lula 3: Clonando o Reposit√≥rio Real
print("\n--- INICIANDO CLONE DO REPOSIT√ìRIO ---")

# Se j√° houver um reposit√≥rio nesse caminho, ele √© deletado
if os.path.exists(REPO_PATH):
    print(f"Removendo diret√≥rio existente: {REPO_PATH}")
    shutil.rmtree(REPO_PATH)

print(f"Clonando {REPO_URL} para {REPO_PATH}...")
try:
    # Usamos --depth 1 para um clone r√°pido (shallow clone)
    # Remova --depth 1 se a an√°lise completa do Git Log (Passo 5) for crucial
    subprocess.run(
        ["git", "clone", REPO_URL, REPO_PATH],
        check=True, capture_output=True, text=True
    )
    print("Reposit√≥rio clonado com sucesso.")
except FileNotFoundError:
    print("ERRO: 'git' n√£o encontrado. Por favor, instale o Git.")
except subprocess.CalledProcessError as e:
    print(f"ERRO ao clonar o reposit√≥rio: {e.stderr}")
except Exception as e:
    print(f"Um erro inesperado ocorreu: {e}")

In [None]:
# C√©lula 4: PASSO 1 - An√°lise da Documenta√ß√£o
print("\n--- INICIANDO PASSO 1: An√°lise da Documenta√ß√£o ---")

documentacao_completa_para_chunking = "" # Coleta toda a documenta√ß√£o relevante para chunking posterior
doc_files = []
# Limita a busca para evitar arquivos .md em 'node_modules' etc.
for root, dirs, files in os.walk(REPO_PATH):
    # Remove diret√≥rios ignorados da busca
    dirs[:] = [d for d in dirs if d not in IGNORE_DIRS]

    for file in files:
        if file.lower().endswith(".md"):
            filepath = os.path.join(root, file)
            doc_files.append(filepath)
            try:
                with open(filepath, "r", encoding="utf-8") as f:
                    conteudo = f.read() # L√™ o conte√∫do completo para chunking posterior
                    # "os.path.relpath" retorna o caminho do conteudo, e "conteudo" o conteudo em si
                    documentacao_completa_para_chunking += f"--- CONTE√öDO DE {os.path.relpath(filepath, REPO_PATH)} ---\n{conteudo}\n\n"
            except Exception as e:
                print(f"Erro ao ler {filepath}: {e}")

print(f"Arquivos .md encontrados e lidos: {len(doc_files)}")

# --- Chunking da documenta√ß√£o para LLM ---
# Estimativa conservadora de chars por token para o modelo (varia por modelo)
CHARS_PER_TOKEN_ESTIMATE = 3.5
MODEL_MAX_TOKENS = 16384
PROMPT_OVERHEAD_TOKENS = 500 # Estimativa para o prompt do sistema + partes fixas do prompt do usu√°rio

MAX_DOCUMENT_TOKENS = MODEL_MAX_TOKENS - PROMPT_OVERHEAD_TOKENS
MAX_CHUNK_CHARS = int(MAX_DOCUMENT_TOKENS * CHARS_PER_TOKEN_ESTIMATE)

documentacao_chunks = []
if len(documentacao_completa_para_chunking) > MAX_CHUNK_CHARS:
    for i in range(0, len(documentacao_completa_para_chunking), MAX_CHUNK_CHARS):
        documentacao_chunks.append(documentacao_completa_para_chunking[i:i + MAX_CHUNK_CHARS])
    print(f"Documenta√ß√£o dividida em {len(documentacao_chunks)} chunks para an√°lise.")
else:
    documentacao_chunks.append(documentacao_completa_para_chunking)
    print("Documenta√ß√£o pequena o suficiente para uma √∫nica an√°lise.")


prompt_sistema = "Voc√™ √© um engenheiro de software s√™nior. Sua tarefa √© analisar a documenta√ß√£o de um projeto e identificar padr√µes arquiteturais e de design."
analises_parciais = []

for i, chunk in enumerate(documentacao_chunks):
    prompt_usuario_chunk = f"""
    Com base na seguinte parte da documenta√ß√£o (parte {i+1} de {len(documentacao_chunks)}), identifique:
    1. Quais padr√µes arquiteturais (ex: MVC, Layered, Microservi√ßos) s√£o explicitamente mencionados?
    2. Quais princ√≠pios de design (ex: separa√ß√£o de responsabilidades, inje√ß√£o de depend√™ncia) s√£o descritos?
    3. Fa√ßa um resumo da arquitetura proposta por esta parte da documenta√ß√£o.

    --- IN√çCIO DO CHUNK {i+1} ---
    {chunk}
    --- FIM DO CHUNK {i+1} ---
    """
    print(f"\n--- Analisando chunk {i+1} de {len(documentacao_chunks)} ---")
    analise_chunk = analisar_com_llm(prompt_sistema, prompt_usuario_chunk)
    analises_parciais.append(f"An√°lise do Chunk {i+1}:\n{analise_chunk}\n")

# --- S√≠ntese das an√°lises parciais ---
if len(analises_parciais) > 1:
    synthesis_prompt_sistema = "Voc√™ √© um engenheiro de software s√™nior. Sua tarefa √© sintetizar m√∫ltiplas an√°lises parciais de documenta√ß√£o em um relat√≥rio coeso e abrangente, focado em padr√µes arquiteturais e de design."
    synthesis_prompt_usuario = f"""
    Sintetize as seguintes an√°lises parciais de documenta√ß√£o em um relat√≥rio √∫nico e coeso sobre os padr√µes arquiteturais e de design do projeto. Evite repeti√ß√µes e foque nos pontos principais de cada an√°lise. Priorize a identifica√ß√£o dos padr√µes mais relevantes e a cria√ß√£o de um resumo claro da arquitetura.

    {'\n\n'.join(analises_parciais)}
    """
    print("\n--- INICIANDO S√çNTESE DAS AN√ÅLISES PARCIAIS ---")

    # Ajusta o prompt de s√≠ntese caso ele tamb√©m exceda o limite de tokens
    if len(synthesis_prompt_usuario) / CHARS_PER_TOKEN_ESTIMATE > MODEL_MAX_TOKENS:
        print("!! ALERTA: O prompt de s√≠ntese √© muito longo e ser√° truncado para caber no limite de tokens. !!")
        synthesis_prompt_usuario = synthesis_prompt_usuario[:int(MODEL_MAX_TOKENS * CHARS_PER_TOKEN_ESTIMATE * 0.9)] + "\n\n[... O prompt de s√≠ntese foi truncado para caber no limite de tokens ...]"


    analise_final = analisar_com_llm(synthesis_prompt_sistema, synthesis_prompt_usuario)
    print("\n--- S√çNTESE CONCLU√çDA ---")
else:
    analise_final = analises_parciais[0] if analises_parciais else "Nenhuma documenta√ß√£o para analisar."

# Salvando o resultado em um arquivo markdown
output_filename = "analise_passo1.md"
with open(output_filename, "w", encoding="utf-8") as f:
    f.write("=== RESULTADO PASSO 1 (LLM) ===\n")
    f.write(analise_final)
    f.write("\n-----------------------------------")
print(f"Resultado do Passo 1 salvo em '{output_filename}'")

In [None]:
cat analise_passo1.md

In [None]:
# C√©lula 5: PASSO 2 - An√°lise da Estrutura de Pastas
print("\n--- INICIANDO PASSO 2: An√°lise da Estrutura de Pastas ---")

# Usando 'tree' (Linux/macOS) ou 'ls -R' (alternativa)
estrutura_pastas = ""
try:
    # Tenta usar 'tree' com profundidade 3 e ignorando diret√≥rios
    ignore_str = "|".join(IGNORE_DIRS)
    comando_tree = ["tree", "-L", "3", "-I", ignore_str, REPO_PATH]
    processo = subprocess.run(comando_tree, capture_output=True, text=True, check=True, encoding="utf-8")
    estrutura_pastas = processo.stdout
except (FileNotFoundError, subprocess.CalledProcessError):
    print("Comando 'tree' n√£o encontrado ou falhou. Gerando lista simples com pastas e arquivos.")
    # Alternativa mais simples: percorrer diret√≥rios e arquivos
    lista_itens = []
    for root, dirs, files in os.walk(REPO_PATH, topdown=True):
        # Remove diret√≥rios ignorados da busca
        dirs[:] = [d for d in dirs if d not in IGNORE_DIRS]

        # Limita a profundidade
        level = root.replace(REPO_PATH, '').count(os.sep)
        if level > 3:
            continue

        indent = " " * 4 * level
        lista_itens.append(f"{indent}{os.path.basename(root)}/")
        for f in files:
            lista_itens.append(f"{indent}    {f}") # Adiciona arquivos com indenta√ß√£o extra

    estrutura_pastas = "\n".join(lista_itens)

print("\nEstrutura de Pastas e Arquivos Gerada (N√≠vel 3):")
print(estrutura_pastas)

# Preparando prompts para a LLM
prompt_sistema = "Voc√™ √© um arquiteto de software. Analise a estrutura de arquivos de um projeto para inferir seu padr√£o arquitetural."
prompt_usuario = f"""
Dada a seguinte estrutura de arquivos e pastas (N√≠vel 3):

{estrutura_pastas}

1. Qual padr√£o arquitetural esta estrutura sugere? (ex: Layered, baseada em features/dom√≠nio, monorepo, etc.)
2. Justifique sua resposta com base nos nomes das pastas e arquivos.
"""

# Chamando a LLM
analise_passo2 = analisar_com_llm(prompt_sistema, prompt_usuario)
output_filename = "analise_passo2.md"
with open(output_filename, "w", encoding="utf-8") as f:
    f.write("=== RESULTADO PASSO 2 (LLM) ===\n")
    f.write(analise_passo2)
    f.write("\n-----------------------------------")
print(f"Resultado do Passo 2 salvo em '{output_filename}'")

In [None]:
cat analise_passo2.md

In [None]:
# C√©lula 6: PASSO 3 - An√°lise do Grafo de Depend√™ncias (Exemplo com Python/radon)
print("\n--- INICIANDO PASSO 3: An√°lise do Grafo de Depend√™ncias ---")
print(f"Usando 'radon' para analisar c√≥digo {CODE_FILE_EXTENSION} (Python).")
print("Este passo precisa ser adaptado para outras linguagens (ex: 'madge' para JS/TS).")

# Coletar arquivos de c√≥digo
arquivos_para_analise = []
for root, dirs, files in os.walk(REPO_PATH):
    dirs[:] = [d for d in dirs if d not in IGNORE_DIRS]
    for file in files:
        if file.endswith(CODE_FILE_EXTENSION):
            arquivos_para_analise.append(os.path.join(root, file))

grafo_dependencias = {}

if CODE_FILE_EXTENSION == ".py" and arquivos_para_analise:
    print(f"Analisando {len(arquivos_para_analise)} arquivos Python com 'radon'...")
    try:
        # Usamos CCHarvester do radon para obter o grafo de chamadas/depend√™ncias
        # Nota: Isso √© complexo. Uma an√°lise de 'import' seria mais simples.
        # Vamos simplificar e focar nos 'imports'

        # An√°lise de Imports (Simplificada)
        for filepath in arquivos_para_analise[:50]: # Limita a 50 arquivos para velocidade
            rel_path = os.path.relpath(filepath, REPO_PATH)
            grafo_dependencias[rel_path] = []
            with open(filepath, "r", encoding="utf-8") as f:
                for line in f:
                    if line.strip().startswith("import ") or line.strip().startswith("from "):
                        # L√≥gica muito crua - apenas para demonstrar
                        parts = line.split()
                        if len(parts) > 1:
                             # Captura 'from fastapi' ou 'import uvicorn'
                            if parts[0] == "from":
                                grafo_dependencias[rel_path].append(parts[1])
                            elif parts[0] == "import":
                                grafo_dependencias[rel_path].append(parts[1])

        output_grafo_simulado = json.dumps(grafo_dependencias, indent=2)
        print("Grafo de depend√™ncias (amostra de imports) gerado.")

    except Exception as e:
        output_grafo_simulado = f"Erro ao analisar depend√™ncias com radon: {e}"
        print(output_grafo_simulado)
else:
    output_grafo_simulado = "Linguagem n√£o suportada por este script ou nenhum arquivo encontrado."
    print(output_grafo_simulado)


# Preparando prompts para a LLM
prompt_sistema = "Voc√™ √© um analista de arquitetura de software especializado em grafos de depend√™ncia."
prompt_usuario = f"""
Analise o seguinte grafo de depend√™ncias (amostrado e simplificado, mostrando 'imports' de arquivos):

{output_grafo_simulado}

1. Com base nesta amostra, o projeto parece ter alta ou baixa acoplamento?
2. Voc√™ consegue identificar depend√™ncias principais (bibliotecas externas) que definem a arquitetura? (ex: 'fastapi', 'django', 'react')
3. Voc√™ consegue identificar 'm√≥dulos' ou 'camadas' com base nos imports internos (se houver)?
"""

# Chamando a LLM
analise_passo3 = analisar_com_llm(prompt_sistema, prompt_usuario)
output_filename = "analise_passo3.md"
with open(output_filename, "w", encoding="utf-8") as f:
    f.write("=== RESULTADO PASSO 3 (LLM) ===\n")
    f.write(analise_passo3)
    f.write("\n-----------------------------------")
print(f"Resultado do Passo 3 salvo em '{output_filename}'")

In [None]:
cat analise_passo3.md

In [None]:
# C√©lula 7: PASSO 4 - Embedding e Clusteriza√ß√£o do C√≥digo
print("\n--- INICIANDO PASSO 4: Embedding e Clusteriza√ß√£o ---")

# --- 4.1. Coletar Arquivos de C√≥digo ---
arquivos_codigo = []
for root, dirs, files in os.walk(REPO_PATH):
    dirs[:] = [d for d in dirs if d not in IGNORE_DIRS]
    for file in files:
        if file.endswith(CODE_FILE_EXTENSION):
            filepath = os.path.join(root, file)
            try:
                with open(filepath, "r", encoding="utf-8") as f:
                    conteudo = f.read()
                # Usamos o caminho relativo para melhor interpreta√ß√£o
                arquivos_codigo.append((os.path.relpath(filepath, REPO_PATH), conteudo))
            except Exception as e:
                print(f"Erro ao ler {filepath}: {e}, pulando...")

print(f"Encontrados {len(arquivos_codigo)} arquivos '{CODE_FILE_EXTENSION}' para embedding.")

# Limitar a 1000 arquivos para evitar estouro de mem√≥ria/tempo
if len(arquivos_codigo) > 1000:
    print("Reposit√≥rio muito grande. Amostrando 1000 arquivos aleatoriamente.")
    indices = np.random.choice(len(arquivos_codigo), 1000, replace=False)
    arquivos_codigo = [arquivos_codigo[i] for i in indices]

if not arquivos_codigo:
    print("Nenhum arquivo de c√≥digo encontrado. Pulando Passo 4.")
    analise_passo4 = "Nenhum arquivo de c√≥digo encontrado para clusterizar."
else:
    # --- 4.2. Gerar Embeddings ---
    print("Carregando modelo de embedding (sentence-transformers)...")
    model = SentenceTransformer('all-MiniLM-L6-v2')

    conteudos = [conteudo for _, conteudo in arquivos_codigo]
    embeddings = model.encode(conteudos)
    print(f"Embeddings gerados. Shape: {embeddings.shape}")

    # --- 4.3. Clusteriza√ß√£o (K-Means) ---
    # Definimos 6 clusters como um chute inicial razo√°vel (ex: models, controllers, services, utils, config, tests)
    num_clusters = min(6, len(arquivos_codigo)) # N√£o ter mais clusters que arquivos
    kmeans = KMeans(n_clusters=num_clusters, random_state=42, n_init=10)
    labels = kmeans.fit_predict(embeddings)

    clusters = {}
    for i in range(len(arquivos_codigo)):
        label = labels[i]
        if label not in clusters:
            clusters[label] = []
        clusters[label].append(arquivos_codigo[i][0]) # Adiciona o nome do arquivo

    print("\nArquivos agrupados por cluster (amostra):")
    for label, files in clusters.items():
        print(f"Cluster {label}: {files[:5]}... ({len(files)} arquivos)")

    # --- 4.4. Analisar Clusters com a LLM ---
    print("\nAnalisando o 'prop√≥sito' de cada cluster com a LLM...")
    analise_clusters = {}
    prompt_sistema_cluster = f"Voc√™ √© um programador s√™nior analisando c√≥digo {CODE_FILE_EXTENSION}. Sua tarefa √© dar um r√≥tulo funcional a um cluster de arquivos (ex: 'Controladores HTTP', 'L√≥gica de Banco de Dados', 'Fun√ß√µes Utilit√°rias', 'Configura√ß√£o')."

    for label, files in clusters.items():
        # Pegar o conte√∫do do primeiro arquivo do cluster como amostra
        sample_filepath_rel = files[0]
        sample_filepath_abs = os.path.join(REPO_PATH, sample_filepath_rel)

        with open(sample_filepath_abs, "r", encoding="utf-8") as f:
            sample_content = f.read(2000) # Limita a 2000 caracteres

        prompt_usuario = f"""
        Estou analisando o **Cluster {label}**.
        Um arquivo de amostra deste cluster √© `{sample_filepath_rel}`.
        Seu conte√∫do (truncado) √©:
        ```{CODE_FILE_EXTENSION}
        {sample_content}
        Com base nesta amostra, qual √© a prov√°vel responsabilidade principal (o r√≥tulo funcional) dos arquivos neste cluster?
        """

        rotulo_cluster = analisar_com_llm(prompt_sistema_cluster, prompt_usuario)
        analise_clusters[f"Cluster {label}"] = {
            "amostra_arquivos": files[:5],
            "total_arquivos": len(files),
            "rotulo_llm": rotulo_cluster
        }

print("\n=== RESULTADO PASSO 4 (LLM) ===")
analise_passo4 = json.dumps(analise_clusters, indent=2)
output_filename = "analise_passo4.md"
with open(output_filename, "w", encoding="utf-8") as f:
    f.write("=== RESULTADO PASSO 4 (LLM) ===\n")
    f.write(analise_passo4)
    f.write("\n-----------------------------------")
print(f"Resultado do Passo 4 salvo em '{output_filename}'")

In [None]:
cat analise_passo4.md

In [None]:
# C√©lula 8: PASSO 5 - An√°lise do Git Log
print("\n--- INICIANDO PASSO 5: An√°lise do Git Log (Filtrado) ---")
print("Nota: Este passo pode falhar se voc√™ usou --depth 1 no clone.")

git_log_filtrado = ""
try:
    # Filtramos por palavras-chave arquiteturais
    comando = [
        "git", "log", "--all", "--max-count=100", # Limita aos √∫ltimos 100 commits
        "--grep=refactor",
        "--grep=architecture",
        "--grep=pattern",
        "--grep=layer",
        "-i" # Ignora case
    ]
    processo = subprocess.run(comando, cwd=REPO_PATH, capture_output=True, text=True, check=True, encoding="utf-8")
    git_log_filtrado = processo.stdout

    if not git_log_filtrado:
        git_log_filtrado = "(Nenhum commit relevante encontrado com os filtros nos √∫ltimos 100 commits)"

except subprocess.CalledProcessError as e:
    # Se o clone foi --depth 1, o 'git log' pode n√£o ter hist√≥rico
    if "shallow" in e.stderr:
        git_log_filtrado = "Erro: O reposit√≥rio foi clonado com '--depth 1' (shallow clone). O hist√≥rico de commits completo n√£o est√° dispon√≠vel para an√°lise. Remova '--depth 1' da C√©lula 3 para analisar o log."
    else:
        git_log_filtrado = f"Erro ao rodar git log: {e.stderr}"
except Exception as e:
    git_log_filtrado = f"Erro ao rodar git log: {e}"


print("Log filtrado (commits com 'refactor', 'architecture', etc.):")
print(git_log_filtrado[:1000] + "...") # Mostra apenas o in√≠cio

# --- Chunking do Git Log para LLM ---
# Reutiliza as constantes de chunking da C√©lula 4
git_log_chunks = []
if len(git_log_filtrado) > MAX_CHUNK_CHARS:
    for i in range(0, len(git_log_filtrado), MAX_CHUNK_CHARS):
        git_log_chunks.append(git_log_filtrado[i:i + MAX_CHUNK_CHARS])
    print(f"Git Log dividido em {len(git_log_chunks)} chunks para an√°lise.")
else:
    git_log_chunks.append(git_log_filtrado)
    print("Git Log pequeno o suficiente para uma √∫nica an√°lise.")


prompt_sistema = "Voc√™ √© um gerente de engenharia analisando o hist√≥rico de commits de um projeto para encontrar decis√µes arquiteturais."
analises_parciais_git = []

for i, chunk in enumerate(git_log_chunks):
    prompt_usuario_chunk_git = f"""
    Analise APENAS a seguinte parte do hist√≥rico de commits (parte {i+1} de {len(git_log_chunks)}).
    O que essas mensagens de commit revelam sobre a evolu√ß√£o ou a inten√ß√£o da arquitetura do software?
    (Se nenhuma mensagem for encontrada ou um erro for reportado, apenas declare isso).

    --- IN√çCIO DO CHUNK {i+1} ---
    {chunk}
    --- FIM DO CHUNK {i+1} ---
    """
    print(f"\n--- Analisando chunk {i+1} de {len(git_log_chunks)} do Git Log ---")
    analise_chunk_git = analisar_com_llm(prompt_sistema, prompt_usuario_chunk_git)
    analises_parciais_git.append(f"An√°lise do Chunk {i+1} do Git Log:\n{analise_chunk_git}\n")

# --- S√≠ntese das an√°lises parciais do Git Log ---
if len(analises_parciais_git) > 1:
    synthesis_prompt_sistema_git = "Voc√™ √© um gerente de engenharia. Sua tarefa √© sintetizar m√∫ltiplas an√°lises parciais de hist√≥ricos de commits em um relat√≥rio coeso, focado em decis√µes e evolu√ß√£o arquitetural."
    synthesis_prompt_usuario_git = f"""
    Sintetize as seguintes an√°lises parciais do Git Log em um relat√≥rio √∫nico e coeso sobre as decis√µes e a evolu√ß√£o arquitetural do projeto. Evite repeti√ß√µes e foque nos pontos principais de cada an√°lise.

    {'\n\n'.join(analises_parciais_git)}
    """
    print("\n--- INICIANDO S√çNTESE DAS AN√ÅLISES PARCIAIS DO GIT LOG ---")

    # Ajusta o prompt de s√≠ntese caso ele tamb√©m exceda o limite de tokens
    if len(synthesis_prompt_usuario_git) / CHARS_PER_TOKEN_ESTIMATE > MODEL_MAX_TOKENS:
        print("!! ALERTA: O prompt de s√≠ntese do Git Log √© muito longo e ser√° truncado para caber no limite de tokens. !!")
        synthesis_prompt_usuario_git = synthesis_prompt_usuario_git[:int(MODEL_MAX_TOKENS * CHARS_PER_TOKEN_ESTIMATE * 0.9)] + "\n\n[... O prompt de s√≠ntese foi truncado para caber no limite de tokens ...]"

    analise_final_git = analisar_com_llm(synthesis_prompt_sistema_git, synthesis_prompt_usuario_git)
    print("\n--- S√çNTESE DO GIT LOG CONCLU√çDA ---")
else:
    analise_final_git = analises_parciais_git[0] if analises_parciais_git else "Nenhum Git Log para analisar."


# Salvando o resultado em um arquivo markdown
output_filename = "analise_passo5.md"
with open(output_filename, "w", encoding="utf-8") as f:
    f.write("=== RESULTADO PASSO 5 (LLM) ===\n")
    f.write(analise_final_git)
    f.write("\n-----------------------------------")
print(f"Resultado do Passo 5 salvo em '{output_filename}'")

In [None]:
cat analise_passo5.md

In [None]:
# C√©lula 9: PASSO 6 - An√°lise Final (S√≠ntese)
print("\n--- INICIANDO PASSO 6: S√≠ntese Final ---")
print("Combinando todas as an√°lises para o relat√≥rio final...")

# Preparando o prompt final com todas as evid√™ncias
prompt_sistema_final = """
Voc√™ √© um Arquiteto de Software S√™nior e est√° escrevendo o relat√≥rio final de uma an√°lise de reposit√≥rio.
Voc√™ recebeu 5 blocos de evid√™ncias. Sua tarefa √© sintetizar TODAS elas em uma conclus√£o coesa e justificada.
Seja direto e use as evid√™ncias para apoiar sua conclus√£o.
"""

prompt_usuario_final = f"""
Por favor, gere um relat√≥rio de an√°lise arquitetural final.
Combine as seguintes 5 fontes de evid√™ncia para chegar a uma conclus√£o sobre os padr√µes arquiteturais de engenharia de software deste projeto.

--- EVID√äNCIA 1: An√°lise da Documenta√ß√£o ---
{analise_passo1}

--- EVID√äNCIA 2: An√°lise da Estrutura de Pastas ---
{analise_passo2}

--- EVID√äNCIA 3: An√°lise do Grafo de Depend√™ncias ---
{analise_passo3}

--- EVID√äNCIA 4: An√°lise da Clusteriza√ß√£o de C√≥digo ---
{analise_passo4}

--- EVID√äNCIA 5: An√°lise do Git Log ---
{analise_passo5}

--- RELAT√ìRIO FINAL ---
Com base em TUDO acima, responda:
1. Qual √© o padr√£o arquitetural prim√°rio identificado?
2. As evid√™ncias s√£o consistentes ou contradit√≥rias? (Ex: A documenta√ß√£o bate com o c√≥digo? A estrutura de pastas reflete os clusters?)
3. Forne√ßa uma justificativa resumida para sua conclus√£o, citando pelo menos 3 das fontes de evid√™ncia.
"""

# Chamando a LLM para o relat√≥rio final
print("\nGerando relat√≥rio final...")
relatorio_final = analisar_com_llm(prompt_sistema_final, prompt_usuario_final)
output_filename = "analise_passo6.md"
with open(output_filename, "w", encoding="utf-8") as f:
    f.write("=== RESULTADO PASSO 6 (LLM) ===\n")
    f.write(relatorio_final)
    f.write("\n-----------------------------------")
print(f"Resultado do Passo 6 salvo em '{output_filename}'")

In [None]:
cat analise_passo6.md