In [3]:
import os
import openai
import textwrap
from datetime import datetime
from collections import defaultdict

# ========================
# CONFIGURA√á√ïES
# ========================

openai.api_key = input('api key') # substitua pela sua chave
CAMINHO_PASTA = input('path')
MAX_CHARS = 4000

# ========================
# FUN√á√ïES UTILIT√ÅRIAS
# ========================

def coletar_markdowns(diretorio_base):
    arquivos_md = []
    for raiz, _, arquivos in os.walk(diretorio_base):
        for arquivo in arquivos:
            if arquivo.endswith(".md"):
                caminho_completo = os.path.join(raiz, arquivo)
                data_modificacao = datetime.fromtimestamp(os.path.getmtime(caminho_completo)).date()
                arquivos_md.append({
                    "caminho": caminho_completo,
                    "data": data_modificacao
                })
    return arquivos_md

def carregar_conteudo_arquivos(lista_arquivos):
    conteudos = []
    for item in lista_arquivos:
        caminho = item["caminho"]
        try:
            with open(caminho, 'r', encoding='utf-8') as f:
                conteudos.append({
                    "caminho": caminho,
                    "data": item["data"],
                    "conteudo": f.read()
                })
        except Exception as e:
            print(f"Erro ao ler {caminho}: {e}")
    return conteudos

def resumir_com_openai(texto, caminho, parte=None):
    titulo_arquivo = os.path.basename(caminho)
    parte_info = f" (Parte {parte})" if parte else ""
    prompt = textwrap.dedent(f"""
        Voc√™ √© um assistente que resume arquivos Markdown de forma objetiva e concisa.
        Resuma brevemente o conte√∫do do arquivo: **{titulo_arquivo}{parte_info}**.

        Formato do resumo:
        - **T√≠tulo** (se houver)
        - **Principais t√≥picos**
        - **Ideias centrais ou insights**
        - **Refer√™ncias importantes (se houver)**
        
        Seja direto, use frases curtas e foque apenas no essencial.

        Texto:
        {texto}
    """)

    try:
        resposta = openai.ChatCompletion.create(
            model="gpt-3.5-turbo",
            messages=[
                {"role": "system", "content": "Voc√™ √© um assistente que resume arquivos Markdown com precis√£o e concis√£o."},
                {"role": "user", "content": prompt}
            ],
            temperature=0.2,
            max_tokens=400  # Resumo mais curto
        )
        return resposta['choices'][0]['message']['content']
    except Exception as e:
        return f"[ERRO AO CONSULTAR LLM]: {e}"


def dividir_texto(texto, max_chars):
    partes = []
    while len(texto) > max_chars:
        corte = texto[:max_chars].rfind("\n\n")
        if corte == -1:
            corte = max_chars
        partes.append(texto[:corte])
        texto = texto[corte:]
    partes.append(texto)
    return partes

def processar_arquivo(item):
    caminho = item["caminho"]
    texto = item["conteudo"]

    partes = dividir_texto(texto, MAX_CHARS)
    resumos_parciais = []

    for idx, parte in enumerate(partes):
        resumo = resumir_com_openai(parte, caminho, parte=(idx+1) if len(partes) > 1 else None)
        resumos_parciais.append(resumo)

    if len(resumos_parciais) > 1:
        resumo_final = resumir_com_openai("\n\n".join(resumos_parciais), caminho)
    else:
        resumo_final = resumos_parciais[0]

    return resumo_final

# ========================
# MAIN
# ========================

if __name__ == "__main__":
    print("üîç Coletando arquivos Markdown...")
    arquivos = coletar_markdowns(CAMINHO_PASTA)
    print(f"‚úÖ {len(arquivos)} arquivos encontrados.\n")

    conteudos = carregar_conteudo_arquivos(arquivos)

    # Agrupar arquivos por data
    arquivos_por_data = defaultdict(list)
    for item in conteudos:
        arquivos_por_data[item["data"]].append(item)

    # Ordenar por data decrescente
    datas_ordenadas = sorted(arquivos_por_data.keys(), reverse=True)

    for data in datas_ordenadas:
        print(f"\nüóìÔ∏è Data: {data}")
        print("=" * 100)
        for item in arquivos_por_data[data]:
            print(f"\nüìÑ Resumo do arquivo: {os.path.basename(item['caminho'])}")
            print("-" * 80)
            resumo = processar_arquivo(item)
            print(resumo)
            print("\n" + "-" * 80)


api key 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
path C:\Users\nonak\Documents\Thoughts\Atlas\03_SNIPPETS


üîç Coletando arquivos Markdown...
‚úÖ 5 arquivos encontrados.


üóìÔ∏è Data: 2025-05-03

üìÑ Resumo do arquivo: snip-openai-agent-llm-classificacao-v-df-pandas.md
--------------------------------------------------------------------------------
- **T√≠tulo**: Cria√ß√£o de um Agente de Classifica√ß√£o de Colunas em DataFrames Pandas
- **Principais t√≥picos**:
  - Fun√ß√£o `classificar_dataframe` para classificar textos em um DataFrame usando a API da OpenAI
  - Par√¢metros da fun√ß√£o e suas descri√ß√µes
  - Processamento em lote ou individualmente
  - Solicita√ß√£o de inputs do usu√°rio para chave de API e prompt do sistema
  - Utiliza√ß√£o de prompt padr√£o se o usu√°rio n√£o fornecer um
  - Classifica√ß√£o de um DataFrame com base em texto e sentimento
- **Ideias centrais ou insights**:
  - Fun√ß√£o que classifica textos em um DataFrame usando a API da OpenAI, preenchendo uma coluna de classifica√ß√£o
  - Configura√ß√£o do modelo da OpenAI, instru√ß√£o do sistema, aleatoriedade da