In [56]:
# ============================================
# COMO MOSTRAR TODOS OS ATRIBUTOS DE UM OBJETO
# ============================================

import inspect
import json
from pprint import pprint

def mostrar_atributos(obj, nome="objeto"):
    """
    Fun√ß√£o utilit√°ria para mostrar todos os atributos de um objeto Python.
    
    Args:
        obj: O objeto a ser inspecionado
        nome: Nome descritivo do objeto (opcional)
    """
    print(f"\n{'='*60}")
    print(f"üìã INSPE√á√ÉO DO OBJETO: {nome}")
    print(f"{'='*60}\n")
    
    # 1. Tipo do objeto
    print(f"üîπ Tipo: {type(obj).__name__}")
    print(f"üîπ M√≥dulo: {type(obj).__module__}\n")
    
    # 2. Listar todos os atributos e m√©todos com dir()
    print("üìå TODOS OS ATRIBUTOS E M√âTODOS (dir()):")
    print("-" * 60)
    atributos = [attr for attr in dir(obj) if not attr.startswith('_')]
    for attr in atributos:
        print(f"  ‚Ä¢ {attr}")
    print()
    
    # 3. Atributos de inst√¢ncia (valores reais)
    print("üìå ATRIBUTOS DE INST√ÇNCIA (vars() ou __dict__):")
    print("-" * 60)
    try:
        if hasattr(obj, '__dict__'):
            for key, value in vars(obj).items():
                tipo_valor = type(value).__name__
                if isinstance(value, (str, int, float, bool, type(None))):
                    print(f"  ‚Ä¢ {key}: {value} ({tipo_valor})")
                elif isinstance(value, (list, dict)):
                    print(f"  ‚Ä¢ {key}: {tipo_valor} com {len(value)} item(s)")
                else:
                    print(f"  ‚Ä¢ {key}: {tipo_valor}")
        else:
            print("  (Objeto n√£o possui __dict__)")
    except Exception as e:
        print(f"  Erro ao acessar vars(): {e}")
    print()
    
    # 4. Informa√ß√µes de inspe√ß√£o (m√©todos, propriedades, etc.)
    print("üìå INFORMA√á√ïES DETALHADAS (inspect):")
    print("-" * 60)
    try:
        # Membros do objeto
        membros = inspect.getmembers(obj)
        metodos = [nome for nome, valor in membros if inspect.ismethod(valor) or inspect.isfunction(valor)]
        propriedades = [nome for nome, valor in membros if isinstance(valor, property)]
        
        if metodos:
            print(f"  üî∏ M√©todos ({len(metodos)}):")
            for metodo in metodos[:10]:  # Mostra apenas os primeiros 10
                print(f"     - {metodo}()")
            if len(metodos) > 10:
                print(f"     ... e mais {len(metodos) - 10} m√©todo(s)")
        
        if propriedades:
            print(f"  üî∏ Propriedades ({len(propriedades)}):")
            for prop in propriedades:
                print(f"     - {prop}")
    except Exception as e:
        print(f"  Erro na inspe√ß√£o: {e}")
    print()
    
    # 5. Tentar converter para dict se poss√≠vel (√∫til para Pydantic models)
    print("üìå REPRESENTA√á√ÉO EM DICT (se dispon√≠vel):")
    print("-" * 60)
    try:
        if hasattr(obj, 'model_dump'):
            # Pydantic v2
            dict_repr = obj.model_dump()
            print(json.dumps(dict_repr, indent=2, ensure_ascii=False, default=str)[:500])
        elif hasattr(obj, 'dict'):
            # Pydantic v1
            dict_repr = obj.dict()
            print(json.dumps(dict_repr, indent=2, ensure_ascii=False, default=str)[:500])
        elif hasattr(obj, '__dict__'):
            dict_repr = vars(obj)
            print(json.dumps(dict_repr, indent=2, ensure_ascii=False, default=str)[:500])
        else:
            print("  (N√£o √© poss√≠vel converter para dict)")
    except Exception as e:
        print(f"  Erro ao converter: {e}")
    
    print(f"\n{'='*60}\n")

# Exemplo de uso r√°pido (vers√£o simplificada)
def mostrar_atributos_rapido(obj):
    """Vers√£o r√°pida - mostra apenas os atributos principais"""
    print(f"\nüîç Atributos de {type(obj).__name__}:")
    print("-" * 40)
    for attr in dir(obj):
        if not attr.startswith('_'):
            try:
                valor = getattr(obj, attr)
                if not callable(valor):
                    tipo = type(valor).__name__
                    if isinstance(valor, (str, int, float, bool, type(None))):
                        print(f"  {attr}: {valor} ({tipo})")
                    elif isinstance(valor, (list, dict)):
                        print(f"  {attr}: {tipo} com {len(valor)} item(s)")
                    else:
                        print(f"  {attr}: {tipo}")
            except:
                print(f"  {attr}: (n√£o acess√≠vel)")
    print()

print("‚úÖ Fun√ß√µes de inspe√ß√£o carregadas!")
print("   Use: mostrar_atributos(objeto, 'nome_descritivo')")
print("   Ou:  mostrar_atributos_rapido(objeto)")



‚úÖ Fun√ß√µes de inspe√ß√£o carregadas!
   Use: mostrar_atributos(objeto, 'nome_descritivo')
   Ou:  mostrar_atributos_rapido(objeto)


In [None]:
# ============================================
# EXEMPLO: Inspecionar um CrawlResult
# ============================================

async def exemplo_inspecionar_resultado():
    """Exemplo de como inspecionar todos os atributos de um CrawlResult"""
    
    async with AsyncWebCrawler() as crawler:
        results = await crawler.arun(
            url="https://predictus.inf.br/",
            config=CrawlerRunConfig()
        )
        
        if results:
            result = results[0]  # Pega o primeiro resultado
            
            # Op√ß√£o 1: Usar a fun√ß√£o completa
            mostrar_atributos(result, "CrawlResult")
            
            # Op√ß√£o 2: Usar a vers√£o r√°pida
            # mostrar_atributos_rapido(result)
            
            # Op√ß√£o 3: M√©todos manuais r√°pidos
            print("\n" + "="*60)
            print("üîß M√âTODOS MANUAIS R√ÅPIDOS:")
            print("="*60)
            
            print("\n1Ô∏è‚É£ dir() - Lista todos os atributos:")
            print([attr for attr in dir(result) if not attr.startswith('_')][:10])
            
            print("\n2Ô∏è‚É£ vars() ou __dict__ - Atributos de inst√¢ncia:")
            for key in list(vars(result).keys())[:5]:
                print(f"   {key}: {type(getattr(result, key)).__name__}")
            
            print("\n3Ô∏è‚É£ type() - Tipo do objeto:")
            print(f"   {type(result)}")
            
            print("\n4Ô∏è‚É£ hasattr() - Verificar se tem atributo espec√≠fico:")
            print(f"   Tem 'markdown'? {hasattr(result, 'markdown')}")
            print(f"   Tem 'links'? {hasattr(result, 'links')}")
            print(f"   Tem 'media'? {hasattr(result, 'media')}")
            
            print("\n5Ô∏è‚É£ getattr() - Acessar atributo com valor padr√£o:")
            print(f"   success: {getattr(result, 'success', 'N/A')}")
            print(f"   url: {getattr(result, 'url', 'N/A')}")
            
            return result

# Descomente para executar:
# await exemplo_inspecionar_resultado()



# üìö RESUMO: Como Mostrar Todos os Atributos de um Objeto em Python

## üîß M√©todos B√°sicos

### 1. **`dir(objeto)`** - Lista todos os atributos e m√©todos
```python
# Mostra tudo (incluindo m√©todos privados)
dir(resultado)

# Apenas atributos p√∫blicos
[attr for attr in dir(resultado) if not attr.startswith('_')]
```

### 2. **`vars(objeto)` ou `objeto.__dict__`** - Atributos de inst√¢ncia
```python
# Mostra apenas atributos de inst√¢ncia (valores reais)
vars(resultado)
resultado.__dict__
```

### 3. **`type(objeto)`** - Tipo do objeto
```python
type(resultado)  # <class 'crawl4ai.models.CrawlResult'>
type(resultado).__name__  # 'CrawlResult'
```

### 4. **`hasattr(objeto, 'atributo')`** - Verificar se tem atributo
```python
hasattr(resultado, 'markdown')  # True ou False
```

### 5. **`getattr(objeto, 'atributo', default)`** - Acessar com valor padr√£o
```python
getattr(resultado, 'markdown', None)  # Retorna None se n√£o existir
```

### 6. **`inspect` module** - Inspe√ß√£o avan√ßada
```python
import inspect

# Todos os membros
inspect.getmembers(resultado)

# Apenas m√©todos
[nome for nome, valor in inspect.getmembers(resultado) if inspect.ismethod(valor)]

# Apenas propriedades
[nome for nome, valor in inspect.getmembers(resultado) if isinstance(valor, property)]
```

## üéØ Para Objetos Espec√≠ficos

### Pydantic Models (v2)
```python
resultado.model_dump()  # Converte para dict
resultado.model_fields  # Campos do modelo
```

### Pydantic Models (v1)
```python
resultado.dict()  # Converte para dict
resultado.__fields__  # Campos do modelo
```

## üí° Exemplo Pr√°tico com CrawlResult

```python
# Inspecionar um resultado do crawl4ai
result = await crawler.arun(url="...")

# Ver todos os atributos
mostrar_atributos(result, "CrawlResult")

# Ou vers√£o r√°pida
mostrar_atributos_rapido(result)

# Ou manualmente
print([attr for attr in dir(result) if not attr.startswith('_')])
print(vars(result))
```



In [5]:
import asyncio
from crawl4ai import AsyncWebCrawler, CrawlResult, CrawlerRunConfig
from typing import List

In [13]:
async def demo_basic_crawl():
    """Basic web crawling with markdown generation"""

    print("\n=== 1. Basic Web Crawling ===")

    async with AsyncWebCrawler() as crawler:
        results: List[CrawlResult] = await crawler.arun(
            url="https://www.jusbrasil.com.br/noticias/",
            config=CrawlerRunConfig()
        )

        for i, result in enumerate(results):
            print(f"Result {i + 1}:")
            print(f"Success: {result.success}")

            if result.success:
                print(f"Markdown length: {len(result.markdown.raw_markdown)} chars")
                print(f"First 100 characters: {result.markdown.raw_markdown[:100]}...")
            else:
                print("Failed to crawl the URL")

In [14]:
await demo_basic_crawl()


=== 1. Basic Web Crawling ===


Result 1:
Success: True
Markdown length: 22383 chars
First 100 characters: Newsletter
Receba por e-mail as publica√ß√µes mais relevantes[Inscreva-se](https://www.jusbrasil.com.b...


In [15]:
async def demo_parallel_crawl():
    """Basic web crawling with markdown generation"""

    print("\n=== 2. Basic Web Crawling ===")

    urls = [
        "https://www.jusbrasil.com.br/noticias/",
        "https://predictus.inf.br/"
    ]

    async with AsyncWebCrawler() as crawler:
        results: List[CrawlResult] = await crawler.arun_many(
            urls=urls,
        )


        print(f"Crawled {len(results)} URL's in parallel")
        for i, result in enumerate(results):
            print(
                f"  {i + 1} - {result.url} - {'Success' if result.success else 'Failed'}"
            )

In [16]:
await demo_parallel_crawl()


=== 2. Basic Web Crawling ===


Crawled 2 URL's in parallel
  1 - https://www.jusbrasil.com.br/noticias/ - Success
  2 - https://predictus.inf.br/ - Success


In [3]:
from crawl4ai.markdown_generation_strategy import DefaultMarkdownGenerator
from crawl4ai.content_filter_strategy import PruningContentFilter

async def demo_fit_markdown():
    """"""
    
    print("\n=== 3. Fit Markdown with LLM Content Filter ===")

    async with AsyncWebCrawler() as crawler:
        result: CrawlResult = await crawler.arun(
            url="https://predictus.inf.br/",
            config=CrawlerRunConfig(
                markdown_generator=DefaultMarkdownGenerator(
                    content_filter=PruningContentFilter()
                )
            )
        )

        print(f"Raw: {len(result.markdown.raw_markdown)} chars")
        print(f"Fit: {len(result.markdown.fit_markdown)} chars")


In [6]:
await demo_fit_markdown()


=== 3. Fit Markdown with LLM Content Filter ===


Raw: 20394 chars
Fit: 13639 chars


In [7]:
import json

async def demo_midia_crawl():
    """Crawl a website with media files"""

    print("\n=== 4. Media Crawl ===")

    async with AsyncWebCrawler() as crawler:
        results: List[CrawlResult] = await crawler.arun(url="https://predictus.inf.br/")

        for i, result in enumerate(results):
            # extract and save all media
            images = result.media.get("images", [])
            print(f"Found {len(images)} images")

            # Extract and save all links (internal and external)
            internal_links = result.links.get("internal", [])
            external_links = result.links.get("external", [])
            print(f"Found {len(internal_links)} internal links")
            print(f"Found {len(external_links)} external links")

            # save all links to a file
            with open("images.json", "w") as f:
                json.dump(images, f, indent=2)

            with open("links.json", "w") as f:
                json.dump(
                    {
                        "internal": internal_links,
                        "external": external_links,
                    },
                    f,
                    indent=2
                )

In [8]:
await demo_midia_crawl()


=== 4. Media Crawl ===


Found 17 images
Found 23 internal links
Found 9 external links


In [12]:
import base64
import os
from pathlib import Path

async def demo_screenshot_and_pdf_crawl():
    """Crawl a website and save screenshot and PDF"""

    print("\n=== 5. Screenshot and PDF Crawl ===")

    # Obter o diret√≥rio atual
    current_dir = Path.cwd()
    tmp_dir = current_dir / "tmp"
    tmp_dir.mkdir(exist_ok=True)  # Criar o diret√≥rio tmp se n√£o existir

    async with AsyncWebCrawler() as crawler:
        results: List[CrawlResult] = await crawler.arun(
            url="https://predictus.inf.br/",
            config=CrawlerRunConfig(screenshot=True, pdf=True)
        )

        for i, result in enumerate(results):
            if result.screenshot:
                screenshot_path = tmp_dir / "exemple_screenshot.png"
                with open(screenshot_path, "wb") as f:
                    f.write(base64.b64decode(result.screenshot))
                print(f"Screenshot saved to {screenshot_path}")

            if result.pdf:
                pdf_path = tmp_dir / "exemple.pdf"
                with open(pdf_path, "wb") as f:
                    f.write(result.pdf)
                print(f"PDF saved to {pdf_path}")
                    

In [13]:
await demo_screenshot_and_pdf_crawl()


=== 5. Screenshot and PDF Crawl ===


Screenshot saved to /home/gabriel/Documentos/Projetos_Python/Projeto_Crawler_Juridico/testes/tmp/exemple_screenshot.png
PDF saved to /home/gabriel/Documentos/Projetos_Python/Projeto_Crawler_Juridico/testes/tmp/exemple.pdf


In [21]:
from crawl4ai import AsyncWebCrawler, BrowserConfig, CrawlerRunConfig, CacheMode, LLMConfig
from crawl4ai import LLMExtractionStrategy
from dotenv import load_dotenv, find_dotenv
import os

load_dotenv(find_dotenv())


GROQ_API_KEY = os.environ.get("GROQ_API_KEY", "")

async def demo_llm_structtured_extraction_no_schema():

    print("\n=== 6. LLM Structured Extraction (No Schema) ===")

    extraction_strategy = LLMExtractionStrategy(
        llm_config=LLMConfig(
            provider="groq/llama-3.3-70b-versatile",
            api_token=GROQ_API_KEY  # Ollama n√£o requer API key
        ),
        instruction="Esse √© o blog do JusBrasil, um site especializado em not√≠cias jur√≠dicas. Extraia todas as noticias e para cada uma eu qeuro que voc√™ traga o t√≠tulo, URL fonte e n√∫mero de coment√°rios",
        extract_type="schema",
        schema="{titile: string, url: string, comments: int}",
        extra_agrs={
            "temperature": 0.0,
            "max_tokens": 4096,
        },
        verbose=True
    )

    config = CrawlerRunConfig(extraction_strategy=extraction_strategy)

    async with AsyncWebCrawler() as crawler:
        results: List[CrawlResult] = await crawler.arun(
            url = "https://www.jusbrasil.com.br/noticias/", 
            config=config
        )

        for result in results:
            print(f"URL: {result.url}")
            print(f"Success: {result.success}")

            if result.success:
                data = json.loads(result.extracted_content)
                print(json.dumps(data, indent=2))
            else:
                print("Failed to extract information")

In [22]:
await demo_llm_structtured_extraction_no_schema()


=== 6. LLM Structured Extraction (No Schema) ===


[LOG] Call LLM for https://www.jusbrasil.com.br/noticias/ - block index: 0
[LOG] Extracted 20 blocks from URL: https://www.jusbrasil.com.br/noticias/ block index: 0


URL: https://www.jusbrasil.com.br/noticias/
Success: True
[
  {
    "title": "Limite de idade unificado para ingresso na PM e Corpo de Bombeiros passa na CCJ",
    "url": "https://www.jusbrasil.com.br/noticias/limite-de-idade-unificado-para-ingresso-na-pm-e-corpo-de-bombeiros-passa-na-ccj/5340390608",
    "comments": 3,
    "error": false
  },
  {
    "title": "Aposentadoria especial para agentes de sa\u00fade ser\u00e1 votada na ter\u00e7a, anuncia Davi",
    "url": "https://www.jusbrasil.com.br/noticias/aposentadoria-especial-para-agentes-de-saude-sera-votada-na-terca-anuncia-davi/5324286431",
    "comments": 2,
    "error": false
  },
  {
    "title": "CPMI: Carlos Viana defende suspens\u00e3o de empr\u00e9stimos consignados de aposentados",
    "url": "https://www.jusbrasil.com.br/noticias/cpmi-carlos-viana-defende-suspensao-de-emprestimos-consignados-de-aposentados/5314638551",
    "comments": 3,
    "error": false
  },
  {
    "title": "Paciente ser\u00e1 indenizada em R$ 3 mil a

In [14]:
import os
import json
import asyncio
from typing import List
from pydantic import BaseModel, Field
from crawl4ai import AsyncWebCrawler, BrowserConfig, CrawlerRunConfig, CacheMode, LLMConfig
from crawl4ai import LLMExtractionStrategy

class Entity(BaseModel):
    name: str
    description: str

class Relationship(BaseModel):
    entity1: Entity
    entity2: Entity
    description: str
    relation_type: str

class KnowledgeGraph(BaseModel):
    entities: List[Entity]
    relationships: List[Relationship]

async def main():
    # LLM extraction strategy
    llm_strat = LLMExtractionStrategy(
        llmConfig = LLMConfig(provider="ollama/llama3.2", base_url="http://localhost:11434"),
        schema=KnowledgeGraph.model_json_schema(),
        extraction_type="schema",
        instruction="Extract entities and relationships from the content. Return valid JSON.",
        chunk_token_threshold=1400,
        apply_chunking=True,
        input_format="html",
        extra_args={"temperature": 0.1, "max_tokens": 2000}
    )

    crawl_config = CrawlerRunConfig(
        extraction_strategy=llm_strat,
        cache_mode=CacheMode.BYPASS
    )

    async with AsyncWebCrawler(config=BrowserConfig(headless=True)) as crawler:
        # Example page
        url = "https://www.jusbrasil.com.br/noticias/"
        result = await crawler.arun(url=url, config=crawl_config)

        print("--- LLM RAW RESPONSE ---")
        print(result.extracted_content)
        print("--- END LLM RAW RESPONSE ---")

        if result.success:
            with open("kb_result.json", "w", encoding="utf-8") as f:
                f.write(result.extracted_content)
            llm_strat.show_usage()
        else:
            print("Crawl failed:", result.error_message)




In [16]:
await main()


[1;31mGive Feedback / Get Help: https://github.com/BerriAI/litellm/issues/new[0m
LiteLLM.Info: If you need to debug this error, use `litellm._turn_on_debug()'.


[1;31mGive Feedback / Get Help: https://github.com/BerriAI/litellm/issues/new[0m
LiteLLM.Info: If you need to debug this error, use `litellm._turn_on_debug()'.


[1;31mGive Feedback / Get Help: https://github.com/BerriAI/litellm/issues/new[0m
LiteLLM.Info: If you need to debug this error, use `litellm._turn_on_debug()'.


[1;31mGive Feedback / Get Help: https://github.com/BerriAI/litellm/issues/new[0m
LiteLLM.Info: If you need to debug this error, use `litellm._turn_on_debug()'.


[1;31mGive Feedback / Get Help: https://github.com/BerriAI/litellm/issues/new[0m
LiteLLM.Info: If you need to debug this error, use `litellm._turn_on_debug()'.


[1;31mGive Feedback / Get Help: https://github.com/BerriAI/litellm/issues/new[0m
LiteLLM.Info: If you need to debug this error, use `litellm._turn_on_debug()'.


[1;31mGive Fee

--- LLM RAW RESPONSE ---
[
    {
        "index": 0,
        "error": true,
        "tags": [
            "error"
        ],
        "content": "litellm.AuthenticationError: AuthenticationError: OpenAIException - The api_key client option must be set either by passing api_key to the client or by setting the OPENAI_API_KEY environment variable"
    },
    {
        "index": 1,
        "error": true,
        "tags": [
            "error"
        ],
        "content": "litellm.AuthenticationError: AuthenticationError: OpenAIException - The api_key client option must be set either by passing api_key to the client or by setting the OPENAI_API_KEY environment variable"
    },
    {
        "index": 2,
        "error": true,
        "tags": [
            "error"
        ],
        "content": "litellm.AuthenticationError: AuthenticationError: OpenAIException - The api_key client option must be set either by passing api_key to the client or by setting the OPENAI_API_KEY environment variable"
  

In [7]:
import os
import asyncio
from typing import List
from dotenv import load_dotenv, find_dotenv

# Importa√ß√µes das ferramentas solicitadas
from tavily import TavilyClient
from crawl4ai import AsyncWebCrawler

# Carrega vari√°veis de ambiente
load_dotenv(find_dotenv())

# Configura√ß√£o de Arquivo de Sa√≠da
OUTPUT_FILE = "predictus_knowledge_base.md"

def search_tavily(query: str, max_results: int = 5) -> List[str]:
    """
    Realiza a busca no Tavily e retorna uma lista de URLs.
    """
    api_key = os.getenv("TAVILY_API_KEY")
    if not api_key:
        raise ValueError("A chave TAVILY_API_KEY n√£o foi encontrada no arquivo .env")

    print(f"Iniciando pesquisa Tavily para: '{query}'...")
    
    tavily_client = TavilyClient(api_key=api_key)
    
    # search_depth="advanced" garante resultados mais profundos e de melhor qualidade
    response = tavily_client.search(
        query=query, 
        search_depth="advanced", 
        max_results=max_results
    )
    
    urls = [result['url'] for result in response.get('results', [])]
    
    print(f"‚úÖ Encontradas {len(urls)} URLs relevantes.")
    return urls


In [25]:
async def crawl_and_save(urls: List[str]):
    """
    Recebe lista de URLs, extrai Markdown via Crawl4AI em paralelo e salva em arquivo.
    """
    if not urls:
        print("‚ö†Ô∏è Nenhuma URL para processar.")
        return

    print("Iniciando Deep Crawling com Crawl4AI...")
    
    async with AsyncWebCrawler() as crawler:
        results = await crawler.arun_many(urls)
        
        print(f"Gravando resultados em {OUTPUT_FILE}...")
        
        with open(OUTPUT_FILE, "w", encoding="utf-8") as f:
            # Cabe√ßalho do Arquivo
            f.write(f"# Base de Conhecimento: Predictus\n")
            f.write(f"Gerado automaticamente via Tavily + Crawl4AI\n\n")
            
            for result in results:
                if result.success:
                    # Formata√ß√£o visual para separar as fontes no arquivo final
                    f.write(f"\n{'='*40}\n")
                    f.write(f"FONTE: {result.url}\n")
                    f.write(f"{'='*40}\n\n")
                    
                    # O conte√∫do Markdown limpo gerado pelo Crawl4AI
                    f.write(result.markdown)
                    
                    print(f"  -> Sucesso: {result.url}")
                else:
                    print(f"  -> Falha ao ler: {result.url} | Erro: {result.error_message}")


In [None]:
async def main():
    # 1. Defini√ß√£o da Query
    # Focamos em "Solu√ß√µes" e "Produtos" para pegar o core business da empresa
    query = "Predictus empresa solu√ß√µes de tecnologia para o setor jur√≠dico no Brasil."
    
    # 2. Busca (Tavily)
    try:
        urls = search_tavily(query, max_results=10)
    except Exception as e:
        print(f"Erro fatal na busca: {e}")
        return

    # 3. Extra√ß√£o e Grava√ß√£o (Crawl4AI)
    if urls:
        await crawl_and_save(urls)
        print("\nüéâ Processo finalizado com sucesso!")

In [16]:
await main()

Iniciando pesquisa Tavily para: 'Predictus empresa solu√ß√µes de tecnologia para o setor jur√≠dico no Brasil.'...
‚úÖ Encontradas 2 URLs relevantes.
üöÄ Iniciando processamento em BATCH de 2 URLs...


‚úÖ Sucesso: https://centraldodireito.com.br/noticias/predictus-apresenta-novas-solucoes-de-analise-juridica-com-ia-na-fenalaw-2025
‚úÖ Sucesso: https://inforchannel.com.br/2025/04/23/predictus-lanca-software-capaz-de-prever-resultados-de-processos-judiciais/

üìä Total de produtos extra√≠dos: 2
üíæ Arquivo 'batch_products_extracted.json' salvo com sucesso.


In [20]:
import os
import asyncio
import json
from typing import List
from dotenv import load_dotenv
from pydantic import BaseModel, Field

from crawl4ai import AsyncWebCrawler, CrawlerRunConfig, CacheMode, LLMConfig
from crawl4ai.extraction_strategy import LLMExtractionStrategy
from crawl4ai.markdown_generation_strategy import DefaultMarkdownGenerator

load_dotenv()

# 1. O Schema (O Contrato de Dados)
class ProductInfo(BaseModel):
    product_name: str = Field(..., description="Nome do produto ou solu√ß√£o.")
    summary: str = Field(..., description="Resumo breve do que o produto faz.")
    key_features: List[str] = Field(..., description="Lista dos principais diferenciais.")

# 2. A Configura√ß√£o Mestra (Reuse Configuration)
# Criamos a configura√ß√£o UMA vez e aplicamos a TODAS as URLs do lote.
def get_crawler_config():
    # A. Limpeza Visual (Tira imagens e links)
    md_generator = DefaultMarkdownGenerator(
        options={
            "ignore_images": True,
            "ignore_links": True,
            "escape_html": True
        }
    )

    # B. Estrat√©gia de Intelig√™ncia (Extrai JSON)
    llm_strategy = LLMExtractionStrategy(
        llm_config=LLMConfig(
            provider="openai/gpt-4o-mini", # Use mini para batch (mais barato e r√°pido)
            api_token=os.getenv("OPENAI_API_KEY"),
        ),
        schema=ProductInfo.model_json_schema(),
        extraction_type="schema",
        instruction="Extraia informa√ß√µes sobre produtos. Se n√£o houver produtos, retorne null."
    )

    # C. Objeto de Configura√ß√£o
    return CrawlerRunConfig(
        cache_mode=CacheMode.BYPASS,
        markdown_generator=md_generator,
        extraction_strategy=llm_strategy,
        exclude_external_links=True,
        remove_overlay_elements=True,
        word_count_threshold=10
    )

async def process_batch_urls(urls: List[str]):
    print(f"üöÄ Iniciando processamento em BATCH de {len(urls)} URLs...")
    
    # Instanciamos a config
    batch_config = get_crawler_config()

    async with AsyncWebCrawler() as crawler:
        # --- A M√ÅGICA ACONTECE AQUI ---
        # Passamos a lista de URLs e a mesma config para todas.
        # O Crawl4AI gerencia a concorr√™ncia internamente.
        results = await crawler.arun_many(
            urls=urls,
            config=batch_config 
        )

        processed_data = []

        # Iteramos sobre os resultados (que voltam na mesma ordem da lista)
        for result in results:
            if result.success:
                print(f"‚úÖ Sucesso: {result.url}")
                try:
                    # O conte√∫do extra√≠do √© uma string JSON. Convertemos para dict.
                    data = json.loads(result.extracted_content)
                    
                    # √Äs vezes o LLM retorna uma lista de produtos por p√°gina, √†s vezes um objeto.
                    # Normalizamos para garantir estrutura.
                    if isinstance(data, list):
                        for item in data:
                            item['source_url'] = result.url # Rastreabilidade
                            processed_data.append(item)
                    else:
                        data['source_url'] = result.url
                        processed_data.append(data)
                        
                except json.JSONDecodeError:
                    print(f"‚ö†Ô∏è Aviso: LLM n√£o retornou JSON v√°lido para {result.url}")
            else:
                print(f"‚ùå Falha ao acessar {result.url}: {result.error_message}")

        return processed_data


async def main():
    # Lista de URLs para teste (Simulando o retorno do Tavily)
    query = "Predictus empresa solu√ß√µes de tecnologia para o setor jur√≠dico no Brasil."
    
    try:
        urls = search_tavily(query, max_results=2)
    except Exception as e:
        print(f"Erro fatal na busca: {e}")
        return

    all_products = await process_batch_urls(urls)

    if all_products:
        print(f"\nüìä Total de produtos extra√≠dos: {len(all_products)}")
        
        # Salvando o resultado consolidado
        with open("batch_products_extracted.json", "w", encoding="utf-8") as f:
            json.dump(all_products, f, indent=2, ensure_ascii=False)
            print("üíæ Arquivo 'batch_products_extracted.json' salvo com sucesso.")

await main()

Iniciando pesquisa Tavily para: 'Predictus empresa solu√ß√µes de tecnologia para o setor jur√≠dico no Brasil.'...
‚úÖ Encontradas 2 URLs relevantes.
üöÄ Iniciando processamento em BATCH de 2 URLs...


‚úÖ Sucesso: https://inforchannel.com.br/2025/04/23/predictus-lanca-software-capaz-de-prever-resultados-de-processos-judiciais/
‚úÖ Sucesso: https://centraldodireito.com.br/noticias/predictus-apresenta-novas-solucoes-de-analise-juridica-com-ia-na-fenalaw-2025

üìä Total de produtos extra√≠dos: 4
üíæ Arquivo 'batch_products_extracted.json' salvo com sucesso.


## Teste de extra√ß√£o de produtos Predictus

In [1]:
import os
import json
from typing import List
from dotenv import load_dotenv, find_dotenv
from pydantic import BaseModel, Field

from crawl4ai import AsyncWebCrawler, CrawlerRunConfig, CacheMode, LLMConfig
from crawl4ai.extraction_strategy import LLMExtractionStrategy
from crawl4ai.markdown_generation_strategy import DefaultMarkdownGenerator

load_dotenv(find_dotenv())

True

In [2]:
# 1. O Schema (O Contrato de Dados)
class ProductInfo(BaseModel):
    product_name: str = Field(..., description="Nome do produto ou solu√ß√£o.")
    summary: str = Field(..., description="Resumo breve do que o produto faz.")
    key_features: List[str] = Field(..., description="Lista dos principais diferenciais.")

In [3]:
async def extract_clean_products(urls: List[str]):

    md_generator = DefaultMarkdownGenerator(
        options={
            "ignore_images": True,
            "ignore_links": True,
            "escape_html": True
        }
    )

    llm_strategy = LLMExtractionStrategy(
        llm_config=LLMConfig(
            # provider="groq/llama-3.3-70b-versatile",
            # api_token=os.getenv("GROQ_API_KEY"),
            provider="openai/gpt-4o-mini",
            api_token=os.getenv("OPENAI_API_KEY"),
            temperature=0
        ),
        schema=ProductInfo.model_json_schema(), # Passamos o esquema definido acima
        extraction_type="schema",
        instruction=(
            "Analise o conte√∫do da p√°gina e extraia informa√ß√µes APENAS sobre "
            "produtos, servi√ßos ou solu√ß√µes de software oferecidos pela empresa. "
            "Ignore hist√≥rico da empresa, not√≠cias, vagas de emprego ou rodap√©s."
        )
    )

    # 4. Configura√ß√£o da Execu√ß√£o
    crawl_config = CrawlerRunConfig(
        cache_mode=CacheMode.BYPASS, # Para garantir dados frescos
        markdown_generator=md_generator, # Aplica a limpeza visual
        extraction_strategy=llm_strategy, # Aplica a intelig√™ncia
        word_count_threshold=10, # Ignora blocos de texto muito curtos (menus, bot√µes)
        exclude_external_links=True, # N√£o segue links para fora
        remove_overlay_elements=True # Remove popups de cookies/chat
    )

    async with AsyncWebCrawler() as crawler:
        results = await crawler.arun_many(
            urls=urls,
            config=crawl_config
        )

        processed_data = []
        for result in results:
            if result.success:
                try:
                    data = json.loads(result.extracted_content)

                    if isinstance(data, list):
                        for item in data:
                            item['source_url'] = result.url
                            processed_data.append(item)
                    else:
                        data['source_url'] = result.url
                        processed_data.append(data)
                        
                except json.JSONDecodeError:
                    print(f"‚ö†Ô∏è Aviso: LLM n√£o retornou JSON v√°lido para {result.url}")
            else:
                print(f"‚ùå Falha ao acessar {result.url}: {result.error_message}")

        return processed_data


In [None]:
async def main():
    urls = [
        "https://predictus.inf.br/predictus_plataforma/",
        "https://predictus.inf.br/predictus-api/",
        "https://predictus.inf.br/predictus_jurimetria/"
    ]

    products_container = await extract_clean_products(urls)

    if products_container:
        with open("./tmp/predictus_products_clean.json", "w", encoding="utf-8") as f:
            json.dump(products_container, f, indent=2, ensure_ascii=False)


products_container = await main()

In [10]:
products = [product[0] for product in products_container]

## Workflow LangGraph - Extra√ß√£o, Dossi√™ e Prompt Template

Este workflow automatiza:
1. **Extra√ß√£o de Produtos**: Extrai informa√ß√µes de produtos das URLs
2. **Gera√ß√£o de Dossi√™**: Cria um dossi√™ completo usando LLM
3. **Cria√ß√£o de Prompt Template**: Gera um template de prompt com contexto dos produtos



In [4]:
# Imports para LangGraph
from typing import TypedDict, List, Annotated
from pathlib import Path
from langgraph.graph import StateGraph, START, END
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage, SystemMessage
import operator

# Definindo o State do workflow
class WorkflowState(TypedDict):
    """Estado compartilhado entre os nodes do workflow"""
    urls: List[str]  # URLs para extrair produtos
    extracted_products: List[dict]  # Produtos extra√≠dos (lista de JSON)
    dossier: str  # Dossi√™ completo gerado pela LLM
    prompt_template: str  # Template de prompt final com contexto



  from pydantic.v1.fields import FieldInfo as FieldInfoV1


In [5]:
# Node 1: Extra√ß√£o de Produtos (ass√≠ncrono)
async def extract_products_node(state: WorkflowState) -> WorkflowState:
    """
    Node ass√≠ncrono que extrai informa√ß√µes de produtos das URLs fornecidas.
    Usa o c√≥digo de extra√ß√£o existente.
    """
    print("üîç [Node 1] Iniciando extra√ß√£o de produtos...")
    
    urls = state.get("urls", [])
    if not urls:
        print("‚ö†Ô∏è Nenhuma URL fornecida")
        return {**state, "extracted_products": []}
    
    # Usa a fun√ß√£o extract_clean_products j√° definida
    extracted_products = await extract_clean_products(urls)
    
    print(f"‚úÖ [Node 1] Extra√≠dos {len(extracted_products)} produtos de {len(urls)} URLs")
    
    return {
        **state,
        "extracted_products": extracted_products
    }



In [15]:
# Node 2: Gera√ß√£o de Dossi√™ (ass√≠ncrono)
async def generate_dossier_node(state: WorkflowState) -> WorkflowState:
    """
    Node ass√≠ncrono que gera um dossi√™ completo das solu√ß√µes da empresa
    usando os produtos extra√≠dos.
    """
    print("üìù [Node 2] Gerando dossi√™ completo...")
    
    extracted_products = state.get("extracted_products", [])
    
    if not extracted_products:
        print("‚ö†Ô∏è Nenhum produto extra√≠do para gerar dossi√™")
        return {**state, "dossier": "Nenhum produto encontrado."}
    
    # Prepara o contexto dos produtos
    products_context = json.dumps(extracted_products, indent=2, ensure_ascii=False)
    
    # Configura o LLM
    llm = ChatOpenAI(
        model="gpt-4o-mini",
        temperature=0.3,
        api_key=os.getenv("OPENAI_API_KEY")
    )
    
    # Prompt para gerar o dossi√™
    system_prompt = """Voc√™ √© um analista especializado em documenta√ß√£o de produtos e solu√ß√µes tecnol√≥gicas.
    Sua tarefa √© criar um dossi√™ completo e profissional sobre as solu√ß√µes oferecidas pela empresa. Verifique
    SEMPRE se um produto que j√° foi abordado est√° sendo mecionado novamente e caso tiver uma correspond√™ncia de 
    70% de similaridade mantenha somente uma vers√£o do produto.
    EX: 
     - Predictus Jurimetria == Jurimetria: previs√µes baseadas em dados judiciais
     - Predictus Plataforma == Plataforma Web Predictus
    """
    
    user_prompt = f"""Com base nas informa√ß√µes dos produtos extra√≠dos abaixo, crie um dossi√™ completo e detalhado 
    sobre as solu√ß√µes oferecidas pela empresa Predictus.

    O dossi√™ deve incluir:
    1. Vis√£o geral da empresa e seu portf√≥lio
    2. Descri√ß√£o detalhada de cada solu√ß√£o/produto (deduplicada)
    3. Diferenciais competitivos
    4. Casos de uso e aplica√ß√µes
    5. Resumo executivo

    Informa√ß√µes dos produtos:
    {products_context}

    Gere um dossi√™ profissional, bem estruturado e completo."""
    
    # Gera o dossi√™
    messages = [
        SystemMessage(content=system_prompt),
        HumanMessage(content=user_prompt)
    ]
    
    response = await llm.ainvoke(messages)
    dossier = response.content
    
    print(f"‚úÖ [Node 2] Dossi√™ gerado com sucesso ({len(dossier)} caracteres)")
    
    return {
        **state,
        "dossier": dossier
    }



In [16]:
# Node 3: Cria√ß√£o de Prompt Template (ass√≠ncrono)
async def create_prompt_template_node(state: WorkflowState) -> WorkflowState:
    """
    Node ass√≠ncrono que cria um template de prompt com o contexto dos produtos
    e o dossi√™ gerado.
    """
    print("üìã [Node 3] Criando prompt template...")
    
    extracted_products = state.get("extracted_products", [])
    dossier = state.get("dossier", "")
    
    # Prepara o contexto dos produtos em formato JSON
    products_json = json.dumps(extracted_products, indent=2, ensure_ascii=False)
    
    # Cria o template de prompt
    prompt_template = f"""# Contexto da Empresa: Predictus

        ## Dossi√™ Completo das Solu√ß√µes

        {dossier}

        ## Produtos e Solu√ß√µes (JSON)

        ```json
        {products_json}
        ```

        ## Instru√ß√µes

        Use o contexto acima para responder perguntas sobre:
        - Produtos e solu√ß√µes oferecidos pela Predictus
        - Caracter√≠sticas e funcionalidades de cada solu√ß√£o
        - Casos de uso e aplica√ß√µes
        - Diferenciais competitivos

        Seja preciso e use as informa√ß√µes do contexto fornecido.
    """
    
    print(f"‚úÖ [Node 3] Prompt template criado com sucesso ({len(prompt_template)} caracteres)")
    
    return {
        **state,
        "prompt_template": prompt_template
    }



In [17]:
# Cria√ß√£o do Grafo LangGraph
def create_workflow_graph():
    """
    Cria e retorna o grafo do workflow LangGraph.
    """
    # Cria o grafo
    workflow = StateGraph(WorkflowState)
    
    # Adiciona os nodes
    workflow.add_node("extract_products", extract_products_node)
    workflow.add_node("generate_dossier", generate_dossier_node)
    workflow.add_node("create_prompt_template", create_prompt_template_node)
    
    # Define o fluxo: START -> extract -> generate -> create -> END
    workflow.add_edge(START, "extract_products")
    workflow.add_edge("extract_products", "generate_dossier")
    workflow.add_edge("generate_dossier", "create_prompt_template")
    workflow.add_edge("create_prompt_template", END)
    
    # Compila o grafo
    app = workflow.compile()
    
    return app

# Cria o grafo
workflow_app = create_workflow_graph()

print("‚úÖ Workflow LangGraph criado com sucesso!")
print("   Fluxo: START -> Extra√ß√£o -> Dossi√™ -> Prompt Template -> END")



‚úÖ Workflow LangGraph criado com sucesso!
   Fluxo: START -> Extra√ß√£o -> Dossi√™ -> Prompt Template -> END


In [18]:
# Fun√ß√£o para executar o workflow completo
async def run_workflow(urls: List[str]) -> dict:
    """
    Executa o workflow completo com as URLs fornecidas.
    
    Args:
        urls: Lista de URLs para extrair produtos
        
    Returns:
        Estado final do workflow com todos os resultados
    """
    print("üöÄ Iniciando workflow LangGraph...")
    print(f"   URLs: {len(urls)}")
    print("-" * 60)
    
    # Estado inicial
    initial_state: WorkflowState = {
        "urls": urls,
        "extracted_products": [],
        "dossier": "",
        "prompt_template": ""
    }
    
    # Executa o workflow
    final_state = await workflow_app.ainvoke(initial_state)
    
    print("-" * 60)
    print("‚úÖ Workflow conclu√≠do com sucesso!")
    
    return final_state

# Exemplo de uso:
# urls = [
#     "https://predictus.inf.br/predictus_plataforma/",
#     "https://predictus.inf.br/predictus-api/",
#     "https://predictus.inf.br/predictus_jurimetria/"
# ]
# result = await run_workflow(urls)



In [19]:
# Executar o workflow completo
urls_to_process = [
    "https://predictus.inf.br/predictus_plataforma/",
    "https://predictus.inf.br/predictus-api/",
    "https://predictus.inf.br/predictus_jurimetria/"
]

# Executa o workflow
workflow_result = await run_workflow(urls_to_process)

# Exibe os resultados
print("\n" + "="*60)
print("üìä RESULTADOS DO WORKFLOW")
print("="*60)

print(f"\n‚úÖ Produtos extra√≠dos: {len(workflow_result['extracted_products'])}")
print(f"‚úÖ Dossi√™ gerado: {len(workflow_result['dossier'])} caracteres")
print(f"‚úÖ Prompt template: {len(workflow_result['prompt_template'])} caracteres")

# Salva os resultados
output_dir = Path("./tmp")
output_dir.mkdir(exist_ok=True)

# Salva produtos extra√≠dos
with open(output_dir / "workflow_products.json", "w", encoding="utf-8") as f:
    json.dump(workflow_result['extracted_products'], f, indent=2, ensure_ascii=False)

# Salva dossi√™
with open(output_dir / "workflow_dossier.md", "w", encoding="utf-8") as f:
    f.write(workflow_result['dossier'])

# Salva prompt template
with open(output_dir / "workflow_prompt_template.md", "w", encoding="utf-8") as f:
    f.write(workflow_result['prompt_template'])

print(f"\nüíæ Arquivos salvos em: {output_dir}")
print("   - workflow_products.json")
print("   - workflow_dossier.md")
print("   - workflow_prompt_template.md")



üöÄ Iniciando workflow LangGraph...
   URLs: 3
------------------------------------------------------------
üîç [Node 1] Iniciando extra√ß√£o de produtos...


‚úÖ [Node 1] Extra√≠dos 11 produtos de 3 URLs
üìù [Node 2] Gerando dossi√™ completo...
‚úÖ [Node 2] Dossi√™ gerado com sucesso (6751 caracteres)
üìã [Node 3] Criando prompt template...
‚úÖ [Node 3] Prompt template criado com sucesso (12787 caracteres)
------------------------------------------------------------
‚úÖ Workflow conclu√≠do com sucesso!

üìä RESULTADOS DO WORKFLOW

‚úÖ Produtos extra√≠dos: 11
‚úÖ Dossi√™ gerado: 6751 caracteres
‚úÖ Prompt template: 12787 caracteres

üíæ Arquivos salvos em: tmp
   - workflow_products.json
   - workflow_dossier.md
   - workflow_prompt_template.md


In [11]:
# Visualizar o dossi√™ gerado
print("="*60)
print("üìÑ DOSSI√ä GERADO")
print("="*60)
print(workflow_result['dossier'])



üìÑ DOSSI√ä GERADO
# Dossi√™ de Solu√ß√µes da Predictus

## 1. Vis√£o Geral da Empresa e seu Portf√≥lio

A Predictus √© uma empresa inovadora que se destaca no mercado de tecnologia jur√≠dica, oferecendo solu√ß√µes que transformam dados judiciais em insights valiosos para advogados, departamentos jur√≠dicos e institui√ß√µes financeiras. Com um portf√≥lio diversificado, a Predictus disponibiliza ferramentas que v√£o desde an√°lises preditivas at√© integra√ß√µes de dados, permitindo que seus clientes tomem decis√µes informadas e estrat√©gicas.

### Portf√≥lio de Produtos
- **Predictus Jurimetria**
- **Plataforma Web Predictus**
- **API Predictus**
- **An√°lise de cr√©dito e risco**
- **Dilig√™ncia e an√°lise detalhada de processos via CNJ**
- **An√°lise e benchmarking de advogados**
- **Consulta customizada de processos via filtros**
- **Jurimetria: previs√µes baseadas em dados judiciais**
- **Integra√ß√µes simples e poderosas**
- **Predictus Plataforma**
- **Consultas para An√°lise de 

In [12]:
# Visualizar o prompt template criado
print("="*60)
print("üìã PROMPT TEMPLATE CRIADO")
print("="*60)
print(workflow_result['prompt_template'])



üìã PROMPT TEMPLATE CRIADO
# Contexto da Empresa: Predictus

        ## Dossi√™ Completo das Solu√ß√µes

        # Dossi√™ de Solu√ß√µes da Predictus

## 1. Vis√£o Geral da Empresa e seu Portf√≥lio

A Predictus √© uma empresa inovadora que se destaca no mercado de tecnologia jur√≠dica, oferecendo solu√ß√µes que transformam dados judiciais em insights valiosos para advogados, departamentos jur√≠dicos e institui√ß√µes financeiras. Com um portf√≥lio diversificado, a Predictus disponibiliza ferramentas que v√£o desde an√°lises preditivas at√© integra√ß√µes de dados, permitindo que seus clientes tomem decis√µes informadas e estrat√©gicas.

### Portf√≥lio de Produtos
- **Predictus Jurimetria**
- **Plataforma Web Predictus**
- **API Predictus**
- **An√°lise de cr√©dito e risco**
- **Dilig√™ncia e an√°lise detalhada de processos via CNJ**
- **An√°lise e benchmarking de advogados**
- **Consulta customizada de processos via filtros**
- **Jurimetria: previs√µes baseadas em dados judiciais**
- **

## üìä Diagrama do Workflow

```
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ  START  ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îò
     ‚îÇ
     ‚ñº
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ extract_products    ‚îÇ  ‚Üê Extrai produtos das URLs usando Crawl4AI
‚îÇ (Node Ass√≠ncrono)   ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
     ‚îÇ
     ‚ñº
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ generate_dossier    ‚îÇ  ‚Üê Gera dossi√™ completo usando LLM
‚îÇ (Node Ass√≠ncrono)   ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
     ‚îÇ
     ‚ñº
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ create_prompt_      ‚îÇ  ‚Üê Cria template de prompt com contexto
‚îÇ template            ‚îÇ
‚îÇ (Node Ass√≠ncrono)   ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
     ‚îÇ
     ‚ñº
‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ   END   ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
```

### Arquivos Gerados:
- `workflow_products.json`: Lista de produtos extra√≠dos
- `workflow_dossier.md`: Dossi√™ completo gerado pela LLM
- `workflow_prompt_template.md`: Template de prompt com contexto

