In [None]:
'''
prompt:
Escreva código python que gera um crawler de https://www.oabnamedida.com.br/questoes-comentadas?page=1, onde page vai de 1 até 343.

Para cada página, preciso que você "clique" nos botões cujo texto é "Comentários do professor", para que o conteúdo completo da página seja exibido. A seguir, salve a página como PDF no arquivo oab-[numero da pagina].pdf. Espere 60 segundos entre cada página.

Page.printToPDF retorna os dados em base64.

O código deve abrir um browser para que eu me autentique, e depois ele pode fazer seu trabalho.

'''

In [None]:
pip install selenium webdriver-manager


In [2]:
import time
import os
import base64
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

BASE_URL = "https://www.oabnamedida.com.br/questoes-comentadas?page={}"
DESTINATION_PATH = "C:/Users/pedro/Downloads/law-cognitive-structure"

def save_as_pdf(driver, output_path):
    pdf = driver.execute_cdp_cmd("Page.printToPDF", {
        "printBackground": True
    })
    with open(output_path, "wb") as f:
        f.write(base64.b64decode(pdf['data']))

def create_driver():
    chrome_options = Options()
    # REMOVE o modo headless para abrir o navegador
    # chrome_options.add_argument('--headless')
    chrome_options.add_argument('--disable-gpu')
    chrome_options.add_argument('--no-sandbox')
    chrome_options.add_argument('--disable-dev-shm-usage')
    chrome_options.add_argument('--kiosk-printing')

    chrome_prefs = {
        'printing.print_preview_sticky_settings.appState':
        '{"recentDestinations":[{"id":"Save as PDF","origin":"local"}],"selectedDestinationId":"Save as PDF","version":2}',
        'savefile.default_directory': os.getcwd()
    }
    chrome_options.add_experimental_option('prefs', chrome_prefs)

    driver = webdriver.Chrome(options=chrome_options)
    driver.set_window_size(1920, 1080)
    return driver

def wait_for_manual_login(driver):
    print("🔐 Faça login manualmente no navegador que foi aberto.")
    print("✅ Após o login, pressione ENTER aqui para continuar...")
    input()

def crawl_oab_pages(start=1, end=343):
    driver = create_driver()

    # Abre a primeira página para login manual
    driver.get(BASE_URL.format(1))
    wait_for_manual_login(driver)

    for page_num in range(start, end + 1):
        print(f"\n🔎 Acessando página {page_num}...")
        url = BASE_URL.format(page_num)
        driver.get(url)

        try:
            WebDriverWait(driver, 15).until(
                EC.presence_of_element_located((By.XPATH, "//button[contains(text(), 'Comentários do professor')]"))
            )
        except:
            print("⚠️ Conteúdo não carregado, tentando mesmo assim...")

        time.sleep(3)

        # Clica em todos os botões "Comentários do professor"
        buttons = driver.find_elements(By.XPATH, "//button[contains(text(), 'Comentários do professor')]")
        for btn in buttons:
            try:
                driver.execute_script("arguments[0].click();", btn)
                time.sleep(1)
            except Exception as e:
                print(f"Erro ao clicar no botão: {e}")

        time.sleep(2)

        # Salva como PDF
        output_filename = f"{DESTINATION_PATH}/oab-{page_num}.pdf"
        save_as_pdf(driver, output_filename)
        print(f"✅ Página salva: {output_filename}")

        time.sleep(10)

    driver.quit()

if __name__ == "__main__":
    crawl_oab_pages()


🔐 Faça login manualmente no navegador que foi aberto.
✅ Após o login, pressione ENTER aqui para continuar...

🔎 Acessando página 1...
✅ Página salva: C:/Users/pedro/Downloads/law-cognitive-structure/oab-1.pdf

🔎 Acessando página 2...
✅ Página salva: C:/Users/pedro/Downloads/law-cognitive-structure/oab-2.pdf

🔎 Acessando página 3...
✅ Página salva: C:/Users/pedro/Downloads/law-cognitive-structure/oab-3.pdf

🔎 Acessando página 4...
✅ Página salva: C:/Users/pedro/Downloads/law-cognitive-structure/oab-4.pdf

🔎 Acessando página 5...
✅ Página salva: C:/Users/pedro/Downloads/law-cognitive-structure/oab-5.pdf

🔎 Acessando página 6...
✅ Página salva: C:/Users/pedro/Downloads/law-cognitive-structure/oab-6.pdf

🔎 Acessando página 7...
✅ Página salva: C:/Users/pedro/Downloads/law-cognitive-structure/oab-7.pdf

🔎 Acessando página 8...
✅ Página salva: C:/Users/pedro/Downloads/law-cognitive-structure/oab-8.pdf

🔎 Acessando página 9...
✅ Página salva: C:/Users/pedro/Downloads/law-cognitive-structure/o