Skip to content

v1.0.18

Choose a tag to compare

@jcarlosrodicio jcarlosrodicio released this 30 May 11:16
· 5 commits to master since this release

v1.0.18

Resumen

Esta release refuerza el flujo de automejora del harness alrededor de evidencia real de sesiones OpenCode y hace más auditable el comportamiento de /evolve, sin mezclar configuraciones privadas ni artefactos locales.

Cambios principales

1. /evolve ahora es OpenCode-first

  • La fuente base de evidencia pasa a ser OpenCode, no sesiones de Codex.
  • El flujo queda orientado a opencode.db como corpus principal.
  • Los raw exports siguen existiendo, pero como fuente suplementaria.

2. Ingesta de sesiones y staging de evidencia

  • Se añade un collector público para recolectar y normalizar session evidence.
  • El collector genera artefactos staged para AHE:
    • execution-trees.jsonl
    • normalized-sessions.jsonl
    • session-sources.summary.json
    • cursor.json

3. Evidencia por árbol de ejecución

  • La unidad principal de evidencia deja de ser la sesión plana.
  • Ahora /evolve trabaja con árboles completos:
    • root session
    • subagentes enlazados por parent_id
  • Esto alinea la evidencia con cómo realmente funciona OpenCode cuando delega.

4. Incremental por cursor canónico

  • El collector soporta revisión incremental.
  • El cursor se basa en:
    • tree_time_updated_max
    • root_session_id
  • Los raw exports no avanzan el cursor canónico.

5. Contrato más claro para AHE

  • Se documenta mejor la diferencia entre:
    • evidencia natural
    • prompts sintéticos/coercitivos
  • Se evita usar árboles coercitivos como prueba suficiente de regresión normal de routing.
  • Se endurece la distinción entre smoke rápido y suite larga del checker.

6. Mejoras de agentes y revisión

  • lead puede lanzar el collector de session evidence en el harness público.
  • evaluator puede ejecutar opencode run --format json --thinking * para transcript replay.
  • debugger prioriza artefactos staged y evita depender de scripting ad hoc para métricas mecánicas.

7. Checks y tests actualizados

  • El checker público se alinea con el nuevo contrato de /evolve.
  • Se añaden tests para el collector y para las reglas del nuevo flujo de evidencia.

Validación usada para publicar

  • ./scripts/check.sh
  • git diff --check

Impacto esperado

  • Mejor base para automejora del harness.
  • Menos falsos positivos en auditorías de routing.
  • Mejor trazabilidad entre evidencia, diagnóstico y cambio propuesto.
  • Contrato público más alineado con el comportamiento real de OpenCode.