v1.0.18
v1.0.18
Resumen
Esta release refuerza el flujo de automejora del harness alrededor de evidencia real de sesiones OpenCode y hace más auditable el comportamiento de /evolve, sin mezclar configuraciones privadas ni artefactos locales.
Cambios principales
1. /evolve ahora es OpenCode-first
- La fuente base de evidencia pasa a ser OpenCode, no sesiones de Codex.
- El flujo queda orientado a
opencode.dbcomo corpus principal. - Los raw exports siguen existiendo, pero como fuente suplementaria.
2. Ingesta de sesiones y staging de evidencia
- Se añade un collector público para recolectar y normalizar session evidence.
- El collector genera artefactos staged para AHE:
execution-trees.jsonlnormalized-sessions.jsonlsession-sources.summary.jsoncursor.json
3. Evidencia por árbol de ejecución
- La unidad principal de evidencia deja de ser la sesión plana.
- Ahora
/evolvetrabaja con árboles completos:- root session
- subagentes enlazados por
parent_id
- Esto alinea la evidencia con cómo realmente funciona OpenCode cuando delega.
4. Incremental por cursor canónico
- El collector soporta revisión incremental.
- El cursor se basa en:
tree_time_updated_maxroot_session_id
- Los raw exports no avanzan el cursor canónico.
5. Contrato más claro para AHE
- Se documenta mejor la diferencia entre:
- evidencia natural
- prompts sintéticos/coercitivos
- Se evita usar árboles coercitivos como prueba suficiente de regresión normal de routing.
- Se endurece la distinción entre smoke rápido y suite larga del checker.
6. Mejoras de agentes y revisión
leadpuede lanzar el collector de session evidence en el harness público.evaluatorpuede ejecutaropencode run --format json --thinking *para transcript replay.debuggerprioriza artefactos staged y evita depender de scripting ad hoc para métricas mecánicas.
7. Checks y tests actualizados
- El checker público se alinea con el nuevo contrato de
/evolve. - Se añaden tests para el collector y para las reglas del nuevo flujo de evidencia.
Validación usada para publicar
./scripts/check.shgit diff --check
Impacto esperado
- Mejor base para automejora del harness.
- Menos falsos positivos en auditorías de routing.
- Mejor trazabilidad entre evidencia, diagnóstico y cambio propuesto.
- Contrato público más alineado con el comportamiento real de OpenCode.