v0.1.1 - 文字区域识别与画笔编辑稳定性
这是一个小版本更新,重点修复真实编辑流程中的两个问题:图片里的文字难以被选中,以及画笔编辑在等待本地 Codex CLI 时反馈不清晰。
新增
- 增加标题/文字区域检测,自动分割时会优先给出
标题文字、文字区域候选。 - 增加 Logo 场景处理:Logo 里的字会尽量和图形标识合并为
品牌标识,避免把 Logo 字母单独拆成文字块。 - LLM 语义分割提示词同步更新:保留有意义的文字候选,但品牌 Logo 作为整体处理。
改进
- 画笔区域编辑请求改为只提交原图和黑白 mask,不再提交大号半透明 overlay,降低大图请求失败概率。
- 编辑生成时在右侧结果画板显示等待时长,并提示本地 Codex CLI 通常需要 3-6 分钟。
- 编辑失败时在右侧画板显示具体错误原因,方便排查 provider、接口或 Codex CLI 问题。
- 后端增加编辑请求日志,记录 provider、原图、mask 和尺寸。
- 新增
CHANGELOG.md,README 增加版本说明入口。
验证
npm run check通过。- 已用画笔 mask 复现
/api/edit,本地 Codex CLI 成功返回 1672x941 编辑结果。
Commit 范围
6cf47b2Add text-aware segmentation candidates282b5b1Improve brush edit request handlinga0af56bPrepare v0.1.1 release