Skip to content

v0.1.1 - 文字区域识别与画笔编辑稳定性

Latest

Choose a tag to compare

@howardrock88 howardrock88 released this 13 May 08:10

v0.1.1 - 文字区域识别与画笔编辑稳定性

这是一个小版本更新,重点修复真实编辑流程中的两个问题:图片里的文字难以被选中,以及画笔编辑在等待本地 Codex CLI 时反馈不清晰。

新增

  • 增加标题/文字区域检测,自动分割时会优先给出 标题文字文字区域 候选。
  • 增加 Logo 场景处理:Logo 里的字会尽量和图形标识合并为 品牌标识,避免把 Logo 字母单独拆成文字块。
  • LLM 语义分割提示词同步更新:保留有意义的文字候选,但品牌 Logo 作为整体处理。

改进

  • 画笔区域编辑请求改为只提交原图和黑白 mask,不再提交大号半透明 overlay,降低大图请求失败概率。
  • 编辑生成时在右侧结果画板显示等待时长,并提示本地 Codex CLI 通常需要 3-6 分钟。
  • 编辑失败时在右侧画板显示具体错误原因,方便排查 provider、接口或 Codex CLI 问题。
  • 后端增加编辑请求日志,记录 provider、原图、mask 和尺寸。
  • 新增 CHANGELOG.md,README 增加版本说明入口。

验证

  • npm run check 通过。
  • 已用画笔 mask 复现 /api/edit,本地 Codex CLI 成功返回 1672x941 编辑结果。

Commit 范围

  • 6cf47b2 Add text-aware segmentation candidates
  • 282b5b1 Improve brush edit request handling
  • a0af56b Prepare v0.1.1 release