Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

在没有原文的情况下要怎么导入原文呢 #557

Closed
lhj5426 opened this issue Jan 15, 2024 · 7 comments
Closed

在没有原文的情况下要怎么导入原文呢 #557

lhj5426 opened this issue Jan 15, 2024 · 7 comments

Comments

@lhj5426
Copy link

lhj5426 commented Jan 15, 2024

这个问题很奇葩是吧
老哥请坐 看我讲来
是这样的
我是在做硬字幕的提取和翻译
然后我像用用 樱花模型 可手里唯一能够使用樱花自动批量的只有IT
然后把 我 用 专门提取硬字幕的工具已经提前把文本提取出来了
图1
image
然后2我把SRT变成了纯文本
图2
image
然后图片总数是 549张图
图3
image
之后我打开 IT 导入图片 建立全图文本框
image

然后我以为只要把文本做成 这个样子
图4
image
就可以导入到IT的原文里
结果我错了没报错也提示导入 但是什么都没有导入
我又用表格

image
把TXT改成了这种格式导入
问题来了原文里没有文本
译文里被填充上了
图5
image

然后我还不死心我像是不是不能用TXT换了DOC
图6
image
还是一样 译文被填充 原文空白

我实在不会了
能不能请老哥您教教我
怎么对原文进行 无中生有式填充 谢谢了

@xulihang
Copy link
Owner

目前上述方法只能导回译文。

导入原文的话,有导出所有文字区域图片和导入文字区域图片的OCR结果这两个操作。文字需要存放在image-index.txt里,其中index表示文字区域的序号。

@xulihang
Copy link
Owner

相关的issue:#124

@xulihang
Copy link
Owner

我可以加一个选项,从docx文件导回时也导回原文

@xulihang
Copy link
Owner

我想起来BasicCAT也有ChatGPT插件的,直接支持SRT格式

@lhj5426
Copy link
Author

lhj5426 commented Jan 16, 2024

相关的issue:#124*

哈哈这个方法不适用与我这个情况
我是把所有所有500张图片的文本OCR到了一个TXT里

image

image

这个功能是导入一个一个图片
image
一个图片对应一个TXT这种的
正好是 完全不同的两种用法

如果 可以让TXT 或者DOC 也支持导入原文就 更好了
2024-01-16-12 57 15

@xulihang
Copy link
Owner

导回翻译时同时导回原文的选项加在v2.8.2里了

@lhj5426
Copy link
Author

lhj5426 commented Jan 21, 2024

导回翻译时同时导回原文的选项加在v2.8.2里了

image
今天做视频 刚好用到 非常感谢!!!!

检测有点严格必须 双侧都有才会导入 原文和译文
image
也不麻烦 用 EmEditor 以制表符分割然后 复制粘贴到第二格就行了
image
总之很感谢 老哥 足够用了

@lhj5426 lhj5426 closed this as completed Jan 21, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants