Replies: 3 comments
-
|
你遇到的多卡和单卡速度一样,是因为 MinerU 的多 GPU(multi_gpu_v2)架构是“多文件并行”,不是“单文件多卡加速”。也就是说,每个 GPU 只会处理独立的 PDF 文件,单个 PDF 不会被拆分到多张卡上处理,所以处理单个小文件时,多卡不会提升速度(哪怕你设置了 如果你想提升整体吞吐量,可以把多个 PDF 文件同时提交处理,并适当调高 如果你的场景是单个大文件、希望单文件多卡加速,目前 MinerU 的架构暂不支持,需要关注后续是否有相关功能更新。你可以用 总结:多卡只提升多文件并发,不提升单文件速度。建议批量处理 PDF 文件,或关注后续版本是否支持单文件多卡。 To reply, just mention @dosu. How did I do? Good | Irrelevant | Incorrect | Verbose | Hallucination | Report 🐛 | Other |
Beta Was this translation helpful? Give feedback.
-
|
你遇到的多卡(2×4090)和单卡速度一样,主要原因是:对于很小的任务(比如2页PDF),多GPU的数据并行带来的启动、同步和I/O开销会远大于计算本身,所以无法体现加速效果。MinerU 的多卡实现(如 multi_gpu_v2,基于 LitServe)在小批量任务下,PDF I/O、预处理/后处理、结果聚合等环节往往是串行的,只有大批量任务才能真正利用多卡的并行能力【详见 multi_gpu_v2 相关实现】。 建议你尝试用更大的批量(比如一次处理更多页或多个PDF),观察多卡是否有明显加速。如果只是单个小文件,建议用单卡即可。你也可以关注 multi_gpu_v2 项目和 Tensor Parallelism(TP)模式,或参考 README 的多卡建议 和 LitServe 相关说明。 如需进一步定位瓶颈,可以用 nvidia-smi 或 PyTorch 的 profiling 工具观察 GPU 利用率,判断是否真的跑满了两张卡。 To reply, just mention @dosu. Share context across your team and agents. Try Dosu. |
Beta Was this translation helpful? Give feedback.
-
|
页数太少看不出加速效果的,你可以拿一个100页以上的文档来测试,效果会比较明显 |
Beta Was this translation helpful? Give feedback.
Uh oh!
There was an error while loading. Please reload this page.
-
🔎 Search before asking | 提交之前请先搜索
🤖 Consult the online AI assistant for assistance | 在线 AI 助手咨询
Description of the bug | 错误描述
请问大佬,这个怎么优化?已经加了--dp-size 2 ,并且设置了 CUDA_VISIBLE_DEVICES=0,1
一个2页的pdf,需要用4秒, 2张4090和一张4090速度一样
怎么优化呢?
How to reproduce the bug | 如何复现
无
Operating System Mode | 操作系统类型
No response
Operating System Version| 操作系统版本
mineru2.1.0
Python version | Python 版本
3.10
Software version | 软件版本 (mineru --version)
No response
Device mode | 设备模式
cuda
Beta Was this translation helpful? Give feedback.
All reactions