请问如何让程序并行执行，用到多GPU卡 #37

amwork2020 · 2023-08-30T07:03:31Z

起始日期 | Start Date

No response

实现PR | Implementation PR

No response

摘要 | Summary

请问如何让程序并行执行，用到多GPU卡

基本示例 | Basic Example

请问如何让程序并行执行，用到多GPU卡
修改 device_map = "cuda" 为 device_map = "auto"
程序用了多卡，但报错：
RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:2 and cuda:3!

缺陷 | Drawbacks

请问如何让程序并行执行，用到多GPU卡

未解决问题 | Unresolved questions

No response

Luccadoremi · 2023-10-09T10:47:58Z

same issue，any solution？

ShuaiBai623 · 2023-10-16T05:59:00Z

如果是多卡测试，可以参考eval_mm/evaluate_caption.py 的实现来进行多卡和组batch执行

Keep-lucky · 2023-10-18T12:22:59Z

如果是多卡测试，可以参考eval_mm/evaluate_caption.py 的实现来进行多卡和组batch执行

我尝试这样做，但是使用model.generate()的方法, 生成效果远远不如model.chat()，请问model.chat()有批量推理的方法嘛？

atomrun39 · 2023-10-26T02:35:43Z

如果是多卡测试，可以参考eval_mm/evaluate_caption.py 的实现来进行多卡和组batch执行

我尝试这样做，但是使用model.generate()的方法, 生成效果远远不如model.chat()，请问model.chat()有批量推理的方法嘛？

同求，请问该怎么实现啊 @ShuaiBai623

iFe1er · 2023-10-26T03:41:45Z

同样的问题求助 @ShuaiBai623

CrazyBrick · 2023-10-27T10:22:09Z

同样的问题求助 @ShuaiBai623

FangGet · 2023-11-06T02:37:08Z

HF上提供了一个qwen_generation_utils.py，循环调用里面make_context函数，组batch，然后调用generate函数和他提供的decode_token函数就好了

peytoncai · 2024-01-05T10:41:32Z

所以结论是qwen vl不支持多卡推理？官方没计划支持吗？

drockser · 2024-02-26T08:37:08Z

HF上提供了一个qwen_generation_utils.py，循环调用里面make_context函数，组batch，然后调用generate函数和他提供的decode_token函数就好了

这个要求输入的query长度必须一致，如果长度不一致的话，现在好像没有合适的padding方法。

ybshaw · 2024-05-10T09:10:23Z

同问，4卡RTX，共96G显存，推理的时候只在第一张卡上执行，指定多卡的话又报错：RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:2 and cuda:3!，请问推理的时候有办法分布到多卡上执行么

cnahmgx · 2024-05-22T13:10:09Z

@ybshaw 问题解决了么？

ybshaw · 2024-05-23T03:35:26Z

@ybshaw 问题解决了么？

没有，目前采用int4版本，可以单卡跑

yihp · 2024-06-24T15:05:41Z

请问大佬儿们有解决方案了吗？

amwork2020 added the question Further information is requested label Aug 30, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

请问如何让程序并行执行，用到多GPU卡 #37

请问如何让程序并行执行，用到多GPU卡 #37

amwork2020 commented Aug 30, 2023

Luccadoremi commented Oct 9, 2023

ShuaiBai623 commented Oct 16, 2023

Keep-lucky commented Oct 18, 2023 •

edited

Loading

atomrun39 commented Oct 26, 2023

iFe1er commented Oct 26, 2023

CrazyBrick commented Oct 27, 2023

FangGet commented Nov 6, 2023

peytoncai commented Jan 5, 2024

drockser commented Feb 26, 2024

ybshaw commented May 10, 2024

cnahmgx commented May 22, 2024

ybshaw commented May 23, 2024

yihp commented Jun 24, 2024

请问如何让程序并行执行，用到多GPU卡 #37

请问如何让程序并行执行，用到多GPU卡 #37

Comments

amwork2020 commented Aug 30, 2023

起始日期 | Start Date

实现PR | Implementation PR

相关Issues | Reference Issues

摘要 | Summary

基本示例 | Basic Example

缺陷 | Drawbacks

未解决问题 | Unresolved questions

Luccadoremi commented Oct 9, 2023

ShuaiBai623 commented Oct 16, 2023

Keep-lucky commented Oct 18, 2023 • edited Loading

atomrun39 commented Oct 26, 2023

iFe1er commented Oct 26, 2023

CrazyBrick commented Oct 27, 2023

FangGet commented Nov 6, 2023

peytoncai commented Jan 5, 2024

drockser commented Feb 26, 2024

ybshaw commented May 10, 2024

cnahmgx commented May 22, 2024

ybshaw commented May 23, 2024

yihp commented Jun 24, 2024

Keep-lucky commented Oct 18, 2023 •

edited

Loading