在持续进行对话时候GPU 内存占用飙升 #306

hhzleon · 2023-11-11T15:24:11Z

hhzleon
Nov 11, 2023

System Info / 系統信息

我的设备：
m1 pro 32+512

Who can help? / 谁可以帮助到您？

No response

Information / 问题信息

The official example scripts / 官方的示例脚本
My own modified scripts / 我自己修改的脚本和任务

Reproduction / 复现过程

无

Expected behavior / 期待表现

您好，我对 AI 智能领域知之甚少。当我成功部署 CHATGLM3 的时候，经过几轮连续对话，我的内存占用飙升。13G——26G，这可能是正常现象，也可能是不正常现象。当在服务器部署的时候，内存也会像在本地部署一样居高不下吗？
那岂不是在一台电脑上只能等待将内存吃的干干净净然后服务器待机吗？
显然可能不是这样的。

我猜测应该当对话进行的时候 GPU 会进行大量的运算，会占用大量内存，但是如果 history 清空了，应该就会回到占用少量内存的时候

实际上我history 清空以后再问问题，并没有看到内存占用有下落的迹象。这说明之前占用内存的会话还在，有没有办法把之前的给清理掉，当我清空 history 进行会话的时候，能让占用的内存下落。

之所以问这个问题是因为我希望这个模型能一直运行下去，不因为触碰到内存上限而导致各种问题出现。

zRzRzRzRzRzRzR · 2023-11-12T08:50:52Z

zRzRzRzRzRzRzR
Nov 12, 2023
Maintainer

mark，我们下周在测试一次，因为我清空历史的时候显存正常了所以之前关闭了issue

0 replies

hhzleon · 2023-11-12T10:11:59Z

hhzleon
Nov 12, 2023
Author

mark，我们下周在测试一次，因为我清空历史的时候显存正常了所以之前关闭了issue

您好，很高兴能看到有大佬愿意帮助我这个充满无知的小老弟，对您的行为表示感谢
下面是我的程序代码，可能会帮助你更好的理解我所遇到的情况

from transformers import AutoModel, AutoTokenizer
import json
tokenizer = AutoTokenizer.from_pretrained("/Users/houhaozhan/GPT/chatglm3-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("/Users/houhaozhan/GPT/chatglm3-6b", trust_remote_code=True).to('mps')
model = model.eval()
his = []
query = "你是一名网店，我不希望出现任何让客户认为你是机器人的话语，同时你应该尽可能去的促成单子成交，引导用户进行下单，并尽量让成交的金额变高。同时如果你对客户的要求或者问题不清楚，可以请求客户描述的更加精确。但注意你的措辞，回答尽可能用一句话来描述，少说点话。"
resp,his = model.chat(tokenizer,query,history=his)
print ("###[角色设定]",query)
query = "HWbook_LTS笔记本是什么配置？能给我介绍一下吗？"
notebook = """
英特尔 i11-13900k
内存 196GB
硬盘 256TB
显卡 RTX6090
4代雷电口*4
USB3.2*2
RJ45*1
4G 上网模块
8k 触摸 OLED屏幕
HWbook_LTS是 2025年9 月最新上架的机器，拥有不俗的游戏性能释放，除此之外，还能应用于其他的不同领域

质保 3 个月，人为损坏不保
6999元，优惠最低价 6799
"""
# resp,his = model.chat(tokenizer,notebook,history=his)
while True:
    query = input("USER: ")
    if (query=="clear"):
        print ("清空 history")
        his = []
    prompt = f"已知信息：\n{notebook}，根据已知信息回答问题：{query}"
    resp,his = model.chat(tokenizer,prompt,history=his)
    print ("BOT: ",resp)

开始运行时，内存为 12.78GB
在经历了几轮对话后，内存升至 22GB
当我执行 clear 指令进行 his 清理后，再进行会话，发现内存依旧是居高不下，我对 AI 知之甚少，希望您不要见怪

我查看内存的方式是 macos 的系统监视器，直接点击内存栏进行查看的。基于 MACOS独特的内存显存管理机制，我不知这样是否准确。但是当占用内存居高不下后，我的电脑处理事情会肉眼可见的发生卡顿

1 reply

hhzleon Nov 14, 2023
Author

下面是对这个例子的一个补充，当我是用原生的例子，自带的，进行 clear history。我注意到他还额外执行了一个清除GPU历史代码，但是很遗憾的是那个代码在我电脑上用处也不也是很大

zRzRzRzRzRzRzR · 2023-11-14T12:09:32Z

zRzRzRzRzRzRzR
Nov 14, 2023
Maintainer

估计是bad case，移动到讨论区后，看看社群有没有人能处理，我们已经将其标注为错误，会进行系统的检查

5 replies

hhzleon Nov 14, 2023
Author

好的，谢谢

zls130921 Nov 25, 2023

你好，我当前也遇到过这种情况，请问你的问题解决了吗，我不是并发操作，顺序执行的

hhzleon Nov 25, 2023
Author

no bro，我也想尽快解决它。但是目前为止我并未找到合适的解决方案

zls130921 Nov 27, 2023

好的，如果解决了请告知一下哈，谢谢！

zRzRzRzRzRzRzR Nov 30, 2023
Maintainer

确实，不过这应该不是只有我们有这个问题，应该所有的开源模型内存都会涨，我们努力解决

gitker · 2023-12-14T07:54:54Z

gitker
Dec 14, 2023

这个问题，关掉use_cache选项，应该能解决，但是会导致推理速度变慢，可做下权衡

1 reply

Ventery Jan 31, 2024

关掉之后没用，生成速度反倒慢了很多

Ventery · 2024-01-31T09:23:51Z

Ventery
Jan 31, 2024

限制一下history的条数就可以了，我是m2 32G的，现在内存增长的很慢
另外还可以让chatglm把之前多条history的摘要提取出来压缩一下再作为新的一条history
这样也能有效减少内存占用且不丢失上下文

0 replies

qmaolong · 2024-04-25T06:18:17Z

qmaolong
Apr 25, 2024

这个问题有处理办法了吗？

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

在持续进行对话时候GPU 内存占用飙升 #306

{{title}}

Replies: 6 comments 7 replies

{{title}}

{{title}}

{{editor}}'s edit

{{editor}}'s edit

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

Select a reply

在持续进行对话时候GPU 内存占用飙升 #306

hhzleon Nov 11, 2023

System Info / 系統信息

Who can help? / 谁可以帮助到您？

Information / 问题信息

Reproduction / 复现过程

Expected behavior / 期待表现

Replies: 6 comments · 7 replies

zRzRzRzRzRzRzR Nov 12, 2023 Maintainer

hhzleon Nov 12, 2023 Author

hhzleon Nov 14, 2023 Author

zRzRzRzRzRzRzR Nov 14, 2023 Maintainer

hhzleon Nov 14, 2023 Author

zls130921 Nov 25, 2023

hhzleon Nov 25, 2023 Author

zls130921 Nov 27, 2023

zRzRzRzRzRzRzR Nov 30, 2023 Maintainer

gitker Dec 14, 2023

Ventery Jan 31, 2024

Ventery Jan 31, 2024

qmaolong Apr 25, 2024

hhzleon
Nov 11, 2023

Replies: 6 comments 7 replies

zRzRzRzRzRzRzR
Nov 12, 2023
Maintainer

hhzleon
Nov 12, 2023
Author

hhzleon Nov 14, 2023
Author

zRzRzRzRzRzRzR
Nov 14, 2023
Maintainer

hhzleon Nov 14, 2023
Author

hhzleon Nov 25, 2023
Author

zRzRzRzRzRzRzR Nov 30, 2023
Maintainer

gitker
Dec 14, 2023

Ventery
Jan 31, 2024

qmaolong
Apr 25, 2024