[BugFix] Raise error when max_model_len is larger than KV cache size #2163

WoosukKwon · 2023-12-18T01:00:54Z

Currently, vLLM hangs when the length of a single sequence is larger than the system's KV cache size.

[BugFix] Raise error when max_model_len is too large

5dbefd9

WoosukKwon requested a review from zhuohan123 December 18, 2023 01:00

WoosukKwon changed the title ~~[BugFix] Raise error when max_model_len larger than KV cache size~~ [BugFix] Raise error when max_model_len is larger than KV cache size Dec 18, 2023

Yard1 approved these changes Dec 18, 2023

View reviewed changes

WoosukKwon merged commit 8041b73 into main Dec 18, 2023
2 checks passed

WoosukKwon deleted the too-long-sequence branch December 18, 2023 01:08

xjpang pushed a commit to xjpang/vllm that referenced this pull request Dec 18, 2023

[BugFix] Raise error when max_model_len is larger than KV cache (vllm…

28c8fdd

…-project#2163)

hongxiayang pushed a commit to hongxiayang/vllm that referenced this pull request Feb 13, 2024

[BugFix] Raise error when max_model_len is larger than KV cache (vllm…

0f7e679

…-project#2163)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[BugFix] Raise error when max_model_len is larger than KV cache size #2163

[BugFix] Raise error when max_model_len is larger than KV cache size #2163

WoosukKwon commented Dec 18, 2023

[BugFix] Raise error when max_model_len is larger than KV cache size #2163

[BugFix] Raise error when max_model_len is larger than KV cache size #2163

Conversation

WoosukKwon commented Dec 18, 2023