Use set, inferred max token limits wherever chat models are used #713

debanjum · 2024-04-20T05:53:11Z

User configured max tokens limits weren't being passed to
send_message_to_model_wrapper
One of the load offline model code paths wasn't reachable. Remove it
to simplify code
When max prompt size isn't set infer max tokens based on free VRAM
on machine
Use min of app configured max tokens, vram based max tokens and
model context window

- User configured max tokens limits weren't being passed to `send_message_to_model_wrapper' - One of the load offline model code paths wasn't reachable. Remove it to simplify code - When max prompt size isn't set infer max tokens based on free VRAM on machine - Use min of app configured max tokens, vram based max tokens and model context window

debanjum force-pushed the enforce-max-token-limits-wherever-chat-model-used branch from 8efb4bc to 175169c Compare April 20, 2024 05:53

debanjum merged commit 419b044 into master Apr 23, 2024
7 checks passed

debanjum deleted the enforce-max-token-limits-wherever-chat-model-used branch April 23, 2024 11:12

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Use set, inferred max token limits wherever chat models are used #713

Use set, inferred max token limits wherever chat models are used #713

debanjum commented Apr 20, 2024 •

edited by sabaimran

Use set, inferred max token limits wherever chat models are used #713

Use set, inferred max token limits wherever chat models are used #713

Conversation

debanjum commented Apr 20, 2024 • edited by sabaimran

debanjum commented Apr 20, 2024 •

edited by sabaimran