patterns-ai-core · andreibondarev · Nov 30, 2023 · Nov 30, 2023 · DDAZZA · Dec 1, 2023
diff --git a/lib/langchain/llm/azure.rb b/lib/langchain/llm/azure.rb
@@ -64,7 +64,7 @@ def complete(prompt:, **params)
       parameters = compose_parameters @defaults[:completion_model_name], params
 
       parameters[:messages] = compose_chat_messages(prompt: prompt)
-      parameters[:max_tokens] = validate_max_tokens(parameters[:messages], parameters[:model])
+      parameters[:max_tokens] = params[:max_tokens] || validate_max_tokens(parameters[:messages], parameters[:model])
 
       response = with_api_error_handling do
         chat_client.chat(parameters: parameters)

diff --git a/spec/langchain/llm/azure_spec.rb b/spec/langchain/llm/azure_spec.rb
@@ -224,12 +224,18 @@
 
     context "with prompt and parameters" do
       let(:parameters) do
-        {parameters: {n: 1, model: "gpt-3.5-turbo", messages: [{content: "Hello World", role: "user"}], temperature: 1.0, max_tokens: 4086}}
+        {parameters: {n: 1, model: "gpt-3.5-turbo", messages: [{content: "Hello World", role: "user"}], temperature: 1.0, max_tokens: 16}}
       end
 
       it "returns a completion" do
-        response = subject.complete(prompt: "Hello World", model: "gpt-3.5-turbo", temperature: 1.0)
+        response = subject.complete(
+          prompt: "Hello World",
+          model: "gpt-3.5-turbo",
+          temperature: 1.0,
+          max_tokens: 16 # `max_tokens` can be passed in and overwritten.
+        )
 
+        expect(response.completion_tokens).to eq(16)
         expect(response.completion).to eq("The meaning of life is subjective and can vary from person to person.")
       end
     end