DataDog
diff --git a/‎packages/dd-trace/src/llmobs/plugins/openai.js‎
Lines changed: 41 additions & 35 deletions b/‎packages/dd-trace/src/llmobs/plugins/openai.js‎
Lines changed: 41 additions & 35 deletions
diff --git a/‎packages/dd-trace/src/llmobs/tagger.js‎
Lines changed: 31 additions & 17 deletions b/‎packages/dd-trace/src/llmobs/tagger.js‎
Lines changed: 31 additions & 17 deletions
diff --git a/‎packages/dd-trace/test/llmobs/plugins/ai/index.spec.js‎
Lines changed: 0 additions & 1 deletion b/‎packages/dd-trace/test/llmobs/plugins/ai/index.spec.js‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎packages/dd-trace/test/llmobs/plugins/aws-sdk/bedrockruntime.spec.js‎
Lines changed: 15 additions & 8 deletions b/‎packages/dd-trace/test/llmobs/plugins/aws-sdk/bedrockruntime.spec.js‎
Lines changed: 15 additions & 8 deletions
diff --git a/‎packages/dd-trace/test/llmobs/plugins/google-cloud-vertexai/index.spec.js‎
Lines changed: 1 addition & 1 deletion b/‎packages/dd-trace/test/llmobs/plugins/google-cloud-vertexai/index.spec.js‎
Lines changed: 1 addition & 1 deletion
@@ -67,6 +67,12 @@ class OpenAiLLMObsPlugin extends LLMObsPlugin {
     if (!error) {
       const metrics = this._extractMetrics(response)
       this._tagger.tagMetrics(span, metrics)
+
+      const responseModel = response.model
+      if (responseModel) {
+        // override the model name with the response model (more accurate)
+        this._tagger.tagModelName(span, responseModel)
+      }
     }
   }
 
@@ -85,11 +91,11 @@ class OpenAiLLMObsPlugin extends LLMObsPlugin {
 
     if (tokenUsage) {
       // Responses API uses input_tokens, Chat/Completions use prompt_tokens
-      const inputTokens = tokenUsage.input_tokens ?? tokenUsage.prompt_tokens
+      const inputTokens = tokenUsage.input_tokens ?? tokenUsage.prompt_tokens ?? 0
       if (inputTokens !== undefined) metrics.inputTokens = inputTokens
 
       // Responses API uses output_tokens, Chat/Completions use completion_tokens
-      const outputTokens = tokenUsage.output_tokens ?? tokenUsage.completion_tokens
+      const outputTokens = tokenUsage.output_tokens ?? tokenUsage.completion_tokens ?? 0
       if (outputTokens !== undefined) metrics.outputTokens = outputTokens
 
       const totalTokens = tokenUsage.total_tokens || (inputTokens + outputTokens)
@@ -105,7 +111,7 @@ class OpenAiLLMObsPlugin extends LLMObsPlugin {
       } else if (tokenUsage.prompt_tokens_details) {
         // Chat/Completions API - only include if > 0
         const cacheReadTokens = tokenUsage.prompt_tokens_details.cached_tokens
-        if (cacheReadTokens) {
+        if (cacheReadTokens != null) {
           metrics.cacheReadTokens = cacheReadTokens
         }
       }
@@ -159,6 +165,16 @@ class OpenAiLLMObsPlugin extends LLMObsPlugin {
   _tagChatCompletion (span, inputs, response, error) {
     const { messages, model, ...parameters } = inputs
 
+    const metadata = Object.entries(parameters).reduce((obj, [key, value]) => {
+      if (!['tools', 'functions'].includes(key)) {
+        obj[key] = value
+      }
+
+      return obj
+    }, {})
+
+    this._tagger.tagMetadata(span, metadata)
+
     if (error) {
       this._tagger.tagLLMIO(span, messages, [{ content: '' }])
       return
@@ -200,16 +216,6 @@ class OpenAiLLMObsPlugin extends LLMObsPlugin {
     }
 
     this._tagger.tagLLMIO(span, messages, outputMessages)
-
-    const metadata = Object.entries(parameters).reduce((obj, [key, value]) => {
-      if (!['tools', 'functions'].includes(key)) {
-        obj[key] = value
-      }
-
-      return obj
-    }, {})
-
-    this._tagger.tagMetadata(span, metadata)
   }
 
   #tagResponse (span, inputs, response, error) {
@@ -269,6 +275,15 @@ class OpenAiLLMObsPlugin extends LLMObsPlugin {
       inputMessages.push({ role: 'user', content: input })
     }
 
+    const inputMetadata = Object.entries(parameters).reduce((obj, [key, value]) => {
+      if (allowedParamKeys.has(key)) {
+        obj[key] = value
+      }
+      return obj
+    }, {})
+
+    this._tagger.tagMetadata(span, inputMetadata)
+
     if (error) {
       this._tagger.tagLLMIO(span, inputMessages, [{ content: '' }])
       return
@@ -287,17 +302,13 @@ class OpenAiLLMObsPlugin extends LLMObsPlugin {
       for (const item of response.output) {
         // Handle reasoning type (reasoning responses)
         if (item.type === 'reasoning') {
-          // Extract reasoning text from summary
-          let reasoningText = ''
-          if (Array.isArray(item.summary) && item.summary.length > 0) {
-            const summaryItem = item.summary[0]
-            if (summaryItem.type === 'summary_text' && summaryItem.text) {
-              reasoningText = summaryItem.text
-            }
-          }
           outputMessages.push({
             role: 'reasoning',
-            content: reasoningText
+            content: JSON.stringify({
+              summary: item.summary ?? [],
+              encrypted_content: item.encrypted_content ?? null,
+              id: item.id ?? ''
+            })
           })
         } else if (item.type === 'function_call') {
           // Handle function_call type (responses API tool calls)
@@ -369,24 +380,19 @@ class OpenAiLLMObsPlugin extends LLMObsPlugin {
 
     this._tagger.tagLLMIO(span, inputMessages, outputMessages)
 
-    const metadata = Object.entries(parameters).reduce((obj, [key, value]) => {
-      if (allowedParamKeys.has(key)) {
-        obj[key] = value
-      }
-      return obj
-    }, {})
+    const outputMetadata = {}
 
     // Add fields from response object (convert numbers to floats)
-    if (response.temperature !== undefined) metadata.temperature = Number(response.temperature)
-    if (response.top_p !== undefined) metadata.top_p = Number(response.top_p)
-    if (response.tool_choice !== undefined) metadata.tool_choice = response.tool_choice
-    if (response.truncation !== undefined) metadata.truncation = response.truncation
-    if (response.text !== undefined) metadata.text = response.text
+    if (response.temperature !== undefined) outputMetadata.temperature = Number(response.temperature)
+    if (response.top_p !== undefined) outputMetadata.top_p = Number(response.top_p)
+    if (response.tool_choice !== undefined) outputMetadata.tool_choice = response.tool_choice
+    if (response.truncation !== undefined) outputMetadata.truncation = response.truncation
+    if (response.text !== undefined) outputMetadata.text = response.text
     if (response.usage?.output_tokens_details?.reasoning_tokens !== undefined) {
-      metadata.reasoning_tokens = response.usage.output_tokens_details.reasoning_tokens
+      outputMetadata.reasoning_tokens = response.usage.output_tokens_details.reasoning_tokens
     }
 
-    this._tagger.tagMetadata(span, metadata)
+    this._tagger.tagMetadata(span, outputMetadata) // update the metadata with the output metadata
   }
 }
 
 
@@ -85,7 +85,7 @@ class LLMObsTagger {
     if (name) this._setTag(span, NAME, name)
 
     this._setTag(span, SPAN_KIND, kind)
-    if (modelName) this._setTag(span, MODEL_NAME, modelName)
+    if (modelName) this.tagModelName(span, modelName)
     if (modelProvider) this._setTag(span, MODEL_PROVIDER, modelProvider)
 
     sessionId = sessionId || registry.get(parent)?.[SESSION_ID]
@@ -194,6 +194,10 @@ class LLMObsTagger {
     this._setTag(span, SPAN_KIND, newKind)
   }
 
+  tagModelName (span, modelName) {
+    this._setTag(span, MODEL_NAME, modelName)
+  }
+
   #tagText (span, data, key) {
     if (data) {
       if (typeof data === 'string') {
@@ -324,36 +328,46 @@ class LLMObsTagger {
 
     for (const message of data) {
       if (typeof message === 'string') {
-        messages.push({ content: message })
+        messages.push({ content: message, role: '' })
         continue
       }
       if (message == null || typeof message !== 'object') {
         this.#handleFailure('Messages must be a string, object, or list of objects', 'invalid_io_messages')
         continue
       }
 
-      const { content = '', role } = message
-      const toolCalls = message.toolCalls
-      const toolResults = message.toolResults
-      const toolId = message.toolId
-      const messageObj = { content }
+      const {
+        role = '',
+        content,
+        toolCalls,
+        toolResults,
+        toolId
+      } = message
+      const messageObj = {}
 
       let condition = this.#tagConditionalString(role, 'Message role', messageObj, 'role')
 
-      const valid = typeof content === 'string'
-      if (!valid) {
-        this.#handleFailure('Message content must be a string.', 'invalid_io_messages')
+      if (
+        content == null &&
+        toolCalls == null &&
+        toolResults == null
+      ) {
+        messageObj.content = ''
+      }
+
+      if (content != null) {
+        condition = this.#tagConditionalString(content, 'Message content', messageObj, 'content') && condition
       }
 
-      if (toolCalls) {
+      if (toolCalls != null) {
         const filteredToolCalls = this.#filterToolCalls(toolCalls)
 
         if (filteredToolCalls.length) {
           messageObj.tool_calls = filteredToolCalls
         }
       }
 
-      if (toolResults) {
+      if (toolResults != null) {
         const filteredToolResults = this.#filterToolResults(toolResults)
 
         if (filteredToolResults.length) {
@@ -363,13 +377,13 @@ class LLMObsTagger {
 
       if (toolId) {
         if (role === 'tool') {
-          condition = this.#tagConditionalString(toolId, 'Tool ID', messageObj, 'tool_id')
+          condition = this.#tagConditionalString(toolId, 'Tool ID', messageObj, 'tool_id') && condition
         } else {
           log.warn(`Tool ID for tool message not associated with a "tool" role, instead got "${role}"`)
         }
       }
 
-      if (valid && condition) {
+      if (condition) {
         messages.push(messageObj)
       }
     }
@@ -380,7 +394,7 @@ class LLMObsTagger {
   }
 
   #tagConditionalString (data, type, carrier, key) {
-    if (!data) return true
+    if (data == null) return true
     if (typeof data !== 'string') {
       this.#handleFailure(`"${type}" must be a string.`)
       return false
@@ -390,7 +404,7 @@ class LLMObsTagger {
   }
 
   #tagConditionalNumber (data, type, carrier, key) {
-    if (!data) return true
+    if (data == null) return true
     if (typeof data !== 'number') {
       this.#handleFailure(`"${type}" must be a number.`)
       return false
@@ -400,7 +414,7 @@ class LLMObsTagger {
   }
 
   #tagConditionalObject (data, type, carrier, key) {
-    if (!data) return true
+    if (data == null) return true
     if (typeof data !== 'object') {
       this.#handleFailure(`"${type}" must be an object.`)
       return false
 
@@ -444,7 +444,6 @@ describe('Plugin', () => {
           { content: 'What is the weather in Tokyo?', role: 'user' }
         ],
         outputMessages: [{
-          content: MOCK_STRING,
           role: 'assistant',
           tool_calls: [{
             tool_id: toolCallId,
 
@@ -62,8 +62,7 @@ describe('Plugin', () => {
             const command = new AWS.InvokeModelCommand(request)
             await bedrockRuntimeClient.send(command)
 
-            const expectedOutput = { content: model.response.text }
-            if (model.outputRole) expectedOutput.role = model.outputRole
+            const expectedOutput = { content: model.response.text, role: model.outputRole ?? '' }
 
             const { apmSpans, llmobsSpans } = await getEvents()
             assertLlmObsSpanEvent(llmobsSpans[0], {
@@ -76,7 +75,7 @@ describe('Plugin', () => {
                     { content: model.userPrompt, role: 'user' }
                   ]
                 : [
-                    { content: model.userPrompt }
+                    { content: model.userPrompt, role: '' }
                   ],
               outputMessages: [expectedOutput],
               metrics: {
@@ -125,7 +124,7 @@ describe('Plugin', () => {
                     { content: model.userPrompt, role: 'user' }
                   ]
                 : [
-                    { content: model.userPrompt }
+                    { content: model.userPrompt, role: '' }
                   ],
               outputMessages: [{ content: expectedResponseObject.text, role: 'assistant' }],
               metrics: {
@@ -171,7 +170,9 @@ describe('Plugin', () => {
             span: apmSpans[0],
             spanKind: 'llm',
             name: 'bedrock-runtime.command',
-            inputMessages: [{ content: 'You are a geography expert'.repeat(200) + cacheWriteRequest.userPrompt }],
+            inputMessages: [
+              { content: 'You are a geography expert'.repeat(200) + cacheWriteRequest.userPrompt, role: '' }
+            ],
             outputMessages: [expectedOutput],
             metrics: {
               input_tokens: cacheWriteRequest.response.inputTokens,
@@ -214,7 +215,9 @@ describe('Plugin', () => {
             span: apmSpans[0],
             spanKind: 'llm',
             name: 'bedrock-runtime.command',
-            inputMessages: [{ content: 'You are a geography expert'.repeat(200) + cacheWriteRequest.userPrompt }],
+            inputMessages: [
+              { content: 'You are a geography expert'.repeat(200) + cacheWriteRequest.userPrompt, role: '' }
+            ],
             outputMessages: [expectedOutput],
             metrics: {
               input_tokens: cacheWriteRequest.response.inputTokens,
@@ -260,7 +263,9 @@ describe('Plugin', () => {
             span: apmSpans[0],
             spanKind: 'llm',
             name: 'bedrock-runtime.command',
-            inputMessages: [{ content: 'You are a geography expert'.repeat(200) + cacheReadRequest.userPrompt }],
+            inputMessages: [
+              { content: 'You are a geography expert'.repeat(200) + cacheReadRequest.userPrompt, role: '' }
+            ],
             outputMessages: [expectedOutput],
             metrics: {
               input_tokens: cacheReadRequest.response.inputTokens,
@@ -303,7 +308,9 @@ describe('Plugin', () => {
             span: apmSpans[0],
             spanKind: 'llm',
             name: 'bedrock-runtime.command',
-            inputMessages: [{ content: 'You are a geography expert'.repeat(200) + cacheReadRequest.userPrompt }],
+            inputMessages: [
+              { content: 'You are a geography expert'.repeat(200) + cacheReadRequest.userPrompt, role: '' }
+            ],
             outputMessages: [expectedOutput],
             metrics: {
               input_tokens: cacheReadRequest.response.inputTokens,
 
@@ -203,7 +203,7 @@ describe('integrations', () => {
 
             inputMessages.push({ role: 'user', content: 'Foobar?' })
             inputMessages.push({ role: 'model', content: 'Foobar!' })
-            inputMessages.push({ content: 'Hello, how are you?' })
+            inputMessages.push({ content: 'Hello, how are you?', role: '' })
 
             assertLlmObsSpanEvent(llmobsSpans[0], {
               span: apmSpans[0],