[FEATURE] Prompt caching support for LiteLLM

### Problem Statement

While LiteLLM does support prompt caching via Bedrock, Strands does not support prompt caching via LiteLLM.

### Proposed Solution

LiteLLM supports prompt caching for Bedrock by following the OpenAI prompt caching usage object format: https://docs.litellm.ai/docs/completion/prompt_caching

```
"usage": {
  "prompt_tokens": 2006,
  "completion_tokens": 300,
  "total_tokens": 2306,
  "prompt_tokens_details": {
    "cached_tokens": 1920
  },
  "completion_tokens_details": {
    "reasoning_tokens": 0
  }
  # ANTHROPIC_ONLY #
  "cache_creation_input_tokens": 0
}
```
Strands should support that format as well. 

### Use Case

The same way as it used via a bedrock model directly.

### Alternatives Solutions

_No response_

### Additional Context

_No response_

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[FEATURE] Prompt caching support for LiteLLM #937

Problem Statement

Proposed Solution

Use Case

Alternatives Solutions

Additional Context

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

[FEATURE] Prompt caching support for LiteLLM #937

Description

Problem Statement

Proposed Solution

Use Case

Alternatives Solutions

Additional Context

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions