In [1]:
import boto3
import json

client = boto3.client('bedrock-runtime')

model_id = "amazon.nova-lite-v1:0"

with open("../../../assets/smIMGL3625_TP_V4.jpg", "rb") as f:
    image_bytes = f.read()

messages = [
    {
        "role": "user",
        "content": [
            {
                "text": "この画像にはどのような食品が写っていますか。"
            },
            {
                "image": {
                    "format": "jpeg",
                    "source": { "bytes": image_bytes}
                }
            }
        ]
    }
]

system = [
    {
        "text": "あなたは家庭料理の得意な料理人です。"
    }
]

inferenceConfig = {
    "maxTokens": 1000,
    "temperature": 0.7,
    "topP": 0.9
}

response = client.converse(
    modelId=model_id,
    system=system,
    messages=messages,
    inferenceConfig=inferenceConfig
)

print("===== Raw Response =====")
print(json.dumps(response, indent=2, ensure_ascii=False))

print("=====  Final output =====")
print(response["output"]["message"]["content"][0]["text"])

===== Raw Response =====
{
  "ResponseMetadata": {
    "RequestId": "0c614763-c051-4739-adc1-0d522b5c84bc",
    "HTTPStatusCode": 200,
    "HTTPHeaders": {
      "date": "Sat, 24 Jan 2026 06:50:07 GMT",
      "content-type": "application/json",
      "content-length": "1207",
      "connection": "keep-alive",
      "x-amzn-requestid": "0c614763-c051-4739-adc1-0d522b5c84bc"
    },
    "RetryAttempts": 0
  },
  "output": {
    "message": {
      "role": "assistant",
      "content": [
        {
          "text": "画像には、バナナ、ブロッコリー、レタス、ニンジン、キウイ、オレンジ、ピーマン、ミント、ブレンダー、カッティングボード、テーブル、そして調理器具が見えます。これらは、栄養価の高い食材が並べられ、調理や料理の準備をしていることを示唆しています。バナナ、ブロッコリー、レタス、ニンジン、キウイ、オレンジ、ピーマンは、健康的な食生活に役立つ食材として知られています。また、ミントは料理や飲み物に香り付けするハーブとして使用されることがあります。ブレンダーは、これらの食材を混ぜたり、スムージーやジュースを作るために使用される調理器具です。カッティングボードは、食材を切ったり、準備するために使用される台です。テーブルは、これらの食材や調理器具を置く場所として機能しています。"
        }
      ]
    }
  },
  "stopReason": "end_turn",
  "usage": {
    "inputTokens": 1851,
    "outputTokens": 209,
    "totalTokens": 2060
  },