In [5]:
import os
from rich.console import Console
from anthropic import Anthropic
from dotenv import load_dotenv

load_dotenv()
console = Console()

# 1. 기본 Usage 정보 확인 과정

In [12]:
MODEL_NAME = "claude-3-5-haiku-20241022"

client = Anthropic(
    api_key=os.environ.get("ANTHROPIC_API_KEY"),  # This is the default and can be omitted
)

message = client.messages.create(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": "Hello, Claude",
        }
    ],
    model=MODEL_NAME,
)

console.log(message)

# 2. 일반 텍스트 캐싱 테스트

아래 코드는 캐싱이 발생하지 않는다.

In [26]:
message = client.messages.create(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Hello, Claude",
                    "cache_control": {"type": "ephemeral"},
                },
            ]
        }
    ],
    model=MODEL_NAME,
)

console.log(message)

아래 코드는 캐싱이 발생해야 한다. Haiku 모델은 2048 토큰 이상만 캐싱되기 때문에 임의로 긴 텍스트를 만들어서 전송함.

In [31]:
message = client.messages.create(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Hello, Claude" * 400,
                    "cache_control": {"type": "ephemeral"},
                },
            ]
        }
    ],
    model=MODEL_NAME,
)

console.log(message)

재실행하면 캐싱된 토큰을 사용한다.

In [32]:
message = client.messages.create(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Hello, Claude" * 400,
                    "cache_control": {"type": "ephemeral"},
                },
            ]
        }
    ],
    model=MODEL_NAME,
)

console.log(message)

새로운 메세지를 추가해도 과거에 캐싱한 데이터가 있으면 캐싱은 여전히 사용된다.

In [33]:
message = client.messages.create(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Hello, Claude" * 400,
                },
            ]
        },
        {
            "role": "assistant",
            "content": [
                {
                    "type": "text",
                    "text": "네 반갑습니당. 근데 왜케 길게 보내셨",
                    "cache_control": {"type": "ephemeral"},
                },
            ]
        }
    ],
    model=MODEL_NAME,
)

console.log(message)

In [34]:
message = client.messages.create(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Hello, Claude" * 400,
                },
            ]
        },
        {
            "role": "assistant",
            "content": [
                {
                    "type": "text",
                    "text": "네 반갑습니당. 근데 왜케 길게 보내셨죠? 😄",
                    "cache_control": {"type": "ephemeral"},
                },
            ]
        },
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "ㅋ 그냥용, 무슨 문제라도?",
                },
            ]
        },
    ],
    model=MODEL_NAME,
)

console.log(message)

In [36]:
message = client.messages.create(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Hello, Claude" * 400,
                },
            ]
        },
        {
            "role": "assistant",
            "content": [
                {
                    "type": "text",
                    "text": "네 반갑습니당. 근데 왜케 길게 보내셨죠? 😄",
                    # "cache_control": {"type": "ephemeral"},
                },
            ]
        },
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "ㅋ 그냥용, 무슨 문제라도?",
                },
            ]
        },
        {
            "role": "assistant",
            "content": [
                {
                    "type": "text",
                    "text": "문제는 없죠 ㅋ, 근데 제 생각에는",
                    "cache_control": {"type": "ephemeral"},
                },
            ]
        },
    ],
    model=MODEL_NAME,
)

console.log(message)

# 3. 이미지/PDF 포함 캐싱 테스트

In [44]:
import base64

# Prepare image and PDF files
image_path = "/home/lsw91/capture.png"
pdf_path = "/home/lsw91/test.pdf"

# Convert image to base64
with open(image_path, "rb") as image_file:
    image_data = image_file.read()
    base64_image = base64.b64encode(image_data).decode("utf-8")

# Convert PDF to base64
with open(pdf_path, "rb") as pdf_file:  
    pdf_data = pdf_file.read()
    base64_pdf_data = base64.b64encode(pdf_data).decode("utf-8")

# Create API blocks for image and PDF
api_image_block = {
    "type": "image",
    "source": {
        "type": "base64",
        "media_type": "image/png",
        "data": base64_image,
    },
    "cache_control": {"type": "ephemeral"}
}   

api_pdf_block = {
    "type": "document",
    "source": {
        "type": "base64",
        "media_type": "application/pdf",
        "data": base64_pdf_data,
    },
    "cache_control": {"type": "ephemeral"}
}

In [42]:
message = client.messages.create(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                api_image_block,
                api_pdf_block,
                {
                    "type": "text",
                    "text": "위 문서에 있는 내용들을 요약해줘.",
                    "cache_control": {"type": "ephemeral"},
                },
            ]
        }
    ],
    model=MODEL_NAME,
)

console.log(message)

In [45]:
message = client.messages.create(
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                api_image_block,
                api_pdf_block,
                {
                    "type": "text",
                    "text": "위 문서에 있는 내용들을 요약해줘.",
                    "cache_control": {"type": "ephemeral"},
                },
            ]
        }
    ],
    model=MODEL_NAME,
)

console.log(message)