# 부록 10.4.2: Claude로 문서를 전사하는 방법

Claude 3는 구조화되지 않은 텍스트와 이미지 및 PDF 내의 정보를 읽고 구조화된 텍스트로 변환하는 데 뛰어납니다. 몇 가지 예를 살펴보겠지만 먼저 노트북을 실행하는 데 필요한 코드를 설정해 보겠습니다.

In [None]:
pip install -qUr requirements.txt

In [None]:
import boto3
import json
from datetime import datetime
from IPython.display import Image
from botocore.exceptions import ClientError

session = boto3.Session()
region = session.region_name

In [None]:
modelId = 'anthropic.claude-3-sonnet-20240229-v1:0'
#modelId = 'anthropic.claude-3-haiku-20240307-v1:0'

print(f'Using modelId: {modelId}')
print('Using region: ', region)

bedrock_client = boto3.client(service_name = 'bedrock-runtime', region_name = region,)

## 입력된 텍스트 전사하기

Claude 3를 사용하면 Claude 3의 고급 추론 기능 덕분에 전사할 내용을 정확히 지정할 수 있다는 장점이 있습니다. 이 이미지의 경우 답변에 있는 코드만 전사해 보겠습니다.

In [None]:
from IPython.display import Image
Image(filename='./images/transcribe/stack_overflow.png')

In [None]:
with open("./images/transcribe/stack_overflow.png", "rb") as f:
    image_file = f.read()

messages = [
    {
        "role": 'user',
        "content": [
            {"text": "Transcribe the code in the answer. Only output the code."},
            {"image": {
                "format": 'png',
                "source": {"bytes": image_file }
                },
            }
        ]
    }
]

converse_api_params = {
    "modelId": modelId,
    "messages": messages,
}

response = bedrock_client.converse(**converse_api_params)

# Extract the generated text content from the response
output_message = response['output']['message']['content'][0]['text']

# Return the generated text content
print(output_message)

## 필기 텍스트 전사하기

좋습니다. 그렇다면 조금 더 어려운 것을 시도해 볼까요. Claude 3는 필기 텍스트를 전사하는 데도 뛰어납니다. Claude 3에게 이 필기 처방전 메모를 전사하도록 요청해 보겠습니다.

In [None]:
Image(filename='./images/transcribe/school_notes.png')

In [None]:
with open("./images/transcribe/school_notes.png", "rb") as f:
    image_file = f.read()

messages = [
    {
        "role": 'user',
        "content": [
            {"text": "Transcribe this text. Only output the text and nothing else."},
            {"image": {
                "format": 'png',
                "source": {"bytes": image_file }
                },
            }
        ]
    }
]

converse_api_params = {
    "modelId": modelId,
    "messages": messages,
}

response = bedrock_client.converse(**converse_api_params)

# Extract the generated text content from the response
output_message = response['output']['message']['content'][0]['text']

# Return the generated text content
print(output_message)

## 양식 전사하기
입력된 텍스트와 필기 텍스트가 혼합된 경우는 어떨까요? 이는 보험 및 보고서 양식과 같은 다양한 문서에서 흔히 볼 수 있습니다.

In [None]:
Image(filename='./images/transcribe/vehicle_form.jpg') 

In [None]:
with open("./images/transcribe/vehicle_form.jpg", "rb") as f:
    image_file = f.read()

messages = [
    {
        "role": 'user',
        "content": [
            {"text": "Transcribe this form exactly."},
            {"image": {
                "format": 'jpeg',
                "source": {"bytes": image_file }
                },
            }
        ]
    }
]

converse_api_params = {
    "modelId": modelId,
    "messages": messages,
}

response = bedrock_client.converse(**converse_api_params)

# Extract the generated text content from the response
output_message = response['output']['message']['content'][0]['text']

# Return the generated text content
print(output_message)

## 복잡한 문서 QA
Claude 3를 사용하면 단순한 전사를 넘어 구조화되지 않은 문서에 대한 특정 질문을 할 수 있습니다. 

In [None]:
Image(filename='./images/transcribe/page.jpeg') 

In [None]:
with open("./images/transcribe/page.jpeg", "rb") as f:
    image_file = f.read()

messages = [
    {
        "role": 'user',
        "content": [
            {"text": "Which is the most critical issue for live rep support?"},
            {"image": {
                "format": 'jpeg',
                "source": {"bytes": image_file }
                },
            }
        ]
    }
]

converse_api_params = {
    "modelId": modelId,
    "messages": messages,
}

response = bedrock_client.converse(**converse_api_params)

# Extract the generated text content from the response
output_message = response['output']['message']['content'][0]['text']

# Return the generated text content
print(output_message)

## 구조화되지 않은 정보 -> JSON

Claude를 사용하여 이미지 내의 구조화되지 않은 정보를 구조화된 JSON 출력으로 변환하는 방법을 살펴보겠습니다.

In [None]:
Image(filename='./images/transcribe/org_chart.jpeg') 

In [None]:
with open("./images/transcribe/org_chart.jpeg", "rb") as f:
    image_file = f.read()

messages = [
    {
        "role": 'user',
        "content": [
            {"text": "Turn this org chart into JSON indicating who reports to who. Only output the JSON and nothing else."},
            {"image": {
                "format": 'jpeg',
                "source": {"bytes": image_file }
                },
            }
        ]
    }
]

converse_api_params = {
    "modelId": modelId,
    "messages": messages,
}

response = bedrock_client.converse(**converse_api_params)

# Extract the generated text content from the response
output_message = response['output']['message']['content'][0]['text']

# Return the generated text content
print(output_message)