In [1]:
# !pip install -qU anthropic langchain-teddynote

## Anthropic PDF Assistant

- 참고 링크: https://docs.anthropic.com/en/docs/build-with-claude/pdf-support
- API 키 발급: https://console.anthropic.com/settings/keys

In [2]:
from dotenv import load_dotenv

load_dotenv()

True

## 셋업

- `pdf_path` : PDF 파일 경로
- `use_prompt_cache` : prompt 캐시 사용 여부(True, False). 사용하는 것을 권장합니다.

**configs**

- `model` : 사용할 모델 이름
- `ANTHROPIC_API_KEY` : Anthropic API 키

In [3]:
import os

from langchain_teddynote.models import AnthropicPDFAssistant

api_key = os.getenv("ANTHROPIC_API_KEY")

configs = {
    "ANTHROPIC_API_KEY": api_key,
    "model": "claude-3-5-sonnet-20241022",
}

# PDF 파일 경로(로컬 PC)
pdf_path = "SPRI_AI_Brief_2023년12월호_F.pdf"

# PDF 파일 경로(URL)
# pdf_path = "https://arxiv.org/pdf/1706.03762"

# prompt 캐시 사용 여부(True, False)
assistant = AnthropicPDFAssistant(configs, pdf_path, use_prompt_cache=True)

## 일반 호출

**옵션**

- `token_info=False` : 토큰 사용량 정보 생략
- `token_info=True` : 토큰 사용량 정보 포함


In [4]:
query = "삼성전자가 개발한 생성형 AI 기술은 무엇인가요?"

# 호출
response = assistant.invoke(query)

# 결과출력
print(response["content"])

삼성전자가 개발한 생성형 AI 기술은 '삼성 가우스(Samsung Gauss)'입니다. 주요 특징은 다음과 같습니다:

1. 구성
- 언어 모델, 코드 모델, 이미지 모델의 3개 모델로 구성

2. 주요 특징
- 온디바이스에서 작동 가능하여 외부로 사용자 정보가 유출될 위험이 없음
- 라이선스나 개인정보를 침해하지 않는 안전한 데이터로 학습
- 다양한 상황에 최적화된 크기의 모델 선택 가능

3. 기능별 특징
- 언어 모델: 메일 작성, 문서 요약, 번역 업무 처리 지원
- 코드 모델: 'Code.i'라는 AI 코딩 어시스턴트로 대화형 인터페이스 제공
- 이미지 모델: 창의적 이미지 생성, 이미지 편집, 저해상도 이미지의 고해상도 전환 지원

삼성전자는 삼성 가우스를 다양한 제품에 단계적으로 탑재할 계획이며, 향후 메타의 라마2나 구글 어시스턴트와 경쟁할 것으로 예상됩니다.


multi-turn 대화 지원

In [5]:
query = "이전의 답변을 영어로 번역해줘"

# 호출
response = assistant.invoke(query)

# 결과출력
print(response["content"])

Samsung Electronics has developed a generative AI technology called 'Samsung Gauss'. Here are its key features:

1. Components
- Consists of three models: language model, code model, and image model

2. Key Features
- Operates on-device, eliminating the risk of user information leakage
- Trained on secure data that doesn't infringe licenses or personal information
- Offers flexible model sizes optimized for various situations

3. Features by Model Type
- Language Model: Supports email composition, document summarization, and translation tasks
- Code Model: Provides 'Code.i', an AI coding assistant with interactive interface
- Image Model: Supports creative image generation, image editing, and conversion of low-resolution images to high-resolution

Samsung Electronics plans to gradually integrate Samsung Gauss into various products, and it is expected to compete with Meta's Llama 2 and Google Assistant in the future.


토큰 정보를 포함하여 호출하려는 경우


In [6]:
query = "삼성전자가 개발한 생성형 AI 기술은 무엇인가요?"

# 호출
response = assistant.invoke(query, token_info=True)

# 결과출력
print(response["content"])

# 토큰 사용량 출력
print(AnthropicPDFAssistant.pretty_token_usage(response["usage"]))

삼성전자가 개발한 생성형 AI 기술은 '삼성 가우스(Samsung Gauss)'입니다. 주요 특징을 알려드리겠습니다:

1. 모델 구성
- 3가지 모델로 구성됨: 언어모델, 코드모델, 이미지모델

2. 핵심 특징
- 온디바이스 작동이 가능하여 사용자 정보의 외부 유출 위험이 없음
- 안전한 데이터를 통해 학습되어 라이선스와 개인정보 침해 우려 없음
- 상황에 맞게 최적화된 크기의 모델 선택 가능

3. 각 모델별 기능
- 언어 모델: 클라우드와 온디바이스 대상 다양한 모델로 구성되며, 메일 작성, 문서 요약, 번역 업무 처리
- 코드 모델: 'code.i'라는 AI 코딩 어시스턴트로 대화형 인터페이스 제공, 사내 소프트웨어 개발에 최적화
- 이미지 모델: 창의적 이미지 생성, 기존 이미지 편집, 저해상도 이미지의 고해상도 전환 지원

삼성전자는 이 기술을 다양한 제품에 단계적으로 탑재할 계획이며, 2024년부터 삼성 가우스를 탑재한 스마트폰이 출시될 것으로 예상됩니다.

토큰 사용 통계
----------------------------------------
Cache Creation Input Tokens    : 0
Cache Read Input Tokens        : 60,911
Input Tokens                   : 747
Output Tokens                  : 491
----------------------------------------


## 스트리밍 출력

**옵션**

- `token_info=False` : 토큰 사용량 정보 생략
- `token_info=True` : 토큰 사용량 정보 포함


토큰 정보는 생략하는 경우

In [7]:
query = "삼성전자가 개발한 생성형 AI 기술은 무엇인가요?"

# 스트리밍 호출
for text in assistant.stream(query, token_info=False):
    if text["type"] == "token":
        # 토큰 출력
        print(text["content"], end="", flush=True)
    elif text["type"] == "usage":
        # 토큰 사용량 출력
        print(text["content"], end="", flush=True)

삼성전자가 개발한 생성형 AI 기술은 '삼성 가우스(Samsung Gauss)'입니다. 이 기술의 주요 내용은 다음과 같습니다:

1. 3가지 모델 구성
- 텍스트를 생성하는 언어 모델
- 코드를 생성하는 코드 모델
- 이미지를 생성하는 이미지 모델

2. 중요 특징
- 온디바이스에서 작동 가능
- 사용자 정보의 외부 유출 위험 없음
- 안전한 데이터로 학습되어 개인정보 보호
- 정규분포 이론을 정립한 수학자 가우스의 이름을 따서 명명

3. 주요 기능
- 언어 모델: 메일 작성, 문서 요약, 번역 작업 수행
- 코드 모델: 'code.i' AI 코딩 어시스턴트로 대화형 서비스 제공
- 이미지 모델: 창의적 이미지 생성, 이미지 편집, 해상도 개선

삼성전자는 이 기술을 다양한 제품에 단계적으로 적용할 예정이며, 2024년부터는 삼성 스마트폰에도 탑재될 것으로 예상됩니다.

In [None]:
query = "이전의 답변을 영어로"

# 스트리밍 호출
for text in assistant.stream(query, token_info=False):
    if text["type"] == "token":
        # 토큰 출력
        print(text["content"], end="", flush=True)
    elif text["type"] == "usage":
        # 토큰 사용량 출력
        print(text["content"], end="", flush=True)

토큰 정보를 포함하여 스트리밍 출력

In [None]:
query = "삼성전자가 개발한 생성형 AI 기술은 무엇인가요?"
token_usage = []

for text in assistant.stream(query, token_info=True):
    if text["type"] == "token":
        # 토큰 출력
        print(text["content"], end="", flush=True)
    elif text["type"] == "usage":
        # 토큰 사용량 저장
        token_usage.append(text["content"])

토큰 정보만 따로 출력하려는 경우

In [None]:
for usage in token_usage:
    print(AnthropicPDFAssistant.pretty_token_usage(usage))

## 새로운 파일로 대화 내역 초기화

In [None]:
query = "논문의 초록을 요약해줘"

# PDF 파일 경로
pdf_path = "https://arxiv.org/pdf/1706.03762"

# 새로운 파일로 대화 내역 초기화
assistant.add_new_pdf(pdf_path)

# 호출
response = assistant.invoke(query)

# 결과출력
print(response["content"])