# 파일 입력
비전 기능을 갖춘 OpenAI 모델은 PDF 파일을 입력으로 사용할 수도 있습니다. 

모델이 PDF 콘텐츠를 이해할 수 있도록 각 페이지의 추출된 텍스트와 이미지를 모델의 컨텍스트에 추가합니다. 모델은 텍스트와 이미지를 모두 사용하여 응답을 생성할 수 있습니다. 이는 예를 들어 다이어그램에 텍스트에 없는 주요 정보가 포함된 경우 유용합니다.

먼저 Files API를 사용하여 PDF를 업로드한 다음, 모델에 대한 API 요청에서 해당 파일 ID를 참조합니다.

In [1]:
from dotenv import load_dotenv
load_dotenv()

True

In [2]:
from openai import OpenAI

client = OpenAI()

Model = "gpt-5-nano"

## 파일 URL (File URLs) 사용

PDF 파일을 직접 업로드하지 않고, 공개된 외부 PDF 링크(URL)를 통해 모델이 해당 파일에 접근하도록 설정할 수 있습니다.

In [3]:
response = client.responses.create(
    model=Model,  

    input=[
        {
            "role": "user",  
            "content": [
                {
                    "type": "input_text",     # 첫 번째 입력: 텍스트 명령
                    "text": "편지를 분석하고 핵심 요점을 한국어로 요약해 주세요",  # 요청 내용
                },
                {
                    "type": "input_file",     # 두 번째 입력: 파일
                    "file_url": "https://www.berkshirehathaway.com/letters/2024ltr.pdf",  # 분석할 PDF 파일 URL
                },
            ],
        },
    ]
)

print(response.output_text) 

다음은 Berkshire Hathaway 2025년 주주 서한의 핵심 요점입니다.

- 서한의 목적과 태도
  - 데이터 제공뿐 아니라 소유주에 대한 해설과 생각을 공유하겠다는 책임감 있는 자세를 강조.
  - 실수나 문제를 솔직히 인정하고, 이를 해결하기 위한 단호한 조치의 필요성을 강조(“thumb-sucking” 금지).

- 경영자와 관리에 대한 관점
  - 과거의 투자/경영 판단에서의 실수 인정. 실수에서 배우고, 승리의 결정 하나가 장기에 큰 차이를 만든다는 점을 강조.
  - Pete Liegl 이야기처럼 뛰어난 경영자와의 협력 사례를 통해 뛰어난 관리의 중요성 부각.
  - 학교 출신보다 실행과 직관, 천부적인 재능이 더 큰 영향을 줄 수 있다는 믿음.

- 2024년 실적 요약
  - 총 운영이익(Non-GAAP): 약 474억 달러.
  - 세부 구성: 보험 언더라이팅 90.2억, 보험 투자수익 136.7억, BNSF 50.3억, Berkshire Hathaway Energy 37.3억, 기타 지배/비지배 사업 합계 약 130.72억, 비지배 포함 기타 약 -13.95억.
  - 위 수치들은 감가상각·세금 차감 후의 영업이익이며, 시장가치 변동이 큰 투자 이익은 제외 또는 조정하는 방식으로 제시.

- 자본배분과 포트폴리오 철학
  - Berkshire의 자금은 여전히 대다수를 주식에 투자하는 방향으로 운용. 현금이나 채권 같은 금전형 자산 선호도는 낮고, 질 좋은 비(非)현금 기업에 대한 투자 비중이 큼.
  - 보유 중인 지배기업(80% 이상 지배)과 비지배 지분 모두를 통해 균형 있게 운용.
  - 시장가치 포트폴리오(상장 주식 등)에서의 비중은 감소했으나, 비상장/지배기업의 가치가 여전히 큼. 총 주식 관련 보유 가치는 약 2720억 달러 규모로 제시.
  - 장기적 시야를 강조. 단기 변동성보다 수십 년에 걸친 가치를 중시.

- 보험 비즈니스(특히 P/C 보험)
  - Berkshire의 핵심인 P/C 보험은 전통적으로 “선지급 수

### 파일 업로드 (Uploading files)

먼저 Files API를 사용하여 PDF 파일을 업로드한 다음, 해당 파일의 파일 ID(file ID) 를 모델의 API 요청에서 참조

In [4]:
file = client.files.create(
    file=open("data/20250714_삼성전자.pdf", "rb"),
    purpose="user_data"
)

response = client.responses.create(
    model=Model,
    input=[
        {
            "role": "user",
            "content": [
                {
                    "type": "input_file",
                    "file_id": file.id,
                },
                {
                    "type": "input_text",
                    "text": "그림 1. 삼성전자 12개월 선행 P/B 밴드 차트 내용을 해석해줘.",
                },
            ]
        }
    ]
)

print(response.output_text)

요약해 드리면 그림 1은 삼성전자(005930)의 12개월 선행 P/B 밴드 차트를 보여줍니다. 축과 선의 의미를 먼저 정리하고, 지금 위치가 무엇을 시사하는지 해석해 드리겠습니다.

구성 및 축 해석
- 목적: 12개월 선행(BPS를 바탕으로 한) P/B 밴드와 주가의 관계를 시각화한 차트로, ROE와의 관계 속에서 합리적 P/B 밴드가 어떻게 형성되는지 보여줍니다.
- 좌축(원): 주가(주가 추세선 등)와 관련된 축으로, 삼성전자의 실제 주가를 나타냅니다.
- 우축(%): ROE 계열의 척도로 보통 0–25% 내외의 범위를 표시합니다.
- 빨간/주황 계열 선: 주가의 흐름을 나타내는 선.
- 밴드: 12MF 선행 P/B의 상단/중간/하단 구간으로, 역사적 관찰치를 바탕으로 형성된 상대적 밴드(저평가 구간, 보통 구간, 고평가 구간)를 의미합니다.
- BPS(주당순자산가치)와 P/B의 관계를 반영한 차트이므로, 현재 P/B를 가늠할 수 있는 기준선으로 작용합니다.

현재 위치의 해석
- 표 1의 핵심 수치와 연결해 보면:
  - 2025F 12MF BPS ≈ 64,839원
  - 현재가 ≈ 62,600원
  - 따라서 현재 선행 P/B ≈ 0.96배(= 62,600 / 64,839) 수준으로, 대략 1.0x 근처에 위치합니다.
  이는 12MF 밴드에서 “보통-약간 하단 근처”에 해당하는 위치일 가능성이 큽니다. 즉, 밴드의 하한보다는 아래 중간 쪽에 가까운 편이나 완전히 밴드 아래로 떨어진 것은 아닙니다.
- 밴드의 해석상으로는:
  - 밴드 하단 근처이나 밴드 밖으로 벗어나지 않은 상태는 합리적 혹은 약간의 저평가 영역으로 해석될 수 있습니다.
  - 현재 P/B가 1.0x 내외로 보여 향후 ROE가 유지되거나 개선될 경우 P/B가 밴드의 중상부로 움직일 가능성도 있습니다.
- 현 분석에서 제시된 목표주가 78,000원은 12MF P/B를 1.2배로 가정한 수치입니다(64,839원 BPS 기준). 78,000원은 P/B가 약 1.2배일 때의 가격으로, 차

### Base64로 인코딩된 파일
PDF 파일 입력도 Base64로 인코딩된 입력으로 보낼 수 있습니다.

In [5]:
import base64

with open("data/20250714_삼성전자.pdf", "rb") as f:
    data = f.read()

base64_string = base64.b64encode(data).decode("utf-8")

response = client.responses.create(
    model=Model,
    input=[
        {
            "role": "user",
            "content": [
                {
                    "type": "input_file",
                    "filename": "20250714_삼성전자.pdf",
                    "file_data": f"data:application/pdf;base64,{base64_string}",
                },
                {
                    "type": "input_text",
                    "text": "표 2 의 내용에 대해서 설명해줘.",
                },
            ],
        },
    ]
)

print(response.output_text)

다음은 표 2의 내용을 간단하고 핵심적으로 설명한 것 입니다.

- 표 2의 목적
  - 삼성전자에 대해 SOTP(다면체 평가, Sum-Of-The-Parts) 방식으로 목표가를 제시한 표입니다. 각 사업부문별로 Forward EBITDA에 일정 배수를 적용해 부문별 가치를 산출하고 이를 합산해 전체 가치를 추정합니다. 그리고 삼성전자가 보유한 자회사들의 시가총액/지분가치를 반영하고, 이를 할인해 주당 목표가를 도출합니다. 이 표는 “단순참고용”으로 제시된 참고 자료임을 명시하고 있습니다.

- 표의 구성(주요 열의 의미)
  - 구분: 부문별 이름(영업가치 전체, DX, MX/NW, VD/DA, DS, Memory, Foundry/LSI, SDC, Harman 등)
  - 12MF EBITDA: 향후 12개월 예상 EBITDA(단위는 조원)로 각 부문별 추정치입니다.
  - 목표 EV: 각 부문에 적용할 EV(기업가치) 목표치. 일반적으로 12MF EBITDA에 EV/EBITDA를 곱해 산출한 값입니다.
  - EV/EBITDA: 부문별로 사용한 EV/EBITDA 배수. 부문 특성에 따라 다르게 설정되어 있습니다.
  - Implied EV: 12MF EBITDA에 EV/EBITDA를 곱해 산출한 부문별 암시 EV(조원).
  - Valuation peer & Note: 배수 산정의 근거가 된 비교대상(peer)나 주석. 예를 들어 특정 부문에 대해 어떤 기업들의 배수나 할인율을 참조했는지, 어떤 할인(또는 프리미엄)을 적용했는지에 대한 주석이 있습니다.
    - 예시: MX/NW는 Xiaomi, Apple 평균의 50% 할인 적용 등, Foundry/LSI는 TSMC, GF, Intel 평균에 대해 30% 할인 등.
  - 아래 표에서의 핵심 값은 Implied EV 합계 및 지분가치 산출에 사용됩니다.

- 부문별 요지
  - 영업가치: 부문별 Implied EV를 합친 총 영업가치를 제시합니다. 예: DX, MX/NW, VD/DA, DS, Memory

---------------------------------
### 사용 시 고려사항 (Usage considerations)

- 토큰 사용량 (Token usage)

    모델이 PDF 내용을 이해할 수 있도록, OpenAI는 각 페이지의 추출된 텍스트와 페이지 이미지를 모두 모델의 컨텍스트에 포함시킵니다. 따라서 PDF를 입력으로 사용할 경우 토큰 사용량과 비용이 증가할 수 있습니다.

- 파일 크기 제한 (File size limitations)

    한 번에 여러 개의 파일을 업로드할 수 있습니다. 단, 각 파일은 50MB 미만이어야 합니다.  
    하나의 API 요청 내에서 전체 파일 용량의 합도 50MB를 초과할 수 없습니다.