### 추론 모델 (Reasoning Models)
추론(reasoning) 모델은 강화학습(Reinforcement Learning)을 통해 논리적 사고와 문제 해결 능력을 학습한 대형 언어 모델(LLM)입니다.

이 모델들은 답변을 바로 생성하지 않고, 응답하기 전에 내부적으로 긴 사고 과정(chain of thought) 을 거친 후 최종 답변을 만듭니다.
그 결과, 복잡한 문제 해결, 코딩, 과학적 추론, 다단계 계획이 필요한 에이전트 기반 워크플로우(agentic workflows) 에서 뛰어난 성능을 보입니다.

이 모델들은 또한 OpenAI의 경량 코딩 에이전트인 Codex CLI 환경에서 가장 우수한 모델로 사용됩니다. 

| 모델                | 특징                                                       |
| ----------------- | -------------------------------------------------------- |
| **gpt-5-nano**    | 매우 빠르고 저비용, 경량 모델                                        |
| **gpt-5-mini**    | 속도와 품질의 균형형 모델                                           |
| **gpt-5 (기본 모델)** | 가장 크고 정교하며, 복잡한 작업과 다양한 도메인에서 최고의 품질 제공 (속도는 느리고 비용은 높음) |


In [1]:
from dotenv import load_dotenv
load_dotenv() 

True

In [2]:
from openai import OpenAI

client = OpenAI()

- 일반적인 추론 모델 실행 예시

In [3]:
prompt = """
문자열로 표현된 행렬을 '[1,2],[3,4],[5,6]' 형식으로 받아서 같은 형식으로 전치행렬을 출력하는 파이썬 스크립트를 작성하세요.
"""

response = client.responses.create(
    model="gpt-5",
    reasoning={"effort": "medium"},
    input=[
        {
            "role": "user", 
            "content": prompt
        }
    ]
)

print(response.output_text)

다음은 입력으로 '[1,2],[3,4],[5,6]' 형식의 문자열을 받아 같은 형식으로 전치행렬을 출력하는 파이썬 스크립트입니다.

```python
#!/usr/bin/env python3
import sys
import ast

def parse_matrix(s: str):
    try:
        data = ast.literal_eval('[' + s.strip() + ']')
    except Exception as e:
        raise ValueError("잘못된 행렬 문자열입니다.") from e
    if not isinstance(data, (list, tuple)):
        raise ValueError("행은 리스트/튜플이어야 합니다.")
    rows = []
    row_len = None
    for r in data:
        if not isinstance(r, (list, tuple)):
            raise ValueError("각 행은 리스트/튜플이어야 합니다.")
        if row_len is None:
            row_len = len(r)
        elif len(r) != row_len:
            raise ValueError("모든 행의 길이가 같아야 합니다.")
        rows.append(list(r))
    return rows

def transpose(mat):
    if not mat or not mat[0]:
        return []
    return [list(col) for col in zip(*mat)]

def format_matrix(mat):
    def fmt_row(row):
        return '[' + ','.join(str(x) for x in row) + ']'
    return ','.join(fmt_row(row) for row in mat)

def main():


### 추론 모델의 비용 관리  

비용을 관리하려면 `max_output_tokens` 매개변수를 사용하여 모델이 생성하는 총 토큰 수(추론 토큰과 응답 토큰 포함)를 제한할 수 있습니다.   
다음은 토큰 제한 및 모델 크기 차이를 보여주기 위한 실험 예시입니다.

In [4]:
prompt = """
문자열로 표현된 행렬을 '[1,2],[3,4],[5,6]' 형식으로 받아서 
같은 형식으로 전치행렬을 출력하는 파이썬 스크립트를 작성하세요.
"""

response = client.responses.create(
    model="gpt-5-nano",              # 경량 reasoning 모델 (소형, 빠르고 비용 저렴)
    reasoning={"effort": "medium"},  # 모델의 사고 깊이 수준 설정 (low/medium/high)
    input=[
        {
            "role": "user",          
            "content": prompt        
        }
    ],
    max_output_tokens=300,           # 최대 출력 토큰 수 제한 (300 토큰 이상 생성 시 중단)
)

# 모델 응답 상태 확인
if response.status == "incomplete" and response.incomplete_details.reason == "max_output_tokens":
    print("토큰 한도를 초과했습니다.")  

    # 모델이 생성한 일부 텍스트가 있다면 출력
    if response.output_text:
        print("Partial output:", response.output_text)
    else:
        # 생성 중 토큰이 모두 소진되어 아무 출력도 남지 않은 경우
        print("추론 과정에서 토큰이 소진되었습니다.")

토큰 한도를 초과했습니다.
추론 과정에서 토큰이 소진되었습니다.


### Prompt Engineering

- 특정 출력을 생성하기 위한 명확한 지침이 있을 때 가장 좋은 성과를 낼 수 있습니다.

**ex) 코딩 지시형(prompt for code generation) prompt**

| 규칙          | 설명                                           |
| ----------- | -------------------------------------------- |
| **작업 지시**   | 어떤 수정을 해야 하는지 (nonfiction → 빨간색 텍스트)         |
| **출력 제약**   | 오직 코드만, 불필요한 설명 금지                           |
| **포맷 제약**   | 마크다운 사용 금지, 4-space 들여쓰기, 80자 이내 제한 |
| **컨텍스트 제공** | 수정 대상 React 코드 제공                            |


In [5]:
prompt = """
Instructions:
- 아래 주어진 React 컴포넌트를 수정하여, 'nonfiction' 카테고리의 책 제목은 빨간색 글씨로 표시되도록 하시오.
- 답변에는 코드만 포함하시오.
- 마크다운 코드 블록 같은 추가 포맷팅은 포함하지 마시오.
- 코드 들여쓰기는 4개의 스페이스를 사용하고, 한 줄이 80자를 초과하지 않도록 하시오.

const books = [
  { title: 'Dune', category: 'fiction', id: 1 },
  { title: 'Frankenstein', category: 'fiction', id: 2 },
  { title: 'Moneyball', category: 'nonfiction', id: 3 },
];

export default function BookList() {
  const listItems = books.map(book =>
    <li>
      {book.title}
    </li>
  );

  return (
    <ul>{listItems}</ul>
  );
}
"""

response = client.responses.create(
    model="gpt-5-nano",
    input=[
        {
            "role": "user",
            "content": prompt,
        }
    ]
)

print(response.output_text)

const books = [
    { title: 'Dune', category: 'fiction', id: 1 },
    { title: 'Frankenstein', category: 'fiction', id: 2 },
    { title: 'Moneyball', category: 'nonfiction', id: 3 },
  ];
  
  export default function BookList() {
    const listItems = books.map(book => {
      const style = book.category === 'nonfiction'
        ? { color: 'red' }
        : {};
      return (
        <li key={book.id} style={style}>
          {book.title}
        </li>
      );
    });
  
    return (
      <ul>{listItems}</ul>
    );
  }
