# Prompting Engineering

## Prompt HyperParameters

**ChatGPT LLM 설정**

https://blog.lukesalamone.com/posts/what-is-temperature/

1. **`temperature`**
    - **작동 방식**:  
      확률 분포를 **평탄화하거나 집중**시킵니다.
      - 낮은 값 (`0.1` 등): 높은 확률의 토큰만 선택하게 하여 응답이 더 **결정적**(예측 가능)입니다.
      - 높은 값 (`1.5` 등): 확률 분포를 평탄화하여 저확률 토큰도 선택할 가능성이 있어 응답이 더 **창의적**이고 다양합니다.
    
    - **적용 범위**:
      - 문장이 단조롭거나 응답이 너무 예상 가능할 때 다양성을 부여.
      - 확률 분포를 조정하는 가장 기본적인 매개변수.
    
    - **비유**:
      - 음식을 만들 때 **조미료의 양을 조정**하는 것처럼, 다양성을 직접적으로 조절.

2. **`top-p`** (또는 **nucleus sampling**)
    - **작동 방식**:  
      확률 분포에서 누적 확률이 특정 값(`p`) 이하가 되는 상위 토큰들만 고려합니다.  
      - 예: `top-p=0.9`라면, 전체 확률의 **90%를 차지하는 상위 토큰**들만 선택 후보로 유지.
      - 확률 분포의 **꼬리 부분**(즉, 낮은 확률 토큰)을 잘라내어 선택 가능성을 제한합니다.
    
    - **적용 범위**:
      - 확률이 높은 후보군에 집중하면서도 너무 단조로운 응답을 방지.
      - 매우 드문(낮은 확률) 선택지를 배제.
    
    - **비유**:
      - 음식에서 **상위 재료 90%만 골라서 요리**하는 것처럼, 유의미한 선택만 남김.
3. **`최대 길이(Max Length)`**
    - 생성되는 토큰 수의 최대 길이를 제한한다.
    - 길이를 제한하여 응답 품질과 비용을 제어한다.
4. **`중지 시퀀스(Stop Sequences)`**
    - 특정 문자열에서 응답 생성을 중단한다.
    - 응답의 구조와 길이를 제어할 수 있다.
5. **`빈도 패널티(Frequency Penalty)`**
    - 특정 단어가 자주 반복되지 않도록 페널티를 적용한다.
    - 빈도 패널티가 높을수록 단어가 다시 나타날 가능성이 낮아짐.
    - 더 많이 나타나는 토큰에 더 높은 패널티를 부여함으로써 모델의 응답에서 단어의 반복을 줄임
6. **`존재 패널티(Presence Penalty)`**
    - 특정 단어가 한 번이라도 등장하면 페널티를 적용한다.
    - 빈도 패널티와 달리, 반복된 토큰에 대한 패널티를 적용하지만, 모든 반복된 토큰에 대해 패널티가 동일하다.
        - 두 번 나타나는 토큰과 열 번 나타나는 토큰이 같은 패널티를 받는다.
    - 모델이 응답에서 구절을 너무 자주 반복하는 것을 방지
    - 모델에게 다양하거나 창의적인 텍스트를 생성하도록 하고 싶다면 높은 존재 패널티를 사용


**temperature vs. top-p**

| **특징**           | **temperature**                        | **top-p**                            |
|---------------------|----------------------------------------|--------------------------------------|
| **작동 방식**       | 확률 분포를 평탄화하거나 집중          | 누적 확률 기준으로 후보 제한         |
| **결과 다양성**     | 전체 분포에서 다양성을 조정            | 높은 확률 토큰만 사용해 제어          |
| **조정 방식**       | 분포의 "모양"을 변경                  | 분포의 "범위"를 제한                 |
| **활용 사례**       | 모델의 창의성이나 결정성 직접 제어     | 비현실적 선택 방지                   |

**`temperature`와 `top-p`는 함께 결합해 사용할 수 있다**:
- `temperature=0.7, top-p=0.9`
- `temperature`로 창의성을 설정하고, `top-p`로 지나치게 낮은 확률의 토큰을 배제하여 모델이 **실용적이면서도 창의적**인 결과를 생성하게 만들수 있다.
  

## Chat Completion의 구성

**Chat Completion 요청/응답흐름**

![](https://d.pr/i/20vYLw+)

**프롬프트 구성요소**

- **지시사항 `User Message`**: 수행하고자 하는 구체적인 작업에 대한 지시.
- **컨텍스트 `System Instruction`**: 페르소나 등의 배경정보, 외부 정보나 추가 세부사항을 제공하여 모델 응답을 보완.
- **입력 데이터**: 응답을 유도하기 위한 데이터나 질문.
- **출력 지시자**: 응답의 형식과 유형을 명시.


**Role**

| Role         | 설명                                                                                     | 사용 시점                                                                                          |
|--------------|------------------------------------------------------------------------------------------|----------------------------------------------------------------------------------------------------|
| `system`     | 대화의 초기 설정과 규칙을 정의                                                           | 대화가 시작될 때 모델의 성격, 행동, 스타일을 설정하는 메시지에서 사용                               |
| `user`       | 사용자가 모델에 요청이나 질문을 전달                                                    | 대화 중에 사용자가 요청하거나 질문할 때 사용                                                      |
| `assistant`  | 모델이 사용자에게 응답하거나 제안                                                      | 사용자의 질문에 답변하거나 함수 호출을 제안할 때 사용                                              |
| `function`   | 함수 호출을 처리하거나 함수의 반환값을 전달                                             | 모델이 함수 호출을 제안하거나 함수가 반환값을 전달할 때 사용                                       |

## 다양한 Prompting 기법


1. **Chain-of-Thought (CoT)**
   중간 추론 과정을 단계별로 명시하도록 유도한다.

   ```text
   문제: 345와 678을 더한 뒤 12로 나눈 나머지를 구하라.
   지시: 단계별로 생각 과정을 자세히 기술한 후 최종 답을 제시하라. “Let’s think step by step.”
   ```

2. **Tree-of-Thought (ToT)**
   여러 사고 경로를 동시에 탐색하고 비교하도록 유도한다.

   ```text
   문제: 한 변의 길이가 5인 정삼각형의 넓이를 구하라.
   지시:
   1) 방법 A: 공식 사용  
   2) 방법 B: 좌표평면에 넣어 계산  
   두 경로를 각각 전개한 뒤, 결과와 장단점을 비교·선택하라.
   ```

3. **Self-Consistency**
   여러 번 답안을 생성한 뒤, 가장 빈번하게 등장한 답을 선택하도록 유도한다.

   ```text
    문제: “racecar”가 팰린드롬인지 판별하라.
    지시: 이 질문을 5회 반복적으로 답변한 뒤, 가장 일관된 답을 최종으로 제시하라.
   ```

4. **Least-to-Most**
   문제를 작은 단계로 나눈 뒤, 쉬운 것부터 차례로 해결하도록 유도한다.

   ```text
   문제: “1234 + 5678 − 910” 계산하라.
   지시:
   1) 먼저 1234 + 5678을 계산하라.  
   2) 그 결과에서 910을 빼라.  
   3) 각 단계의 답을 제시하고, 최종 결과를 계산하라.
   ```

5. **Plan-and-Solve (PS)**
   전체 풀이 계획을 먼저 작성하고, 그 계획에 따라 차례로 풀이하도록 유도한다.

   ```text
   문제: “2차 방정식 x^2 − 5x + 6 = 0의 해를 구하라.”
   지시:
   1) 계획 세우기: 필요한 공식·단계를 나열하라.  
   2) 계획에 따라 단계별로 해를 구하라.
   ```

6. **ReAct (Reasoning and Acting)**
   추론과 외부 행동(e.g., 검색, 코드 실행)을 번갈아가며 수행하도록 유도한다.

   ```text
   문제: “2025년 FIFA 여자 월드컵 개최국은 어디인가?”
   지시:
   - Reasoning: 관련 지식을 확인한 뒤  
   - Action: “search(‘2025 FIFA Women’s World Cup host country’)” 명령어를 사용해 인터넷에서 최신 정보를 가져오라  
   - Reasoning: 검색 결과를 바탕으로 최종 답을 제시하라.
   ```