# **Chapter 1. Basic Prompt Structure** 

Upstage offers various types of APIs, including Chat, Text Embedding, Translation, Grounding Check, Layout Analysis, Key Information Extraction, and Document Processing. In this book, we will exclusively focus on using the `Chat API`.

For more information about the APIs, please refer to the following [link](https://github.com/UpstageAI/cookbook?tab=readme-ov-file#api-list).

## **Table of Contents**
- Use `Ctrl + F` (Windows) or `Cmd + F` (Mac) to locate specific sections by title.

- **1.1 `Chat API`**  


- **1.2 Understanding Parameters**  

    - 1.2.1 Paramters  

    - 1.2.2 Examples  


- **1.3 Understanding Structure**  

    - 1.3.1 Input Structure  

    - 1.3.2 Example  


- **1.4 Understanding System Prompt**

    - 1.4.1 System Prompt  

    - 1.4.2 Examples  

    - 1.4.3 Practice  


---

## **1.1 `Chat API`**

The Following is a standard API call format used to interact with Upstage’s API for generating chat completions.

In [1]:
from openai import OpenAI

# Retrieve the OPENAI_API_KEY variable from the IPython store
%store -r OPENAI_API_KEY

try:
    if OPENAI_API_KEY:
        print("Success!")
except NameError as ne:
    print(f"Since, {ne}")
    print("Please, insert your API key.")
    OPENAI_API_KEY = input("OPENAI_API_KEY =")

# Set your API key: 
# OPENAI_API_KEY = " " ←- Insert your API key here. 

client = OpenAI(
    api_key= OPENAI_API_KEY,
    base_url="https://api.openai.com/v1"
)
 
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {
            "role": "user",
            "content": "한국인이 영어를 배울 필요가 있을까?"
        }
    ],
)

print('\n', response.choices[0].message.content, '\n\n')


Success!

 한국인이 영어를 배우는 것은 여러 가지 이유로 유익할 수 있습니다. 몇 가지 주요 이유는 다음과 같습니다:

1. **국제 소통**: 영어는 국제적으로 가장 널리 사용되는 언어 중 하나입니다. 한국인이 영어를 잘하면 해외에서의 소통이 원활해지고, 다양한 문화와 사람들을 만날 기회가 더 많아집니다.

2. **취업 기회 확대**: 많은 기업들이 영어 능력을 중요한 조건으로 삼고 있습니다. 영어를 잘 구사하면 글로벌 기업이나 외국계 기업에서 일할 기회가 늘어납니다.

3. **정보 접근**: 많은 최신 정보, 연구, 기술 등이 영어로 제공됩니다. 영어를 이해하면 더 많은 자료에 접근할 수 있고, 지식을 확장하는 데 도움이 됩니다.

4. **여행**: 외국을 여행할 때 영어를 할 수 있으면 현지인과 소통이 용이하고, 더 풍부한 경험을 할 수 있습니다.

5. **학문적 발전**: 많은 학술 연구와 교육 과정이 영어로 진행되므로, 영어를 잘하면 더 많은 학문적 자료에 접근할 수 있습니다.

6. **문화 교류**: 영어를 배우면 영화, 음악, 문학 등의 다양한 문화 콘텐츠를 원어로 즐길 수 있어, 문화에 대한 이해도가 깊어집니다.

결론적으로, 영어를 배우는 것은 한국인에게 다양한 기회를 제공하고, 개인적인 성장에도 큰 도움이 됩니다. 




---

## **1.2 Understanding Parameters**

When performing prompt engineering, parameters are key to controlling how the model behaves and the type of output you receive. <br>
Here’s a detailed explanation of these parameters and their role in the completion generation process.

### **1.2.1 Paramters**

**`Model`**:

The specific model you are intending to interact with. 

**`Max_Tokens`**: 

- 출력의 총 토큰 수(단어 또는 단어의 일부)를 제한합니다. max_tokens를 설정하면 모델 출력의 최대 길이를 제어할 수 있습니다. 이는 지나치게 긴 응답을 방지하거나, API 사용 비용을 관리하거나, 특정 용도(예: 짧은 답변, 요약 등)에 맞게 출력을 조정하는 데 유용

- **Hard Stop**:
    - 설정된 제한을 초과하여 토큰을 생성하지 않도록 모델을 중지
    - 토큰 제한에 도달하면 단어 또는 문장이 중간에서 멈출 수 있음

- **Prompt Tokens**: 입력 프롬프트에 포함된 토큰 수.

- `max_tokens`가 설정된 경우, 입력 토큰과 max_tokens의 합은 모델의 context length (≤ 4096)를 초과해서는 안 됩니다.

**`Temperature`**:

모델 응답의 무작위성(randomness) 또는 창의성(creativity)을 제어 

- 높은 값은 더 유연하게 작동하며, 보다 다양한 텍스트 생성을 유도합니다.
- 낮은 값은 모델을 더 결정론적으로 만들어, 일반적으로 더 정확하고 일관된 출력을 생성합니다.

허용범위는 **0** ~ **2.0** (`0 ≤ Temperature ≤ 2.0`).

- **`0.0`**: 출력이 결정적이며 예측 가능하여, 동일한 프롬프트에 대해 매번 동일한 응답을 반환할 가능성이 높습니다.
- **`0.7`**: 창의성과 초점이 균형을 이루는 수준으로, 응답이 다양할 수 있지만 주제에서 크게 벗어나지 않습니다.
- **`2.0`**: 매우 창의적이거나 무작위적인 출력을 장려하며, 더 독특하거나 다양한 응답을 생성할 가능성이 있습니다.

**`Top_P`**: 

 이 매개변수는 토큰 선택의 누적 확률을 고려하여 모델 출력의 무작위성을 제어하는 대안적인 방식입니다. Top_P를 사용하면 모델이 응답을 생성할 때 얼마나 "안전"하거나 "위험"한 선택을 할지 제어할 수 있습니다. 낮은 값은 모델의 샘플링 범위를 줄여 더 높은 확률의 토큰에 집중하도록 강제하며, 높은 값은 응답의 다양성을 증가시킵니다.

- **Top_P = 0.9**: 모델은 누적 확률이 90%인 가장 작은 토큰 집합에서 샘플링

**! How it differs from `temperature`**: While `temperature` affects how creative the model is overall, `Top_P` affects how many of the high-probability tokens are considered in the final response.

> **Summary** 
> 
> - **model**: Defines the specific AI model being used.
> - **max_tokens**: Limits the length of the response.
> - **temperature**: Controls the **creativity or randomness** of the response.
> - **top_p**: Controls **how many token choices the model considers** based on probability.

### **1.2.2 Examples**

**Example #1: Configuration**

In [5]:
config_model = {
    "model": "gpt-4o-mini",
    "max_tokens": 500,
    "temperature": 0.7,
    "top_p": 0.9,
}

**Example #2: Temperature and Top_P Adjustment**

Objective:  Compare how creativity and randomness affect responses. 

In [13]:
config_robust = {
    "model": "gpt-4o-mini",
    "messages": [
        {
            "role": "user",
            "content": "김치찌개 끓이는 방법은?"
        }
    ],
    "max_tokens": 400,
    "temperature": 0.0,
    "top_p": 0.8
}

response = client.chat.completions.create(**config_robust)
print(response.choices[0].message.content, '\n\n')

김치찌개는 한국의 대표적인 찌개 중 하나로, 간단하게 만들 수 있습니다. 아래는 기본적인 김치찌개 레시피입니다.

### 재료
- 잘 익은 김치 2컵
- 돼지고기 (목살 또는 삼겹살) 200g
- 두부 1/2모
- 대파 1대
- 양파 1개
- 마늘 2~3쪽
- 고춧가루 1~2큰술 (취향에 따라 조절)
- 국간장 1큰술
- 소금, 후추 약간
- 물 4컵

### 조리 방법
1. **재료 손질**: 
   - 김치는 먹기 좋은 크기로 자르고, 돼지고기는 한 입 크기로 썰어줍니다.
   - 두부는 깍둑썰기하고, 대파는 송송 썰고, 양파는 채 썰어줍니다.
   - 마늘은 다져줍니다.

2. **고기 볶기**: 
   - 냄비에 돼지고기를 넣고 중불에서 볶아 기름이 나올 때까지 익힙니다.
   - 고기가 익으면 다진 마늘과 양파를 넣고 함께 볶아줍니다.

3. **김치 넣기**: 
   - 볶은 고기와 양파에 김치를 넣고, 김치가 익을 때까지 5~7분 정도 볶아줍니다.

4. **국물 만들기**: 
   - 볶은 재료에 물을 붓고, 고춧가루와 국간장을 넣습니다. 끓기 시작하면 중불로 줄여 10~15분 정도 끓입니다.

5. 




In [12]:
config_creative = {
    "model": "gpt-4o-mini",
    "messages": [
        {
            "role": "user",
            "content": "김치찌개 끓이는 방법은?"
        }
    ],
    "max_tokens": 400,
    "temperature": 1.0,
    "top_p": 1.0
}

response = client.chat.completions.create(**config_creative)
print(response.choices[0].message.content, '\n\n')

김치찌개는 한국의 대표적인 찌개로, 간단하게 만들 수 있습니다. 아래는 기본적인 김치찌개 레시피입니다.

### 재료
- 잘 익은 김치 200g
- 돼지고기 (목살 또는 삼겹살) 150g
- 두부 1/2 모
- 대파 1대
- 마늘 2~3쪽
- 고춧가루 1~2 큰술 (취향에 따라 조절)
- 국간장 1 큰술
- 소금, 후추 약간
- 물 3~4컵

### 조리 방법
1. **재료 준비**: 
   - 김치는 적당한 크기로 자르고, 돼지고기도 한 입 크기로 썰어 준비합니다. 
   - 두부는 깍둑썰기로 자르고, 대파는 어슷하게 썰어줍니다. 마늘은 다져줍니다.

2. **돼지고기 볶기**: 
   - 냄비에 돼지고기를 넣고 중불에서 볶아 기름이 조금 나올 때까지 조리합니다.

3. **김치 추가**: 
   - 고기가 익으면 준비한 김치를 넣고 함께 볶아줍니다. 이때, 김치와 고기가 잘 섞이도록 볶아줍니다.

4. **물 추가**: 
   - 볶은 김치와 고기에 물 3~4컵을 붓고 끓여줍니다. 끓기 시작하면 중불로 줄입니다.

5. **양념하기**: 
   - 끓는 국물에 고춧가루, 국간장, 다진 마늘을 추가하고, 원하는 간에 따라 소금과 후추로 간을 맞 




**Example #3: Limiting Output with Max_Tokens**

Objective: Control the length of responses and stop them at specific points. 

In [14]:
config_output_400 = {
    "model": "gpt-4o-mini",
    "messages": [
        {
            "role": "user",
            "content": "Explain how Upstage AI models handle natural language processing. Explain it in a way that non-developers can easily understand."
        }
    ],
    "max_tokens": 400,
    "temperature": 0.7,
}

response = client.chat.completions.create(**config_output_400)
print(response.choices[0].message.content, '\n\n')

Upstage AI models handle natural language processing (NLP) by simulating how humans understand and use language, allowing them to interpret, generate, and respond to text in a way that feels natural and meaningful.

Here’s a simple breakdown of how it works:

1. **Understanding Language**: Just like how we learn language by listening and reading, Upstage AI models are trained on a vast amount of written text from books, articles, and websites. This training helps the model learn the rules of grammar, the meanings of words, and how sentences are structured.

2. **Recognizing Patterns**: As the model processes this text, it starts to recognize patterns. For instance, it learns that "The cat is on the mat" is a complete thought, while "The cat on" is incomplete. This helps the model understand what makes sense and what doesn’t.

3. **Context Matters**: Upstage AI models also pay attention to context. This means they can understand that the word "bank" can refer to a financial institution 

In [15]:
config_output_40 = {
    "model": "gpt-4o-mini",
    "messages": [
        {
            "role": "user",
            "content": "Explain how Upstage AI models handle natural language processing. Explain it in a way that non-developers can easily understand."
        }
    ],
    "max_tokens": 40,
    "temperature": 0.7,
}

response = client.chat.completions.create(**config_output_40)
print(response.choices[0].message.content, '\n\n')

Upstage AI models handle natural language processing (NLP) by using advanced algorithms and techniques that allow computers to understand, interpret, and generate human language in a way that's meaningful and useful. Here's a 




---

## **1.3 Understanding Structure**

### **1.3.1 Input Structure** 

**`messages`** :

This is an array containing the conversation context. It includes exchanges between the user and the model. Each element contains: 

- “**role**”:
    
    The role can be `"user"`, `"assistant"`, or `"system"`, indicating the source of the message.
    
    In the case of `"role": "system"`, it sets the behavior, tone, and knowledge base of the assistant, acting as an initial instruction.
    
    In the case of `"role": "user"`, it specifies that the message comes from the user.
    
    In the case of `"role": "assistant"`, it contains responses generated by the AI to address the user’s queries or continue the conversation.

### **1.3.2 Example**

In [None]:
{
  "role": "system",
  "content": "You are my Assistant. Your role is to answer my questions faithfully and in detail."
}

In [None]:
{
  "role": "user",
  "content": "Hello, Solar. Can you help me plan a weekend trip to New York City?"
}

In [None]:
{
  "role": "assistant",
  "content": "Hello! I'd be happy to help you plan your weekend trip to New York City. Let's start by discussing your interests and preferences. Are you looking for sightseeing, shopping, diningor perhaps a mix of all?"
}

---

## **1.4 Understanding System Prompt**

### **1.4.1 System Prompt**

**시스템 프롬프트**는 AI 모델이 사용자 입력을 해석하고 응답하는 방식을 결정하는 데 중요한 역할을 합니다. 프롬프트 엔지니어링의 맥락에서, 시스템 프롬프트를 효과적으로 이해하고 활용하면 모델의 동작을 안내하고, 사용자 기대에 부합하는 응답을 보장할 수 있습니다. 이 책에서는 **두 가지 유형의 시스템 프롬프트: 짧은 버전과 긴 버전**을 소개합니다.


> **Tips**:
>
> If the system prompt is short, the responses tend to be brief; if the system prompt is long, the responses are generally longer. 

### **1.4.2 Examples**

**Example #1: Short Version**

In [16]:
config_model = {
    "model": "gpt-4o-mini",
    "max_tokens": 2000,
    "temperature": 0.7,
    "top_p": 0.9,
}

message = [
    {
        "role": "system",
        "content": "You are an AI assistant to help user's various tasks. Please provide me with an accurate information."
    },
    {
        "role": "user",
        "content": "Explain about Blockchain in detail."
    }
]

config = {**config_model, "messages": message}

response = client.chat.completions.create(**config)
print(response.choices[0].message.content, '\n\n')

Blockchain is a decentralized and distributed digital ledger technology that securely records transactions across multiple computers in such a way that the registered transactions cannot be altered retroactively. This technology is the backbone of cryptocurrencies, such as Bitcoin, but its applications extend far beyond that. Here’s a detailed explanation of its key components, functionalities, and implications:

### Key Components of Blockchain

1. **Blocks**: The basic unit of a blockchain is a block, which contains a list of transactions. Each block has:
   - **Data**: Information regarding the transactions.
   - **Nonce**: A random number used in the mining process.
   - **Hash**: A cryptographic hash of the block’s data, which ensures the integrity of the block.
   - **Previous Hash**: A reference to the hash of the previous block, linking it to the chain.

2. **Chain**: A blockchain is formed by linking blocks together in a linear sequence, where each block contains the hash of t

**Example #2: Long Version**

In [17]:
config_model = {
    "model": "gpt-4o-mini",
    "max_tokens": 2000,
    "temperature": 0.7,
    "top_p": 0.9,
}

message = [
    {
        "role": "system",
        "content": "Your name is Solar. As my friendly AI language assistant, you are tasked with providing me an accurate information. If you find that the information at hand is inadequate, please ask me for further information. [Strong Rule] If you don't have any real-time information about the user’s query, please be honesty."
    },
    {
        "role": "user",
        "content": "Explain about Blockchain in detail."
    }
]

config = {**config_model, "messages": message}

response = client.chat.completions.create(**config)
print(response.choices[0].message.content, '\n\n')

Blockchain is a decentralized digital ledger technology that records transactions across many computers in such a way that the registered transactions cannot be altered retroactively. This ensures the security, transparency, and integrity of the data. Here’s a detailed breakdown of its key components and features:

### Key Components of Blockchain:

1. **Blocks**:
   - A blockchain is made up of a series of blocks, each containing a list of transactions.
   - Each block has three main components:
     - **Data**: Information about the transactions (e.g., sender, receiver, amount).
     - **Hash**: A unique identifier for the block created by a cryptographic function, which is based on the block's content. If the content changes, the hash changes as well.
     - **Previous Block Hash**: Links the current block to the previous one, forming a chain. This is what gives blockchain its name.

2. **Chain**:
   - The blocks are linked in chronological order, forming a chain. This structure hel

### **1.4.3 Practice**

Try switching between the short and long versions of the system prompt with different questions to experience the difference in responses.

**Short System Prompt**

In [None]:
message = [
    {
        "role": "system",
        "content": "You are an AI assistant to help user's various tasks. Please provide me with an accurate information."
    },
    {
        "role": "user",
        "content": " " # ←- Insert your prompt here.
    }
]

config = {**config_model, "messages": message}

response = client.chat.completions.create(**config)
print(response.choices[0].message.content, "\n\n")

**Long System Prompt**

In [None]:
message = [
    {
        "role": "system",
        "content": "Your name is Solar. As my friendly AI language assistant, you are tasked with providing me an accurate information. If you find that the information at hand is inadequate, please ask me for further information. [Strong Rule] If you don't have any real-time information about the user’s query, please be honesty."
    },
    {
        "role": "user",
        "content": " " # ←- Insert your prompt here.
    }
]

config = {**config_model, "messages": message}

response = client.chat.completions.create(**config)
print(response.choices[0].message.content, "\n\n")

**Custom Your System Prompt**

In [None]:
config_your_model = {
    "model": "gpt-4o-mini",
    "max_tokens": 0.0,  # ←- Insert your max_tokens: 0.0 ~ here. 
    "temperature": 0.0, # ←- Insert your temperature: 0.0 ~ 2.0 here.
    "top_p": 0.0,       # ←- Insert your top_p: 0.0 ~ 1.0 here.
}

message = [
    {
        "role": "system",
        "content": " " # ←- Insert your system prompt here.
    },
    {
        "role": "user",
        "content": " " # ←- Insert your prompt here.
    }
]

config = {**config_your_model, "messages": message}

response = client.chat.completions.create(**config)
print(response.choices[0].message.content, '\n\n')