### Few shot Learning

소량의 학습만으로 새로운 작업을 학습하거나 일반화하는 것을 의미한다. 모델에 어떻게 반응하기를 원하는지에 대한 예시를 제공하는 것으로, 이 기술은 전체 아키텍처를 건드리지 않고도 모델 맞춤화를 가능하게 한다.

In [1]:
import datetime

import numpy as np
import pandas as pd
import openai
from openai import OpenAI
import os

with open('../config/api.key') as file :
    lines = file.readlines()
    api_key = lines[0].strip()
    serp_api_key = lines[1].strip()
    langsmith_api_key = lines[2].strip()

openai.api_key = api_key

In [2]:
system_message = """
당신은 AI 마케팅 도우미입니다. 사용자가 새로운 제품 이름에 대한 캐치프레이즈를 만들 수 있도록 도와줍니다.
주어진 제품명에 대해 다음 예시와 비슷한 홍보 문구를 만들어주세요.

Apple - Think Different
Samsung - Do What You Can’t
SK 텔레콤 - 또 다른 세상을 만날 땐 잠시 꺼두셔도 좋습니다.
Amazon - Earth’s Most Customer-Centric Company
Microsoft - Cloud First
Google - Don’t Be Evil

제품명 : 
"""

product_name = 'iPhone'

In [3]:
client = OpenAI(api_key = openai.api_key)

response = client.chat.completions.create(
    model = 'gpt-4o-mini',
    messages = [
        {'role': 'system', 'content': system_message},
        {'role': 'user', 'content': product_name},
    ]
)

In [4]:
print(response.choices[0].message.content)

iPhone - 혁신을 손끝에 담다.


대부분의 경우, fewshot learning은 fine tuning을 적절한 도구로 생각할 수 있는 극도로 특수한 시나리오에서도 모델을 맞춤화할 수 있을 만큼 강력하다는 점을 명심하자. 실제로 적절한 few shot learning은 fine tuning process만큼 효과적일 수 있다. 다른 예를 살펴보자. 감정 분석에 특화된 모델을 개발하고자 한다고 가정해 보자. 이를 위해 긍정 또는 부정 등 원하는 결과와 함께 다양한 감정을 가진 일련의 텍스트 예시를 제공한다. 이 예제 세트는 지도 학습 과업을 위한 작은 훈련 세트에 불과하며, fine tuning과 유일한 차이점은 모델의 parameter를 업데이트 하지 않는다는 점이다.

In [5]:
system_message = """
당신은 금융, 경제에 종사하고 있는 사람들의 연설을 전문적으로 분석하는 분석가입니다. 
연설의 감정을 향후 주식시장에 미칠 영향을 기준으로 positive, negative 로 분류합니다.

원문이 한국어가 아닌 경우, 한국어로 번역을 하되 번역된 원문은 제공하지 마세요.

다음 텍스트들을 예시로 사용할 수 있습니다.

텍스트 : "I love this product! It's fantastic and works perfectly."
Positive

텍스트 : "I'm really disappointed with the quality of the food."
Negative

텍스트 : "This is the best day of my life."
Positive

텍스트 : "I can't stand the noise in this restaurant."
Negative

감정만을 구두점 없이 출력합니다.

텍스트 : 
"""

분류기를 테스트하기 위해 Kaggle에서 제공되는 영화 리뷰의 IMDB 데이터베이스를 사용한다.

In [6]:
df = pd.read_csv('../data/IMDB Dataset.csv', encoding = 'utf-8')
df['sentiment'] = df['sentiment'].replace(
    {0: 'negative', 1: 'positive'}
)
df.head()

Unnamed: 0,review,sentiment
0,One of the other reviewers has mentioned that ...,positive
1,A wonderful little production. <br /><br />The...,positive
2,I thought this was a wonderful way to spend ti...,positive
3,Basically there's a family where a little boy ...,negative
4,"Petter Mattei's ""Love in the Time of Money"" is...",positive


In [7]:
df = df.sample(n=10, random_state=42)

In [8]:
df

Unnamed: 0,review,sentiment
33553,I really liked this Summerslam due to the look...,positive
9427,Not many television shows appeal to quite as m...,positive
199,The film quickly gets to a major chase scene w...,negative
12447,Jane Austen would definitely approve of this o...,positive
39489,Expectations were somewhat high for me when I ...,negative
42724,I've watched this movie on a fairly regular ba...,positive
10822,For once a story of hope highlighted over the ...,positive
49498,"Okay, I didn't get the Purgatory thing the fir...",positive
4144,I was very disappointed with this series. It h...,negative
36958,The first 30 minutes of Tinseltown had my fing...,negative


In [9]:
def process_text(text) : 
    response = client.chat.completions.create(
        model = 'gpt-4o-mini',
        messages = [
            {'role': 'system', 'content': system_message},
            {'role': 'user', 'content': text},
        ]
    )
    return response.choices[0].message.content

df['predicted'] = df['review'].apply(process_text)

In [10]:
df

Unnamed: 0,review,sentiment,predicted
33553,I really liked this Summerslam due to the look...,positive,Negative
9427,Not many television shows appeal to quite as m...,positive,Positive
199,The film quickly gets to a major chase scene w...,negative,Negative
12447,Jane Austen would definitely approve of this o...,positive,positive
39489,Expectations were somewhat high for me when I ...,negative,Negative
42724,I've watched this movie on a fairly regular ba...,positive,Positive
10822,For once a story of hope highlighted over the ...,positive,Positive
49498,"Okay, I didn't get the Purgatory thing the fir...",positive,Positive
4144,I was very disappointed with this series. It h...,negative,Negative
36958,The first 30 minutes of Tinseltown had my fing...,negative,Negative


label과 predicted 열을 비교한 결과를 보면 알 수 있듯이, 모델을 fine tuning하지 않고도 모든 리뷰를 정확하게 분류할 수 있다. 이것은 모델 전문화 측면에서 few shot learning 기술을 통해 달성할 수 있는 것의 한 예일 뿐이다.

### Chain of Thought(CoT

사고 연쇄(Chain of Thought)는 중간 추론 단계를 통해 복잡한 추론을 가능하게 하는 기법이다. 또한 모델이 자신의 추론을 설명하도록 유도하여 너무 빠르지 않도록 '강제'함으로써 잘못된 응답을 제공할 위험을 방지한다. LLM이 일반적인 일차 방정식을 풀게 하고 싶다고 가정하자. 이를 위해 LLM이 따라야 할 기본 추론 목록을 제공한다.

In [22]:
system_message = """
일반적인 1차 방정식을 해결하려면 다음 단계를 따르세요.

1. 방정식 식별 : 해결하려는 방정식을 식별합니다.
   방정식은 'ax + b = c' 형태여야 합니다.
   여기서 'a'는 변수의 계수, 'x'는 변수, 'b'는 상수, 'c'는 또 다른 상수입니다.
2. 변수 고립화 : 목표는 변수 'x'를 방정식 한쪽에 고립시키는 것입니다.
   이를 위해 다음 단계를 수행합니다:
   a. 상수 추가 또는 빼기 : 상수를 한쪽으로 이동시키기 위해 양쪽에서 'b'를 더하거나 뺍니다.
   b. 계수로 나누기 : 'x'를 고립시키기 위해 양쪽을 'a'로 나눕니다.
      'a'가 0이면 방정식에는 고유한 해가 없을 수 있습니다.
3. 단순화 : 방정식의 양쪽을 최대한 단순화합니다.
4. 'x'에 대해 해결 : 'x'를 한쪽에 고립시키면 해결책을 얻을 수 있습니다.
   이는 'x = 값' 형태가 될 것입니다. 
5. 해 검토 : 찾은 'x' 값을 원래 방정식에 대입하여 방정식을 만족하는지 확인합니다.
   그렇다면 올바른 해결책을 찾은 것입니다.
6. 해 표현 : 해결책을 명확하고 간결한 형태로 작성합니다.
7. 특수 경우 고려 : 'a'가 0일 때 해가 없거나 무한히 많은 해가 있을 수 있는 특수한 경우를 인지합니다.

방정식 : 
"""

equation = "3x + 5 = 11"

response = client.chat.completions.create(
    model = 'gpt-4o-mini',
    messages = [
        {'role': 'system', 'content': system_message},
        {'role': 'user', 'content': equation},
    ]
)

In [23]:
print(response.choices[0].message.content)

주어진 방정식은 \( 3x + 5 = 11 \)입니다. 이 방정식을 해결해 보겠습니다.

1. **방정식 식별**: 방정식은 \( ax + b = c \) 형태이고, 여기서 \( a = 3 \), \( b = 5 \), \( c = 11 \)입니다.

2. **변수 고립화**:
   - **상수 추가 또는 빼기**: 양쪽에서 5를 빼줍니다.
     \[
     3x + 5 - 5 = 11 - 5
     \]
     이는 \( 3x = 6 \)이 됩니다.
     
   - **계수로 나누기**: 양쪽을 3으로 나눕니다.
     \[
     \frac{3x}{3} = \frac{6}{3}
     \]
     그러면 \( x = 2 \)가 됩니다.

3. **단순화**: 현재 방정식은 이미 단순화 되어 있습니다.

4. **'x'에 대해 해결**: \( x = 2 \)입니다.

5. **해 검토**: 원래 방정식에 대입하여 확인합니다.
   \[
   3(2) + 5 = 6 + 5 = 11
   \]
   오른쪽과 왼쪽이 같으므로 올바른 해결책입니다.

6. **해 표현**: 최종 해는 \( x = 2 \)입니다.

7. **특수 경우 고려**: \( a \)는 3이므로 고유한 해가 있습니다.

따라서 주어진 방정식의 해는 \( x = 2 \)입니다.


모델은 meta prompt에 지정된 7단계를 명확하게 따랐으며, 이를 통해 이 과업을 수행하는 데 '시간적 여유'를 가질 수 있다. 응답하기 전에 추론이 필요한 더 복잡한 과업에서 더 나은 결과를 얻기 위해 이 기능을 단답형 prompt와 결합할 수도 있다.

CoT를 사용하면 모델에 중간 추론 단계를 생성하도록 유도한다. 이는 다음 절에서 살펴볼 또 다른 추론 기법의 구성 요소이기도 하다.

### Reason and Act (ReAct)

In [24]:
import openai

from datetime import datetime
from langchain_openai import ChatOpenAI
from langchain_community.utilities import SerpAPIWrapper
from langchain_community.tools import Tool
from langchain.agents import create_agent

TODAY = datetime.today().strftime('%Y/%m/%d')

llm = ChatOpenAI(
    model="gpt-4o-mini",
    api_key=openai.api_key,
)

search = SerpAPIWrapper(serpapi_api_key=serp_api_key)

serp_tool = Tool(
    name="serpapi",
    description="Search the web using SerpAPI and return relevant results.",
    func=search.run,
)

tools = [serp_tool]

agent = create_agent(
    model=llm,
    tools=tools,
)

result = agent.invoke({
      "messages": [("user",
        f"Search the web and list ONLY KOSPI (not KOSDAQ) top 3 gainers for today {TODAY}"
        "Return: ticker, name, %change. If sources disagree, say so."
      )]
})

In [25]:
import pprint

final_text = result["messages"][-1].content

print(final_text)

The top 3 gainers for KOSPI on January 19, 2026, are as follows:

1. **Ticker**: 005380 
   **Name**: Hyundai Motor 
   **% Change**: +13%

2. **Ticker**: 000270 
   **Name**: Kia Corp 
   **% Change**: +1.71%

3. **Ticker**: Not listed (no third gainer was consistently mentioned).

Sources indicate Hyundai Motor had a significant rise, while Kia Corp also gained but with lower increments. There was disagreement on whether there were clear third gainers, as several sources primarily focused on the two mentioned above.


구글 서치 엔진을 통해 전역 검색을 하면 요청시마다 결과가 달라질 수 있으므로, 아래와 같이 검색 도메인 제한을 통해 안정적으로 데이터를 가져오도록 할 수 있다.

In [29]:
import json
import openai
from typing import List, Dict, Any

model = ChatOpenAI(
    model="gpt-4o-mini",
    api_key=openai.api_key,
)

serp = SerpAPIWrapper(
    serpapi_api_key=serp_api_key,
    params={"engine": "google", "hl": "en", "gl": "kr", "num": 10},
)


ALLOWED_SITES = ["krx.co.kr", "finance.naver.com", "investing.com"]

def site_locked_search(user_query: str) -> str:
    site_expr = " OR ".join([f"site:{s}" for s in ALLOWED_SITES])
    q = f"({site_expr}) {user_query}"
    return serp.run(q)

serp_locked_tool = Tool(
    name="serpapi_locked",
    description="Search via SerpAPI restricted to trusted domains (KRX, Naver Finance, Investing.com).",
    func=site_locked_search,
)

agent = create_agent(
    model=model,
    tools=[serp_locked_tool]
)

query = (
    f"Search the web and list ONLY KOSPI (not KOSDAQ) top 3 gainers for today {TODAY}"
        "Return: ticker, name, %change. If sources disagree, say so."
)

In [30]:
result = agent.invoke({"messages": [("user", query)]})

print(result["messages"][-1].content)

Here are the top 3 gainers on the KOSPI for January 19, 2026:

1. **Korea Flange (KS: 010100)**: +29.94%
2. **Charm Engine (KS: 009310)**: +29.92%
3. **Isu Specialty Chemical (KS: 457190)**: +29.90%

Sources confirm these figures, and there are no discrepancies noted among them.


과거 버전처럼 실시간 스트림으로 사고 과정을 보고싶다면 아래의 코드처럼 해 주면 된다.

In [32]:
for event in agent.stream(
    {"messages": [("user", query)]},
    stream_mode="values",
):
    msgs = event.get("messages", [])
    last = msgs[-1]

    if last.type == "tool":
        print("\n[TOOL RESULT]")
        print(last.content)

    elif last.type == "ai":
        if last.tool_calls:
            print("\n[MODEL → TOOL CALL]")
            print(last.tool_calls)


[MODEL → TOOL CALL]
[{'name': 'serpapi_locked', 'args': {'__arg1': 'top gainers KOSPI 2026/01/19'}, 'id': 'call_cRCtSVQRnPNEsa0283zVDTEE', 'type': 'tool_call'}]

[TOOL RESULT]
['Hyundai Motor (KS:005380) was by far the biggest gainer and boost to the KOSPI, rising over 13% to a record high. Sister company Kia Corp (KS: ...', 'Up-to-date data on the stock market in South Korea, including leading stocks, large and small cap stocks.', 'KOSPI Recent Sentiments ; Jan 15, 2026, Devan Uhl ; Jan 15, 2026, Anssi Ahtolinna ; Jan 14, 2026, Vatcharakris Nopakun ; Jan 14, 2026, SeungHo Choi ...', "What Is the KOSPI's 5-Day Moving Average? The KOSPI 5-day moving average is 4836.15, suggesting that the index is a Buy.", 'Get data on global stock markets and stock prices. You can choose to view the information by continent, specific country or specific stock index.', 'Find information on Asian stock markets, including price, performance over time, technical analysis summaries and key fundamental info

In [33]:
print(result["messages"][-1].content)

Here are the top 3 gainers on the KOSPI for January 19, 2026:

1. **Korea Flange (KS: 010100)**: +29.94%
2. **Charm Engine (KS: 009310)**: +29.92%
3. **Isu Specialty Chemical (KS: 457190)**: +29.90%

Sources confirm these figures, and there are no discrepancies noted among them.
