# 프롬프트 엔지니어링 기법
https://www.promptingguide.ai/kr/techniques

In [15]:
from dotenv import load_dotenv
import os

# .env 파일의 내용을 환경 변수로 불러오기
load_dotenv("C:/env/.env")

# 환경 변수 가져오기
API_KEY = os.getenv("OPENAI_API_KEY")

from openai import OpenAI
client = OpenAI(api_key=API_KEY)

### Zero-shot Prompting
: 예시가 주어지지 않음

In [39]:
prompt = '''
다음 영어 문장을 불어로 번역해줘 :
'Hello, how are you?'
'''
completion = client.chat.completions.create(
    model = "gpt-4o-mini",
    temperature = 0.2,
    messages = [
        { "role" : "user",
          "content" : prompt }
    ]
)

print(completion.choices[0].message.content)

'Hello, how are you?'는 프랑스어로 'Bonjour, comment ça va ?'입니다.


### Few-shot Prompting 
: 몇 개의 예시를 제공 , 한 개의 예시가 주어지는 경우 --> One-shot

In [44]:
prompt = '''
English : 'Hello, how are you?'
French : 'Bonjour, comment ça va ?'

English: 'What is your name?'
French: 'Comment vous appelez-vous?'

English : 'Hello, Miss'
French :
'''
completion = client.chat.completions.create(
    model = "gpt-4o-mini",
    temperature = 0.2,
    messages = [
        { "role" : "user",
          "content" : prompt }
    ]
)

print(completion.choices[0].message.content)
# 지시가 없어도 예시만 보고 불어로 번역해준다

French: 'Bonjour, Mademoiselle'


In [56]:
prompt = """
아래 예시를 참조해서 알맞은 답변해줘

질문: 이 영화 너무 재미 없어!!'
답변: 부정 평가

질문: 이 영화 돈이 안 아까와..'
답변: 긍정 평가

질문: 시간만 버렸어~'
답변: 부정 평가

질문: 내내 하품만 나옴'
답변: 

질문: 핵 꿀잼~'
답변: 
"""
completion = client.chat.completions.create(
    model = "gpt-4o-mini",
    temperature = 0.2,
    messages = [
        { "role" : "user",
          "content" : prompt }
    ]
)

print(completion.choices[0].message.content)

질문: 내내 하품만 나옴  
답변: 부정 평가

질문: 핵 꿀잼~  
답변: 긍정 평가


### CoT(Chain-of-Thought) Prompting

In [78]:
prompt = """
철수에게는 사과가 10개 있었습니다 그저께 부터 오늘까지 매일 아침에 2개씩 먹었습니다
오늘 점심에 어머니께서 사과 5개를 더 사다 주셨습니다 오늘 저녁에 친구에게 2개를 주었습니다
철수는 총 몇 개의 사과를 가지고 있을까요?
"""
completion = client.chat.completions.create(
    model = "gpt-3.5-turbo",
    temperature = 0,
    messages = [
        { "role" : "user",
          "content" : prompt }
    ]
)

print(completion.choices[0].message.content)  # 11개,9개,5개 .. : 틀린 답변이 자주 나옴

철수는 현재 11개의 사과를 가지고 있습니다. 처음에는 10개의 사과를 가졌고, 그저께와 어제 각각 2개씩 먹어서 6개가 줄었으며, 어머니께서 5개를 더 사다 주셨기 때문에 11개가 되었습니다. 이후 친구에게 2개를 주었기 때문에 현재 11개의 사과를 가지고 있습니다.


In [70]:
completion = client.chat.completions.create(
    model = "gpt-4o-mini",
    temperature = 0,
    messages = [
        { "role" : "user",
          "content" : prompt }
    ]
)

print(completion.choices[0].message.content)   # 7개 : 정답

철수의 사과 개수를 계산해 보겠습니다.

1. 철수는 처음에 사과가 10개 있었습니다.
2. 그저께부터 오늘까지 매일 아침에 2개씩 먹었습니다. 오늘은 3일째이므로:
   - 2개 × 3일 = 6개를 먹었습니다.
3. 따라서 오늘 아침까지 남은 사과는:
   - 10개 - 6개 = 4개입니다.
4. 오늘 점심에 어머니께서 사과 5개를 더 사다 주셨으므로:
   - 4개 + 5개 = 9개입니다.
5. 오늘 저녁에 친구에게 2개를 주었으므로:
   - 9개 - 2개 = 7개입니다.

결론적으로, 철수는 오늘 저녁에 총 7개의 사과를 가지고 있습니다.


In [74]:
prompt = """
철수에게는 사과가 10개 있었습니다 그저께 부터 오늘까지 매일 아침에 2개씩 먹었습니다
오늘 점심에 어머니께서 사과 5개를 더 사다 주셨습니다 오늘 저녁에 친구에게 2개를 주었습니다
철수는 총 몇 개의 사과를 가지고 있을까요? 단계별로 분리해서 생각해 보세요
"""
completion = client.chat.completions.create(
    model = "gpt-3.5-turbo",
    temperature = 0,
    messages = [
        { "role" : "user",
          "content" : prompt }
    ]
)

print(completion.choices[0].message.content)

1. 처음에 가지고 있던 사과의 개수: 10개
2. 매일 아침에 먹은 사과의 개수: 2개 * 3일 = 6개
3. 어머니가 사다준 사과의 개수: 5개
4. 친구에게 준 사과의 개수: 2개

따라서, 철수가 현재 가지고 있는 사과의 개수는
10개 (처음에 가지고 있던 개수) - 6개 (아침에 먹은 개수) + 5개 (어머니가 사다준 개수) - 2개 (친구에게 준 개수) = 7개

철수는 현재 7개의 사과를 가지고 있습니다.


In [80]:
prompt = """
1. 철수에게는 사과가 10개 있었습니다.
2. 그저께부터 오늘까지 매일 아침에 2개씩 먹었습니다.
   (3일 동안 2개씩 먹어서 2 * 3 = 6개의 사과를 먹었습니다.)
3. 오늘 점심에 어머니께서 사과 5개를 더 사다 주셨습니다.
4. 오늘 저녁에 친구에게 2개를 주었습니다.
철수는 총 몇 개의 사과를 가지고 있을까요?
"""
completion = client.chat.completions.create(
    model = "gpt-3.5-turbo",
    temperature = 0,
    messages = [
        { "role" : "user",
          "content" : prompt }
    ]
)

print(completion.choices[0].message.content) # 7개 : 정답

철수는 현재 7개의 사과를 가지고 있습니다. 처음에 10개의 사과가 있었고, 6개를 먹었으며, 5개를 추가로 받았지만 2개를 친구에게 주었기 때문에 7개가 남게 됩니다.


### SC(Self-Consistency) Prompting
: 여러번 질의해서 가장 빈도가 높은 답을 선택한다

In [162]:
from collections import Counter

# 동일한 질문에 대해 여러 번의 답변을 생성하여 Self-Consistency 유도
def generate_responses(prompt,n=5):
    responses = []
    for _ in range(n):
        response = client.chat.completions.create(
            model = "gpt-3.5-turbo",
            # model = "gpt-4o-mini",
            messages = [ {"role": "user",  "content": prompt}],
            temperature = 0.7,  # 다양성 확보를 위해 온도를 높게 설정
            top_p = 1,
            frequency_penalty=0,
            presence_penalty=0            
        )
        responses.append(response.choices[0].message.content)
    return responses  

# 가장 자주 등장하는 답변을 선택
# response_count.most_common() 메서드는 Counter 객체에 저장된 요소들의 
# 빈도수를 기준으로 정렬된 리스트를 반환,  [0][0]는 첫번째 요소 선택
def select_most_consistent_response(responses):        
    response_count = Counter(responses)        
    most_common_response = response_count.most_common(1)[0][0]    
    return most_common_response

# 문제 정의
prompt = """
철수에게는 사과가 10개 있었습니다. 그저께부터 오늘까지 매일 아침에 2개씩 먹었습니다.
오늘 점심에 어머니께서 사과 5개를 더 사다 주셨습니다.
오늘 저녁에 친구에게 2개를 주었습니다.
철수는 총 몇 개의 사과를 가지고 있을까요?
"""

# 여러 번 답변을 생성
responses = generate_responses(prompt,n=5)

# 가장 일관성 있는 답변 선택
final_answer = select_most_consistent_response(responses)

# 결과 출력
print("Generated Responses:")
for i, response in enumerate(responses,1):
    print(f"Response {i}: {response}")

print("\nMost Consistent Answer:")
print(final_answer)     

Generated Responses:
Response 1: 철수가 가지고 있는 사과의 개수는 11개입니다.
철수는 처음에 10개의 사과를 가졌고, 이후 매일 2개씩 먹어서 6개가 소비되었습니다. 
따라서 오늘 점심에 어머니가 사다 주신 5개의 사과를 더해 9개가 된 후, 친구에게 2개를 주어 7개가 남게 됩니다. 
따라서 철수는 총 11개의 사과를 가지고 있습니다.
Response 2: 철수는 처음에 10개의 사과를 가졌고, 매일 아침에 2개씩 먹어서 3일 동안 6개를 먹었습니다. 따라서 10 - 6 = 4개의 사과가 남았습니다.
어머니께서 5개의 사과를 더 사다 주었으므로, 4 + 5 = 9개의 사과가 있었습니다.
친구에게 2개를 주었으므로, 9 - 2 = 7개의 사과가 남았습니다.
따라서 철수는 총 7개의 사과를 가지고 있습니다.
Response 3: 철수는 처음에 10개의 사과를 가졌고, 매일 아침에 2개씩 먹었으므로 2일 동안 4개를 먹었습니다.
따라서 처음에는 10 - 4 = 6개의 사과가 남았습니다.
어머니께서 사과 5개를 더 사다 주었으므로 6 + 5 = 11개의 사과가 되었습니다.
친구에게 2개를 주었으므로 11 - 2 = 9개의 사과가 남게 됩니다.
따라서 철수는 총 9개의 사과를 가지고 있습니다.
Response 4: 철수는 현재 11개의 사과를 가지고 있습니다. 처음에 10개를 가졌고, 매일 아침에 2개씩 먹어서 6개가 소진되었습니다. 어머니께서 5개를 사다 주셨으므로 10-6+5=9개가 되었습니다. 그리고 친구에게 2개를 주어서 9-2=7개가 남았습니다. 따라서 철수는 현재 7개의 사과를 가지고 있습니다.
Response 5: 철수는 총 11개의 사과를 가지고 있습니다. 처음에 10개를 가졌고, 그저께부터 오늘까지 매일 2개씩 먹어서 6개를 소비했고, 어머니께서 5개를 더 사다 주셨기 때문에 11개가 됩니다. 이후 친구에게 2개를 주었기 때문에 남은 사과는 9개가 됩니다.

Most Consistent Answer:
철수가 가지고 있는 사

In [173]:
# responses

In [171]:
# response_count = Counter(responses)        
# # print(response_count)
# print(response_count.most_common(1))
# print(response_count.most_common(1)[0])
# print(response_count.most_common(1)[0][0])
# most_common_response = response_count.most_common(1)[0][0] 

In [260]:
from collections import defaultdict
import re

prompt = """
4명의 생존자가 강을 건너야 합니다. 각 생존자가 강을 건너는 데 걸리는 시간은 각각 다릅니다: 3분, 4분, 7분, 12분.
이들은 한 번에 최대 두 명씩만 함께 배를 타고 강을 건널 수 있으며, 배에는 반드시 등불을 지참해야 합니다. 
그러나 등불은 하나뿐이어서, 생존자들이 강을 건널 때마다 등불을 반드시 함께 가져가야 합니다. 
모든 생존자가 가장 효율적으로 강을 건너려면 어떻게 해야 할까요? 
마지막으로 총 소요 시간을 '정답: <정답>분' 형식으로 답변하세요.
"""

def get_most_frequent_answer(prompt,iterations=10):
    answers = defaultdict(int)
    for idx in range(iterations):
        context =  [{ "role" : "user", "content" : prompt }]
        response = client.chat.completions.create(
            model = "gpt-4o-mini",
            temperature = 0.2,
            messages = context
        )
        response_content = response.choices[0].message.content 
        
        print(f"\n{idx+1}번째 샘플:")
        print(response_content)

        match = re.search(r"정답: (\d+분)",response_content)

        if match:
            parsed_answer = match.group(1)
            answers[parsed_answer] += 1      
        print('-'*60) 

    # 빈도가 가장 높은 답을 선택  
    sorted_answers = sorted(answers.items(),key=lambda x : x[1],reverse=True)  # 내림차순
    print(f"\n빈도표: {sorted_answers}")
    most_frequent_answer = sorted_answers[0]
    return most_frequent_answer                       
            
most_frequent_answer = get_most_frequent_answer(prompt)
print("최빈값:",most_frequent_answer)


1번째 샘플:
이 문제를 해결하기 위해서는 생존자들이 강을 건너는 최적의 순서를 찾아야 합니다. 각 생존자의 강을 건너는 시간은 다음과 같습니다:

- A: 3분
- B: 4분
- C: 7분
- D: 12분

최적의 방법은 다음과 같습니다:

1. A(3분)와 B(4분)가 함께 건너갑니다. (총 4분)
2. A(3분)가 돌아옵니다. (총 3분, 누적 7분)
3. C(7분)와 D(12분)가 함께 건너갑니다. (총 12분, 누적 19분)
4. B(4분)가 돌아옵니다. (총 4분, 누적 23분)
5. A(3분)와 B(4분)가 함께 건너갑니다. (총 4분, 누적 27분)

따라서 모든 생존자가 강을 건너는 데 걸리는 총 소요 시간은 27분입니다.

정답: 27분
------------------------------------------------------------

2번째 샘플:
이 문제를 해결하기 위해서는 생존자들이 강을 건너는 시간을 최소화해야 합니다. 각 생존자의 강을 건너는 시간은 다음과 같습니다:

- A: 3분
- B: 4분
- C: 7분
- D: 12분

효율적인 방법은 다음과 같습니다:

1. A(3분)와 B(4분)가 함께 강을 건넙니다. (4분 소요)
2. A(3분)가 돌아옵니다. (3분 소요)
3. C(7분)와 D(12분)가 함께 강을 건넙니다. (12분 소요)
4. B(4분)가 돌아옵니다. (4분 소요)
5. A(3분)와 B(4분)가 함께 강을 건넙니다. (4분 소요)

이 과정을 통해 총 소요 시간을 계산하면:

4 + 3 + 12 + 4 + 4 = 27분

따라서, 모든 생존자가 강을 건너는 데 걸리는 총 소요 시간은 다음과 같습니다.

정답: 27분
------------------------------------------------------------

3번째 샘플:
이 문제를 해결하기 위해서는 생존자들이 강을 건너는 시간을 최소화하는 전략을 세워야 합니다. 각 생존자의 강을 건너는 시간은 다음과 같습니다:

- A: 3분
- B

#### <br>
## Prompt Chaining (프롬프트 연쇄)
: 복잡한 문제를 해결하기 위해 여러 단계를 거쳐 연속적으로 프롬프트를 작성하는 방법
https://devocean.sk.com/blog/techBoardDetail.do?ID=166026&boardType=techBlog

In [274]:
def ask_openai(prompt, max_tokens=150):
    response = client.chat.completions.create(
        model="gpt-4o-mini",
        max_tokens=max_tokens,
        messages=[
                {"role": "user", 
                 "content": prompt}
                ]
    )
    return response.choices[0].message.content

# 제품 개발 체이닝
def product_development_chain():
    
    # 1단계 : 제품 아이디어 구체화
    product_idea = "스마트 홈 보안 시스템"
    prompt_1 = f"{product_idea}의 핵심 기능과 그 기능들이 어떻게 사용자에게 가치를 제공할 수 있는지 설명해줘. 이 제품이 기존 시장에서 어떤 문제를 해결하는지에 대해 강조해줘."
    product_summary = ask_openai(prompt_1)
    print('-'*50)
    print('[1단계] : 제품 아이디어 구체화')
    print(f"제품 아이디어: {product_idea }\n제품 요약: {product_summary}\n")

    # 2단계 : 고객 요구사항 분석
    prompt_2 = f"{product_summary}을 바탕으로, 이 제품의 주요 타겟 고객이 어떤 요구사항을 가지고 있는지 분석해줘. 이 고객들이 제품을 사용하면서 겪을 수 있는 주요 문제와 기대되는 기능을 설명해줘."
    customer_requirements = ask_openai(prompt_2)
    print('-'*50)
    print('[2단계] : 고객 요구사항 분석')
    print(f"제품 요약: {product_summary}\n\n고객 요구사항 분석:\n{customer_requirements}\n")

    # 3단계 : 성공적인 출시 전략
    prompt_3 = f"{customer_requirements}을 기반으로, 이 제품을 성공적으로 출시하기 위한 전략을 제안해줘. 특히, 마케팅 전략과 고객 피드백을 반영하는 방법에 대해 자세히 설명해줘."
    launch_strategy = ask_openai(prompt_3)
    print('-'*50)
    print('[3단계] : 성공적인 출시 전략')
    print(f"고객 요구사항 분석:\n{customer_requirements}\n\n출시 전략:\n{launch_strategy}\n")
    
if __name__ == "__main__":
    product_development_chain() 

--------------------------------------------------
[1단계] : 제품 아이디어 구체화
제품 아이디어: 스마트 홈 보안 시스템
제품 요약: 스마트 홈 보안 시스템은 현대 주거 환경에서 중요한 요소로 자리 잡고 있으며, 여러 핵심 기능이 사용자에게 다양한 가치를 제공합니다. 주요 기능과 그 기능이 제공하는 가치는 다음과 같습니다.

### 1. **실시간 모니터링**
   - **설명**: 카메라 및 센서를 통해 집 안팎을 실시간으로 모니터링할 수 있습니다.
   - **가치 제공**: 사용자는 외부에서 집을 지키고 있다는 느낌을 받을 수 있으며, 예기치 않은 상황에 즉시 대응할 수 있습니다.

### 2. **위험 탐지**
   - **설명**: 움직임 감지 센서,

--------------------------------------------------
[2단계] : 고객 요구사항 분석
제품 요약: 스마트 홈 보안 시스템은 현대 주거 환경에서 중요한 요소로 자리 잡고 있으며, 여러 핵심 기능이 사용자에게 다양한 가치를 제공합니다. 주요 기능과 그 기능이 제공하는 가치는 다음과 같습니다.

### 1. **실시간 모니터링**
   - **설명**: 카메라 및 센서를 통해 집 안팎을 실시간으로 모니터링할 수 있습니다.
   - **가치 제공**: 사용자는 외부에서 집을 지키고 있다는 느낌을 받을 수 있으며, 예기치 않은 상황에 즉시 대응할 수 있습니다.

### 2. **위험 탐지**
   - **설명**: 움직임 감지 센서,

고객 요구사항 분석:
스마트 홈 보안 시스템의 주요 타겟 고객은 다음과 같으며, 이 고객들의 요구 사항과 관련된 문제 및 기대되는 기능은 다음과 같습니다.

### 주요 타겟 고객

1. **도시에서 거주하는 고소득층 가구**
   - 이들은 보안에 대한 높은 관심이 있으며, 고가의 자산을 보호하고자 하는 필요가 있습니다.

2. **대가족 또는 자녀가 있는 가구**
   - 자녀의 안전을 중요시

## Tree of Thoughts (ToT)
: **Tree of Thoughts (ToT)**는 대규모 언어 모델(LLM)이 복잡한 문제를 해결하기 위해 다양한 아이디어를 생성하고 평가하는 과정을 시뮬레이션하는 새로운 방법입니다. 마치 사람이 문제에 대한 해결책을 찾기 위해 마음속으로 여러 가지 가능성을 떠올리고 그중 가장 적절한 것을 선택하는 것과 유사합니다. <br>
### ToT가 작동하는 방식
생각의 나무(Tree of Thoughts): 문제를 해결하기 위한 다양한 아이디어와 접근 방식을 가지(branches)로 확장시키는 나무 구조로 표현합니다. 각 가지는 다양한 사고의 흐름을 나타냅니다.

탐색 과정: 나무의 뿌리(root)에서 시작하여 각 가지를 따라가며 가능한 해결 방법들을 평가하고, 최적의 해결책을 찾는 과정을 탐색이라고 합니다. 이 과정에서 여러 가지 경로를 비교하고, 실패하거나 비효율적인 경로는 가지치기(pruning)하여 제거합니다.

분기와 평가: 문제를 해결하는 다양한 경로를 탐색하는 중간 중간에 각 경로가 얼마나 유망한지 평가하고, 유망한 경로를 더 깊이 탐색하며 문제 해결에 접근합니다.]

![image](https://www.promptingguide.ai/_next/image?url=%2F_next%2Fstatic%2Fmedia%2FTOT.3b13bc5e.png&w=1200&q=75)

In [283]:
def generate_thoughts(prompt, n=3):
    """
    GPT를 사용하여 주어진 프롬프트에 대해 여러 가지 생각(아이디어)을 생성하는 함수.
    """
    response = client.chat.completions.create(
        model="gpt-4o-mini",
        messages=[
            {"role": "system", "content": "You are a helpful assistant."},
            {"role": "user", "content": prompt}
        ],
        n=n,  # 생성할 생각(아이디어)의 수
        max_tokens=100  # 각 응답의 최대 길이
    )
    thoughts =  [choice.message.content for choice in response.choices]
    return thoughts

# 함수는 초기 생각들을 생성한 후, 각 생각에 대해 더 깊이 탐색하는 과정을 거칩니다.
# 더 깊이 탐색한 결과 중 길이가 가장 긴 응답을 최적의 생각으로 선택
def tree_of_thoughts(prompt, depth=2):
    """
    Tree of Thoughts 방식을 사용하여 최적의 생각을 찾는 함수.
    """
    initial_thoughts = generate_thoughts(prompt)
    print(f"Initial thoughts:\n{initial_thoughts}\n")

    best_thought = None
    for i, thought in enumerate(initial_thoughts):
        print(f"Exploring thought {i + 1}: {thought}")
        next_prompt = f"{thought} 다음에 어떻게 할 수 있을까요?"
        deeper_thoughts = generate_thoughts(next_prompt)

        # 간단한 평가 방법: 길이가 가장 긴 응답을 최선으로 선택
        best_deeper_thought = max(deeper_thoughts, key=len)
        print(f"Deeper thought: {best_deeper_thought}\n")

        # 최적의 생각 갱신
        if not best_thought or len(best_deeper_thought) > len(best_thought):
            best_thought = best_deeper_thought

    print(f"Best thought: {best_thought}")

# 사용 예제
user_prompt = "자연을 보존하기 위한 창의적인 아이디어가 무엇일까요?"
tree_of_thoughts(user_prompt)

Initial thoughts:
['자연을 보존하기 위한 창의적인 아이디어는 다양합니다. 다음은 몇 가지 제안입니다:\n\n1. **도시 농업과 수직 정원**: 도시 지역에서 농업을 장려하고, 건물의 벽면을 활용하여 수직 정원을 조성함으로써 녹지를 증가시키고 식물의 생태계를 지원할 수 있습니다.\n\n2. **재활용 아트 프로젝트**: 폐기물이나 재활', '자연을 보존하기 위한 창의적인 아이디어는 다양합니다. 아래 몇 가지 제안을 소개합니다:\n\n1. **도시 녹화 프로젝트**: 도시 내 공원과 녹지 공간을 확장하고, 건물 옥상과 발코니에 식물을 심는 프로그램을 운영하여 도시의 공기 질을 개선하고 생물 다양성을 증진합니다.\n\n2. **재활용 아트**: 폐기물과 재활용', '자연을 보존하기 위한 창의적인 아이디어는 다양하게 있을 수 있습니다. 몇 가지를 제안해 드리겠습니다.\n\n1. **커뮤니티 정원 만들기**: 지역 주민들이 함께 참여하는 커뮤니티 정원을 만들어 생태계를 보호하고 도시의 녹지를 늘릴 수 있습니다. 유기농 작물 재배와 생태 다양성을 촉진하는 공간으로 활용할 수 있습니다.\n\n2. **제로 웨이스트 캠']

Exploring thought 1: 자연을 보존하기 위한 창의적인 아이디어는 다양합니다. 다음은 몇 가지 제안입니다:

1. **도시 농업과 수직 정원**: 도시 지역에서 농업을 장려하고, 건물의 벽면을 활용하여 수직 정원을 조성함으로써 녹지를 증가시키고 식물의 생태계를 지원할 수 있습니다.

2. **재활용 아트 프로젝트**: 폐기물이나 재활
Deeper thought: 재활용 아트 프로젝트는 자연을 보존하는 창의적인 방식 중 하나로, 쓰레기를 예술작품으로 변환하여 재사용의 중요성을 알리는 좋은 방법입니다. 다음은 이러한 프로젝트를 발전시키기 위한 몇 가지 아이디어입니다:

1. **공공 미술 전시회**: 지역 사회와 협력하여 재활용된 재료로 만든 아트 작품을 전시하는 이벤트를 개최합니다. 이를 통해 지역 주민들에게

Explori

#### <br>
## Retrieval Augmented Generation (RAG)
RAG의 기본 개념:
Retrieval (검색): 먼저, 특정 질문이나 문장에 대해 관련성이 높은 문서나 정보를 대규모 데이터베이스에서 검색합니다. 이 단계는 전통적인 정보 검색 시스템이나 특수한 인코더 모델(BERT와 같은 트랜스포머 기반 모델)을 사용하여 수행됩니다. 검색된 문서들은 후속 생성 과정의 입력으로 사용됩니다.

Augmentation (증강): 검색된 문서나 정보를 사용하여 입력된 질문이나 문장을 보강합니다. 즉, 검색된 관련 정보가 모델의 입력으로 주어지며, 이는 생성 모델이 더 나은 텍스트를 생성할 수 있도록 도와줍니다.

Generation (생성): 마지막으로, 검색된 정보를 바탕으로 주어진 질문에 대한 답변이나 설명을 생성합니다. 이 단계에서 GPT 생성 모델이 사용될 수 있으며, 검색된 정보가 포함되어 보다 정확하고 풍부한 응답을 생성할 수 있습니다.

In [312]:
def search_documents(query):
    # 이 함수는 문서를 검색하는 역할을 합니다.
    # 실제로는 외부 검색 엔진이나 데이터베이스에 쿼리를 보내야 하지만,
    # 이 예제에서는 간단히 미리 정의된 문서를 반환합니다.
    
    # 예제 문서
    documents = [
        "OpenAI는 인공지능 연구소로, 다양한 AI 기술을 개발합니다.",
        "GPT-4는 OpenAI에서 개발한 언어 모델로, 자연어 처리를 위한 강력한 도구입니다.",
        "RAG는 정보 검색과 텍스트 생성을 결합하여 더 나은 결과를 제공합니다."
    ]
    
    # 간단한 검색 논리: 입력 쿼리와 관련된 문서 필터링
    relevant_docs = [doc for doc in documents if query.lower() in doc.lower()]
    
    return relevant_docs

def generate_answer(query, documents):
    # 검색된 문서를 바탕으로 답변 생성
    combined_context = "\n".join(documents)
    prompt = f"질문: {query}\n\n문서:\n{combined_context}\n\n답변:"
    
    response = client.chat.completions.create(
        model="gpt-4o-mini",
        messages=[
                {"role": "user", 
                 "content": prompt}
                ],
        max_tokens=100,
        temperature=0.5
    )
    
    return response.choices[0].message.content

# query = "OpenAI"
# query = "GPT-4"
query = "RAG"

# 1. 문서 검색
documents = search_documents(query)
print(documents)

# 2. 답변 생성
answer = generate_answer(query, documents)

print("질문:", query)
print("답변:", answer)

['RAG는 정보 검색과 텍스트 생성을 결합하여 더 나은 결과를 제공합니다.']
질문: RAG
답변: RAG( Retrieval-Augmented Generation)는 정보 검색과 텍스트 생성을 통합한 접근 방식으로, 사용자가 제시한 질문이나 요청에 대해 보다 정확하고 풍부한 답변을 제공하는 데 도움을 줍니다. 이 방법은 먼저 관련 정보를 검색한 후, 그 정보를 바탕으로 자연어 텍스트를 생성하여 최종 결과를 도출합니다. 이렇게 함으로써 RAG는 기존의 텍스트 생성 모델보다 더 신뢰


In [336]:
# 문서 사전 참조 : 환각 현상 방지
system_role = """
신조어 사전:
{"스불재": "스스로 불러온 재앙의 줄임말로, 자신이 만든 문제로 곤란한 상황에 처했을 때 사용"
"억까": "억지로 까기의 줄임말로, 근거 없이 비판하거나 비난하는 상황을 말함"
"존맛탱": "존맛과 탱의 합성어로, 매우 맛있는 음식을 뜻함"
"어쩔티비": "상대방의 말을 무시하거나 별다른 대응을 하지 않겠다는 의미로, 주로 장난스럽게 사용된다"
"복세편살": "복잡한 세상 편하게 살자의 줄임말로, 복잡한 인생을 간단하게 살자는 의미"
"알잘딱깔센":"알아서 잘, 딱, 깔끔하고 센스 있게의 줄임말로, 어떤 일을 척척 잘 해내는 사람을 칭찬할 때 쓰임"}

이 신조어 사전을 참조하여 답변하세요. 만일 이 신조어 사전에 없으면 "모르는 단어입니다"라고 답하세요."
"""
# "점메추": "점심 메뉴 추천의 줄임말로, 점심에 무엇을 먹을지 고민할 때 사용"
# "킹받다": "열받다의 변형 표현으로, 아주 화가 나거나 짜증이 날 때 사용"
# "갓생": "신처럼 성실하고 부지런하게 사는 삶을 의미하며, 목표를 향해 최선을 다하는 삶을 칭찬할 때 사용"

prompt = "신조어 {신조어}의 뜻을 말해주세요.".format(신조어="스불재")
context = [{"role": "system", "content": system_role},
           {"role": "user", "content": prompt}] 
response = client.chat.completions.create(
            # model="gpt-4o-mini", 
            model="gpt-3.5-turbo",
            messages=context,
            temperature=0,
            top_p=0
        )
print(response.choices[0].message.content)

"스불재"는 '스스로 불러온 재앙'을 줄인 말로, 자신이 만든 문제로 곤란한 상황에 처했을 때 사용하는 표현입니다.


In [342]:
prompt = "신조어 {신조어}의 뜻을 말해주세요.".format(신조어="어쩔티비")
context = [{"role": "user", "content": prompt}] 
response = client.chat.completions.create(
            # model="gpt-4o-mini", 
            model="gpt-3.5-turbo",
            messages=context,
            temperature=0,
            top_p=0
        )
print(response.choices[0].message.content)

"어쩔티비"는 "어쩔 수 없는 TV"의 줄임말로, 어떤 상황이나 일에 대해 어쩔 수 없는 상태에서 TV를 보는 것을 뜻합니다. 이는 주로 힘들거나 지루한 상황에서 TV를 보며 스트레스를 해소하는 의미로 사용됩니다.
