#### lab 3a: LangChain을 사용한 프롬프트 템플릿 만들기 소개

In [None]:
!pip install ibm-watson-machine-learning==1.0.311
!pip install ipywidgets==8.0.7
!pip install jupyter==1.0.0
!pip install langchain==0.0.236
#!pip install matplotlib==3.7.2
!pip install numpy==1.23.5
!pip install pandas==1.5.3
!pip install plotly==5.15.0
#!pip install pypdf==3.12.2
!pip install python-dotenv==1.0.0
!pip install requests==2.31.0
!pip install urllib3==1.26.11
!pip install sentence-transformers==2.2.2
#!pip install streamlit==1.24.1
!pip install safetensors==0.3.1
#!pip install faiss-cpu==1.7.4
#!pip install pymilvus

In [None]:
from ibm_watson_machine_learning.metanames import GenTextParamsMetaNames as GenParams
from ibm_watson_machine_learning.foundation_models.utils.enums import DecodingMethods
from ibm_watson_machine_learning.foundation_models.utils.enums import ModelTypes
from langchain.llms.base import LLM
from dotenv import load_dotenv
from langchain import PromptTemplate, FewShotPromptTemplate
import os
from ibm_watson_machine_learning.foundation_models import Model
from langchain.chains import LLMChain, SimpleSequentialChain
from typing import Any, List, Mapping, Optional, Union, Dict

API_KEY="7JDXm2roHKdgxDtS1bCjmKbbY9jM-dAr8RpEB0HMvWbx"
IBM_CLOUD_URL="https://us-south.ml.cloud.ibm.com"
PROJECT_ID="a9b59392-efda-46a0-a6b5-0d6af0f60e20"
HUGGINGFACEHUB_API_TOKEN="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"

load_dotenv()
# api_key = os.getenv("API_KEY", None)
api_key = API_KEY
# ibm_cloud_url = os.getenv("IBM_CLOUD_URL", 'https://us-south.ml.cloud.ibm.com')
ibm_cloud_url = IBM_CLOUD_URL
# project_id = os.getenv("PROJECT_ID", None)
project_id = PROJECT_ID
if api_key is None or ibm_cloud_url is None or project_id is None:
    print("Ensure you copied the .env file that you created earlier into the same directory as this notebook")
else:
    creds = {
        "url": ibm_cloud_url,
        "apikey": api_key
    }


In [None]:
# Wrap the WatsonX Model in a langchain.llms.base.LLM subclass to allow LangChain to interact with the model

class LangChainInterface(LLM):
    credentials: Optional[Dict] = None
    model: Optional[str] = None
    params: Optional[Dict] = None
    project_id : Optional[str]=None

    @property
    def _identifying_params(self) -> Mapping[str, Any]:
        """Get the identifying parameters."""
        _params = self.params or {}
        return {
            **{"model": self.model},
            **{"params": _params},
        }

    @property
    def _llm_type(self) -> str:
        """Return type of llm."""
        return "IBM WATSONX"

    def _call(self, prompt: str, stop: Optional[List[str]] = None) -> str:
        """Call the WatsonX model"""
        params = self.params or {}
        model = Model(model_id=self.model, params=params, credentials=self.credentials, project_id=self.project_id)
        text = model.generate_text(prompt)
        if stop is not None:
            text = enforce_stop_tokens(text, stop)
        return text

In [None]:
##predict with the model

params = {
    GenParams.DECODING_METHOD: DecodingMethods.GREEDY,
    GenParams.MAX_NEW_TOKENS: 5,
    GenParams.MIN_NEW_TOKENS: 1,
    GenParams.TEMPERATURE: 0,
    GenParams.TOP_K: 50,
    GenParams.TOP_P: 1
}


'''LangChainInterface 클래스에 모델을 실행하기 위한 래퍼 함수를 ​​추가했으므로 우리가 갖고 있는 model_id를 간단히 호출합니다.'''
mt_model = "bigscience/mt0-xxl"
llama2= "meta-llama/llama-2-70b-chat"

#Lalu kita dapat mencoba mengajukan pertanyaan sederhana dan lihat bagaimana model memberikan respon
model_list = [mt_model, llama2]
text = "대한민국의 수도는 어딘지 말해주세요? 정답:"
for i in model_list:
    llm_model = LangChainInterface(model=i, credentials=creds, params=params, project_id=project_id)
    print(f"\nModel {i} 결과:")
    print(llm_model(text))
    print({i})

In [None]:
params = {
    GenParams.DECODING_METHOD: DecodingMethods.SAMPLE,
    GenParams.MAX_NEW_TOKENS: 100,
    GenParams.MIN_NEW_TOKENS: 1,
    GenParams.TEMPERATURE: 0.5,
    GenParams.TOP_K: 50,
    GenParams.TOP_P: 1
}

# Define the prompt templates
prompt = PromptTemplate(
  input_variables=["country"],
  template= "{country}의 수도는 어디입니까:",
)
llm_model = LangChainInterface(model=mt_model, credentials=creds, params=params, project_id=project_id)
# Chaining
chain = LLMChain(llm=llm_model, prompt=prompt)

# Getting predictions
countries = ["미국", "영국", "일본", "사우디아라비야"]
for country in countries:
    response = chain.run(country)
    print(prompt.format(country=country) + " = " + response)
    print()

In [None]:
params = {
    GenParams.DECODING_METHOD: DecodingMethods.SAMPLE,
    GenParams.MAX_NEW_TOKENS: 100,
    GenParams.MIN_NEW_TOKENS: 1,
    GenParams.TEMPERATURE: 0.5,
    GenParams.TOP_K: 50,
    GenParams.TOP_P: 1
}

## Create two sequential prompts
pt1 = PromptTemplate(input_variables=["topic"],
                    template="{topic} 주제와 관련된 질문을 작성하세요: 질문:")
pt2 = PromptTemplate(input_variables=["question"],
                     template="다음 질문에 답하세요: {question}"
)
question_model = LangChainInterface(model=mt_model, credentials=creds, params=params, project_id=project_id)
answer_model=  LangChainInterface(model=mt_model, credentials=creds, params=params, project_id=project_id)

prompt_to_question= LLMChain(llm=question_model, prompt=pt1)
question_to_answer = LLMChain(llm=answer_model, prompt=pt2)
qa = SimpleSequentialChain(chains=[prompt_to_question, question_to_answer], verbose=True)
qa.run("삶")


#### lab 3b: LangChain을 사용한 프롬프트 템플릿 만들기 소개
lab 3에 오신 것을 환영합니다.

이전 랩에서는 프롬프트 엔지니어링의 어려움을 탐험했습니다. 어떻게 문구를 조정하고 다른 모델을 선택하며 모델 매개변수를 최적화하는지를 배워보았습니다. 작은 변경이 언어 모델이 생성하는 결과를 크게 향상시킬 수 있습니다.

이번 랩에서는 실제 사례에 새로운 지식을 적용하면서 프롬프트 코딩과 관련된 모범 사례에 대해 계속 배우겠습니다. Watson Machine Learning Python SDK를 사용하여 watsonx.ai와 프로그래밍적으로 상호 작용하면서, LangChain Python 라이브러리에서 제공하는 프롬프트 템플릿 기술을 사용하여 언어 모델과의 상호 작용을 최적화하고 그 잠재력을 극대화할 것입니다.

LangChain이 제공하는 프롬프트 템플릿의 개념을 사용하면 특정 정보로 쉽게 채워질 수 있는 프롬프트 템플릿을 만들 수 있습니다. 이를 통해 watsonx.ai에 제공할 수 있는 다양한 결과를 생성할 수 있습니다. 아래에서 볼 수 있듯이 퓨-샷 프롬프팅에 특화된 프롬프트 템플릿을 활용할 수도 있습니다.

LangChain 프롬프트 패턴을 사용하여 Prompt Builder 프롬프트 재생성
시나리오: XYZ 소매 회사를 위한 맞춤형 추천
XYZ Retail은 전자제품, 의류, 가정용품 등 다양한 제품을 판매하는 인기있는 온라인 소매점입니다. 그들은 큰 고객 기반을 보유하고 고객 만족도를 높이고 매출을 증대하기 위해 맞춤형 쇼핑 경험을 제공하고자 합니다.

이 목표를 달성하기 위해 XYZ는 생성적 AI를 활용하여 각 고객에 대한 팩트 시트를 작성하려고 합니다. 이러한 팩트 시트에는 고객 인구 통계 (이름, 나이, 위치) 및 구매 내역과 같은 관련 정보가 요약될 것입니다. 이러한 팩트 시트는 XYZ 소매의 영업 팀이 더 강력한 고객 관계를 구축하고 고객 만족도를 높이며 반복 구매를 촉진하는 데 도움이 될 것입니다.

당신은 Prompt Lab에서 프롬프트 엔지니어링을 수행하기 시작하고 다음과 같은 초기 프롬프트로 기본 모델 출력을 테스트할 수 있습니다.

![image.png](attachment:e698a2d9-ef55-4a02-8916-f75c2e4a9271.png)

고객 Michael Jones의 경우 모델의 추천이 정확하지 않거나 유용하지 않습니다. 다행히 Prompt Engineering 랩에서 Few Shot Learning이 더 나은 결과를 얻는 데 도움이 될 수 있다는 것을 배웠습니다.

Prompt Builder를 사용하여 몇 가지 예를 제공하면 어떻게 될까요? LLM을 유의미한 추천을 생성하도록 안내합니다.

![image.png](attachment:085de7fa-ec38-42a5-8ba9-b4820a767f95.png)

멋져요, Michael Jones에 대한 제품 추천이 훨씬 나아졌습니다. 그러나 XYZ Retail 모든 고객에 대한 추천을 생성하려면 few shot 프롬프팅을 어떻게 프로덕션화해야 할까요? 각 고객의 정보를 Prompt Builder에 복사하여 붙이는 것은 너무 오래 걸릴 것입니다.

프로그래밍 솔루션이 필요합니다. 심지어 많은 예제를 생성한 다음 watsonx.ai에서 모델을 튜닝하는 데 사용할 수도 있을 것입니다. 그러나 이런 내용은 나중의 랩에서 프롬프트 튜닝 데이터 세트를 구축하는 방법에 대해 배우게 될 것입니다."








### 1. Load the required libraries

In [None]:
import os

from dotenv import load_dotenv
import pandas as pd
from langchain import PromptTemplate, FewShotPromptTemplate
from ibm_watson_machine_learning.foundation_models import Model
from ibm_watson_machine_learning.metanames import GenTextParamsMetaNames as GenParams

### 2. 각 고객에 대한 팩트시트 작성하기 - 프롬프트 패턴 사용
2.1 프롬프트 템플릿이란 무엇인가요?
LangChain Python 라이브러리의 PromptTemplate 클래스는 구조화된 템플릿에서 프롬프트를 만들기 위한 유연한 방법을 제공합니다. 우리는 PromptTemplate 클래스를 사용하여 XYZ Retail의 few shot 프롬프트를 간단히 만들 것입니다.

XYZ Retail은 고객 데이터를 .csv 형식으로 제공했습니다. 각 고객에 대한 프롬프트를 생성하려면 Prompt Builder에서 엔지니어링한 프롬프트를 보다 유용한 프로그래밍 형식으로 변환해야 합니다. PromptTemplate 클래스를 사용하면 고객 데이터를 쉽게 대체하여 하나 이상의 프롬프트를 생성할 수 있습니다.

PromptTemplate 클래스는 대체할 변수가 중괄호 내에 위치하는 스키마를 정의합니다. Python 용어로는 그저 하드코딩된 "f-strings"를 사용하는 것입니다. 이러한 중괄호는 실제 데이터를 템플릿에 대체할 자리 표시자로 작용합니다.

이것이 실제로 어떻게 동작하는지 살펴보겠습니다.

#### 2.2 템플릿에서 간단한 프롬프트 생성
프롬프트 템플릿은 PromptTemplate 클래스를 사용하여 문자열이나 .txt 파일에서 생성할 수 있습니다. LangChain 문서에는 추가적인 PromptTemplate 예제가 제공됩니다.

#### 2.2.1 문자열에서 프롬프트 템플릿 만들기

In [None]:

# template is a string with variable names in curly brackets
pattern = "input: {name} {family_name} 은 {age} 살 입니다. 사는곳은 {location}. 그는 {purchase_history}을 샀습니다."

# generate template
prompt_template = PromptTemplate.from_template(pattern)
prompt_template.template

'input: {name} {family_name} 은 {age} 살 입니다. 사는곳은 {location}. 그는 {purchase_history}을 샀습니다.'

In [None]:
# now let's provide some values and generate our prompt
# notice how the variables coincide with those we specified in curly brackets
prompt = prompt_template.format(name="유진",
                                family_name="김",
                                age=34,
                                location="용인시 수지구",
                                purchase_history = "식료품, 가정용품, 생필품")

prompt


#### 2.2.2 텍스트 파일에서 프롬프트 템플릿

프롬프트 패턴은 텍스트 파일로 저장할 수도 있습니다.







In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:

# We create a template from a file:
#_path_to_file = "./template/customer_factsheet_lang.txt"

_path_to_file = '/content/drive/MyDrive/customer_factsheet_lang.txt'

# this time we provide the variable names in a list
example_prompt = PromptTemplate.from_file(_path_to_file,
                                input_variables=["name", "family_name", "age","city",
                                                 "purchase_history", "recommendation_1", "recommendation_2"])

print(example_prompt.template)

#### 2.1 처럼 이 템플릿을 입력 변수의 값이 들어 있는 딕셔너리에서 채울 수 있습니다.

In [None]:
examples = [
    {
        "name": "상식",
        "family_name": "박",
        "age": 43,
        "city": "샌프란시스코",
        "purchase_history": "식료품, 생활용품 및 여행 용품",
        "recommendation_1": "유기농 과일 바구니",
        "recommendation_2": "경량 캐리어"
    },
    {
        "name": "민희",
        "family_name": "김",
        "age": 57,
        "city": "시카고",
        "purchase_history": "도서, 전자제품, 가정용품",
        "recommendation_1": "Kindle Paperwhite - 이 전자 책 리더는 수천 권의 책을 저장할 수 있는 가벼우면서 휴대 가능한 장치를 원하는 도서 애호가를 위한 것입니다. 눈부림이 없는 디스플레이와 긴 배터리 수명이 특징이며 전원이 바닥나는 걱정 없이 몇 시간 동안 읽을 수 있습니다.",
        "recommendation_2": "Google Home Mini - 이 스마트 스피커는 음성으로 집의 스마트 기기를 제어하기에 완벽합니다. 음악 재생, 알람 설정, 뉴스 받아보기 등 다양한 용도로 사용할 수 있습니다. 또한 친구와 가족과 연결되는 좋은 방법입니다."
    },
    {
        "name": "은정",
        "family_name": "박",
        "age": 21,
        "city": "뉴욕 시티",
        "purchase_history": "의류, 신발, 화장품",
        "recommendation_1": "Aritzia Wilfred Free Sweater - 이 부드럽고 아늑한 스웨터는 캐주얼한 외출에 완벽합니다. 다양한 색상으로 제공되어 스타일에 맞는 완벽한 색상을 찾을 수 있습니다.",
        "recommendation_2": "Steve Madden Pointed Toe Pumps - 이 세련된 펌프는 도시에서의 야외 약속에 완벽합니다. 편안하고 다양한 의상에 매치할 수 있어 다양한 의상에 착용할 수 있습니다."
    }
]

In [None]:
for example in examples:
    print(example_prompt.format(**example))

input: 상식 박 은 43살 입니다. 그리고 샌프란시스코에 거주합니다. 그는 식료품, 생활용품 및 여행 용품을(를) 샀습니다.
output: Recommendations: Item 1: 유기농 과일 바구니 Item 2: 경량 캐리어
input: 민희 김 은 57살 입니다. 그리고 시카고에 거주합니다. 그는 도서, 전자제품, 가정용품을(를) 샀습니다.
output: Recommendations: Item 1: Kindle Paperwhite - 이 전자 책 리더는 수천 권의 책을 저장할 수 있는 가벼우면서 휴대 가능한 장치를 원하는 도서 애호가를 위한 것입니다. 눈부림이 없는 디스플레이와 긴 배터리 수명이 특징이며 전원이 바닥나는 걱정 없이 몇 시간 동안 읽을 수 있습니다. Item 2: Google Home Mini - 이 스마트 스피커는 음성으로 집의 스마트 기기를 제어하기에 완벽합니다. 음악 재생, 알람 설정, 뉴스 받아보기 등 다양한 용도로 사용할 수 있습니다. 또한 친구와 가족과 연결되는 좋은 방법입니다.
input: 은정 박 은 21살 입니다. 그리고 뉴욕 시티에 거주합니다. 그는 의류, 신발, 화장품을(를) 샀습니다.
output: Recommendations: Item 1: Aritzia Wilfred Free Sweater - 이 부드럽고 아늑한 스웨터는 캐주얼한 외출에 완벽합니다. 다양한 색상으로 제공되어 스타일에 맞는 완벽한 색상을 찾을 수 있습니다. Item 2: Steve Madden Pointed Toe Pumps - 이 세련된 펌프는 도시에서의 야외 약속에 완벽합니다. 편안하고 다양한 의상에 매치할 수 있어 다양한 의상에 착용할 수 있습니다.


### 3. 고객 요약서를 기반으로 프롬프트 예시 생성
PromptTemplate의 가치는 엔지니어링된 프롬프트의 대량 평가용 예시 또는 튜닝 데이터셋을 생성할 때 많은 프롬프트를 생성할 때 나타납니다.

#### 3.1 FewShot 프롬프트 생성
우리는 FewShotPromptTemplate 객체를 생성하여 시작할 것입니다. 이 클래스는 PromptTemplate의 몇 번의 반복으로 구성된 프롬프트를 만들 수 있게 해줍니다. 자세한 내용은 FewShotPromptTemplate 클래스 문서에서 확인할 수 있습니다.






In [None]:
# Next step create a few shot prompt template

few_shot_examples = examples[:2]
few_shot_input = examples[2].copy()
del few_shot_input['recommendation_1']
del few_shot_input['recommendation_2']

def make_few_shot_prompt(few_shot_examples, few_shot_input):
    """
    Generate a few-shot prompt using the FewShotPromptTemplate class.

    Parameters:
    - few_shot_examples: List of examples to be shown as few-shot examples.
    - few_shot_input: Input for which the prompt will be generated.

    Returns:
    - A string representing the formatted few-shot prompt.
    """
    prompt = FewShotPromptTemplate(
        examples=few_shot_examples,
        example_prompt=example_prompt,
        suffix='input: "{name} {family_name} 은 {age}살 입니다. 그리고 {city}에 거주합니다. 그는 {purchase_history}을(를) 샀습니다."\noutput: ',
        input_variables=["name", "family_name", "age", "city", "purchase_history"]
    )
    # Return the formatted prompt using the provided input data
    return prompt.format(**few_shot_input)


few_shot_prompt = make_few_shot_prompt(few_shot_examples, few_shot_input)
print(few_shot_prompt)

#### 3.2 프롬프트 대량 생성
FewShotPromptTemplate 클래스를 사용하여 이제 노트북에서 직접 추출한 값으로 반복적으로 채워진 few shot 프롬프트 목록을 생성하는 함수를 만들 수 있습니다.

한 few shot 프롬프트에 몇 개의 단일 프롬프트를 포함할지 선택할 수 있습니다. 함수의 출력은 few shot 프롬프트의 목록입니다.


In [None]:
# Specify the path to the CSV file containing the data
csv_file_path = "/content/drive/MyDrive/customer_factsheet.csv"

def sub_all_from_csv(csv_file_path, n_prompt_examples=2):
    """
    Generates a list of few-shot prompts using the FewShotPromptTemplate class.
    The prompts are populated iteratively from values extracted from a CSV file.

    Parameters:
    - csv_file_path: The path to the CSV file.
    - n_prompt_examples: The number of examples included in one few-shot prompt.

    Returns:
    - list_of_prompts: A list of few-shot prompts.
    """

    df = pd.read_csv(csv_file_path)
    examples = [example for _, example in df.transpose().to_dict().items()]
    i=0
    list_of_prompts = []

    while i < len(df):
        few_shot_examples = examples[i:i+n_prompt_examples]
        few_shot_input = examples[i+n_prompt_examples].copy()
        del few_shot_input['recommendation_1']
        del few_shot_input['recommendation_2']

        list_of_prompts.append(make_few_shot_prompt(few_shot_examples, few_shot_input))

        i = i+n_prompt_examples +1

    # Return the list of few-shot prompts
    return list_of_prompts

In [None]:
list_of_prompts = sub_all_from_csv(csv_file_path)
print(list_of_prompts[0])

input: 유진 김 은 30살 입니다. 그리고 용인에 거주합니다. 그는 도서, 전자제품, 가정용품을(를) 샀습니다.
output: Recommendations: Item 1: Kindle Paperwhite - 이 전자 책 리더는 수천 권의 책을 저장할 수 있는 가벼우면서 휴대 가능한 장치를 원하는 도서 애호가를 위한 것입니다. 눈부림이 없는 디스플레이와 긴 배터리 수명이 특징이며 전원이 바닥나는 걱정 없이 몇 시간 동안 읽을 수 있습니다. Item 2: Google Home Mini - 이 스마트 스피커는 음성으로 집의 스마트 기기를 제어하기에 완벽합니다. 음악 재생, 알람 설정, 뉴스 받아보기 등 다양한 용도로 사용할 수 있습니다. 또한 친구와 가족과 연결되는 좋은 방법입니다.

input: 용국 방 은 25살 입니다. 그리고 진주에 거주합니다. 그는 의류, 신발, 화장품을(를) 샀습니다.
output: Recommendations: Item 1: Aritzia Wilfred Free Sweater - 이 부드럽고 아늑한 스웨터는 캐주얼한 외출에 완벽합니다. 다양한 색상으로 제공되어 스타일에 맞는 완벽한 색상을 찾을 수 있습니다. Item 2: Steve Madden Pointed Toe Pumps - 이 세련된 펌프는 도시에서의 야외 약속에 완벽합니다. 편안하고 다양한 의상에 매치할 수 있어 다양한 의상에 착용할 수 있습니다.

input: "찬영 강 은 40살 입니다. 그리고 전주에 거주합니다. 그는 장난감, 게임, 스포츠용품을(를) 샀습니다."
output: 


In [None]:
list_of_prompts[2]

'input: 환 곽 은 35살 입니다. 그리고 강릉에 거주합니다. 그는 전자제품, 가정 개선, 스포츠용품을(를) 샀습니다.\noutput: Recommendations: Item 1: 무선 헤드폰 Item 2: 전동 공구\n\ninput: \x08현태 김 은 45살 입니다. 그리고 목포에 거주합니다. 그는 도서, 음악, 영화을(를) 샀습니다.\noutput: Recommendations: Item 1: 베스트셀러 소설 Item 2: 비닐 레코드\n\ninput: "기연 전 은 55살 입니다. 그리고 안산에 거주합니다. 그는 가구, 가전제품, 가정용품을(를) 샀습니다."\noutput: '

#### 3.2 추가 예시
PromptTemplate을 사용하여 추가 예시를 탐색할 수 있습니다.

### 4. 프롬프트 평가 및 대량 생성된 프롬프트로부터의 퓨 샷 러닝
이전 예제에서 "2 샷 러닝" 프롬프트를 생성했습니다. 즉, 세 개의 입력이 있지만 두 개의 완전한 출력만 있었습니다. 이 방법으로 더 큰 데이터셋을 사용하면 프롬프트를 대량으로 테스트할 수 있습니다.

예를 들어 데이터 샘플 중 두 개는 훈련에 사용되고 3번째의 "출력"은 모델 출력과 비교하여 프롬프트가 예상대로 작동하는지 확인할 수 있습니다. 이제 이러한 퓨 샷 프롬프트를 실행하여 엔지니어링된 프롬프트가 다양한 예제에서 얼마나 잘 작동하는지 확인할 수 있습니다.

#### 4.1 Watsonx.ai 액세스 자격 증명 가져오기 및 모델 로드
이전에 생성한 .env 파일을 이 노트북과 동일한 디렉토리로 복사했는지 확인하세요.

In [None]:
API_KEY="7JDXm2roHKdgxDtS1bCjmKbbY9jM-dAr8RpEB0HMvWbx"
IBM_CLOUD_URL="https://us-south.ml.cloud.ibm.com"
PROJECT_ID="a9b59392-efda-46a0-a6b5-0d6af0f60e20"
HUGGINGFACEHUB_API_TOKEN="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"

#load_dotenv()
#api_key = os.getenv("API_KEY", None)
api_key = API_KEY
#ibm_cloud_url = os.getenv("IBM_CLOUD_URL", 'https://us-south.ml.cloud.ibm.com')
ibm_cloud_url = IBM_CLOUD_URL
#project_id = os.getenv("PROJECT_ID", None)
project_id = PROJECT_ID
if api_key is None or ibm_cloud_url is None or project_id is None:
    print("Ensure you copied the .env file that you created earlier into the same directory as this notebook")
else:
    creds = {
        "url": ibm_cloud_url,
        "apikey": api_key
    }


model_params = {
    GenParams.DECODING_METHOD: "greedy",
    GenParams.MIN_NEW_TOKENS: 50,
    GenParams.MAX_NEW_TOKENS: 200,
    GenParams.STOP_SEQUENCES: ["\n\n"]
}

# Instantiate a model proxy object to send your requests
model = Model(
    model_id='meta-llama/llama-2-70b-chat',
    params=model_params,
    credentials=creds,
    project_id=project_id)


In [None]:
responses = [model.generate_text(prompt) for prompt in list_of_prompts]
for i, response in enumerate(responses):
    lines = str(list_of_prompts[i]).strip().split("\n")
    user_description = str(lines[8])
    print(f"\n{user_description}")
    print(f"\noutput: {response}")
    print("---------------------")

### 퓨 샷 프롬프트 분석
이러한 결과는 나쁘지 않습니다. 장난감과 게임을 많이 구매한 고객에 대한 전자제품 추천, 마찬가지로 다른 두 명의 고객에 대해서는 화장품 및 가구가 구매 이력을 정확하게 반영하고 있습니다.

모델은 제품에 대한 자세한 설명 대신 더 많은 추천 항목을 추가하는 경우도 있습니다. 이러한 추가 항목은 추가 항목에 대한 훈련 데이터가 없으므로 정확하지 않습니다.

앞부분에 지시사항을 추가하는 것도 도움이 될 것으로 보입니다. 이것은 여러분이 시도해볼 연습이 될 것입니다.



#### 4.3 Additional Technique on Few Shot Prompt Analysis

In [None]:
def new_shot(values):
    '''"이전에 사용한 프롬프트 대부분은 데이터/customer_factsheet.csv 디렉토리에 생성된 팩트 시트에서 데이터를 가져오지만,
    이 함수는 분석이나 입력으로 사용할 새로운 데이터를 생성하는 데 도움이 될 것입니다."'''
    keys = ['name', 'family_name', 'age', 'city', 'purchase_history', 'recommendation_1', 'recommendation_2']
    prompt_shot = dict(zip(keys, values))
    return prompt_shot

new_values = [ '소연', '권', 50, '광주', '게임, 컴퓨터, 텀블러']
new_shot_input = new_shot(new_values)
# Function
csv_file_path = "/content/drive/MyDrive/customer_factsheet.csv"
df = pd.read_csv(csv_file_path)
df

In [None]:
new_shot_input

In [None]:
def few_shot(name_to_test, number_of_examples, no_extra_sample=True, new_shot=None):

    '''
    이 함수는 Generative AI 모델에서 사용할 수 있는 형식으로 데이터 시트를 생성하는 데 유용합니다.
    name_to_test = 테스트하려는 사용자의 이름을 채우는 변수로, 이미 팩트 시트에 포함되어 있어야 합니다.
    number_of_example = 사용할 퓨 샷 테스트의 수
    no_extra_sample = True -> 시트에 이미 있는 데이터를 사용
    False -> "few_shot" 함수에서 호출할 새로운 데이터 사용
    new_shot = False가 아닐 때 호출할 새로운 데이터 변수
    '''

    # Filter the DataFrame to exclude specified names
    df_filtered = df[~df['name'].isin(name_to_test)]
    few_shot_train = [example for _, example in df_filtered.transpose().to_dict().items()]
    print(few_shot_train)
    #print(df_filtered)
    print("==")
    print(df[df['name'].isin(name_to_test)].iloc[0].to_dict())
    print("==")
    if no_extra_sample==True:
        few_shot_test = df[df['name'].isin(name_to_test)].iloc[0].to_dict()
        few_shot_test.pop('recommendation_1', None)
        few_shot_test.pop('recommendation_2', None)
    else:
        few_shot_input = new_shot

    return make_few_shot_prompt(few_shot_train[:number_of_examples - 1], few_shot_test)

few_shot_model = few_shot(name_to_test=['유진'], number_of_examples=4, no_extra_sample=True, new_shot = new_shot_input)
print(few_shot_model)

In [None]:
# Generative AI Model
'''"좋은 결과를 얻기 위해 모델 파라미터를 조정해보세요."'''
model_parameters = {
    GenParams.DECODING_METHOD: "greedy",
    GenParams.MIN_NEW_TOKENS: 1,
    GenParams.MAX_NEW_TOKENS: 500,
    GenParams.STOP_SEQUENCES: ["\n\n"]
}

llama2 = "meta-llama/llama-2-70b-chat"

model = Model(model_id=llama2,params=model_parameters,credentials=creds,project_id=project_id)

def prompt_ID(shot_list):

    '''
    이 함수는 기존 팩트 시트와 일치하는 제품 추천을 생성하는 데 사용되는 Generative AI 함수입니다.
    이 함수의 주요 차이점은 다음과 같습니다:

    1. 사용 가능한 퓨 샷 또는 샘플의 수
    2. 지시사항, 사용할 Generative AI 모델에 대한 명확성 또는 설명을 제공합니다.
    아래에서는 LLAMA2 모델을 위한 프롬프트 템플릿을 사용합니다.
    '''
    segments = shot_list.split("\n\ninput:")
    sample_shot_list = "\n\ninput:".join(segments[:-1])
    test_shot = "input:" + segments[-1]
    prompt_en_id = ""
    prompt_en_id +=  "<s>[INST] <<SYS>>"\
                    f"{sample_shot_list}\n"\
                    "<</SYS>>\n"\
                    "최대 2가지 품목을 추천하세요!\n"\
                    "당신은 사용자에게 특정 제품 및 브랜드에 관한 권장 사항을 제공하는 AI 모델입니다.\n"\
                    "우리의 소비자들은 이름, 성, 도시 및 거래 내역과 같은 몇 가지 특징을 가지고 있습니다.\n"\
                    "권장 사항은 그들의 거래 내역과 관련이 있고 거래 패턴을 따르도록 하십시오. 아래의 예시처럼 표시된 표시에서\n"\
                    "기억하세요: 가능한 도움이 될 수 있도록 항상 답하되, 안전을 유지하세요. \n"\
                    "당신의 답변은 해로운, 비윤리적, 인종 차별적, 성차별적, 유독성, 위험한 또는 불법적인 내용을 포함해서는 안 됩니다.\n"\
                    "당신의 응답은 사회적으로 편향되지 않고 긍정적인 성격을 가지도록 해주세요.\n"\
                    "위는 예시입니다.:\n"\
                    "[/INST]"\
                    f"{test_shot}"
    return prompt_en_id

# Call prompt_definitions to get the full prompt
prompts = prompt_ID(few_shot_model)
responses = model.generate_text(prompts)
print(prompts,responses)
# print(prompts,responses)

In [None]:
#recommendation_1': 'Kindle Paperwhite - 이 전자 책 리더는 수천 권의 책을 저장할 수 있는 가벼우면서 휴대 가능한 장치를 원하는 도서 애호가를 위한 것입니다.
#눈부림이 없는 디스플레이와 긴 배터리 수명이 특징이며 전원이 바닥나는 걱정 없이 몇 시간 동안 읽을 수 있습니다.',

#'recommendation_2': 'Google Home Mini - 이 스마트 스피커는 음성으로 집의 스마트 기기를 제어하기에 완벽합니다.
#음악 재생, 알람 설정, 뉴스 받아보기 등 다양한 용도로 사용할 수 있습니다. 또한 친구와 가족과 연결되는 좋은 방법입니다.'

### 축하합니다
PromptTemplate을 사용한 퓨 샷 프롬프트의 대량 생성의 흥미로운 세계를 탐험하고 랩을 완료한 것을 축하합니다!
개인 맞춤형 제품 추천을 생성하는 실제 사용 사례를 통해 고객 프로필에 프롬프트를 맞춤 설정하는 힘을 목격했습니다. 고객별 세부 정보를 통합하고 프로그래밍적으로 대량의 예제를 생성함으로써 모델을 튜닝할 수 있으며, 이는 더 정확하고 맞춤형된 결과를 얻게 됩니다.

이러한 예제를 기반으로 계속해서 프롬프트를 반복하고 개선함으로써 언어 모델의 전체 잠재력을 발휘하고 다양한 도메인에서의 성능을 향상시킬 수 있습니다. 계속해서 실험을 진행하고 프롬프트 엔지니어링 기술을 활용하여 언어 모델과의 상호 작용을 최적화하고 프로젝트에서 효과적인 결과를 얻어보세요.