# 프롬프트 엔지니어링
- 생성형 인공 지능(생성형 AI) 솔루션을 안내하여 원하는 결과를 생성하는 프로세스

## 참고링크
- https://platform.openai.com
- https://cookbook.openai.com/examples/how_to_format_inputs_to_chatgpt_models
- https://platform.openai.com/docs/models
- https://platform.openai.com/playground/chat?models=gpt-4o
- https://velog.io/@yule/OpenAI-API-%EB%B0%9C%EA%B8%89
- 제로샷, 원샷, 퓨샷 : https://moonlang.tistory.com/29


In [None]:
!pip install openai
!pip install PyMySQL

Collecting PyMySQL
  Downloading PyMySQL-1.1.1-py3-none-any.whl.metadata (4.4 kB)
Downloading PyMySQL-1.1.1-py3-none-any.whl (44 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m45.0/45.0 kB[0m [31m820.0 kB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: PyMySQL
Successfully installed PyMySQL-1.1.1


OPEN AI Playground에 접속합니다.
- https://platform.openai.com/playground/chat?models=gpt-4o

In [None]:
# You are a  very helpful code assistant.  / You are a very helpful English teacher.  / You are a  very helpful Chinese teacher.  각각 띄우고 질문.
# Tell me about GO.

In [None]:
# OPEN AI 셋팅
import os
from openai import OpenAI
from dotenv import load_dotenv

load_dotenv()  # .env 파일을 읽어서 환경변수로 설정

os.environ["OPENAI_API_KEY"] = os.getenv("OPENAI_API_KEY")
client = OpenAI()

1. **client.chat.completions.create 메서드**
- OpenAI의 챗봇 모델과 대화를 나누기 위해 사용됩니다.
- 주요 파라미터:

    - model (str): 사용할 모델의 이름을 지정합니다. 예를 들어, "gpt-4", "gpt-3.5-turbo" 등
    - messages (list of dict): 모델에게 보낼 대화 메시지의 리스트입니다. 각 메시지는 다음과 같은 형식을 가집니다.
    ```
        messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "List three fruits:\n1. Apple\n2. Banana\n3."},
        {"role": "assistant", "content": "Get rid off and number."}
         ],
    ```
        - role (str): 메시지의 역할을 지정합니다. "system", "user", "assistant" 중 하나를 사용할 수 있습니다.
            - system: 채팅 AI에 지시할 내용. system의 지령은 대화의 흐름에 더 큰 영향을 줍니다.
            - user: 사용자가 작성할 메시지
            - assistant: 사용자의 응답에 따라 대답을 해주는 보조 역할입니다. 메시지는 나열된 순서대로 처리되며, assistant가 이에 대한 응답을 제공합니다.

        - content (str): 각 role에 따른 메시지의 내용입니다.
    - temperature (float, optional): 생성되는 텍스트의 창의성을 조절합니다. 값이 높을수록 더 창의적이고 예측 불가능한 결과가 나오며, 낮을수록 더 보수적이고 예측 가능한 결과가 나옵니다. 기본값은 0.7입니다.
    - max_tokens (int, optional): 생성될 응답의 최대 토큰 수를 지정합니다. 이를 통해 응답의 길이를 제한할 수 있습니다.
    - top_p (float, optional): 생성된 텍스트의 다양성을 조절하는 또 다른 방법입니다. top_p가 1이면 모든 단어를 고려하고, 0이면 가장 확률이 높은 단어만 고려합니다. top_p가 낮으면 모델이 더 정확하고 일관된 텍스트를 생성하고, 높으면 더 다양하고 창의적인 텍스트를 생성합니다. 기본값은 0.9입니다.
    - n (int, optional): 한 번의 호출로 생성할 응답의 수를 지정합니다.
    - stop (str or list of str, optional): 응답 생성을 중지할 문자열을 지정합니다. 이 문자열이 생성된 텍스트에 포함되면 그 지점에서 생성을 중단합니다.
            - 예시: ['.', '\n'] '.'을 선택하면 한 문장만 생성. \n를 누르면 한 문단만 생성 등.
    -  frequency_penalty: 생성된 토큰의 빈도에 따라 페널티를 적용하여 반복을 줄입니다. 범위는 0~2. frequency_penalty가 높으면 모델이 동일한 단어나 구문을 반복해서 사용하는 것을 억제하고, 낮으면 그대로 유지합니다. 기본값은 0입니다.
    - presence_penalty: 텍스트에 새로운 토큰이 나타날 경우 페널티를 적용합니다. 범위는 0~2.presence_penalty가 높으면 모델이 새로운 단어나 구문을 사용하는 것을 장려하고, 낮으면 그대로 유지합니다. 기본값은 0입니다.

    - 그 외

```
    logit_bias: 지정된 토큰의 발생 확률을 바이어스 값으로 수정합니다.
    logprobs: true로 설정하면 출력 토큰의 로그 확률을 반환합니다.
    top_logprobs: 각 위치에서 가장 가능성이 높은 토큰의 수를 지정합니다.
    response_format: 출력 형식을 지정합니다(예: JSON 모드).
    seed: 지정된 시드로 결정론적 샘플링을 보장합니다.
    stream: 토큰이 사용 가능해질 때마다 부분 메시지 델타를 전송합니다.
    tools: 모델이 호출할 수 있는 함수 목록을 지정합니다.
    tool_choice: 모델의 함수 호출 방식을 제어합니다(none/auto/function).
    user: 최종 사용자 모니터링 및 남용 감지를 위한 고유 식별자입니다.
```



# 제로샷, 원샷, 퓨샷 프롬프트
- 자연어 처리 모델을 학습시키거나 테스트할 때 사용하는 방식입니다.

1) 제로샷(Zero-shot) 프롬프트:
- 모델이 해당 작업에 대해 전혀 학습되지 않은 상태에서 주어진 프롬프트에 응답하는 방식입니다.

- 예시: 특정한 주제에 대해 전혀 학습되지 않은 모델에게 "이 텍스트를 요약해 주세요"라고 요청.

2) 원샷(One-shot) 프롬프트:
- 모델이 해당 작업에 대해 한 번의 예시만을 보고 주어진 프롬프트에 응답하는 방식입니다.

- 예시: 모델에게 "이 텍스트를 요약해 주세요"라는 요청과 함께 하나의 요약 예시를 제공.

3) 퓨샷(Few-shot) 프롬프트:
- 모델이 해당 작업에 대해 몇 개의 예시를 보고 주어진 프롬프트에 응답하는 방식입니다. 원샷보다 더 많은 예시를 제공하여 모델의 성능을 향상시키는 방법입니다.

- 예시: 모델에게 "이 텍스트를 요약해 주세요"라는 요청과 함께 여러 개의 요약 예시를 제공.

In [1]:
# zero shot
import openai

response =client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "You are a helpful assistant. List three fruits:"}
    ],
    temperature=1,
    max_tokens=50
)

print(response.choices[0].message.content)

ModuleNotFoundError: No module named 'openai'

In [2]:
# one shot

In [3]:
# zero shot

# AI SQL Assistant 만들기

In [None]:
# 데이터 확인
df.groupby('Region')['Total_Sales'].sum().sort_values(ascending=False)

Region
West         269943182.0
Northeast    186324067.0
Southeast    163171236.0
South        144663181.0
Midwest      135800459.0
Name: Total_Sales, dtype: float64

In [None]:
# SQL DB 셋팅
from sqlalchemy import create_engine
from sqlalchemy import text # 쿼리 입력에 필요
import pymysql

db = create_engine(r'mysql+pymysql://fisaai:woorifisa3!W@118.67.131.22:3306/fisa?charset=utf8mb4', echo=True)

In [None]:
# GPT에게 우리가 다루는 데이터, 테이블이 어떤 구조인지 알려주는 함수 작성
# 아래 테이블 구조 기준으로 코드를 작성해줄 것 요청

def table_definition_prompt(df):
    prompt = '''Given the following sqlite SQL definition,
            write queries based on the request
            \n### MySQL SQL table, with its properties:

            #
            # Sales({})
            #
            '''.format(",".join(str(x) for x in df.columns))

    return prompt


In [None]:
# 사용자로부터 어떤 것을 확인하고 싶은지 받는 내용의 함수

def prompt_input():
    nlp_text = input('궁금한 것이 무엇인가요?: ')
    return nlp_text


In [4]:
#  1. R T F C 프레임워크에 맞춰서 작성
#  Role : AI가 수행할 역할을 명확히 정의
#  Task : 수행할 구체적인 작업 기술
#  Format : 결과물의 형식과 길이를 지정
#  Constraints : 준수해야할 규칙과 제한을 명시

# API 호출
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "You are an assistant that generates SQL queries based on the given MySQL table definition\
        and a natural language request. The query should start with 'SELECT' and end with a semicolon(;)."},
        {"role": "user", "content": f"A query to answer: {full_prompt}"}
    ],
    max_tokens=200, # 비용 발생하므로 시도하며 적당한 값 찾아간다. 200이면 최대 200단어까지 생성.
                    # 영어는 한 단어가 1토큰, 한글은 한 글자가 1토큰 정도
    temperature=1.0, # 창의성 발휘 여부. 0~2 사이. 0에 가까우면 strict하게, 2에 가까우면 자유롭게(창의성 필요)
    stop=None  # 특정 문자열이 들어오면 멈춘다든지. None이면 없음. .이면 문장이 끝나면 멈춘다든지
    )

In [5]:
def handle_response(response):


    return query

In [None]:
# 실습
# 1. 위 함수를 정리해서 streamlit으로 변환

# 2. 해당 내용으로 데이터 분석

