## Import, install

In [None]:
!pip install openai

In [None]:
import os
from json import loads
from functools import partial
from IPython.display import Markdown
from google.colab import userdata
from openai import OpenAI

In [None]:
# set key to env
os.environ['OPENAI_API_KEY'] = userdata.get('OPENAI_API_KEY')

In [None]:
client = OpenAI()

## Test basic

In [None]:
completion = client.chat.completions.create(
  model="gpt-4-turbo-preview",
  messages=[
    {"role": "system", "content": "Summarize user's content"},
    {"role": "user", "content": "ประเทศไทยรวมเลือดเนื้อชาติเชื้อไทย เป็นประชารัฐ ไผทของไทยทุกส่วน อยู่ดำรงคงไว้ได้ทั้งมวล ด้วยไทยล้วนหมาย รักสามัคคี ไทยนี้รักสงบ แต่ถึงรบไม่ขลาด เอกราชจะไม่ให้ใครข่มขี่ สละเลือดทุกหยาดเป็นชาติพลี เถลิงประเทศชาติไทยทวี มีชัย ชโย"}
  ]
)
print(completion.choices[0].message.content)

เนื้อหาดังกล่าวเป็นการสื่อถึงความมีอัตลักษณ์และคุณค่าของชาติไทย ให้คำมั่นสัญญาว่าชาวไทยจะรักษาอธิปไตย ความเป็นชาติที่ไม่ยอมให้ผู้ใดมาข่มขู่หรือกดดัน พร้อมที่จะปกป้องประเทศด้วยความสามัคคีและความรักสงบ แต่ก็พร้อมจะป้องกันไม่ให้ถูกล่วงละเมิดเช่นกัน ข้อความนี้ยังแสดงถึงความกล้าหาญและความพร้อมที่จะเสียสละเพื่อปกป้องอธิปไตยของชาติ โดยมีจุดยืนที่ชัดเจนในการทำทุกอย่างเพื่อให้ประเทศไทยเจริญรุ่งเรืองและมีอิสรภาพ.


In [None]:
completion = client.chat.completions.create(
  model="gpt-4-turbo-preview",
  messages=[
    {"role": "system", "content": "Segment into words"},
    {"role": "user", "content": "ประเทศไทยรวมเลือดเนื้อชาติเชื้อไทย เป็นประชารัฐ ไผทของไทยทุกส่วน อยู่ดำรงคงไว้ได้ทั้งมวล ด้วยไทยล้วนหมาย รักสามัคคี ไทยนี้รักสงบ แต่ถึงรบไม่ขลาด เอกราชจะไม่ให้ใครข่มขี่ สละเลือดทุกหยาดเป็นชาติพลี เถลิงประเทศชาติไทยทวี มีชัย ชโย"}
  ]
)
print(completion.choices[0].message.content)

ประเทศ ไทย รวม เลือด เนื้อ ชาติ เชื้อ ไทย เป็น ประชา รัฐ ไผ ท ของ ไทย ทุก ส่วน อยู่ ดำรง คง ไว้ ได้ ทั้ง มวล ด้วย ไทย ล้วน หมาย รัก สามัคคี ไทย นี้ รัก สงบ แต่ ถึง รบ ไม่ ขลาด เอกราช จะ ไม่ ให้ ใคร ข่ม ขี่ สละ เลือด ทุก หยาด เป็น ชาติ พลี เถลิง ประเทศ ชาติ ไทย ทวี มี ชัย ชโย


## GPT4

In [None]:
# ทำ function กลางๆ ไว้ใช้
def gpt4(prompt, content, json=True):
  if json:
    fmt = dict(response_format={"type": "json_object"})
  else:
    fmt = {}
  # call API
  completion = client.chat.completions.create(
    model="gpt-4-turbo-preview",
    messages=[
      {"role": "system", "content": prompt},
      {"role": "user", "content": content}
    ],
    **fmt
  )
  output = completion.choices[0].message.content
  if json:
    output = loads(output)
  return output

In [None]:
gpt4("Segment into words (json)", "สวัสดีครับคุณครู")

{'words': ['สวัสดี', 'ครับ', 'คุณ', 'ครู']}

## เรียก Function

In [None]:
segment = partial(gpt4, "Segment into words (json)")

In [None]:
segment('สวัสดีครับคุณครู')

{'words': ['สวัสดี', 'ครับ', 'คุณ', 'ครู']}

In [None]:
segment('สวัสดีครับคุณครู')['words']

['สวัสดี', 'ครับ', 'คุณ', 'ครู']

In [None]:
segment('เขานั่งตากลมเย็นๆ')

{'words': ['เขา', 'นั่ง', 'ตาก', 'ลม', 'เย็นๆ']}

In [None]:
segment('เขานั่งตากลมมองเหม่อ')

{'words': ['เขา', 'นั่ง', 'ตากลม', 'มอง', 'เหม่อ']}

In [None]:
summarize = partial(gpt4, "Summarize", json=False)

In [None]:
summarize("สวัสดี สวัสดี สวัสดี สวัสดี สวัสดี สวัสดี สวัสดี สวัสดี สวัสดี")

'สวัสดี'

In [None]:
summarize("สวัสดี สวัสดี สวัสดี สวัสดี สวัสดี สวัสดี สวัสดี สวัสดี สวัสดี")

'สวัสดีถึง 9 ครั้ง'

In [None]:
ner = partial(gpt4, "Extract NER (json)")

In [None]:
ner("สวัสดีครับ ผมชื่อ กรกฎ เชาวะวณิช ผมอยู่จังหวัดนนทบุรี ประเทศไทย")

{'entities': [{'text': 'กรกฎ เชาวะวณิช', 'type': 'Person'},
  {'text': 'นนทบุรี', 'type': 'Location'},
  {'text': 'ประเทศไทย', 'type': 'Location'}]}

In [None]:
sentiment = partial(gpt4, "Find sentiment (json)")

In [None]:
sentiment('เมพขิงๆ เลย')

{'sentiment': 'positive'}

In [None]:
sentiment('โคตรกากเลย')

{'text': 'โคตรกากเลย', 'sentiment': 'negative'}

In [None]:
tothai = partial(gpt4, "Translate to Thai", json=False)

In [None]:
tothai('Happy Birthday to you')

'สุขสันต์วันเกิดนะ'

In [None]:
sentseg = partial(gpt4, "Segement into sentences (json)")

In [None]:
sentseg("สวัสดีครับ ผมชื่อ กรกฎ เชาวะวณิช ผมอยู่จังหวัดนนทบุรี ประเทศไทย \
วันนี้ผมอยากมาเล่าเรื่องการใช้ gpt-4 สำหรับ NLP ภาษาไทย")

{'sentences': ['สวัสดีครับ',
  'ผมชื่อ กรกฎ เชาวะวณิช',
  'ผมอยู่จังหวัดนนทบุรี ประเทศไทย',
  'วันนี้ผมอยากมาเล่าเรื่องการใช้ gpt-4 สำหรับ NLP ภาษาไทย']}

In [None]:
pronounce = partial(gpt4, "Get the pronunciation of the given word in json")

In [None]:
pronounce("Hello")

{'word': 'hello', 'phonetic': '/həˈloʊ/', 'phoneticNotation': 'IPA'}

In [None]:
pronounce("สวัสดี")

{'word': 'สวัสดี', 'pronunciation': 'sa-wat-dee'}

In [None]:
findpos = partial(gpt4, "Find POS of each word, return json")

In [None]:
findpos("สวัสดีครับ ผมกรกฎ ครับ ผมชอบ AI")

{'สวัสดี': 'V',
 'ครับ': 'PART',
 'ผม': 'PRON',
 'กรกฎ': 'N',
 'ชอบ': 'V',
 'AI': 'N'}

In [None]:
tonum = partial(gpt4, "Convert the words to a number, return json")

In [None]:
tonum("สองพันห้าร้อยหกสิบเจ็ด")

{'number': 2567}