In [6]:
import os
from dotenv import load_dotenv
from langchain_core.prompts import PromptTemplate
from langchain_core.pydantic_v1 import BaseModel, Field
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage

In [7]:
load_dotenv()
API_KEY = os.getenv("TYPHOON_API_KEY")

tagging_prompt = PromptTemplate(
    input_variables=["text"],
    template="Generate tags for the following text in both Thai and English:\n\nThai text: {text}\n\nTags:\nThai: \nEnglish: "
    )

llm = ChatOpenAI(base_url='https://api.opentyphoon.ai/v1',
                    model='typhoon-instruct',
                    temperature=0.0,
                    api_key=API_KEY)

# resp = model.invoke([HumanMessage(content="สวัสดี")])
# print(resp.content)
# Create a chain
chain = tagging_prompt | llm

In [8]:
chain.invoke("ประกอบกิจการนำเข้าส่งออกผลิตหมวกกันน๊อค")

AIMessage(content='Thai: นำเข้า, ส่งออก, ผลิตหมวกกันน๊อค\nEnglish: Import, Export, Helmet Production', response_metadata={'token_usage': {'completion_tokens': 29, 'prompt_tokens': 58, 'total_tokens': 87}, 'model_name': 'scb10x/llama-3-typhoon-v1.5-8b-instruct', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-4d43d15e-228f-4e7f-be39-dcd0acd45e26-0', usage_metadata={'input_tokens': 58, 'output_tokens': 29, 'total_tokens': 87})

In [9]:
chain.invoke("ประกอบกิจการนำเข้าส่งออกผลิตหมวกกันน๊อค").content.split("\n")

['Thai: นำเข้า, ส่งออก, ผลิตหมวกกันน๊อค',
 'English: Import, Export, Helmet Production']

In [10]:
chain.invoke("ประกอบกิจการนำเข้าส่งออกผลิตหมวกกันน๊อคประกอบกิจการโรงงานผลิต นำเข้า และส่งออก ผลิตภัณฑ์ท่อเหล็ก เหล็กโครงสร้างรูปพรรณ เหล็กแผ่น").content.split("\n")

['Thai: หมวกกันน็อก, โรงงาน, นำเข้า, ส่งออก, ท่อเหล็ก, เหล็กโครงสร้างรูปพรรณ, เหล็กแผ่น',
 'English: Motorcycle helmet, factory, import, export, steel pipe, structural steel, steel sheet.']

In [11]:
result=chain.invoke("ประกอบกิจการนำเข้าส่งออกวัตถุดิบและอะไหล่ยานยนต์และการให้บริการด้านการดำเนินพิธีการศุลกากร")

In [12]:
result.content.split("\n")

['Thai: นำเข้าส่งออก, วัตถุดิบยานยนต์, อะไหล่ยานยนต์, ศุลกากร',
 'English: ImportExport, AutomotiveRawMaterial, AutomotiveParts, Customs']

In [20]:
pd_list = [
    'ขายส่งและส่งออกพืชผลทางการเกษตรให้เช่าทรัพย์สินและให้บริการอื่นๆ',
    'ผลิตและจำหน่ายโลหะทั้งสเตนคาร์ไบด์',
    'ค้าส่งชุดสายไฟในรถยนต์วิจัยและพัฒนาชุดสายไฟในรถยนต์วิจัยและพัฒนาเชิงทดลองด้านวิศวกรรมเทคโนโลยี',
    'ให้โฆษณาบนเว็บไซต์บริการให้โหลดเพลงและภาพผ่านทางโทรศัพท์มือถือ'
    ]

tag_label = {}
for pdtext in pd_list:
    result=chain.invoke(pdtext).content.split('\n')
    tag_label[pdtext] = result
tag_label

{'ขายส่งและส่งออกพืชผลทางการเกษตรให้เช่าทรัพย์สินและให้บริการอื่นๆ': ['Thai: ขายส่ง, ส่งออก, พืชผลทางการเกษตร, เช่าทรัพย์สิน, บริการ',
  'English: Wholesale, Export, Agricultural produce, Rental property, Services'],
 'ผลิตและจำหน่ายโลหะทั้งสเตนคาร์ไบด์': ['Thai: ผลิต, จำหน่าย, โลหะ, สเตนคาร์ไบด์',
  'English: Production, Sales, Metal, Stancarbide'],
 'ค้าส่งชุดสายไฟในรถยนต์วิจัยและพัฒนาชุดสายไฟในรถยนต์วิจัยและพัฒนาเชิงทดลองด้านวิศวกรรมเทคโนโลยี': ['Thai: ค้าส่ง, ชุดสายไฟ, รถยนต์, วิจัย, พัฒนา, ทดลอง, วิศวกรรม, เทคโนโลยี',
  'English: Wholesale, Electrical Harness Set, Vehicle, Research, Development, Experimental, Engineering, Technology'],
 'ให้โฆษณาบนเว็บไซต์บริการให้โหลดเพลงและภาพผ่านทางโทรศัพท์มือถือ': ['Thai: โฆษณา, เว็บไซต์, บริการ, เพลง, ภาพ, โทรศัพท์มือถือ',
  'English: Advertisement, Website, Service, Song, Image, Mobile Phone']}