In [1]:
import os
from config import LANGCHAIN_API_KEY, OPENAI_API_KEY, GEMINI_API_KEY, GOOGLE_API_KEY
os.environ["LANGCHAIN_TRACING_V2"] = "true"
os.environ["LANGCHAIN_API_KEY"] = LANGCHAIN_API_KEY
os.environ["OPENAI_API_KEY"] = OPENAI_API_KEY

# Structured Output

In [12]:
from langchain_openai import ChatOpenAI
from langchain_ollama import ChatOllama
ON_PREM = True
if ON_PREM:
    model = ChatOllama(
    model="llama3.1",
    temperature=0,
)
else:
    model = ChatOpenAI(model="gpt-4o-mini")

In [16]:
from typing import Optional
from langchain_core.pydantic_v1 import BaseModel, Field

class Summarizer(BaseModel):
    '''
    Summary of Compliant
    '''
    Summary: str = Field(description="the summary of the complaint, be concise")
    AllegedParty: str = Field(description="The person(people) or/and organization(s) being accused (NOT THE ACCUSER), if there are multiple, separate them with comma")
    Accusation: str = Field(description="the action that the perpetrator is accused of")
    Location: str = Field(description="province, district, or subdistrict")
    Amount: str = Field(description="the amount of money, if there is any involved, i prefer numeric value with currency eg. 1,000,000 บาท if no money involved or specified, just leave N/A")
    
    def __str__(self):
        return f"Summary: {self.Summary}\nAllegedParty: {self.AllegedParty}\nAccusation: {self.Accusation}\nLocation: {self.Location}\nAmount: {self.Amount}"

structured_model = model.with_structured_output(Summarizer)
compliant = '''
"ยุทธพงศ์" แฉ "ทร." ตั้งงบซื้อยูเอวี แพงเกินราคาพันล้าน ส่อไม่โปร่งใส นายยุทธพงศ์ จรัสเสถียร ส.ส.มหาสารคาม พรรคเพื่อไทย อภิปรายต่อที่ประชุม วาระพิจารณาร่างพระราชบัญญัติ (พ.ร.บ.) งบประมาณรายจ่ายประจำปีงบประมาณ พ.ศ.2566 วงเงิน 3.185 ล้านล้านบาท วาระแรก เป็นวันสาม โดยเปิดประเด็นกับกระทรวงการคลังต่อการเปิดประมูลโครงการท่อส่งน้ำในเขตพัฒนาเศรษฐกิจพิเศษ (อีอีซี) ซึ่งย้ำถึงการเปิดประมูลที่ส่อว่าไม่โปร่งใส ขัดต่อการประกาศวิสัยทัศน์ของหน่วยงาน ทั้งนี้ในกลางเดือนกรกฎหาคม หากพล.อ.ประยุทธ์ จันทร์โอชา นายกรัฐมนตรีและรมว.กลาโหม ฐานะประธานอีอีซี ไม่ทำให้โปร่งใส เกิดประโยชน์ต่อแผ่นดิน  จะถูกยื่นอภิปรายไม่ไว้วางใจ รวมถึงนายอาคม เติมพิทยาไพสิฐ รมว.คลัง ฐานะกรรมการที่ราชพัสดุ และนายสันติ พร้อมพัฒน์ รมช.คลังที่รับมอบอำนาจจากรมว.คลังให้เป็นกรรมการที่ราชพัสดุ แต่ก่อนอภิปรายไม่ไว้วางใจ ตนจะยื่นเรื่องต่อคณะกรรมการป้องกันและปราบปรามการทุจริตแห่งชาติ  (ป.ป.ช.)  เพื่อให้สอบกรรมการที่ราชพัสดุ จำนวน 6 คน ที่ยกเลิกการประมูลในครั้งแรก ทำให้บริษัทอีสวอเตอร์เสียสิทธิ์
'''

result = structured_model.invoke(compliant)
print(result)      

Summary: การเปิดประมูลท่อส่งน้ำในเขตพัฒนาเศรษฐกิจพิเศษ (อีอีซี) ที่ไม่โปร่งใส และการยกเลิกการประมูลครั้งแรก ทำให้บริษัทอีสวอเตอร์เสียสิทธิ
AllegedParty: พล.อ.ประยุทธ์ จันทร์โอชา, นายอาคม เติมพิทยาไพสิฐ, นายสันติ พร้อมพัฒน์
Accusation: การเปิดประมูลท่อส่งน้ำในเขตพัฒนาเศรษฐกิจพิเศษ (อีอีซี) ที่ไม่โปร่งใส
Location: ประเทศไทย
Amount: N/A


In [14]:
import pandas as pd
data = pd.read_excel('Mock.xlsx',sheet_name='Sheet1')
data

Unnamed: 0,Complaint,Category_Assigned
0,วันที่ 17 สิงหาคม 2567\n\nเรื่อง ขอร้องเรียนเก...,จัดซื้อจัดจ้าง
1,วันที่ 17 สิงหาคม 2567\n\nเรื่อง แจ้งเรื่องพฤต...,เรียกรับสินบน ให้/ขอให้ หรือรับว่าจะให้ทรัพย์ส...
2,เรื่อง ขอให้ตรวจสอบกิจกรรมส่งมอบกระเป๋ายา อสม....,เรียกรับสินบน ให้/ขอให้ หรือรับว่าจะให้ทรัพย์ส...
3,เรื่อง ขอให้ตรวจสอบและเร่งดำเนินการซ่อมแซมถนนค...,ทุจริตในการจัดทำงบประมาณ/โครงการ/เบิกจ่ายเงินใ...
4,เรื่อง ขอให้ตรวจสอบการดำเนินการโครงการจัดซื้อพ...,ปฏิบัติหรือละเว้นการปฏิบัติหน้าที่โดยมิชอบหรือ...
5,เรื่อง ขอให้ตรวจสอบโครงการพัฒนาน้ำบาดาลเพื่อกา...,การขัดกันระหว่างประโยชน์ส่วนบุคคลและประโยชน์ส่...
6,เรื่อง ขอให้ตรวจสอบและเร่งแก้ไขปัญหาถนนคอนกรีต...,ร่ำรวยผิดปกติ
7,เรื่อง ขอให้ตรวจสอบการใช้รถยนต์ของสถานีตำรวจภู...,ยักยอก/เบียดบังเงินหรือทรัพย์สินของทางราชการ
8,เรื่อง ขอให้ตรวจสอบการดำเนินโครงการขยายท่อน้ำป...,ออกเอกสารสิทธิ
9,เรื่อง ขอให้ติดตามและตรวจสอบแนวทางการดำเนินโคร...,การบริหารงานบุคคล (การบรรจุ/แต่งตั้ง/เลื่อนตำแ...


In [15]:
data['temp'] = data['Complaint'].apply(lambda x: structured_model.invoke(x))
data['Summary'] = data['temp'].apply(lambda x: x.Summary)
data['AllegedParty'] = data['temp'].apply(lambda x: x.AllegedParty)
data['Accusation'] = data['temp'].apply(lambda x: x.Accusation)
data['Location'] = data['temp'].apply(lambda x: x.Location)
data['Amount'] = data['temp'].apply(lambda x: x.Amount)
data = data.drop(columns=['temp'])

AttributeError: 'NoneType' object has no attribute 'Summary'

In [None]:
data.to_excel('Mock.xlsx',index=False)

# JSON

In [1]:
import json
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain_ollama import ChatOllama
ON_PREM = True
if ON_PREM:
    json_llm = ChatOllama(model="gemma2",format="json",temperature=0)
else:
    llm = ChatOpenAI(model="gpt-4o-mini")
    json_llm = llm.bind(response_format={"type": "json_object"})


prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            '''You are a helpful assistant that digests a complaint in Thai given into JSON format, in Thai as follow:
    ### format
     Summary: '...', AllegedParty: '...', Accusation: '...', Location: '...', Amount: '...'
    
    ### field description
     where Summary is the concise summary of the complaint, and just explain what the alleged party is accused of, 
     AllegedParty is the person(people) or/and organization(s) being accused (NOT THE ACCUSER), if there are multiple, separate them with comma, 
     Accusation is the action that the perpetrator is accused of, 
     Location is the province, district, or subdistrict, 
     Amount is the amount of money, if there is any involved, in the format of (number) บาท for example 1,000,000 บาท
    
    ### additional information
     the Summary is the only field that is required. if information is not explicitly available for any other field, just leave it as empty string
     EVERY FIELD MUST BE FILLED IN FORMAL THAI LANGUAGE''',
        ),
        ("human", "{complaint}"),
    ]
)

chain = prompt | json_llm
compliant = '''
"ยุทธพงศ์" แฉ "ทร." ตั้งงบซื้อยูเอวี แพงเกินราคาพันล้าน ส่อไม่โปร่งใส นายยุทธพงศ์ จรัสเสถียร ส.ส.มหาสารคาม พรรคเพื่อไทย อภิปรายต่อที่ประชุม วาระพิจารณาร่างพระราชบัญญัติ (พ.ร.บ.) งบประมาณรายจ่ายประจำปีงบประมาณ พ.ศ.2566 วงเงิน 3.185 ล้านล้านบาท วาระแรก เป็นวันสาม โดยเปิดประเด็นกับกระทรวงการคลังต่อการเปิดประมูลโครงการท่อส่งน้ำในเขตพัฒนาเศรษฐกิจพิเศษ (อีอีซี) ซึ่งย้ำถึงการเปิดประมูลที่ส่อว่าไม่โปร่งใส ขัดต่อการประกาศวิสัยทัศน์ของหน่วยงาน ทั้งนี้ในกลางเดือนกรกฎหาคม หากพล.อ.ประยุทธ์ จันทร์โอชา นายกรัฐมนตรีและรมว.กลาโหม ฐานะประธานอีอีซี ไม่ทำให้โปร่งใส เกิดประโยชน์ต่อแผ่นดิน  จะถูกยื่นอภิปรายไม่ไว้วางใจ รวมถึงนายอาคม เติมพิทยาไพสิฐ รมว.คลัง ฐานะกรรมการที่ราชพัสดุ และนายสันติ พร้อมพัฒน์ รมช.คลังที่รับมอบอำนาจจากรมว.คลังให้เป็นกรรมการที่ราชพัสดุ แต่ก่อนอภิปรายไม่ไว้วางใจ ตนจะยื่นเรื่องต่อคณะกรรมการป้องกันและปราบปรามการทุจริตแห่งชาติ  (ป.ป.ช.)  เพื่อให้สอบกรรมการที่ราชพัสดุ จำนวน 6 คน ที่ยกเลิกการประมูลในครั้งแรก ทำให้บริษัทอีสวอเตอร์เสียสิทธิ์
'''
result = chain.invoke(
    {
        "complaint": compliant,
    }
)
result_json = json.loads(result.content)
result_json

KeyboardInterrupt: 

In [5]:
import pandas as pd
data = pd.read_excel('Mock.xlsx',sheet_name='Sheet1')

In [6]:
data['temp'] = data['Complaint'].apply(lambda x: chain.invoke({
        "complaint": x,
    }).content)
data['temp'] = data['temp'].apply(lambda x: json.loads(x))
data['Summary'] = data['temp'].apply(lambda x: x['Summary'])
data['AllegedParty'] = data['temp'].apply(lambda x: x['AllegedParty'])
data['Accusation'] = data['temp'].apply(lambda x: x['Accusation'])
data['Location'] = data['temp'].apply(lambda x: x['Location'])
data['Amount'] = data['temp'].apply(lambda x: x['Amount'])
data = data.drop(columns=['temp'])

In [8]:
data

Unnamed: 0,Complaint,Category_Assigned,Summary,AllegedParty,Accusation,Location,Amount,Category
0,วันที่ 17 สิงหาคม 2567\n\nเรื่อง ขอร้องเรียนเก...,จัดซื้อจัดจ้าง,ผู้ร้องเรียนกล่าวหาว่า โครงการก่อสร้างบ้านพักส...,"กรมท่าอากาศยาน, บริษัทอันนาเทรดดิ้งจำกัด","ทิ้งงาน, ความล่าช้าเกินเหตุ",จังหวัดสุราษฎร์ธานี,44 ล้านบาท,จัดซื้อจัดจ้าง
1,วันที่ 17 สิงหาคม 2567\n\nเรื่อง แจ้งเรื่องพฤต...,เรียกรับสินบน ให้/ขอให้ หรือรับว่าจะให้ทรัพย์ส...,เจ้าหน้าที่ข้าราชการเรียกรับเงินใต้โต๊ะโดยอ้าง...,เจ้าหน้าที่ข้าราชการ,เรียกรับเงินใต้โต๊ะ,จังหวัดปทุมธานี,,เรียกรับสินบน ให้/ขอให้ หรือรับว่าจะให้ทรัพย์ส...
2,เรื่อง ขอให้ตรวจสอบกิจกรรมส่งมอบกระเป๋ายา อสม....,เรียกรับสินบน ให้/ขอให้ หรือรับว่าจะให้ทรัพย์ส...,มีการสงสัยว่าเทศบาลนครอุดรธานี มีการจัดซื้ออุป...,"เทศบาลนครอุดรธานี, บริษัท จีวาน โซลูชั่น จำกัด",จัดซื้ออุปกรณ์วิทยาศาสตร์การแพทย์โดยวิธีเฉพาะเ...,เทศบาลนครอุดรธานี,"7,318,925 บาท",จัดซื้อจัดจ้าง
3,เรื่อง ขอให้ตรวจสอบและเร่งดำเนินการซ่อมแซมถนนค...,ทุจริตในการจัดทำงบประมาณ/โครงการ/เบิกจ่ายเงินใ...,ขอให้ตรวจสอบและเร่งดำเนินการซ่อมแซมถนนคอนกรีตเ...,เทศบาลเมืองปราจีนบุรี,ไม่ได้รับการซ่อมแซมถนนคอนกรีตเสริมเหล็กที่ชำรุด,เขตเทศบาลเมืองปราจีนบุรี,,การบริหารงานบุคคล (การบรรจุ/แต่งตั้ง/เลื่อนตำแ...
4,เรื่อง ขอให้ตรวจสอบการดำเนินการโครงการจัดซื้อพ...,ปฏิบัติหรือละเว้นการปฏิบัติหน้าที่โดยมิชอบหรือ...,ขอให้ตรวจสอบการดำเนินการโครงการจัดซื้อพร้อมติด...,เทศบาลเมืองท่าโขลง,ดำเนินการโครงการจัดซื้อพร้อมติดตั้งโคมไฟถนนโดย...,เทศบาลเมืองท่าโขลง,,จัดซื้อจัดจ้าง
5,เรื่อง ขอให้ตรวจสอบโครงการพัฒนาน้ำบาดาลเพื่อกา...,การขัดกันระหว่างประโยชน์ส่วนบุคคลและประโยชน์ส่...,โครงการพัฒนาน้ำบาดาลเพื่อการเกษตรแปลงใหญ่ ที่บ...,กรมทรัพยากรน้ำบาดาล,ปล่อยทิ้งโครงการพัฒนาน้ำบาดาลเพื่อการเกษตรแปลง...,"บ้านคลองวังทอง, ต.คลองยาง, อ.สวรรคโลก, จ.สุโขทัย",113 ล้านบาท,ทุจริตในการจัดทำงบประมาณ/โครงการ/เบิกจ่ายเงินใ...
6,เรื่อง ขอให้ตรวจสอบและเร่งแก้ไขปัญหาถนนคอนกรีต...,ร่ำรวยผิดปกติ,นายก อบต. ใช้ชื่อห้างของลูกน้องคนสนิทมารับงานก...,นายก อบต.,ใช้ชื่อห้างของลูกน้องคนสนิทมารับงานก่อสร้างถนน...,หมู่ 7 อ.รือเสาะ จ.นราธิวาส,"6,352,200 บาท",จัดซื้อจัดจ้าง
7,เรื่อง ขอให้ตรวจสอบการใช้รถยนต์ของสถานีตำรวจภู...,ยักยอก/เบียดบังเงินหรือทรัพย์สินของทางราชการ,มีการร้องเรียนว่ารถยนต์ของสถานีตำรวจภูธร อ.กัน...,สถานีตำรวจภูธร อ.กันตัง จ.ตรัง,จอดรถยนต์ราชการในโรงรถของบ้านพักส่วนบุคคล,อ.กันตัง จ.ตรัง,,การปฏิบัติหรือละเว้นการปฏิบัติหน้าที่โดยมิชอบห...
8,เรื่อง ขอให้ตรวจสอบการดำเนินโครงการขยายท่อน้ำป...,ออกเอกสารสิทธิ,ร้องเรียนว่าหลังจากโครงการขยายท่อน้ำประปาของเท...,เทศบาลตำบลคลองขุด,ดำเนินโครงการขยายท่อน้ำประปาโดยระบบน้ำประปายัง...,ตำบลคลองขุด อำเภอเมือง จังหวัด [จังหวัดของท่าน],,ทุจริตในการจัดทำงบประมาณ/โครงการ/เบิกจ่ายเงินใ...
9,เรื่อง ขอให้ติดตามและตรวจสอบแนวทางการดำเนินโคร...,การบริหารงานบุคคล (การบรรจุ/แต่งตั้ง/เลื่อนตำแ...,"ขอให้ติดตามและตรวจสอบแนวทางการดำเนินโครงการ ""ป...",โครงการส่งน้ำและบำรุงรักษาโก-ลก,ดำเนินโครงการอย่างไม่โปร่งใสและมีประสิทธิภาพ,บ้านปลักปลา หมู่ 4 ตำบลโฆษิต อำเภอตากใบ จังหวั...,"21,000,000 บาท",จัดซื้อจัดจ้าง


In [9]:
data.to_excel('Mock.xlsx',index=False)