In [2]:
import os
from config import LANGCHAIN_API_KEY, OPENAI_API_KEY, GEMINI_API_KEY, GOOGLE_API_KEY
os.environ["LANGCHAIN_TRACING_V2"] = "true"
os.environ["LANGCHAIN_API_KEY"] = LANGCHAIN_API_KEY
os.environ["OPENAI_API_KEY"] = OPENAI_API_KEY

In [3]:
from langchain_openai import ChatOpenAI
model = ChatOpenAI(model="gpt-4o-mini")

In [4]:
from typing import Optional, List
from langchain_core.pydantic_v1 import BaseModel, Field

class Summarizer(BaseModel):
    '''
    Summary of Compliant
    '''
    Summary: str = Field(description="the summary, be concise")
    Perpetrator: Optional[List[str]] = Field(description="The person(people) or/and organization(s) being accused")
    Accusation: Optional[str] = Field(description="the action that the perpetrator is accused of")
    Where: Optional[str] = Field(description="province, district, or subdistrict")
    Amount: Optional[str] = Field(description="the amount of money, if there is any involved, i prefer numeric value with currency")
    
    def __str__(self):
        return f"Summary: {self.Summary}\nPerpetrator: {self.Perpetrator}\nAccusation: {self.Accusation}\nWhere: {self.Where}\nAmount: {self.Amount}"

structured_model = model.with_structured_output(Summarizer)
compliant = '''
"ยุทธพงศ์" แฉ "ทร." ตั้งงบซื้อยูเอวี แพงเกินราคาพันล้าน ส่อไม่โปร่งใส นายยุทธพงศ์ จรัสเสถียร ส.ส.มหาสารคาม พรรคเพื่อไทย อภิปรายต่อที่ประชุม วาระพิจารณาร่างพระราชบัญญัติ (พ.ร.บ.) งบประมาณรายจ่ายประจำปีงบประมาณ พ.ศ.2566 วงเงิน 3.185 ล้านล้านบาท วาระแรก เป็นวันสาม โดยเปิดประเด็นกับกระทรวงการคลังต่อการเปิดประมูลโครงการท่อส่งน้ำในเขตพัฒนาเศรษฐกิจพิเศษ (อีอีซี) ซึ่งย้ำถึงการเปิดประมูลที่ส่อว่าไม่โปร่งใส ขัดต่อการประกาศวิสัยทัศน์ของหน่วยงาน ทั้งนี้ในกลางเดือนกรกฎหาคม หากพล.อ.ประยุทธ์ จันทร์โอชา นายกรัฐมนตรีและรมว.กลาโหม ฐานะประธานอีอีซี ไม่ทำให้โปร่งใส เกิดประโยชน์ต่อแผ่นดิน  จะถูกยื่นอภิปรายไม่ไว้วางใจ รวมถึงนายอาคม เติมพิทยาไพสิฐ รมว.คลัง ฐานะกรรมการที่ราชพัสดุ และนายสันติ พร้อมพัฒน์ รมช.คลังที่รับมอบอำนาจจากรมว.คลังให้เป็นกรรมการที่ราชพัสดุ แต่ก่อนอภิปรายไม่ไว้วางใจ ตนจะยื่นเรื่องต่อคณะกรรมการป้องกันและปราบปรามการทุจริตแห่งชาติ  (ป.ป.ช.)  เพื่อให้สอบกรรมการที่ราชพัสดุ จำนวน 6 คน ที่ยกเลิกการประมูลในครั้งแรก ทำให้บริษัทอีสวอเตอร์เสียสิทธิ์
'''

result = structured_model.invoke(compliant)
print(result)      

Summary: นายยุทธพงศ์ จรัสเสถียร ส.ส.มหาสารคาม พรรคเพื่อไทย แฉงบประมาณซื้อยูเอวี ของกระทรวงกลาโหม ว่าแพงเกินราคาพันล้านและไม่โปร่งใส โดยเตือนหากไม่มีความโปร่งใสในการประมูลจะยื่นอภิปรายไม่ไว้วางใจนายกรัฐมนตรีและรมว.การคลัง รวมถึงยื่นเรื่องให้ป.ป.ช.สอบกรรมการที่ราชพัสดุ 6 คน ที่ยกเลิกการประมูลทำให้บริษัทเสียสิทธิ์
Perpetrator: ['กระทรวงกลาโหม', 'พล.อ.ประยุทธ์ จันทร์โอชา', 'นายอาคม เติมพิทยาไพสิฐ', 'นายสันติ พร้อมพัฒน์']
Accusation: ตั้งงบซื้อยูเอวีแพงเกินราคาพันล้านและไม่โปร่งใส
Where: ประเทศไทย
Amount: 1,000,000,000 THB


In [5]:
import pandas as pd
data = pd.read_excel('Accusation Mock.xlsx',sheet_name='Sheet1')
data

Unnamed: 0,Accusation Example,Headers,ฐานความผิด
0,วันที่ 17 สิงหาคม 2567\n\nเรื่อง ขอร้องเรียนเก...,โครงการก่อสร้างบ้านพักสนามบินสุราษฎร์ มูลค่ากว...,จัดซื้อจัดจ้าง
1,วันที่ 17 สิงหาคม 2567\n\nเรื่อง แจ้งเรื่องพฤต...,พบเจ้าหน้าที่ข้าราชการแห่งหนึ่งในพื้นที่จังหวั...,เรียกรับสินบน ให้/ขอให้ หรือรับว่าจะให้ทรัพย์ส...
2,\n\nเรื่อง ขอให้ตรวจสอบกิจกรรมส่งมอบกระเป๋ายา ...,"""ขอให้ตรวจสอบกิจกรรมส่งมอบกระเป๋ายา อสม. ในเขต...",เรียกรับสินบน ให้/ขอให้ หรือรับว่าจะให้ทรัพย์ส...
3,เรื่อง ขอให้ตรวจสอบและเร่งดำเนินการซ่อมแซมถนนค...,ถนน 3 ล้าน 3 ปีพัง ทิ้งไว้เกือบปีไร้วี่แววซ่อม...,ทุจริตในการจัดทำงบประมาณ/โครงการ/เบิกจ่ายเงินใ...
4,เรื่อง ขอให้ตรวจสอบการดำเนินการโครงการจัดซื้อพ...,"""โครงการจัดซื้อพร้อมติดตั้งโคมไฟถนน จำนวน 11 โ...",ปฏิบัติหรือละเว้นการปฏิบัติหน้าที่โดยมิชอบหรือ...
5,เรื่อง ขอให้ตรวจสอบโครงการพัฒนาน้ำบาดาลเพื่อกา...,โครงการพัฒนาน้ำบาดาลเพื่อการเกษตรแปลงใหญ่ ผลงา...,การขัดกันระหว่างประโยชน์ส่วนบุคคลและประโยชน์ส่...
6,เรื่อง ขอให้ตรวจสอบและเร่งแก้ไขปัญหาถนนคอนกรีต...,"ถนนคอนกรีตมูลค่า 6,352,200 บาท ระยะทาง 2.35 กิ...",ร่ำรวยผิดปกติ
7,เรื่อง ขอให้ตรวจสอบการใช้รถยนต์ของสถานีตำรวจภู...,ชาวต้องแฉเมืองตรังเขาส่งมาให้แอดดูว่าเห็นรถยนต...,ยักยอก/เบียดบังเงินหรือทรัพย์สินของทางราชการ
8,เรื่อง ขอให้ตรวจสอบการดำเนินโครงการขยายท่อน้ำป...,"""การร้องเรียนทางสื่อออนไลน์ว่ามีการจัดทำโครงกา...",ออกเอกสารสิทธิ
9,เรื่อง ขอให้ติดตามและตรวจสอบแนวทางการดำเนินโคร...,ลงพื้นที่ติดตามแนวทางการดำเนินโครงการ “ปรับแหล...,การบริหารงานบุคคล (การบรรจุ/แต่งตั้ง/เลื่อนตำแ...


In [8]:
data['temp'] = data['Accusation Example'].apply(lambda x: structured_model.invoke(x))
data['Summary'] = data['temp'].apply(lambda x: x.Summary)
data['Perpetrator'] = data['temp'].apply(lambda x: x.Perpetrator)
data['Accusation'] = data['temp'].apply(lambda x: x.Accusation)
data['Where'] = data['temp'].apply(lambda x: x.Where)
data['Amount'] = data['temp'].apply(lambda x: x.Amount)
data = data.drop(columns=['temp'])
data.to_excel('Accusation Mock.xlsx',index=False)

In [6]:
# invoke all in Accusation Example
for index, row in data.iterrows():
    compliant = row['Accusation Example']
    result = structured_model.invoke(compliant)
    print(result)
    print()

Summary: นายสมชาย พงษ์ศิริร้องเรียนเกี่ยวกับโครงการก่อสร้างบ้านพักสนามบินสุราษฎร์ธานี มูลค่า 44 ล้านบาท ที่มีความล่าช้าเกินเหตุตั้งแต่ปี 2563 โดยมีปัญหาผู้รับเหมาทิ้งงาน สร้างความกังวลให้กับประชาชน
Perpetrator: ['กรมท่าอากาศยาน', 'บริษัทอันนาเทรดดิ้งจำกัด']
Accusation: ความล่าช้าในการก่อสร้าง
Where: สุราษฎร์ธานี
Amount: 44,000,000 บาท

Summary: นายสมชาย พงษ์ศิริ แจ้งเรื่องการเรียกรับเงินใต้โต๊ะจากเจ้าหน้าที่ข้าราชการในจังหวัดปทุมธานี โดยอ้างว่าจะช่วยเร่งรัดการจ่ายเงินค่าเวนคืนที่ดิน พร้อมมีหลักฐานเป็นคลิปเสียง
Perpetrator: ['เจ้าหน้าที่ข้าราชการ']
Accusation: เรียกรับเงินใต้โต๊ะ
Where: จังหวัดปทุมธานี
Amount: None

Summary: นายสมชาย พงษ์ศิริ ขอให้เทศบาลนครอุดรธานีตรวจสอบกิจกรรมส่งมอบกระเป๋ายา อสม. หลังพบว่ามีการจัดซื้ออุปกรณ์วิทยาศาสตร์การแพทย์โดยไม่มีการประกาศโครงการและงบประมาณที่ชัดเจน รวมถึงการมีใบแจ้งหนี้จากบริษัท จีวาน โซลูชั่น จำกัด มูลค่ากว่า 7,318,925 บาท แต่หน่วยงานไม่สามารถชี้แจงได้ว่าเป็นการจัดซื้อจริงหรือไม่
Perpetrator: ['เทศบาลนครอุดรธานี', 'บริษัท จีวาน โซลูชั่น จำกัด']
