In [None]:
# -- Cell 1: Imports
from llama_index.llms.ollama import Ollama
from llama_index.core.extractors import (
    SummaryExtractor,
    TitleExtractor,
    KeywordExtractor,
    QuestionsAnsweredExtractor,
)
from llama_index.core import Document




In [None]:
# -- Cell 2: สร้าง LLM instance (เช่น gemma3n ที่รันผ่าน Ollama ใน local)
llm = Ollama(model="gemma3n:e2b", request_timeout=60.0)



In [None]:
# -- Cell 3: เตรียมข้อความ/Document
text = """
LlamaIndex เป็นเครื่องมือที่ช่วยเชื่อมโยงโมเดลภาษาเข้ากับฐานข้อมูลหรือเอกสารได้อย่างง่ายดาย จุดเด่นคือรองรับการสกัด metadata เช่น ชื่อเรื่อง คำสำคัญ สาระสังเขป ฯลฯ เพื่อช่วยให้การค้นหาข้อมูลมีประสิทธิภาพมากขึ้น

โมเดล embedding ที่นิยมใช้กับภาษาไทยในปัจจุบัน เช่น BAAI/bge-m3 สามารถนำมาใช้ร่วมกับ LlamaIndex เพื่อสร้างระบบ RAG ที่รองรับภาษาไทยได้ดี
"""
doc = Document(text)



In [None]:
# -- Cell 4: LLM-powered Extractor ตัวอย่าง (ใช้ llm=... ส่งเข้าไป)
title_extractor = TitleExtractor(llm=llm)
summary_extractor = SummaryExtractor(llm=llm)
keyword_extractor = KeywordExtractor(llm=llm)
questions_extractor = QuestionsAnsweredExtractor(llm=llm)

title = title_extractor.extract(doc.text)
summary = summary_extractor.extract(doc.text)
keywords = keyword_extractor.extract(doc.text)
questions = questions_extractor.extract(doc.text)

print("Title:", title)
print("Summary:", summary)
print("Keywords:", keywords)
print("Questions answered:", questions)



In [None]:
# -- Cell 5: [Optional] ใส่ metadata ลงใน node เพื่อ indexing/ค้นหา
from llama_index.core.schema import Node

node = Node(text=doc.text, metadata={
    "title": title,
    "summary": summary,
    "keywords": keywords,
    "questions_answered": questions,
})

print("\nNode with metadata:")
for k, v in node.metadata.items():
    print(f"{k}: {v}")