# 📚 Workshop: RAG + LangChain + Streamlit

## Simple Chatbot vs RAG Chatbot
---

### 🎯 วัตถุประสงค์
- แสดงความแตกต่างระหว่าง chatbot ธรรมดา vs RAG
- เปรียบเทียบผลลัพธ์การตอบคำถาม
- เห็นข้อจำกัดของ chatbot ธรรมดา
- เห็นข้อดีของ RAG Chatbot

---


image.png

### what is LLM
#### LLM = Large Language Model = โมเดลภาษาขนาดใหญ่ เป็น 
- AI ที่เรียนรู้จากข้อความจำนวนมหาศาล (หนังสือ, บทความ, เว็บไซต์) สามารถเข้าใจและสร้างข้อความได้เหมือนมนุษย์

#### LLM ทำงานยังไง 
- เรียนรู้ จากข้อมูลข้อความมากมาย
- เข้าใจ ความหมายของคำและประโยค
- สร้าง คำตอบใหม่จากความรู้ที่เรียนรู้มา

### ตัวอย่าง LLM ที่รู้จัก
- ChatGPT (OpenAI)
- Gemini (Google)
- Claude (Anthropic)
- Llama (Meta)
---

## 🤖 Simple Chatbot (ไม่ใช้ RAG)

### ข้อจำกัดของ Simple Chatbot:

1. **Hallucination** - หลอน สร้างข้อมูลที่ดูเหมือนจริงแต่ไม่ถูกต้อง
2. **Context Limit** - ไม่สามารถเข้าถึงข้อมูลล่าสุดหรือข้อมูลเฉพาะได้
3. **Static Knowledge** - ใช้ความรู้ที่เรียนรู้มาแล้วเท่านั้น
4. **reference ไม่มีแหล่งอ้างอิง** - ไม่สามารถบอกได้ว่าข้อมูลมาจากไหน


### how to run llm 

In [7]:
# Simple Chatbot Demo
import os
from dotenv import load_dotenv
from langchain_groq import ChatGroq

# โหลด environment variables
load_dotenv()

# ตั้งค่า Simple Chatbot
def setup_simple_chatbot():
    """ตั้งค่า Simple Chatbot (ไม่ใช้ RAG)"""
    try:
        api_key = os.getenv("GROQ_API_KEY")
        if not api_key:
            raise ValueError("GROQ_API_KEY ไม่พบใน environment variables")
        
        llm = ChatGroq(
            groq_api_key=api_key,
            model_name="llama-3.3-70b-versatile",
            temperature=0.1
        )
        
        print("✅ Simple Chatbot ตั้งค่าสำเร็จ")
        return llm
        
    except Exception as e:
        print(f"❌ เกิดข้อผิดพลาด: {e}")
        return None

# ทดสอบ Simple Chatbot
def test_simple_chatbot(llm, questions):
    """ทดสอบ Simple Chatbot"""
    if not llm:
        print("❌ ไม่มี LLM ให้ทดสอบ")
        return
    
    print("🤖 Simple Chatbot (ไม่ใช้ RAG)")
    print("=" * 60)
    
    for i, question in enumerate(questions, 1):
        print(f"\n📝 คำถามที่ {i}: {question}")
        print("-" * 50)
        
        try:
            response = llm.invoke(question)
            print(f"🤖 คำตอบ: {response.content}")
            print("❌ ไม่มีแหล่งอ้างอิง")
            
        except Exception as e:
            print(f"❌ เกิดข้อผิดพลาด: {e}")
        
        print("\n" + "=" * 60)

# ตั้งค่าและทดสอบ Simple Chatbot
simple_llm = setup_simple_chatbot()

# คำถามทดสอบ
test_questions = [
    # "จังหวัดน่านมีประชากรเท่าไหร่?",
    # "จังหวัดน่านมีสถานที่ท่องเที่ยวอะไรบ้าง?",
    # "จังหวัดน่านมีประวัติศาสตร์อย่างไร?",
    # "จังหวัดน่านมีอาหารพื้นเมืองอะไรบ้าง?",
    "นายของประเทศไทยคน ล่าสุดคืออะไร?"
]

# ทดสอบ Simple Chatbot
test_simple_chatbot(simple_llm, test_questions)


✅ Simple Chatbot ตั้งค่าสำเร็จ
🤖 Simple Chatbot (ไม่ใช้ RAG)

📝 คำถามที่ 1: นายของประเทศไทยคน ล่าสุดคืออะไร?
--------------------------------------------------
🤖 คำตอบ: นายกรัฐมนตรีคนล่าสุดของประเทศไทย คือ เศรษฐา ทวีสิน เขาได้รับการลงมติเลือกจากสภาผู้แทนราษฎรเมื่อวันที่ 22 สิงหาคม พ.ศ. 2566 และได้รับพระบรมราชโองการโปรดเกล้าฯ แต่งตั้งเป็นนายกรัฐมนตรี เมื่อวันที่ 22 สิงหาคม พ.ศ. 2566
❌ ไม่มีแหล่งอ้างอิง



## 🔍 RAG Chatbot (ใช้ RAG)

### ข้อดีของ RAG Chatbot:

1. **ลด Hallucination** - ใช้ข้อมูลจากเอกสารจริง
2. **เข้าถึงข้อมูลล่าสุด** - สามารถใช้ข้อมูลเฉพาะโดเมนได้
3. **มีแหล่งอ้างอิง** - แสดงแหล่งข้อมูลที่ใช้ตอบคำถาม
4. **ความแม่นยำสูง** - ตอบคำถามได้ถูกต้องตามข้อมูลจริง


In [5]:
# RAG Chatbot Demo
import os
import sys
from pathlib import Path

# เพิ่ม path สำหรับ import modules
sys.path.append('..')

# Import LangChain components
from langchain.chains import RetrievalQA
from langchain.prompts import PromptTemplate
from langchain_groq import ChatGroq
from langchain_community.vectorstores import FAISS
from langchain_community.embeddings import HuggingFaceEmbeddings

# ตั้งค่า RAG Chatbot
def setup_rag_chatbot():
    """ตั้งค่า RAG Chatbot"""
    try:
        # โหลด Vector Store
        vectorstore_path = "../vectorstore"
        if not os.path.exists(vectorstore_path):
            print("❌ ไม่พบ Vector Store - กรุณารัน notebook ช่วงที่ 2 ก่อน")
            return None
        
        # โหลด embeddings
        embeddings = HuggingFaceEmbeddings(
            model_name="all-MiniLM-L6-v2",
            cache_folder="../model_cache"
        )
        
        # โหลด FAISS vector store
        vectorstore = FAISS.load_local(vectorstore_path, embeddings, allow_dangerous_deserialization=True)
        
        # ตั้งค่า LLM
        api_key = os.getenv("GROQ_API_KEY")
        if not api_key:
            raise ValueError("GROQ_API_KEY ไม่พบใน environment variables")
        
        llm = ChatGroq(
            groq_api_key=api_key,
            model_name="llama-3.3-70b-versatile",
            temperature=0.1
        )
        
        # สร้าง Custom Prompt
        prompt_template = """
คุณเป็นผู้ช่วยที่เชี่ยวชาญเกี่ยวกับข้อมูลในเอกสาร จงตอบคำถามอย่างกระชับและถูกต้อง

ข้อมูลอ้างอิง:
{context}

คำถาม: {question}

คำตอบ:"""
        
        PROMPT = PromptTemplate(
            template=prompt_template,
            input_variables=["context", "question"]
        )
        
        # สร้าง RetrievalQA chain
        qa_chain = RetrievalQA.from_chain_type(
            llm=llm,
            chain_type="stuff",
            retriever=vectorstore.as_retriever(search_kwargs={"k": 3}),
            chain_type_kwargs={"prompt": PROMPT},
            return_source_documents=True
        )
        
        print("✅ RAG Chatbot ตั้งค่าสำเร็จ")
        print(f"📊 Vector Store: {vectorstore.index.ntotal} documents")
        return qa_chain
        
    except Exception as e:
        print(f"❌ เกิดข้อผิดพลาด: {e}")
        return None

# ทดสอบ RAG Chatbot
def test_rag_chatbot(qa_chain, questions):
    """ทดสอบ RAG Chatbot"""
    if not qa_chain:
        print("❌ ไม่มี QA Chain ให้ทดสอบ")
        return
    
    print("🔍 RAG Chatbot (ใช้ RAG)")
    print("=" * 60)
    
    for i, question in enumerate(questions, 1):
        print(f"\n📝 คำถามที่ {i}: {question}")
        print("-" * 50)
        
        try:
            result = qa_chain({"query": question})
            answer = result["result"]
            source_docs = result.get("source_documents", [])
            
            print(f"🤖 คำตอบ: {answer}")
            
            if source_docs:
                print(f"\n📚 แหล่งอ้างอิง ({len(source_docs)} เอกสาร):")
                for j, doc in enumerate(source_docs, 1):
                    print(f"  {j}. หน้า {doc.metadata.get('page', 'N/A')}")
                    print(f"     เนื้อหา: {doc.page_content[:100]}...")
            
        except Exception as e:
            print(f"❌ เกิดข้อผิดพลาด: {e}")
        
        print("\n" + "=" * 60)

# ตั้งค่าและทดสอบ RAG Chatbot
rag_chain = setup_rag_chatbot()

# ทดสอบ RAG Chatbot
test_rag_chatbot(rag_chain, test_questions)


  embeddings = HuggingFaceEmbeddings(


✅ RAG Chatbot ตั้งค่าสำเร็จ
📊 Vector Store: 13 documents
🔍 RAG Chatbot (ใช้ RAG)

📝 คำถามที่ 1: จังหวัดน่านมีประชากรเท่าไหร่?
--------------------------------------------------


  result = qa_chain({"query": question})


🤖 คำตอบ: ข้อมูลที่ให้มาไม่ได้ระบุจำนวนประชากรของจังหวัดน่าน

📚 แหล่งอ้างอิง (3 เอกสาร):
  1. หน้า 2
     เนื้อหา: สมัยกรุงรัตนโกสินทร์ นครน่านมีฐานะเป็นหัวเมืองประเทศราช เจ้าผู้ครองนครน่านในชั้นหลัง
ทุกองค์ต่างปฏิบ...
  2. หน้า 0
     เนื้อหา: ครองเมืองย่างแทน จึงให้เสนาอำมาตย์ไปเชิญ เจ้าเก้าเถื่อนเกรงใจปู่จึงยอมไปอยู่เมืองย่างและ
มอบให้ชายาค...
  3. หน้า 2
     เนื้อหา: สมัยล้านนา 
ในปี พ.ศ. 1993 พระเจ้าติโลกราชกษัตริย์นครเชียงใหม่ มีความประสงค์จะครอบครอง
เมืองน่านและแ...


📝 คำถามที่ 2: จังหวัดน่านมีสถานที่ท่องเที่ยวอะไรบ้าง?
--------------------------------------------------
🤖 คำตอบ: จังหวัดน่านมีสถานที่ท่องเที่ยวหลายแห่ง เช่น วัดพระธาตุแช่แห้ง, วัดสวนตาล, วัดพระธาตุช้างค้ำ และบ่อเกลือใต้ เป็นต้น

📚 แหล่งอ้างอิง (3 เอกสาร):
  1. หน้า 2
     เนื้อหา: สมัยกรุงรัตนโกสินทร์ นครน่านมีฐานะเป็นหัวเมืองประเทศราช เจ้าผู้ครองนครน่านในชั้นหลัง
ทุกองค์ต่างปฏิบ...
  2. หน้า 0
     เนื้อหา: ครองเมืองย่างแทน จึงให้เสนาอำมาตย์ไปเชิญ เจ้าเก้าเถื่อนเกรงใจปู่จึงยอมไปอยู่เมืองย่างและ
มอบให้ชายาค...
  3

## 📊 เปรียบเทียบผลลัพธ์

### สรุปความแตกต่าง:

| ด้าน | Simple Chatbot | RAG Chatbot |
|------|----------------|-------------|
| **ความแม่นยำ** | ❌ อาจเกิด hallucination | ✅ ใช้ข้อมูลจริง |
| **แหล่งอ้างอิง** | ❌ ไม่มี | ✅ มีแหล่งอ้างอิงชัดเจน |
| **ข้อมูลเฉพาะ** | ❌ ไม่สามารถตอบได้ | ✅ ตอบได้ถูกต้อง |
| **ความน่าเชื่อถือ** | ❌ ไม่แน่ใจ | ✅ น่าเชื่อถือ |
| **การใช้งาน** | ✅ ง่าย | ✅ ง่าย |

### 🎯 สรุป:

**RAG Chatbot** มีข้อดีเหนือกว่า Simple Chatbot อย่างชัดเจน:
- ตอบคำถามได้ถูกต้องตามข้อมูลจริง
- มีแหล่งอ้างอิงที่ชัดเจน
- ลด hallucination
- น่าเชื่อถือมากกว่า

**Simple Chatbot** เหมาะสำหรับ:
- คำถามทั่วไปที่ไม่ต้องการข้อมูลเฉพาะ
- การสนทนาทั่วไป
- การทดสอบเบื้องต้น

---

**💡 คำแนะนำ: ใช้ RAG Chatbot สำหรับการใช้งานจริงที่ต้องการความแม่นยำและความน่าเชื่อถือ**
