In [17]:
import chromadb
from sentence_transformers import SentenceTransformer
from langchain_anthropic import ChatAnthropic
import os
from IPython.display import display, Markdown

In [18]:
class NaiveRAG:
    def __init__(self, collection_name: str):
        """
        เปเบซเบผเบ RAG เบเบฒเบ Chroma DB เบเบตเปเบกเบตเบขเบนเปเปเบฅเปเบง
        """
        # เปเบซเบผเบ ChromaDB client เบเบฒเบ folder เบเบตเปเบเบปเบเปเบญเบเบชเปเบฒเบ
        self.client = chromadb.PersistentClient(path="../Vector/chroma_db")
        
        # เปเบซเบผเบ embedding model
        self.embedding_model = SentenceTransformer('D:/model/BAAI-bge-m3',device='cpu')
        
        # เปเบซเบผเบ collection เบเบตเปเบกเบตเบขเบนเปเปเบฅเปเบง
        try:
            self.collection = self.client.get_collection(name=collection_name)
            print(f"โ เปเบซเบผเบ collection เบชเปเบฒเปเบฅเบฑเบ: {collection_name}")
            print(f"   เบกเบตเปเบญเบเบฐเบชเบฒเบเบเบฑเบเปเบปเบ: {self.collection.count()} เปเบญเบเบฐเบชเบฒเบ")
        except Exception as e:
            print(f"โ เบเปเปเบชเบฒเบกเบฒเบเปเบซเบผเบ collection: {collection_name}")
            print(f"   เบเปเปเบเบดเบเบเบฒเบ: {e}")
            raise

        # เบเบดเบเบเบฑเปเบ Anthropic Claude
        api_key = os.getenv("ANTHROPIC_API_KEY")
        if not api_key:
            raise ValueError("เบเบฐเบฅเบธเบเบฒเปเบซเป ANTHROPIC_API_KEY")
        
        self.llm = ChatAnthropic(
            api_key=api_key,
            model="claude-opus-4-1-20250805",  
            temperature=0.0,
            max_tokens=2000
        )
    
    def search(self, query: str, n_results: int = 5):
        """
        เบเบปเปเบเบซเบฒเปเบญเบเบฐเบชเบฒเบเบเบตเปเบเปเบฝเบงเบเปเบญเบ
        """
        query_embedding = self.embedding_model.encode([query]).tolist()
        
        results = self.collection.query(
            query_embeddings=query_embedding,
            n_results=n_results
        )
        
        docs = []
        for i in range(len(results['documents'][0])):
            docs.append({
                'text': results['documents'][0][i],
                'score': 1 - results['distances'][0][i],  # เบเปเบฝเบ distance เปเบเบฑเบ similarity
                'id': results['ids'][0][i]
            })
        
        return docs
    
    def ask(self, question: str, n_results: int = 5):
        """
        เบเบฒเบกเบเปเบฒเบเบฒเบก เปเบฅเบฐ เปเบเปเบเปเบฒเบเบญเบ
        """
        print(f"๐ เบเปเบฒเบฅเบฑเบเบเบปเปเบเบซเบฒ: {question}")
        
        # 1. เบเบปเปเบเบซเบฒเปเบญเบเบฐเบชเบฒเบเบเบตเปเบเปเบฝเบงเบเปเบญเบ
        docs = self.search(question, n_results)
        
        if not docs:
            return "โ เบเปเปเบเบปเบเปเบญเบเบฐเบชเบฒเบเบเบตเปเบเปเบฝเบงเบเปเบญเบ"
        
        print(f"๐ เบเบปเบเปเบญเบเบฐเบชเบฒเบ: {len(docs)} เปเบญเบเบฐเบชเบฒเบ")
        
        # 2. เบชเปเบฒเบ context
        context = "\n\n".join([doc['text'] for doc in docs])
        
        # 3. เบชเปเบฒเบ prompt
        prompt = f"""เบเปเบฒเบเปเบเบฑเบ AI Assistant เบเบตเปเบเปเบฝเบงเบเบฒเบเปเบเบเบฒเบเบเบญเบเบเบณเบเบฒเบกเปเบเบเบญเปเบฒเบเบญเบตเบเบเบฒเบเปเบญเบเบฐเบชเบฒเบเบเบตเปเปเบซเปเบกเบฒ.

        เบเบณเปเบเบฐเบเบณ:
        1. เบเบญเบเบเบณเบเบฒเบกเปเบเบเบญเปเบฒเบเบญเบตเบเบเบฒเบเปเบญเบเบฐเบชเบฒเบเบเบตเปเปเบซเปเบกเบฒเปเบเบปเปเบฒเบเบฑเปเบ
        2. เบเปเบฒเบเปเปเบเบปเบเบเบณเบเบญเบเปเบเปเบญเบเบฐเบชเบฒเบ, เปเบซเปเบเบญเบเบงเปเบฒเบเปเปเบเบปเบเบเปเปเบกเบนเบเบเบตเปเบเปเบฝเบงเบเปเบญเบ
        3. เบฅเบฐเบเบธเปเบซเบผเปเบเบเปเปเบกเบนเบเบเบตเปเปเบเปเปเบเบเบฒเบเบเบญเบ
        4. เบเบญเบเปเบเบฑเบเบเบฒเบชเบฒเบฅเบฒเบงเปเบเบปเปเบฒเบเบฑเปเบ, เปเบซเปเบเบณเบเบญเบเบเบตเปเบเบฑเบเปเบเบ เปเบฅเบฐ เบฅเบฐเบญเบฝเบ
        5. เบเบญเบเปเบซเปเปเบเบฑเบ Format markdown
                
        เบเปเปเบกเบนเบเบญเปเบฒเบเบญเบตเบ:
        {context}

        เบเปเบฒเบเบฒเบก: {question}
        """
        
        # 4. เบชเปเบฒเบเบเปเบฒเบเบญเบเบเปเบงเบ Claude
        try:
            response = self.llm.invoke(prompt)
            answer = response.content.strip()
            
            return {
                'question': question,
                'answer': answer,
                'sources': docs
            }
            
        except Exception as e:
            return f"โ เปเบเบตเบเบเปเปเบเบดเบเบเบฒเบ: {str(e)}"

In [19]:
# เบงเบดเบเบตเปเบเปเบเบฒเบเบเปเบฒเบเป
def main():
    # เปเบชเปเบเบทเป collection เบเบญเบเบเปเบฒเบ
    COLLECTION_NAME = "pdf_documents"  # เบเปเบฝเบเบเบทเปเบเบตเปเบเบฒเบก collection vector เบเบตเปเบเบปเบเปเบญเบเบชเปเบฒเบ
    
    try:
        # เบชเปเบฒเบ RAG
        rag = NaiveRAG(
            collection_name=COLLECTION_NAME, 
        )
        
        # เบเบฒเบกเบเปเบฒเบเบฒเบก
        while True:
            question = input("\nโ เบเบฒเบกเบเปเบฒเบเบฒเบก (เบซเบผเบท 'quit' เปเบเบทเปเบญเบญเบญเบ): ")
            
            if question.lower() in ['quit', 'exit', 'เบญเบญเบ']:
                print("๐ เบฅเบฒเบเปเบญเบ!")
                break
            
            if question.strip():
                print("\n๐ค เบเปเบฒเบฅเบฑเบเบเบฐเบกเบงเบเบเบปเบ...")
                # n_result เบชเบฒเบกเบฒเบเบเบฑเบเปเบเปเบเบฒเบกเปเบ เปเบเปเปเบเบทเปเบญเบเบเบฒเบเบงเปเบฒ model เปเบฎเบปเบฒเบกเบฑเบเบเบณเบเบฑเบ token เบชเบฐเบเบฑเปเบเปเบกเปเบเปเบซเปเบฎเบฐเบงเบฑเบ เปเบฅเบทเปเบญเบเบเบญเบ context window เบเบณเปเบเบต เบญเบฒเบเบเบฐเปเบฎเบฑเบเปเบซเป error เปเบเป. เปเบเปเบเปเบฒเบขเบฒเบเบเบปเบเบฅเบญเบเบเปเบงเบเบเบปเบเบฅเบฑเบเบเบณเบเบงเบเบซเบฅเบฒเบเปเบกเปเบเปเบเบฐเบเบณเปเบซเปเปเบเป model LLM เปเบชเบเปเบเบดเบ
                result = rag.ask(question=question,n_results=20)
                
                if isinstance(result, dict):
                    display(Markdown(f"\nโ เบเปเบฒเบเบญเบ: {result['answer']}"))  
                else:
                    print(f"\n{result}")
    
    except Exception as e:
        print(f"โ เปเบเบตเบเบเปเปเบเบดเบเบเบฒเบ: {e}")

In [20]:
if __name__ == "__main__":
    main()
    

โ เปเบซเบผเบ collection เบชเปเบฒเปเบฅเบฑเบ: pdf_documents
   เบกเบตเปเบญเบเบฐเบชเบฒเบเบเบฑเบเปเบปเบ: 95 เปเบญเบเบฐเบชเบฒเบ

๐ค เบเปเบฒเบฅเบฑเบเบเบฐเบกเบงเบเบเบปเบ...
๐ เบเปเบฒเบฅเบฑเบเบเบปเปเบเบซเบฒ: เบญเบฑเบเบเบฒเบเบญเบ  เปเบเปเบ เบเปเปเบเบด fixed loan เปเบเบปเปเบฒเปเบ
๐ เบเบปเบเปเบญเบเบฐเบชเบฒเบ: 20 เปเบญเบเบฐเบชเบฒเบ



โ เบเปเบฒเบเบญเบ: เบญเบตเบเบเบฒเบกเปเบญเบเบฐเบชเบฒเบเบเบตเปเปเบซเปเบกเบฒ, เบญเบฑเบเบเบฒเบเบญเบเปเบเปเบเบเปเปเบเบตเบเบญเบเปเบเบดเบเบเบนเปเบเบปเบเบเบตเป (Fixed Loan) เบกเบตเบเบฑเปเบเบเบตเป:

## เบญเบฑเบเบเบฒเบเบญเบเปเบเปเบเปเบเบดเบเบเบนเปเบเบปเบเบเบตเป (Fixed Loan)

- **เบชเบฐเบเบธเบเปเบเบดเบเบเบตเบ:** 9% - 10.25% เบเปเปเบเบต
- **เบชเบฐเบเบธเบเปเบเบดเบเปเบเบฅเบฒ/เบเบฒเบ:** 7.50% - 9.25% เบเปเปเบเบต

### เบเปเบฒเบเบณเบเบฝเบกเปเบเบตเปเบกเปเบเบตเบก:
- เบเปเบฒเบเบณเบเบฝเบกเบเบฐเปเบกเบตเบเบซเบผเบฑเบเบเบฑเบ: 0.2% เบเบญเบเบงเบปเบเปเบเบดเบเบญเบฐเบเบธเบกเบฑเบ (เบชเบนเบเบชเบธเบเบเปเปเปเบเบตเบ 5 เบฅเปเบฒเบเบเบตเบ)
- เบเปเบฒเบเบณเบเบฝเบกเบญเบฐเบเบธเบกเบฑเบ: 0.5 - 1% เบเบญเบเบงเบปเบเปเบเบดเบเบญเบฐเบเบธเบกเบฑเบ

**เปเบฒเบเปเบซเบ:** เบญเบฑเบเบเบฒเบเบญเบเปเบเปเบ เปเบฅเบฐ เบเปเบฒเบเบณเบเบฝเบก เบญเบฒเบเบเบฐเบเปเบฝเบเปเบเบเบเบฒเบกเบเบฒเบเบเบฐเบเบฒเบเปเบเปเปเบเปเบเปเบฅเบฐเปเบฅเบเบฐ

*เปเบซเบผเปเบเบเปเปเบกเบนเบ: เบเบทเปเบกเบชเบฑเบเบฅเบงเบกเบเบฐเบฅเบดเบเบเบฐเบเบฑเบเบเบฑเบเปเบปเบเบเบญเบ เบเบเบเบฅ_2020_Update.2 เปเปเบฒเบเบต 52*


๐ค เบเปเบฒเบฅเบฑเบเบเบฐเบกเบงเบเบเบปเบ...
๐ เบเปเบฒเบฅเบฑเบเบเบปเปเบเบซเบฒ: เบเปเบฅเบดเบเบฒเบเบฎเบฑเบเปเบเบดเบเบชเบปเบเบเบฑเบเบเบตเบฑเป เบเปเบฒเบเปเบฒเบเบฝเบกเปเบเบปเปเบฒเปเบ
๐ เบเบปเบเปเบญเบเบฐเบชเบฒเบ: 20 เปเบญเบเบฐเบชเบฒเบ



โ เบเปเบฒเบเบญเบ: เบญเบตเบเบเบฒเบกเปเบญเบเบฐเบชเบฒเบเบเบตเปเปเบซเปเบกเบฒ, **เบเปเบฒเบเปเบฒเบเบฝเบกเบเปเบฅเบดเบเบฒเบเบฎเบฑเบเปเบเบดเบเบชเบปเบเบเบฑเบเบเบตเป** เบกเบตเบเบฑเปเบเบเบตเป:

## เบเปเบฒเบเปเบฒเบเบฝเบกเบเบฒเบกเปเบฅเบเบฐเบเบฒเบ:

- **เปเบฅเบเบฐเบเบฒเบ 10 KM เบฅเบปเบเบกเบฒ:** เปเบเบฑเบ 200,000 เบเบตเบ/เบเบฑเปเบ
- **เปเบฅเบเบฐเบเบฒเบ 10.1 KM - 15 KM:** เปเบเบฑเบ 300,000 เบเบตเบ/เบเบฑเปเบ  
- **เปเบฅเบเบฐเบเบฒเบ 15.1 KM - 20 KM:** เปเบเบฑเบ 400,000 เบเบตเบ/เบเบฑเปเบ

## เปเบฒเบเปเบซเบ:
เบเปเบฒเบเปเบฒเบเบฝเบกเปเบกเปเบเบญเบตเบเบเบฒเบกเปเบเปเบเบเบฒเบเบเปเบฒเบเปเบฒเบเบฝเบกเบเบตเป เบเบเบเบฅ เบเบฐเบเบฒเบเบเปเบฒเปเบเปเปเบเปเบฅเบฐเปเบฅเบเบฐ

---
**เปเบซเบผเปเบเบเปเปเบกเบนเบ:** เบเบทเปเบกเบชเบฑเบเบฅเบงเบกเบเบฐเบฅเบดเบเบเบฐเบเบฑเบเบเบฑเบเปเบปเบเบเบญเบ เบเบเบเบฅ_2020_Update.2 เปเปเบฒเบเบต 41

๐ เบฅเบฒเบเปเบญเบ!
