In [3]:
import requests
import pdfplumber
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

# Lớp OllamaLLM để kết nối với Ollama API
class OllamaLLM:
    def __init__(self, model="gpt-oss", base_url="http://127.0.0.1:11434"):
        self.model = model
        self.base_url = base_url

    def _call(self, prompt: str) -> str:
        payload = {
            "model": self.model,
            "prompt": prompt,
            "stream": False  # Không sử dụng stream trong ví dụ này
        }
        
        # Gửi yêu cầu POST tới Ollama API
        response = requests.post(f"{self.base_url}/api/generate", json=payload)
        
        if response.status_code != 200:
            raise Exception(f"Ollama API error: {response.status_code} {response.text}")
        
        result = response.json()
        return result["text"]  # Đoạn văn bản trả về từ Ollama

# Đọc nội dung từ PDF
def read_pdf(file_path):
    with pdfplumber.open(file_path) as pdf:
        text = ""
        for page in pdf.pages:
            text += page.extract_text()  # Extract text from each page
    return text

# Tạo prompt và sử dụng Ollama GPT-OSS
def summarize_pdf_content(pdf_text):
    ollama_llm = OllamaLLM(model="gpt-oss", base_url="http://127.0.0.1:11434")
    
    # Tạo chuỗi tóm tắt Langchain với Ollama
    template = """Summarize the following text:
    {text}"""
    
    prompt = PromptTemplate(input_variables=["text"], template=template)
    chain = LLMChain(llm=ollama_llm, prompt=prompt)

    # Tóm tắt nội dung PDF
    result = chain.run({"text": pdf_text})
    return result

# Đọc và tóm tắt nội dung PDF
def read_and_summarize_pdf(file_path):
    pdf_text = read_pdf(file_path)
    return summarize_pdf_content(pdf_text)

# Đoạn code thử nghiệm
pdf_file_path = 'path_to_your_pdf.pdf'  # Đảm bảo bạn thay bằng đường dẫn đến file PDF của bạn
summary = read_and_summarize_pdf(pdf_file_path)
print("Tóm tắt nội dung PDF: ", summary)


ModuleNotFoundError: No module named 'langchain.llms'

In [6]:
!pip install langchain requests pdfplumber


