In [5]:
import os
from dotenv import load_dotenv
from langchain_google_genai import ChatGoogleGenerativeAI

In [6]:
load_dotenv()

google_api_key = os.getenv("GOOGLE_API_KEY")

In [7]:
llm = ChatGoogleGenerativeAI(google_api_key=google_api_key, model="gemini-2.0-flash")

## RAG sederhana menggunakan Keyword Matching

In [1]:
dokumen_1 = "AI (Artificial Intelligence) atau kecerdasan buatan adalah cabang ilmu komputer yang membuat mesin mampu meniru cara berpikir, belajar, dan mengambil keputusan seperti manusia. Dengan AI, komputer bisa mengenali pola, memahami bahasa, memecahkan masalah, dan bahkan beradaptasi dari pengalaman tanpa harus diprogram secara langsung."
dokumen_2 = "ML (Machine Learning) atau pembelajaran mesin adalah cabang dari AI yang memungkinkan komputer belajar dari data tanpa perlu diprogram secara eksplisit. Dengan ML, sistem dapat mengenali pola, membuat prediksi, dan meningkatkan kinerjanya seiring waktu berdasarkan pengalaman dari data yang dianalisis."
dokumen_3 = "DS (Data Science) atau sains data adalah bidang yang menggabungkan statistik, pemrograman, dan pemahaman bisnis untuk mengolah serta menganalisis data agar menghasilkan wawasan dan keputusan yang berbasis fakta."

In [2]:
list_of_docs = [dokumen_1, dokumen_2, dokumen_3]

In [10]:
# fungsi: query, list_of_docs, llm -> jawaban

def keyword_rag(query, list_of_docs, llm):

    # mencari dokumen yang relevan
    # memenggal query menjadi kata-kata terpisah
    # relevancy = berapa banyak kata di query yang muncul di dokumen

    relevant_docs = []
    query_lower = query.lower()

    for i, doc in enumerate(list_of_docs):
        query_words = query_lower.split()
        doc_lower = doc.lower()

        relevancy = sum(1 for word in query_words if word in doc_lower)

        if relevancy > 0:
            relevant_docs.append((i+1, doc, relevancy))
    
    if not relevant_docs:
        print("Maaf, saya tidak menemukan informasi yang relevan.")
        return None

    best_doc = max(relevant_docs, key=lambda x: x[2])
    selected_doc = best_doc[1]

    print(f"Isi dokumen terpilih:\n{selected_doc}\n")

    prompt = f"Berikan jawaban singkat untuk pertanyaan berikut berdasarkan informasi dari dokumen:\n\nDokumen: {selected_doc}\n\nPertanyaan: {query}\n\nJawaban:"

    response = llm.invoke(prompt)
    return response.content


In [11]:
keyword_rag("Apa itu kecerdasan buatan?", list_of_docs, llm)

Isi dokumen terpilih:
AI (Artificial Intelligence) atau kecerdasan buatan adalah cabang ilmu komputer yang membuat mesin mampu meniru cara berpikir, belajar, dan mengambil keputusan seperti manusia. Dengan AI, komputer bisa mengenali pola, memahami bahasa, memecahkan masalah, dan bahkan beradaptasi dari pengalaman tanpa harus diprogram secara langsung.



'Cabang ilmu komputer yang membuat mesin mampu meniru cara berpikir, belajar, dan mengambil keputusan seperti manusia.'