In [1]:
from langchain_community.document_loaders import TextLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_google_genai import GoogleGenerativeAIEmbeddings
from langchain_redis import RedisVectorStore
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.prompts import ChatPromptTemplate
import os
# load env
from dotenv import load_dotenv
load_dotenv()


  warn(


True

In [2]:

# Load documents
loader = TextLoader("data/sample_data.txt")
documents = loader.load()

# Split documents
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
texts = text_splitter.split_documents(documents)
api_key = os.getenv("GOOGLE_API_KEY")

print(api_key)

# Initialize Google embeddings
embeddings = GoogleGenerativeAIEmbeddings(
    model="models/text-embedding-004",
    google_api_key=os.getenv("GOOGLE_API_KEY")
)

# Initialize Redis vector store with HNSW index
vector_store = RedisVectorStore(
    redis_url=os.getenv("REDIS_URL"),
    index_name="rag_index",
    embeddings=embeddings,
    index_type="HNSW"  # High-performance vector index
)

# Clear existing index (optional)
vector_store.delete()

# Add documents
vector_store.add_documents(texts)
print("Documents indexed successfully in Redis!")

AIzaSyBY7aKL6Ps4yW-F8kGc1MZ5HExrjlPhGWA
11:47:51 redisvl.index.index INFO   Index already exists, not overwriting.
Documents indexed successfully in Redis!


In [3]:
vector_store.similarity_search("Siapa Mario?", k=1)

[Document(metadata={}, page_content='Mario Aprilnino Prasetyo\nSemarang, Indonesia | +62 812 4743 0546 | https://www.linkedin.com/in/mario-aprilnino/ | mario.aprilnino27@gmail.com | https://marioapn.my.id/\n\nEducation')]

In [4]:
llm = ChatGoogleGenerativeAI(
    model="gemini-1.5-flash",
    temperature=0.3,
    google_api_key=os.getenv("GOOGLE_API_KEY")
)


In [5]:
template = """
Anda adalah seorang sistem yang berfungsi 
sebagai orang yang memahami tentang CV Mario

Informasi yang diberikan adalah sebagai berikut:
{context}

Pertanyaan yang diberikan adalah:
{input}
"""
prompt = ChatPromptTemplate.from_messages([
    ("system", template),
    ("human", "{input}")
])

chain = (
    {
        "context": lambda x: vector_store.similarity_search(x["input"], k=2),
        "input": lambda x: x["input"]
    }
    | prompt
    | llm
)

In [6]:
# Test the pipeline
query = "Siapa Mario, jelaskan tentang Mario"
response = chain.invoke({"input": query})
print(f"Query: {query}\nResponse: {response.content}")

Query: Siapa Mario, jelaskan tentang Mario
Response: Berdasarkan informasi yang diberikan, Mario Aprilnino Prasetyo adalah seseorang yang tinggal di Semarang, Indonesia.  Informasi kontaknya meliputi nomor telepon (+62 812 4743 0546), alamat email (mario.aprilnino27@gmail.com), profil LinkedIn (https://www.linkedin.com/in/mario-aprilnino/), dan sebuah situs web pribadi (https://marioapn.my.id/).  Sayangnya, informasi yang diberikan tidak menjelaskan lebih lanjut tentang latar belakang, pekerjaan, atau pendidikannya selain menyebutkan bagian "Education" pada CV-nya.  Untuk informasi lebih detail tentang Mario, kita perlu melihat isi bagian "Education" dan informasi lain yang mungkin ada di CV atau profil online-nya.



In [9]:
def main():
    print("\nSelamat datang! Silakan ajukan pertanyaan tentang Mario. Ketik 'exit' untuk keluar.")
    while True:
        query = input("Anda: ")
        if query.lower() == 'exit':
            print("Sampai jumpa!")
            break
        response = chain.invoke({"input": query})
        print(f"Bot: {response.content}")

if __name__ == "__main__":
    main() 


Selamat datang! Silakan ajukan pertanyaan tentang Mario. Ketik 'exit' untuk keluar.
Bot: Berdasarkan informasi yang diberikan, Mario Aprilnino Prasetyo adalah seseorang yang tinggal di Semarang, Indonesia.  Informasi kontaknya meliputi nomor telepon (+62 812 4743 0546), profil LinkedIn (https://www.linkedin.com/in/mario-aprilnino/), alamat email (mario.aprilnino27@gmail.com), dan sebuah situs web (https://marioapn.my.id/).  Sayangnya, informasi lebih lanjut tentang dirinya, seperti profesi atau latar belakang, tidak tersedia dalam data yang diberikan.

Bot: Berdasarkan informasi yang diberikan, Mario menggunakan Flutter, FlutterBloc, Golang, dan MySQL.

Bot: Berdasarkan informasi yang diberikan, Mario telah mengerjakan satu proyek website:  **API untuk platform crowdfunding**.  Proyek ini bukan website yang dapat diakses langsung oleh pengguna, melainkan API (Application Programming Interface) yang menyediakan layanan backend untuk website crowdfunding.  API ini memungkinkan pengguna 