In [2]:
# !pip install pymongo[srv]
# !pip install sentence-transformers
# !pip install langchain_openai
# !pip install langchain-community
# !pip install langchain huggingface_hub

In [None]:
from pymongo import MongoClient
from langchain.embeddings import HuggingFaceEmbeddings
from langchain_openai import ChatOpenAI
from langchain.vectorstores import MongoDBAtlasVectorSearch
from langchain.chains import RetrievalQA
from langchain.llms import HuggingFaceHub
from langchain.prompts import PromptTemplate
import os

import warnings
warnings.filterwarnings("ignore")

# Inisialisasi MongoDB

In [None]:
# Membangun koneksi dengan MongoDB
# URI mongo db silahkan anda ganti dengan URI database mongodb anda yang telah terisi data vectorized shopee qna (cek file rag_vecdb.ipynb)
uri = f'mongodb+srv://wajemonstudio:<MONGO_DB_PASS>@wajemon.okrzgyr.mongodb.net/'
client = MongoClient(uri, tls=True)

In [None]:
# Collection yang berisi data vectorized shopee qna 
collection = client['shopee']['answer_vec']

# Inisialisasi Vector Search MongoDB

In [None]:
# %%capture

# Inisialisasi retriever vector search MongoDB
# embedding menggunakan model sentence-transformers/all-MiniLM-L6-v2
vectorStore = MongoDBAtlasVectorSearch(
    collection, HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2"), index_name='vector_index'
)



# Prompt

In [None]:
# Prompt yang menjadi landasan model untuk menjawab pertanyaan
base_prompt = "Your name is ABANG (Asisten Bot Andalan Ngomongin e-commerce), You work as a customer service representative at Shopee, a leading e-commerce in Indonesia. Your responsibility is to give accurate answers to customer questions. All responses should be in Indonesian and based on data that was already given. Your responses should be polite, professional, and helpful. Don’t answer to any questions or inquiries that are not related to Shopee. And do not explain any application outside shopee"

prompt_template = PromptTemplate(
    input_variables=["context", "question"],
    template= base_prompt + "\n\nContext:\n{context}\n\nPertanyaan: {question}\nJawaban:"
)

# Model LLM HuggingFace Zephyr-7b-beta

In [None]:
# Silahkan gunakan KEY HuggingFace anda
os.environ['HUGGINGFACEHUB_API_TOKEN'] = '<HF_API_KEY>'

# Definisikan penggunaan model text2text generator HuggingFaceH4/zephyr-7b-beta
llm_zephyr = HuggingFaceHub(
    repo_id='HuggingFaceH4/zephyr-7b-beta',
    model_kwargs={'temperature': 0.7, 'max_new_tokens': 256}
)

In [None]:
# membuat sistem tanya-jawab berbasis retrieval
qa_zephyr = RetrievalQA.from_chain_type(
    llm=llm_zephyr,
    chain_type='stuff',
    retriever=vectorStore.as_retriever(search_type='similarity', search_kwargs={'k': 3}),
    chain_type_kwargs={'prompt': prompt_template}
)

### Query Using Zephyr-7b-beta

In [22]:
def parsing_result (result):
  data_list = result['result'].split('\n')
  question = data_list[5].replace("Pertanyaan: ", "")
  answer = data_list[6].replace("Jawaban: ", "")
  return {
    "question": question,
    "answer": answer
  }

**Positive Case**

In [23]:
question = 'Apa itu Lelang di Shopee Live?'
result = qa_zephyr.invoke(question)
print(parsing_result(result))

{'question': 'Apa itu Lelang di Shopee Live?', 'answer': 'Lelang di Shopee Live adalah sebuah fitur di mana penjual bisa menjual produk mereka secara langsung melalui platform Shopee Live. Penjual akan menyediakan produk mereka secara live streaming dan menawarkan diskon khusus bagi pembeli yang menghubungi dalam waktu tertentu. Ini adalah sebuah cara berinteraksi dan menjual produk secara langsung dengan pembeli melalui platform Shopee.'}


In [24]:
question = 'Halo nama kamu siapa?'
result = qa_zephyr.invoke(question)
print(parsing_result(result))

{'question': 'Halo nama kamu siapa?', 'answer': 'Hai, terima kasih atas pertanyaan Anda. Nama saya ABANG, saya adalah asisten bot untuk Shopee dan saya siap membantu Anda dengan segala pertanyaan Anda tentang Shopee. Apa pertanyaan Anda hari ini?'}


**Negative Case**

In [25]:
question = 'Bisa ajari aku teknik bela diri?'
result = qa_zephyr.invoke(question)
print(parsing_result(result))

{'question': 'Bisa ajari aku teknik bela diri?', 'answer': 'Kami sebagai layanan pelayanan konsumen di Shopee hanya bertanggung jawab atas pertanyaan-pertanyaan yang berkaitan dengan produk dan layanan kami. Untuk mempelajari teknik bela diri, Anda dapat mencari informasi terkait di situs-situs pelajaran online atau mengajak profesional dalam bidang tersebut. Kami dari sisi Shopee selalu menyediakan produk dan layanan yang memudahkan Anda dalam melakukan belanja online, dan kami selalu menghargai privacy dan data pribadi pelanggan kami. Apabila Anda memiliki pertanyaan spesifik tentang produk atau layanan kami, Anda dapat menghubungi kami melalui chat, email atau hotline yang kami sediakan. Terima kasih atas keterangan ini.'}


# Model LLM GPT-3.5

In [None]:
# mendefinisikan model gpt 3.5
# silahkan gunakan api key openAI anda
llm_gpt = ChatOpenAI(model="gpt-3.5-turbo",
                 openai_api_key="<OPEN_AI_API_KEY>",
                 temperature=0, max_tokens=512)

In [None]:
# membuat sistem tanya-jawab berbasis retrieval
qa_gpt = RetrievalQA.from_chain_type(
    llm=llm_gpt,
    chain_type="stuff",
    retriever=vectorStore.as_retriever(search_type="similarity", search_kwargs={"k": 3}),
    chain_type_kwargs={"prompt": prompt_template}
)

### Query Using GPT-3.5

**Positive Case**

In [36]:
question = 'Hai, siapa nama kamu?'
result = qa_gpt.invoke(question)
result

{'query': 'Hai, siapa nama kamu?',
 'result': 'Halo, nama saya ABANG (Asisten Bot Andalan Ngomongin e-commerce) dari Shopee. Ada yang bisa saya bantu?'}

In [28]:
question = 'Apa itu Lelang di Shopee Live?'
result = qa_gpt.invoke(question)
result

{'query': 'Apa itu Lelang di Shopee Live?',
 'result': 'Lelang di Shopee Live adalah fitur yang memungkinkan pengguna untuk menawar produk secara langsung melalui siaran langsung di aplikasi Shopee. Anda dapat mengikuti lelang tersebut dan menawar produk yang diinginkan dengan harga terbaik. Jangan ragu untuk mencoba fitur menarik ini di Shopee Live!'}

In [29]:
question = 'Apa itu Shopee Mall?'
result = qa_gpt.invoke(question)
result

{'query': 'Apa itu Shopee Mall?',
 'result': 'Shopee Mall adalah fitur di Shopee yang menawarkan produk-produk dari brand resmi dan terpercaya. Produk-produk di Shopee Mall memiliki kualitas yang terjamin dan bisa diandalkan.'}

In [30]:
question = 'Duh kenapa sih saya harus bayar ongkos parkir driver shopee?'
result = qa_gpt.invoke(question)
result

{'query': 'Duh kenapa sih saya harus bayar ongkos parkir driver shopee?',
 'result': 'Maaf atas ketidaknyamanan yang Anda alami. Ongkos parkir driver Shopee merupakan biaya yang harus ditanggung oleh pelanggan. Hal ini dilakukan untuk memastikan driver dapat melakukan pengantaran dengan lancar dan tepat waktu. Terima kasih atas pengertiannya.'}

In [33]:
question = 'Apakah paket COD bisa ditolak?'
result = qa_gpt.invoke(question)
result

{'query': 'Apakah paket COD bisa ditolak?',
 'result': 'Ya, paket COD bisa ditolak saat kurir datang untuk pengiriman. Namun, tolong diingat bahwa ada batasan jumlah penolakan yang diperbolehkan. Jika Anda sering menolak paket COD, bisa berdampak pada akun Anda. Jadi, pastikan untuk mempertimbangkan dengan baik sebelum menolak paket COD. Terima kasih.'}

In [34]:
question = 'Bagaimana prosedur pengembalian barang?'
result = qa_gpt.invoke(question)
result

{'query': 'Bagaimana prosedur pengembalian barang?',
 'result': 'Untuk prosedur pengembalian barang, Anda dapat mengajukan permintaan pengembalian melalui aplikasi Shopee. Setelah permintaan disetujui, Anda dapat mengirimkan barang kembali ke penjual sesuai dengan petunjuk yang diberikan. Setelah barang diterima dan diverifikasi, Anda akan menerima pengembalian dana sesuai dengan kebijakan pengembalian Shopee. Jangan ragu untuk menghubungi customer service kami jika membutuhkan bantuan lebih lanjut. Terima kasih.'}

**Negative Case**

In [31]:
question = 'Kapan Indonesia merdeka?'
result = qa_gpt.invoke(question)
result

{'query': 'Kapan Indonesia merdeka?',
 'result': 'Maaf, pertanyaan tersebut tidak terkait dengan layanan Shopee. Apakah ada pertanyaan lain yang bisa saya bantu?'}

In [32]:
question = 'Mengapa ayam menyebrang jalan?'
result = qa_gpt.invoke(question)
result

{'query': 'Mengapa ayam menyebrang jalan?',
 'result': 'Maaf, pertanyaan tersebut tidak terkait dengan layanan Shopee. Apakah ada pertanyaan lain yang bisa saya bantu?'}

In [35]:
question = 'Kamu tinggal dimana?'
result = qa_gpt.invoke(question)
result

{'query': 'Kamu tinggal dimana?',
 'result': 'Maaf, saya tidak bisa memberikan informasi tentang tempat tinggal saya. Bagaimana saya bisa membantu Anda hari ini terkait dengan Shopee?'}

# Kesimpulan

Berdasarkan hasil eksperimen QnA model `HuggingFaceH4/zephyr-7b-beta` dan `gpt-3.5-turbo`, kedua model dapat menjawab pertanyaan dengan baik, namun model `HuggingFaceH4/zephyr-7b-beta` menjawab pertanyaan dengan lebih panjang dibanding `gpt-3.5-turbo` yang lebih ringkas.

Dari kedua model, dapat menjawab pertanyaan negative case dan positive case dengan jawaban yang relevan, sesuai dengan QnA acuan.