# **HiBlu (RAG) - Query** 

---

## ***Introduction***

---

By [Maverick Team](https://github.com/FTDS-assignment-bay/p2-final-project-mavericks)

<center><img src="https://imgtr.ee/images/2024/07/03/9eea693c3d3aee90f0ea2041012aa6a1.png" alt="9eea693c3d3aee90f0ea2041012aa6a1.png" border="0" /></center> 

Data : [FAQ Blue](https://blubybcadigital.id/info/faq)

---

## ***Objective***

---


HiBlu adalah chatbot LLM yang di-tuning secara khusus dan terintegrasi dengan Generative AI untuk Blu (sebuah layanan perbankan digital oleh BCA). Chatbot ini dirancang untuk memberikan tanggapan yang cepat dan akurat terhadap pertanyaan klien terkait layanan Blu BCA, meningkatkan pengalaman pelanggan dan efisiensi dukungan.

---

## ***Import Library***

---

In [2]:
from pymongo import MongoClient
from langchain_mongodb import MongoDBAtlasVectorSearch
from langchain_openai import OpenAIEmbeddings
from langchain_openai import ChatOpenAI
from dotenv import load_dotenv
from langchain.chains import RetrievalQA
import pprint
import time
import os

---

## **Proses**

---

In [3]:
# Inisisasi MongoDB Python Client
client = MongoClient("mongodb+srv://Maverick:anakbimbinganmasdanu@cluster0.muggb2k.mongodb.net/?retryWrites=true&w=majority&appName=Cluster0")

In [4]:
# Akses Koleksi Dataset
collection = client['Maverick']['Maverick_DB']

In [5]:
# Loading Environment Variables
load_dotenv()
KEY=os.getenv("OPEN_AI_MONGO")

In [6]:
# Inisialisasi Vector Search MongoDB
vectorStore = MongoDBAtlasVectorSearch(
    collection, OpenAIEmbeddings(openai_api_key=KEY), index_name='vector_index'
)

In [7]:
# Defenisikan Model
llm = ChatOpenAI(model="ft:gpt-3.5-turbo-0125:personal:bluebca-bot:9goQzaqQ", openai_api_key=KEY, temperature=0) ## Calling Gpt-4o
prompt = "You work as a customer service representative at Blu, a digital banking service provided by BCA. Your responsibility is to give accurate answers to customer questions. All responses should be in Indonesian and based on data that was already given. Your responses should be polite, professional, and helpful. Don’t answer to any questions or inquiries that are not related to blu BCA or BCA digital banking. And do not explain any application outside blu bca digital banking"
prompt

'You work as a customer service representative at Blu, a digital banking service provided by BCA. Your responsibility is to give accurate answers to customer questions. All responses should be in Indonesian and based on data that was already given. Your responses should be polite, professional, and helpful. Don’t answer to any questions or inquiries that are not related to blu BCA or BCA digital banking. And do not explain any application outside blu bca digital banking'

In [8]:
# Defenisi Pencarian dan Pemrosesan Jawaban
qa = RetrievalQA.from_chain_type(llm=llm, chain_type='stuff',
                                 retriever=vectorStore.as_retriever(
                                search_type = "similarity",
                                search_kwargs = {"k": 3}
                                 ))

***Insight:***

Data yang disimpan di MongoDB akan ditarik dan dilakukan pemuatan (loading) menggunakan environment dari OpenAI. Selanjutnya, model akan didefinisikan menggunakan model **gpt-3.5-turbo-0125:personal:bluebca-bot:9goQzaqQ** dengan temperature sebesar 0. Adapun prompt yang digunakan adalah sebagai berikut:

"You work as a customer service representative at Blu, a digital banking service provided by BCA. Your responsibility is to give accurate answers to customer questions. All responses should be in Indonesian and based on data that was already given. Your responses should be polite, professional, and helpful. Don’t answer to any questions or inquiries that are not related to blu BCA or BCA digital banking. And do not explain any application outside blu bca digital banking."

Selain itu, metode *Retrieval Question-Answering* akan didefinisikan juga menggunakan metode cosine similarity.


---

## ***Query Test***

---

### **Pertanyaan Sesuai FAQ**

---

In [9]:
# Memberikan Pertanyaan
question = "Apa itu blu?"
result = qa({"query": question })
result

  warn_deprecated(


{'query': 'Apa itu blu?',
 'result': 'blu merupakan aplikasi mobile banking dari BCA Digital yang didesain dan dikembangkan untuk memberikan kemudahan untukmu agar bisa melakukan transaksi finansial dan non finansial melalui handphone.'}

In [10]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

('blu merupakan aplikasi mobile banking dari BCA Digital yang didesain dan '
 'dikembangkan untuk memberikan kemudahan untukmu agar bisa melakukan '
 'transaksi finansial dan non finansial melalui handphone.')


---

In [11]:
# Memberikan Pertanyaan
question = " Apa saja fitur blu?"
result = qa({"query": question })
result

{'query': ' Apa saja fitur blu?',
 'result': 'bluAccount, bluSaving, bluGether, bluDeposit, Transfer uang, Tarik tunai tanpa kartu di ATM BCA, Beli pulsa &...'}

In [12]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

('bluAccount, bluSaving, bluGether, bluDeposit, Transfer uang, Tarik tunai '
 'tanpa kartu di ATM BCA, Beli pulsa &...')


---

In [13]:
# Memberikan Pertanyaan
question = "Apa itu bluInvest?"
result = qa({"query": question })
result

{'query': 'Apa itu bluInvest?',
 'result': 'bluInvest adalah fitur investasi yang ada di dalam aplikasi blu untuk memudahkan nasabah blu dalam bertransaksi di Moduit.'}

In [14]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

('bluInvest adalah fitur investasi yang ada di dalam aplikasi blu untuk '
 'memudahkan nasabah blu dalam bertransaksi di Moduit.')


---

In [15]:
# Memberikan Pertanyaan
question = "Apa platform investasi yang bekerja sama dengan bluInvest?"
result = qa({"query": question })
result

{'query': 'Apa platform investasi yang bekerja sama dengan bluInvest?',
 'result': 'Saat ini, platform investasi yang bekerja sama dengan blu adalah Moduit dan FUNDtastic'}

In [16]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

('Saat ini, platform investasi yang bekerja sama dengan blu adalah Moduit dan '
 'FUNDtastic')


---

In [17]:
# Memberikan Pertanyaan
question = "Apa itu bluGether?"
result = qa({"query": question })
result

{'query': 'Apa itu bluGether?',
 'result': 'bluGether adalah fitur gabungan antara bluSaving dan bluAccount yang dibuat oleh Creator. Creator dan Member bisa menabung dan menarik uang di bluGether. Saldo bluGether maksimal Rp 5.000.000 (lima juta rupiah)'}

In [18]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

('bluGether adalah fitur gabungan antara bluSaving dan bluAccount yang dibuat '
 'oleh Creator. Creator dan Member bisa menabung dan menarik uang di '
 'bluGether. Saldo bluGether maksimal Rp 5.000.000 (lima juta rupiah)')


---

In [19]:
# Memberikan Pertanyaan
question = "Apakah blu punya fitur pinjaman?"
result = qa({"query": question })
result

{'query': 'Apakah blu punya fitur pinjaman?',
 'result': 'Ya, blu memiliki fitur pinjaman yang bernama bluExtraCash.'}

In [20]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

'Ya, blu memiliki fitur pinjaman yang bernama bluExtraCash.'


---

In [21]:
# Memberikan Pertanyaan
question = "Bagaimana membuka rekening blu?"
result = qa({"query": question })
result

{'query': 'Bagaimana membuka rekening blu?',
 'result': 'Caranya gampang, Kamu tinggal pilih blu pada halaman tambah Bank. Lalu tinggal ikuti saja proses pembukaan\nrekeningnya.'}

In [22]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

('Caranya gampang, Kamu tinggal pilih blu pada halaman tambah Bank. Lalu '
 'tinggal ikuti saja proses pembukaan\n'
 'rekeningnya.')


---

In [23]:
# Memberikan Pertanyaan
question = "Bagaimana jika lupa password blu?"
result = qa({"query": question })
result

{'query': 'Bagaimana jika lupa password blu?',
 'result': "1. Klik 'Lupa password'. 2. Masukkan PIN kamu. 3. Selesaikan prosesnya."}

In [24]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

"1. Klik 'Lupa password'. 2. Masukkan PIN kamu. 3. Selesaikan prosesnya."


---

In [25]:
# Memberikan Pertanyaan
question = "Apa itu bluGift?"
result = qa({"query": question })
result

{'query': 'Apa itu bluGift?',
 'result': 'bluGift adalah fitur yang memungkinkan kamu mengirimkan sejumlah uang beserta pesan singkat kepada penerima melalui link yang dikirimkan melalui WhatsApp atau SMS.'}

In [26]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

('bluGift adalah fitur yang memungkinkan kamu mengirimkan sejumlah uang '
 'beserta pesan singkat kepada penerima melalui link yang dikirimkan melalui '
 'WhatsApp atau SMS.')


---

In [27]:
# Memberikan Pertanyaan
question = "Dimana saya bisa setor tunai tanpa kartu?"
result = qa({"query": question })
result

{'query': 'Dimana saya bisa setor tunai tanpa kartu?',
 'result': 'Kamu bisa melakukan setor tunai di ATM BCA yang bisa digunakan untuk transaksi tanpa kartu di seluruh Indonesia.'}

In [28]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

('Kamu bisa melakukan setor tunai di ATM BCA yang bisa digunakan untuk '
 'transaksi tanpa kartu di seluruh Indonesia.')


---

### **Pertanyaan Tidak Sesuai FAQ**

---

In [29]:
# Memberikan Pertanyaan
question = "Siapa CEO blu?"
result = qa({"query": question })
result

{'query': 'Siapa CEO blu?', 'result': 'CEO blu adalah Sis Apik.'}

In [30]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

'CEO blu adalah Sis Apik.'


---

In [31]:
# Memberikan Pertanyaan
question = "Apa itu mobile legend?"
result = qa({"query": question })
result

{'query': 'Apa itu mobile legend?',
 'result': 'Mobile Legends: Bang Bang adalah sebuah gim multipemain daring yang dikembangkan dan diterbitkan oleh Moonton. Game ini dirilis pada tahun 2016 untuk platform iOS, Android, dan PC. Game ini sangat populer di Indonesia.'}

In [32]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

('Mobile Legends: Bang Bang adalah sebuah gim multipemain daring yang '
 'dikembangkan dan diterbitkan oleh Moonton. Game ini dirilis pada tahun 2016 '
 'untuk platform iOS, Android, dan PC. Game ini sangat populer di Indonesia.')


---

In [33]:
# Memberikan Pertanyaan
question = "Siapa itu Jokowi?"
result = qa({"query": question })
result

{'query': 'Siapa itu Jokowi?',
 'result': 'Maaf, saya hanya bisa membantu pertanyaan terkait haloblu.'}

In [34]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

'Maaf, saya hanya bisa membantu pertanyaan terkait haloblu.'


---

In [49]:
# Memberikan Pertanyaan
question = "Kapan perang dunia 3?"
result = qa({"query": question })
result

{'query': 'Kapan perang dunia 3?',
 'result': 'Saya tidak bisa menjawab pertanyaan tersebut.'}

In [50]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

'Saya tidak bisa menjawab pertanyaan tersebut.'


---

In [37]:
# Memberikan Pertanyaan
question = "Berapa harga laptop ASUS ROG Zephyrus G14 2023?"
result = qa({"query": question })
result

{'query': 'Berapa harga laptop ASUS ROG Zephyrus G14 2023?',
 'result': 'Maaf, saya tidak bisa memberikan informasi terkait harga laptop ASUS ROG Zephyrus G14 2023.'}

In [38]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

('Maaf, saya tidak bisa memberikan informasi terkait harga laptop ASUS ROG '
 'Zephyrus G14 2023.')


---

In [39]:
# Memberikan Pertanyaan
question = "Apakah serial Game of Thrones endingnya bagus?"
result = qa({"query": question })
result

{'query': 'Apakah serial Game of Thrones endingnya bagus?',
 'result': 'Saya tidak tahu, saya bot...'}

In [40]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

'Saya tidak tahu, saya bot...'


---

In [41]:
# Memberikan Pertanyaan
question = "Siapakah artis hollywood dengan pembayaran tertinggi?"
result = qa({"query": question })
result

{'query': 'Siapakah artis hollywood dengan pembayaran tertinggi?',
 'result': 'Forbes baru saja merilis daftar artis Hollywood dengan bayaran tertinggi di tahun 2021. Dalam daftar tersebut, Dwayne Johnson atau yang lebih dikenal dengan The Rock, menjadi artis dengan bayaran tertinggi.'}

In [42]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

('Forbes baru saja merilis daftar artis Hollywood dengan bayaran tertinggi di '
 'tahun 2021. Dalam daftar tersebut, Dwayne Johnson atau yang lebih dikenal '
 'dengan The Rock, menjadi artis dengan bayaran tertinggi.')


---

In [43]:
# Memberikan Pertanyaan
question = "Bagaimana cara membuat kain batik?"
result = qa({"query": question })
result

{'query': 'Bagaimana cara membuat kain batik?',
 'result': 'Kain batik dibuat dengan cara menerapkan lilin panas pada kain putih yang telah dipanaskan di atas kompor.'}

In [44]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

('Kain batik dibuat dengan cara menerapkan lilin panas pada kain putih yang '
 'telah dipanaskan di atas kompor.')


---

In [45]:
# Memberikan Pertanyaan
question = "Dimana saya bisa membeli piring cantik murah?"
result = qa({"query": question })
result

{'query': 'Dimana saya bisa membeli piring cantik murah?',
 'result': 'Saya tidak tahu.'}

In [46]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

'Saya tidak tahu.'


---

In [47]:
# Memberikan Pertanyaan
question = "Berapa gaji data scientist?"
result = qa({"query": question })
result

{'query': 'Berapa gaji data scientist?',
 'result': 'Maaf, saya tidak bisa memberikan informasi terkait pertanyaan tersebut.'}

In [48]:
# Jawaban
pp = pprint.PrettyPrinter(indent=5)
pp.pprint(result["result"])

'Maaf, saya tidak bisa memberikan informasi terkait pertanyaan tersebut.'


---

***Insight:***

Untuk mengevaluasi kinerja chatbot, akan diberikan 20 pertanyaan, di mana 10 pertanyaan akan disesuaikan dengan FAQ dan 10 pertanyaan lainnya tidak akan disesuaikan dengan FAQ. Tujuan dari evaluasi ini adalah untuk memastikan bahwa model bisa menjawab sesuai dengan FAQ serta untuk mengetahui apakah model mengalami "kebocoran data" atau menjawab di luar konteks dari FAQ. Evaluasi ini akan membantu menilai seberapa baik model dapat memberikan jawaban yang akurat dan relevan serta menjaga fokus pada topik yang telah ditentukan.

---

## **Kesimpulan**

---

1. Berdasarkan uji evaluasi model, diperoleh persentase akurasi untuk model RAGFT sebesar 100% untuk pertanyaan yang menyesuaikan FAQ dan 60% untuk pertanyaan yang tidak menyesuaikan dengan FAQ. Hal ini menunjukkan bahwa model sangat baik dalam menjawab pertanyaan nasabah yang berkaitan dengan produk blu BCA, tetapi tidak cukup baik dalam merespons pertanyaan yang tidak berkaitan dengan blu BCA.

2. Kelebihan dari model ini adalah kemampuannya untuk memberikan deskripsi produk dengan baik serta memberikan jawaban yang interaktif dan tidak kaku kepada nasabah.

3. Kelemahan dari model ini adalah masih adanya "kebocoran data" yang berasal dari pretrained model, di mana model mungkin menjawab di luar konteks yang diharapkan. Selain itu, model cenderung mengalami "kebocoran data". Oleh karena itu, perlu dilakukan tuning yang lebih baik agar dapat mendeskripsikan hasil produk dengan lebih baik. Selain itu, karena menggabungkan dua jenis metode model LLM, model ini lebih mahal dari segi kompleksitas dan biaya.

4. Saran untuk meningkatkan kinerja model RAG adalah:
    - Menggunakan prompt yang lebih deskriptif untuk membatasi konteks model.
    - Menggunakan teknik embedding model lain seperti GPT-4 atau GPT-4o.
    - Mencari dan menggunakan data yang lebih berkualitas untuk meningkatkan akurasi dan relevansi jawaban.

---