![](assets/gen_ai_hierarchy.png)

Gambar tersebut menunjukkan hubungan hierarkis antara Artificial Intelligence (AI), Machine Learning (ML), Deep Learning, dan Generative AI. Berikut penjelasan tiap lapisan dari luar ke dalam:

1. **Artificial Intelligence (AI)**:
   - AI adalah bidang studi yang bertujuan untuk menciptakan mesin cerdas yang dapat melakukan tugas-tugas yang biasanya membutuhkan kecerdasan manusia.
   - Contohnya adalah pengenalan suara, pengolahan bahasa alami, dan sistem rekomendasi.

2. **Machine Learning (ML)**:
   - ML adalah cabang dari AI yang fokus pada pembuatan mesin cerdas yang dapat belajar dari data. Artinya, mesin tidak perlu diprogram secara eksplisit untuk setiap tugas, melainkan belajar dari pola data.
   - Salah satu cabang terkenal dari ML adalah **Optimisasi**.

3. **Deep Learning**:
   - Deep Learning adalah subset dari Machine Learning yang berbasis pada jaringan saraf tiruan (**Artificial Neural Networks** atau ANNs).
   - Deep Learning memanfaatkan jaringan saraf yang terdiri dari banyak lapisan untuk mempelajari pola yang kompleks dari data.
   - Contohnya adalah **Convolutional Neural Networks (CNNs)** untuk pengenalan gambar dan **Recurrent Neural Networks (RNNs)** untuk pemrosesan data berurutan seperti teks atau suara.

4. **Generative AI**:
   - Generative AI adalah jenis jaringan saraf tiruan (ANNs) yang berfokus pada menghasilkan data baru yang menyerupai data pelatihannya.
   - Contohnya adalah **GANs (Generative Adversarial Networks)** dan **LLMs (Large Language Models)** seperti GPT.
   - Generative AI digunakan untuk membuat teks, gambar, video, suara, dan data lainnya secara sintetis, sering kali dengan kualitas yang menyerupai buatan manusia.

## LLM Capability, Limitation, and Consideration

Saat ini, LLM banyak dipilih karena keandalan dan kemampuannya untuk memahami konteks yang rumit. Selain itu, LLM juga mampu untuk menghasilkan teks dan narasi yang hampir menyamai produk bahasa yang ditulis oleh manusia. 

Berikut ini beberapa contoh task yang dapat diaplikasikan oleh LLM.

* **Text Generation**: menghasilkan narasi dengan gaya bahasa yang hampir menyamai kemampuan manusia.
* **Translation**: menerjemahkan teks ke dalam bahasa yang berbeda secara akurat.
* **Summarization**: membuat ringkasan singkat dari teks yang panjang.
* **Question-Answering**: menjawab sebuah pertanyaan berdasarkan konteks yang diberikan.

Akan tetapi, perlu diperhatikan bahwa saat ini LLM masih menjadi topik riset yang aktif. Para peneliti masih mengembangkan metode yang lebih advanced untuk mengurangi beberapa limitasi dari LLM, seperti:

* **Misleading Output** 
    
    Sebagai produk AI yang sangat powerful, output yang dihasilkan oleh LLM dapat terlihat sangat meyakinkan. Akan tetapi, sebagai pengguna, kita perlu bijak dalam mengonsumsi konten yang dibuat oleh AI. Secara aktif, kita perlu melakukan verifikasi fakta melalui sumber-sumber yang kredibel.

* **Technical Limitation**

    Di balik kapabilitas LLM dalam task yang melibatkan natural language, masih terdapat concern terkait limitasi teknis. Terdapat situasi di mana AI tidak dapat memahami konteks secara mendalam atau menghasilkan respons yang sesuai dengan harapan pengguna. Selain itu, LLM memerlukan sumber daya komputasi yang sangat tinggi untuk berfungsi secara optimal, yang dapat menjadi hambatan bagi pengguna dengan keterbatasan infrastruktur teknologi.

* **Laws and Rights-Related Issue**

    Sebagai teknologi yang terus berkembang, penggunaan LLM juga dihadapkan pada isu-isu hukum dan hak. Misalnya, hak cipta, privasi, dan perlindungan data adalah aspek-aspek penting yang perlu dipertimbangkan saat menggunakan AI. 
    
    Pengguna harus memastikan bahwa mereka mematuhi semua regulasi yang relevan dan menghormati hak-hak individu dan entitas lain dalam penggunaan dan penyebaran konten yang dihasilkan oleh AI.

Mempertimbangkan kelebihan dan limitasi yang ada, sebagai end-user, kita perlu cermat, selektif, dan aware dalam mempergunakan LLM. Kemampuan LLM yang powerful akan semakin maksimal selama dibersamai dengan konsiderasi berikut:

* **Tidak Menganggap Output LLM sebagai Final Result** 
    
    Output dari LLM tidak dijadikan sebagai hasil akhir, melainkan hanya sebagai pendukung tersier. Kita perlu tetap melakukan verifikasi dan cross-check dengan sumber lain yang terpercaya untuk memastikan akurasi dan relevansi informasi.

* **Keputusan Kompleks dan Terkait Makhluk Hidup**
    
    Keputusan yang diambil dari output LLM tidak digunakan dalam pertimbangan yang kompleks dan menyangkut keperluan yang berkaitan dengan makhluk hidup, seperti keputusan medis, hukum, atau keuangan, tanpa konsultasi dengan ahli yang kompeten di bidang tersebut.

* **Evaluasi Kritis dan Penyesuaian Konteks**
    
    Selalu melakukan evaluasi kritis terhadap output yang dihasilkan oleh LLM, termasuk memahami konteks dan bias yang mungkin ada dalam data pelatihannya. Penyesuaian dan interpretasi yang bijak diperlukan untuk memastikan bahwa informasi tersebut sesuai dengan konteks yang dibutuhkan.

* **Keamanan dan Privasi Data**

    Memperhatikan aspek keamanan dan privasi data saat menggunakan LLM. Jangan memasukkan informasi pribadi atau sensitif yang dapat disalahgunakan, dan pastikan bahwa penggunaan LLM mematuhi kebijakan privasi dan regulasi yang berlaku.



Sebelum kita bisa menggunakan model generatif dari Google (Gemini), kita perlu mempersiapkan lingkungan kita terlebih dahulu. Salah satu langkah awal yang umum dilakukan adalah mengimpor modul yang dibutuhkan dan memuat file konfigurasi .env jika kita menggunakan variabel sensitif seperti API key.

In [1]:
# untuk meng-import fungsi load_dotenv() dari package dotenv
from dotenv import load_dotenv

In [2]:
# load file .env secara otomatis
load_dotenv()

True

Apa yang terjadi di sini?
Mengimpor load_dotenv: Fungsi ini berasal dari package dotenv, yang memungkinkan kita untuk membaca file .env. File .env biasanya digunakan untuk menyimpan variabel sensitif seperti API key, tanpa harus menuliskannya langsung dalam kode.

load_dotenv(): Dengan satu baris ini, kita memastikan bahwa semua variabel di file .env dimuat ke dalam lingkungan Python, sehingga kita bisa menggunakannya langsung.

## Membuat Objek untuk Google Generative AI

### Experiment 1: Your First Call to Gemini ♊

Setelah lingkungan siap, kita akan membuat objek untuk mengakses model Google Generative AI. Objek ini akan menjadi "jembatan" antara kode kita dan model yang ada di cloud.

In [3]:
from langchain_google_genai import GoogleGenerativeAI

In [4]:
# membuat objek LLM 
gemini_10_pro = GoogleGenerativeAI(model = "gemini-1.0-pro") # gemini versi 1.0

## Mengajukan Pertanyaan ke Model

Sekarang, model sudah siap digunakan. Untuk mencobanya, mari kita ajukan sebuah pertanyaan sederhana kepada model.

In [5]:
# memberi pertanyaan dengan method .invoke()
gemini_10_pro.invoke('Who is the new president of Indonesia?')

'Joko Widodo'

Model akan memproses permintaan tersebut dan memberikan jawaban berdasarkan pengetahuan yang dimilikinya.

## Membuat Template untuk Translasi

Bagaimana jika kita ingin menerjemahkan sesuatu? Untuk itu, kita perlu mendefinisikan prompt template—sebuah kerangka yang menentukan bagaimana permintaan kita disusun.

In [6]:
from langchain_core.prompts import PromptTemplate

Pertama, kita akan membuat sebuah template untuk menerjemahkan sebuah kalimat ke dalam bahasa Inggris dengan gaya bahasa yang informal.

In [7]:
# mendefinisikan prompt untuk translasi
prompt = PromptTemplate(template = '''
                        Translate the following sentence into informal English:
                        {sentence}
                        ''',
                        input_variables = ["sentence"]
)

Untuk mempermudah proses, kita bisa menggabungkan template translasi dan model ke dalam sebuah "chain". Ini memungkinkan kita untuk langsung menjalankan tugas end-to-end.

In [8]:
# membuat chain untuk translasi 
llm_chain = prompt | gemini_10_pro

In [9]:
# menerjemahkan kalimat dengan method .invoke()
llm_chain.invoke({
    'sentence': 'Saya akan kembali 10 menit lagi'
})

"I'll be back in 10"

## Q&A

### Retrieval Augmented Generation

🤔 Coba tanyakan pertanyaan berikut kepada LLM!

In [11]:
gemini_10_pro.invoke('Siapa pemenang Pemilu 2024 di Indonesia?')

'Saya tidak dapat memberikan prediksi mengenai pemenang Pemilu 2024 di Indonesia karena hal tersebut masih terlalu dini untuk diprediksi dan dapat berubah tergantung pada berbagai faktor.'

Meskipun memiliki kemampuan yang powerful untuk mengerjakan task yang berkaitan dengan bahasa, LLM memiliki **knowledge cutoff**. Knowledge cutoff merupakan batas pengetahuan yang dimiliki oleh LLM karena resource untuk men-training LLM berhenti pada titik waktu tertentu. 

> ℹ️ Untuk Gemini, knowledge cutoff-nya adalah November 2023.

![image.png](attachment:image.png)

Dengan demikian, pengetahuan LLM tentang peristiwa dan informasi setelah knowledge cutoff tersebut mungkin terbatas atau tidak ada sama sekali.

Pada segmen ini, kita akan memuat semua library yang dibutuhkan dan menginisialisasi model generatif dari Google, yaitu gemini-1.0-pro. Model ini akan digunakan untuk menjawab pertanyaan berbasis dokumen. Selain itu, environment variables akan dimuat untuk memastikan konfigurasi seperti API key tersedia.

## Import dan Inisialisasi LLM

In [1]:
import os
from dotenv import load_dotenv
from langchain_google_genai import GoogleGenerativeAI, GoogleGenerativeAIEmbeddings, ChatGoogleGenerativeAI
from langchain_community.vectorstores import Chroma
from langchain.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_core.prompts import PromptTemplate
from langchain_core.runnables import RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser
import textwrap

In [2]:
# Load environment variables
load_dotenv()

# Inisialisasi model Google Generative AI dan embeddings
gemini_10_pro = GoogleGenerativeAI(model="gemini-1.0-pro")

Semua library penting telah diimpor.
Model generatif gemini-1.5-pro telah berhasil diinisialisasi dan siap digunakan untuk menghasilkan jawaban berbasis konteks.
Environment variables telah dimuat untuk memastikan konfigurasi aplikasi.

Pada segmen ini, dokumen PDF akan dibaca menggunakan PyPDFLoader. Setelah teks dokumen berhasil dimuat, kita akan membagi dokumen tersebut menjadi potongan-potongan kecil (chunks) menggunakan RecursiveCharacterTextSplitter. Chunking diperlukan untuk mempermudah pembuatan embedding dan pencarian konteks.

## Membaca PDF dan Membagi Teks

In [3]:
# Path file PDF yang akan dibaca
file_path = "data_input/transformer_ts.pdf"  # Ganti dengan path file PDF Anda

# Membaca file PDF dengan PyPDFLoader
pdf_loader = PyPDFLoader(file_path, extract_images=True)  # `extract_images=True` untuk mengekstrak informasi dari gambar
pdf_data = pdf_loader.load()

In [4]:
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=450,
    separators=[
        "\n\n", "\n", " ", ".", ",", "\u200b", "\uff0c", "\u3001", "\uff0e", "\u3002", ""
    ]
)
splits = text_splitter.split_documents(pdf_data)
print(f"Dokumen dibagi menjadi {len(splits)} potongan teks.")

Dokumen dibagi menjadi 95 potongan teks.


Penjelasan:

1. Membaca PDF:

- PyPDFLoader digunakan untuk memuat file PDF.

- Parameter extract_images=True memungkinkan ekstraksi teks dan informasi dari gambar dalam PDF.

2. Membagi Teks:

- RecursiveCharacterTextSplitter digunakan untuk membagi dokumen menjadi chunks:

     * chunk_size=1000: Panjang maksimum per chunk adalah 1000 karakter.
    * chunk_overlap=450: Overlap antar-chunk menjaga konteks.
    * separators: Separator yang digunakan untuk menentukan titik pemotongan.

Teks dari PDF telah berhasil dibaca, termasuk informasi dari gambar jika tersedia (karena extract_images=True).
Dokumen dibagi menjadi potongan-potongan kecil dengan panjang maksimal 1000 karakter, dengan overlap 450 karakter untuk menjaga konteks antar-chunk.

## Inisialisasi dan Menyimpan Embedding

 Di segmen ini, kita akan menginisialisasi model embedding dan membuat representasi vektor (embedding) dari chunks dokumen. Embedding ini akan disimpan ke direktori tertentu menggunakan Chroma agar dapat digunakan kembali tanpa harus membuat ulang.

In [5]:
# Inisialisasi model embedding tanpa menentukan model eksplisit
embedding_model = GoogleGenerativeAIEmbeddings(model="models/embedding-001")  # Menggunakan model default
print("Model embedding berhasil diinisialisasi dengan model default.")

# Fungsi untuk membuat dan menyimpan embedding ke Chroma
def create_vectorstore_folder(documents, embedding, persist_directory):
    vectorstore = Chroma.from_documents(
        documents=documents, 
        embedding=embedding,
        persist_directory=persist_directory
    )
    return vectorstore

persist_directory = 'data_input/chroma_gemini'

Model embedding berhasil diinisialisasi dengan model default.


* Fungsi create_vectorstore_folder:
    * Membuat vectorstore (penyimpanan embedding) dari dokumen chunks.
    * Parameter:
        * documents: Daftar chunks teks yang dipecah di Segmen 2.
        * embedding: Model embedding yang digunakan untuk memproses chunks menjadi vektor.
        * persist_directory: Lokasi penyimpanan embedding hasil proses.
* Output:
Vectorstore dengan embedding dari dokumen disimpan di lokasi yang ditentukan.


In [6]:
# Membuat dan menyimpan embedding (dijalankan hanya saat pertama kali)
vectorstore_gemini = create_vectorstore_folder(
    documents=splits,
    embedding=embedding_model,
    persist_directory=persist_directory
)
print("Embedding berhasil dibuat dan disimpan di Chroma.")


Embedding berhasil dibuat dan disimpan di Chroma.


* create_vectorstore_folder:

    * Memproses chunks dokumen (splits) menjadi embedding menggunakan embedding_model.
    * Hasil embedding disimpan di direktori data_input/chroma_gemini.

* Output:
Embedding dari dokumen telah berhasil dibuat dan disimpan.

Embedding dari chunks dokumen berhasil dibuat menggunakan GoogleGenerativeAIEmbeddings.
Embedding disimpan di direktori data_input/chroma_gemini untuk mempermudah pencarian konteks di langkah berikutnya.

## Memanggil Embedding yang Sudah Disimpan

Jika embedding sudah pernah dibuat dan disimpan sebelumnya, kita dapat langsung memuat embedding tersebut tanpa membuat ulang. Ini menghemat waktu dan sumber daya.

In [7]:
# Memanggil embedding dari direktori yang sudah disimpan
vec_gemini = Chroma(
    persist_directory='data_input/chroma_gemini',
    embedding_function=embedding_model
)
print("Embedding berhasil dimuat dari direktori.")


Embedding berhasil dimuat dari direktori.


Embedding berhasil dimuat dari direktori yang telah disimpan (data_input/chroma_gemini). Sistem siap untuk menggunakan embedding ini untuk pencarian konteks.

## Membuat Prompt dan Chain RAG

Di segmen ini, kita akan membuat template prompt untuk LLM dan membangun chain Retrieval-Augmented Generation (RAG). Chain ini akan menggabungkan retriever, prompt, dan LLM untuk menjawab pertanyaan berbasis dokumen.

In [8]:
# Fungsi untuk memformat dokumen
def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

# Template untuk prompt
qa_template = """
    You are the great assistant in understanding additional context.
    Use the following pieces of context to answer the question at the end.
    Use the minimum of three sentences to answer the question. 
    Try your best to answer as complete as possible with easy style of English.
    Always say "thanks for asking!" at the end of the answer.

    {context}

    Question: {question}

    Helpful Answer:"""

custom_rag_prompt = PromptTemplate.from_template(qa_template)


Perhatikan pada saat kita mendefinisikan template prompt, terdapat 2 placeholder: `{context}` dan `{question}`.

* Value untuk `{context}` berasal dari vector database.
* Value untuk `{question}` berasal dari pertanyaan pengguna pada saat menjalankan chain.

In [9]:
# Fungsi untuk membuat chain RAG
def create_qa_chain(retriever, llm):
    rag_chain = (
        {"context": retriever | format_docs, "question": RunnablePassthrough()}
        | custom_rag_prompt
        | llm
        | StrOutputParser()
    )
    return rag_chain

# Membuat chain RAG menggunakan retriever dan LLM
gemini_chain = create_qa_chain(
    retriever=vec_gemini.as_retriever(),
    llm=ChatGoogleGenerativeAI(model="gemini-pro")
)
print("Chain RAG berhasil dibuat.")

Chain RAG berhasil dibuat.


Pada kode di atas, kita membuat sebuah fungsi untuk membuat chain untuk Q&A. Chain untuk Q&A di atas terdiri atas beberapa komponen:

*  `custom_rag_prompt` yang merupakan prompt untuk mengarahkan output dari LLM.
* `llm` yang akan berinteraksi dengan pengguna.
* `StrOutputParser()` yang akan menangkap output dari LLM.

Template prompt berhasil dibuat dengan instruksi khusus untuk menjawab pertanyaan.
Chain RAG yang menggabungkan retriever, prompt, dan LLM berhasil dibangun.

## Menjalankan Chain RAG

Pada segmen ini, kita akan mengajukan pertanyaan ke RAG chain dan mendapatkan jawaban berbasis konteks dari dokumen.

In [16]:
# Menjalankan pertanyaan melalui chain RAG
question = "What is different about GPT, PaLM, LLaMa"
print("\nPertanyaan:", question)

answer = gemini_chain.invoke(question)

# Menampilkan jawaban dengan format rapi
print("\nJawaban dari RAG Chain:\n")
print(textwrap.fill(answer, width=90))



Pertanyaan: What is different about GPT, PaLM, LLaMa

Jawaban dari RAG Chain:

GPT, PaLM, and LLaMa are all large language models (LLMs), but they have different
architectures. GPT is a causal decoder, PaLM is a prefix decoder, and LLaMa is a mixture-
of-experts model. GPT predicts output tokens one by one, while PaLM predicts a sequence of
tokens at once. LLaMa uses a mixture of experts to scale up the model parameters while
maintaining a constant computational cost. Thanks for asking!


Jawaban dari pertanyaan berhasil dihasilkan. Jawaban ini berbasis pada konteks yang diambil dari dokumen dan diformat rapi.