# DSS May 2024: Efficient Information Extraction: Q&A and Summarization over PDF Documents using LLM

* Instruktur: [Saskia Dwi Ulfah](https://www.linkedin.com/in/saskia-dwi-ulfah/).
* Last updated: May 2024.

# Background

üìï Dokumen yang disimpan dalam format **Portable Document Format (PDF)** merupakan salah satu bentuk dokumen yang sering digunakan untuk bertukar informasi melalui internet dan perangkat digital seperti handphone, laptop, dan komputer. PDF juga dimanfaatkan di berbagai sektor. Di bidang pendidikan, mahasiswa dapat mengakses jurnal penelitian dengan format PDF melalui website seperti Elsevier dan IEEE. Di bidang finansial, perusahaan menampilkan laporan keuangan tahunan dalam format PDF pada website perusahaan.


‚õ≥ Format PDF merupakan format yang universal. Artinya, dokumen yang disimpan dalam format PDF dapat diakses secara mudah pada perangkat yang berbeda. Selain itu, format PDF lebih disukai karena tampilan dokumen yang lebih rapi dibandingkan format dokumen lainnya. PDF juga men-support dokumen yang terdiri lebih dari satu halaman. Hal ini memungkinkan pengguna untuk menuliskan informasi yang lengkap dan komprehensif dalam sebuah dokumen PDF. Akan tetapi, hal ini membuat **dokumen PDF cenderung tebal dan kompleks** sehingga menyebabkan pembaca **kesulitan untuk menemukan informasi yang spesifik**.

üí° Dengan perkembangan teknologi artificial intelligence  (AI) dan machine learning (ML), kita dapat menggunakan **Large Language Model (LLM)** untuk pencarian informasi pada dokumen PDF. Pada workshow ini, Anda akan belajar bagaimana kita dapat memperluas kemampuan LLM untuk pencarian informasi secara efisien dari dokumen PDF. Dimulai dengan dokumen PDF biasa, Anda akan belajar cara memproses dokumen ini dan menyajikannya sebagai konteks tambahanuntuk LLM.


## Learning Outcomes

üéØ Setelah menyelesaikan workshop ini, Anda diharapkan dapat:

* Memahami konsep dasar dari LLM.
* Mengimplementasikan penggunaan LLM dengan framework LangChain.
* Memahami workflow yang digunakan dalam menyediakan additional context untuk LLM.
* Mengembangkan skill di bidang AI dan data science dengan menguasai teknik information retrieval dari dokumen PDF menggunakan LLM.

## Training Syllabus

* **Python Programming Basics** 
    - Introduction to Python for Data Science.
    - Working with Python Environment.
    - Working with Notebook.
    - Python Fundamental Data Types and Data Structures.
    - Understanding Looping Concept in Python.
    - Understanding The Creation of Python Function.
    - Understanding The Usage of Python Libraries.
* **The Fundamentals of LLM**
    - The Concept of Generative AI.
    - LLM as Generative AI.
    - Transformer Architecture in a Nutshell
    - LLM Capability, Limitation, and Consideration
* **Introduction to LangChain**
    - The Big Picture of LangChain Concept and Component
    - API Concept and Setting for LangChain Usage
    - Demonstration of LLM Usage with LangChain
* **Case Study: Q&A and Summarization for PDF Document**
    - The Concept of RAG (Retrieval Augmented Generation)
    - Loading PDF Documents using LangChain
    - The Concept of Embedding for PDF Documents
    - Storing The Embedding using a Vector Database
    - Prompt Creation for Q&A and Summarization Cases
    - Employing LLM for Information Retrieval

# The Fundamentals of LLM

## The Concept of Generative AI

![](assets/gen_ai_hierarchy.png)

üöÄ **Apa itu Generative AI?**

**Generative AI** merupakan bagian dari artificial intelligence yang bertujuan untuk **menghasilkan (generate) data**, seperti teks, gambar, video, dan musik. Untuk dapat menghasilkan data, generative AI dilatih/belajar dari data yang jumlahnya sangat besar. Proses belajar ini sering disebut training. Generative AI akan menghasilkan data berdasarkan pola yang sudah dipelari selama proses training.

üöÄ **Jenis-Jenis Generative AI dan Aplikasinya**

1. **Generative Text Model**
    * Input: teks.
    * Output ‚Üí teks (text-to-text generator).
      * Contoh: translation, **summarization**, **question-answering**, grammar correction.
    * Output ‚Üí image (text-to-image generator).
      * Contoh: image generation, video generation.
    * Output ‚Üí audio (text-to-speech generator).
      * Contoh: music generation.
2. **Generative Image Model**
    * Input: gambar.
    * Output: teks (image-to-text generator).
      * Contoh: image captioning, visual question-answering, image search.
    * Output: gambar (image-to-image generator).
      * Contoh: image completion.
    * Output: video (image-to-video generator).
      * Contoh: animation generation.

## LLM as Generative AI 

üí¨ **LLM** merupakan generative AI yang telah dilatih menggunakan data teks dalam jumlah yang sangat besar. LLM mampu untuk memahami dan menghasilkan teks dengan gaya bahasa yang mirip dengan manusia. Selain menggambarkan besarnya data yang digunakan untuk melatih LLM, istilah "large" mengacu kepada tingkat kompleksitas, ukuran, dan banyaknya parameter pada LLM.

> ‚ÑπÔ∏è Sebagai contoh, GPT-4, varian yang paling baru dari LLM yang dirilis oleh OpenAI, memiliki 1,3 triliun parameter. Sumber data yang digunakan untuk melatih model ini meliputi buku, website, jurnal ilmiah, artikel, posting-an media sosial, dan repositori kode.

### LLM Platforms

üí¨ Beberapa contoh platform LLM yang cukup populer: 

1. ü§ñ**GPT**ü§ñ

    ü§ñ **Generative Pre-Trained Transformer (GPT)** merupakan large language model yang dikembangkan oleh Open AI. Sama seperti model generative AI lainnya, GPT di-training dengan data teks dalam jumlah yang besar. GPT dirancang untuk memahami dan menghasilkan teks dengan cara yang mirip dengan manusia, sehingga dapat digunakan dalam berbagai aplikasi seperti chatbot, language translation, dan content creation. Baru-baru ini, OpenAI meluncurkan varian terbaru dari GPT-4, yakni GPT-4o.

    Segmentasi produk GPT dapat dibedakan menjadi 2: chat-based platform dan Application Programming Interface (API)-based platform. Produk GPT berbasis chat dikenal sebagai [**ChatGPT**](https://chatgpt.com/). Semenjak dirilis pada November 2022 dengan versi GPT-2, saat ini ChatGPT telah merilis varian GPT yang lebih powerful: ChatGPT dengan GPT-3.5 dan ChatGPT dengan GPT-4. Untuk ChatGPT-3.5, pengguna dapat mengakses secara free. Untuk mendaptkan fitur yang lebih advanced pada ChatGPT dengan GPT-4, pengguna perlu melakukan subscription terlebih dahulu.

    Varian produk kedua adalah produk berbasis [**Application Programming Interface (API)**](https://platform.openai.com/). API memungkinkan pengguna untuk meng-embbed kemampuan GPT pada aplikasi yang dapat disesuakaikan dengan kebutuhan mereka. Penggunaan API ini sangat fleksibel karena dapat diintegrasikan dengan berbagai platform dan sistem yang sudah ada. 

2. ‚ôä**Gemini**‚ôä

    ‚ôä **Gemini** merupakan model generative AI yang dikembangkan oleh Google. Gemini dilatih menggunakan data teks, gambar, suara, dan video secara bersamaan dalam jumlah yang sangat besar. Hal ini membuat Gemini mampu untuk menerima berbagai macam input. Kelebihan ini menjadikan Gemini unggul dari segi generalisasinya terhadap data baru. Saat ini, versi terbaru dari Gemini adalah Gemini 1.5. 

    Sama seperti GPT, secara umum, fitur-fitur pada Gemini dikemas dalam 2 bentuk produk. Produk yang pertama merupakan [aplikasi yang berbasis chat bernama **Gemini app (sebelumnya Bard)**](https://gemini.google.com/app). Penggunaan aplikasi ini ditujukan untuk siapa saja secara umum tanpa perlu menuliskan kode tertentu. Produk lainnya merupakan [**API**](https://ai.google.dev/gemini-api) yang dapat digunakan pada use case yang lebih custom. Penggunaan API ini lebih ditujukan untuk pengguna dengan aspek pekerjaan teknis yang lebih tinggi, seperti software developer.

3. ü§ó**HuggingFace**ü§ó

    ü§ó**HuggingFace** platform yang dikenal luas dalam komunitas machine learning dan AI, khususnya dalam bidang Natural Language Processing (NLP). Platform ini menyediakan model-model pre-trained yang dapat digunakan untuk berbagai task yang berkaitan dengan NLP, seperti language modeling dan sentiment analysis.

    Beberapa contoh LLM open source yang dapat diakses melalui HuggingFace:
    
    ---add the list---

### Prompt pada Language Model

Untuk menghasilkan output yang sesuai, LLM memerlukan **prompt**. Prompt dapat dianalogikan sebagai sebuah petunjuk untuk LLM. Secara eksplisit, prompt merujuk kepada instruksi atau detail yang diberikan kepada LLM terkait output seperti apa yang diharapkan. Prompt juga bisa berupa konteks atau latar belakang dari topik yang ingin diketahui.

üí° Beberapa tips awal untuk merancang sebuah prompt:

1. **Buat Prompt yang Sederhana**

    Pembuatan prompt merupakan proses iteratif. Selalu mulai dengan sebuah prompt sederhana. Jika masih belum mendapatkan output yang diinginkan dari LLM, kita bisa me-refine prompt yang sudah dibuat sebelumnya.

    Hindari pembuatan prompt untuk task yang kompleks. Kita dapat mem-break down task yang kompleks tersebut menjadi subtask yang lebih kecil dan membuat prompt yang berbeda untuk masing-masing subtask.

2. **Berikan Perintah yang Jelas: What to Do and What Not to Do?**

    Saat membuat sebuah prompt, pastikan prompt memiliki instruksi yang jelas. Misalnya, kita menginginkan ringkasan dari sebuah kalimat, maka prompt yang efektif mengandung instruksi untuk membuat ringkasan tersebut. Kita juga dapat mendefinisikan detail apa yang tidak perlu dimasukkan dalam ringkasan yang dihasilkan LLM.


3. **Be Speficic and Detail**

    Selain memberikan perintah yang jelas, kita dapat membuat prompt menjadi lebih spesifik dan detail. Misalnya, kita dapat mendefinisikan detail seperti gaya bahasa dan panjang output yang diharapkan.

Contoh prompt:

```

Summarize the following article into approximately 150 words, highlighting the main points and key information discussed. Do not include minor details, personal opinions, or repetitive information.

```

> üîë Kunci prompt yang efektif: sederhana, jelas, dan spesifik.

## Transformer Architecture in a Nutshell

ü§ñ Arsitektur **Transformer** merupakan salah satu fondasi dibalik keandalan LLM. Arsitektur ini pertama kali diperkenalkan pada paper yang berjudul [Attention is All You Need](https://arxiv.org/abs/1706.03762) oleh Vaswani dkk. pada tahun 2017. 

Kemunculan arsitektur Transformer bertolak dari keterbatasan dari arsitektur yang sebelumnya sering digunakan untuk memodelkan data berupa sequence (contoh: bahasa), seperti Recurrent Neural Network (RNN) dan Long Short-Term Memory (LSTM). Keterbatasan ini di antaranya: ketidakefisienan dari segi daya komputasi dan waktu serta ketersediaan memori yang terbatas untuk sequence yang cukup panjang. Transformer mengatasi keterbatasan ini dengan fitur spesial yang disebut dengan **self-attention mechanism**. 

Secara sederhana, Transformer terdiri dari 2 komponen utama:

1. **Encoder**
2. **Decoder**

## LLM Capability, Limitation, and Consideration

Saat ini, LLM banyak dipilih karena keandalan dan kemampuannya untuk memahami konteks yang rumit. Selain itu, LLM juga mampu untuk menghasilkan teks dan narasi yang hampir menyamai produk bahasa yang ditulis oleh manusia. 

Berikut ini beberapa contoh task yang dapat diaplikasikan oleh LLM.

* **Text Generation**: menghasilkan narasi dengan gaya bahasa yang hampir menyamai kemampuan manusia.
* **Translation**: menerjemahkan teks ke dalam bahasa yang berbeda secara akurat.
* **Summarization**: membuat ringkasan singkat dari teks yang panjang.
* **Question-Answering**: menjawab sebuah pertanyaan berdasarkan konteks yang diberikan.

Akan tetapi, perlu diperhatikan bahwa saat ini LLM masih menjadi topik riset yang aktif. Para peneliti masih mengembangkan metode yang lebih advanced untuk mengurangi beberapa limitasi dari LLM, seperti:

* **Misleading Output** 
    
    Sebagai produk AI yang sangat powerful, output yang dihasilkan oleh LLM dapat terlihat sangat meyakinkan. Akan tetapi, sebagai pengguna, kita perlu bijak dalam mengonsumsi konten yang dibuat oleh AI. Secara aktif, kita perlu melakukan verifikasi fakta melalui sumber-sumber yang kredibel.

* **Technical Limitation**

    Di balik kapabilitas LLM dalam task yang melibatkan natural language, masih terdapat concern terkait limitasi teknis. Terdapat situasi di mana AI tidak dapat memahami konteks secara mendalam atau menghasilkan respons yang sesuai dengan harapan pengguna. Selain itu, LLM memerlukan sumber daya komputasi yang sangat tinggi untuk berfungsi secara optimal, yang dapat menjadi hambatan bagi pengguna dengan keterbatasan infrastruktur teknologi.

* **Laws and Rights-Related Issue**

    Sebagai teknologi yang terus berkembang, penggunaan LLM juga dihadapkan pada isu-isu hukum dan hak. Misalnya, hak cipta, privasi, dan perlindungan data adalah aspek-aspek penting yang perlu dipertimbangkan saat menggunakan AI. 
    
    Pengguna harus memastikan bahwa mereka mematuhi semua regulasi yang relevan dan menghormati hak-hak individu dan entitas lain dalam penggunaan dan penyebaran konten yang dihasilkan oleh AI.

Mempertimbangkan kelebihan dan limitasi yang ada, sebagai end-user, kita perlu cermat, selektif, dan aware dalam mempergunakan LLM. Kemampuan LLM yang powerful akan semakin maksimal selama dibersamai dengan konsiderasi berikut:

1. **Tidak Menganggap Output LLM sebagai Final Result** 
    
    Output dari LLM tidak dijadikan sebagai hasil akhir, melainkan hanya sebagai pendukung tersier. Kita perlu tetap melakukan verifikasi dan cross-check dengan sumber lain yang terpercaya untuk memastikan akurasi dan relevansi informasi.

2. **Keputusan Kompleks dan Terkait Makhluk Hidup**
    
    Keputusan yang diambil dari output LLM tidak digunakan dalam pertimbangan yang kompleks dan menyangkut keperluan yang berkaitan dengan makhluk hidup, seperti keputusan medis, hukum, atau keuangan, tanpa konsultasi dengan ahli yang kompeten di bidang tersebut.

3. **Evaluasi Kritis dan Penyesuaian Konteks**
    
    Selalu melakukan evaluasi kritis terhadap output yang dihasilkan oleh LLM, termasuk memahami konteks dan bias yang mungkin ada dalam data pelatihannya. Penyesuaian dan interpretasi yang bijak diperlukan untuk memastikan bahwa informasi tersebut sesuai dengan konteks yang dibutuhkan.

4. **Keamanan dan Privasi Data**

    Memperhatikan aspek keamanan dan privasi data saat menggunakan LLM. Jangan memasukkan informasi pribadi atau sensitif yang dapat disalahgunakan, dan pastikan bahwa penggunaan LLM mematuhi kebijakan privasi dan regulasi yang berlaku.

> üìå More info: [Responsible AI](https://ai.google/responsibility/responsible-ai-practices/)

# Introduction to LangChainü¶úüîó

ü¶úüîó**LangChain** merupakan framework untuk membuat aplikasi berbasis LLM.

> üìå[LangChain Official Documentation](https://python.langchain.com/v0.1/docs/get_started/introduction)

## LangChain Concept and Component

### LLM and Chat Models

### Template

## API Concept and Setting for LangChain Usage

In [1]:
from dotenv import load_dotenv

In [2]:
load_dotenv()

True

## Demonstration of LLM Usage with LangChain

# Case Study: Q&A and Summarization for PDF Document

## Retrieval Augmented Generation

## Preprocessing

### PDF Loading

In [3]:
# untuk loading file PDF
from langchain_community.document_loaders import PyPDFLoader

In [4]:
pdf_loader = PyPDFLoader('data_input/llm_survey.pdf',
                         extract_images = True)
pdf_data = pdf_loader.load()

In [5]:
type(pdf_data)

list

In [6]:
len(pdf_data)

124

In [7]:
pdf_data[2]

Document(page_content='3\n(i.e.,following the scaling law [30]). A number of studies\nhave explored the performance limit by training an ever\nlarger PLM ( e.g., the 175B-parameter GPT-3 and the 540B-\nparameter PaLM). Although scaling is mainly conducted\nin model size (with similar architectures and pre-training\ntasks), these large-sized PLMs display different behaviors\nfrom smaller PLMs ( e.g., 330M-parameter BERT and 1.5B-\nparameter GPT-2) and show surprising abilities (called emer-\ngent abilities [31]) in solving a series of complex tasks. For\nexample, GPT-3 can solve few-shot tasks through in-context\nlearning , whereas GPT-2 cannot do well. Thus, the research\ncommunity coins the term ‚Äú large language models (LLM) ‚Äù1\nfor these large-sized PLMs [32‚Äì35], which attract increasing\nresearch attention (See Figure 1). A remarkable application\nof LLMs is ChatGPT2that adapts the LLMs from the GPT\nseries for dialogue, which presents an amazing conversation\nability with hum

### Splitting

In [8]:
# untuk split file PDF menjadi chunk yang lebih kecil
from langchain.text_splitter import RecursiveCharacterTextSplitter

In [9]:
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size = 1000, 
    chunk_overlap = 450,
    separators=[
                "\n\n",
                "\n",
                " ",
                ".",
                ",",
                "\u200b",  # zero-width space
                "\uff0c",  # full-width comma
                "\u3001",  # ideographic comma
                "\uff0e",  # full-width full stop
                "\u3002",  # ideographic full stop
                "",
            ])
splits = text_splitter.split_documents(pdf_data)

### Embedding and Storing

In [10]:
# untuk membuat embedding
from langchain_openai import OpenAIEmbeddings # embedding OpenAI
from langchain_google_genai import GoogleGenerativeAIEmbeddings # embedding Google Generative AI
from langchain_community.embeddings import HuggingFaceEmbeddings # embedding HuggingFace 

# untuk menyimpan embedding
from langchain_community.vectorstores import Chroma

  from .autonotebook import tqdm as notebook_tqdm


In [11]:
def create_vectorstore_folder(documents, embedding, persist_directory):
    vectorstore = Chroma.from_documents(
        documents = documents, 
        embedding = embedding,
        persist_directory = persist_directory
    )

    return vectorstore

In [12]:
# hanya perlu dijalankan pada saat pertama kali membuat embedding

# vectorstore_open_ai = create_vectorstore_folder(
#     documents = splits,
#     embedding = OpenAIEmbeddings(model="text-embedding-3-large"),
#     persist_directory = 'data_input/chroma_open_ai'
# )

# time spent: 48s

In [13]:
# hanya perlu dijalankan pada saat pertama kali membuat embedding

# vectorstore_gemini = create_vectorstore_folder(
#     documents = splits,
#     embedding = GoogleGenerativeAIEmbeddings(model="models/embedding-001"),
#     persist_directory = 'data_input/chroma_gemini'
# )

# time spent: 40.8s

In [14]:
# hanya perlu dijalankan pada saat pertama kali membuat embedding

# vectorstore_hf = create_vectorstore_folder(
#     documents = splits,
#     embedding = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2"),
#     persist_directory = 'data_input/chroma_hugging_face'
# )

# time spent: 6m 24.6s

In [15]:
# memanggil embedding dari directory yang sudah disimpan

vec_openai = Chroma(persist_directory = 'data_input/chroma_open_ai',
                    embedding_function = OpenAIEmbeddings(model="text-embedding-3-large"))

In [16]:
vec_gemini = Chroma(persist_directory = 'data_input/chroma_gemini',
                    embedding_function = GoogleGenerativeAIEmbeddings(model="models/embedding-001"))

In [17]:
vec_hf = Chroma(persist_directory = 'data_input/chroma_hugging_face',
                    embedding_function = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2"))

## Q&A

In [18]:
# LLM
from langchain_openai import ChatOpenAI
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_community.llms import HuggingFaceHub
from langchain_community.chat_models.huggingface import ChatHuggingFace

# mempersiapkan prompt
from langchain_core.prompts import PromptTemplate
# untuk memasukkan pertanyaan
from langchain_core.runnables import RunnablePassthrough
# untuk menampilkan output yang diinginkan
from langchain_core.output_parsers import StrOutputParser

# menampilkan output secara rapi
import textwrap

In [19]:
def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

In [20]:
template = """
    You are the great assistant in understanding additional context

    Use the following pieces of context to answer the question at the end.
    Use the minimum of three sentences to answer the question. 
    Try your best to answer as complete as possible with easy style of English.
    Always say "thanks for asking!" at the end of the answer.

    {context}

    Question: {question}

    Helpful Answer:"""

### OpenAI

In [21]:
retriever_openai = vec_openai.as_retriever()
custom_rag_prompt = PromptTemplate.from_template(template)
llm = ChatOpenAI(model="gpt-4", temperature=0) # versi terbaru dari GPT

openai_chain = (
    {"context": retriever_openai | format_docs, "question": RunnablePassthrough()}
    | custom_rag_prompt
    | llm
    | StrOutputParser()
)

In [22]:
neat_result = textwrap.fill(openai_chain.invoke('Describe about llaMa model family'), width=90)
print(neat_result)

The LLaMA model family is a collection of models introduced by Meta AI in February 2023.
The family consists of four sizes: 7B, 13B, 30B, and 65B. Since its release, LLaMA has
gained significant attention from both the research and industry communities due to its
excellent performance on various open benchmarks. It has become one of the most popular
open language models. Many researchers have extended LLaMA models through instruction
tuning or continual pretraining. Stanford Alpaca is one of the extended models, which is
the first open instruct-following model fine-tuned based on LLaMA (7B). Other popular
LLaMA variants include Vicuna, which is trained upon user-shared conversations. Thanks for
asking!


In [23]:
neat_result = textwrap.fill(openai_chain.invoke('When was the Turing test proposed?'), width=90)
print(neat_result)

The Turing test was proposed by Alan Turing, a British mathematician and computer
scientist, in 1950. This test was designed to assess a machine's ability to exhibit
intelligent behavior equivalent to, or indistinguishable from, human behavior. It's a
significant concept in the field of artificial intelligence. Thanks for asking!


In [24]:
neat_result = textwrap.fill(openai_chain.invoke('What is the title of the paper?'), width=90)
print(neat_result)

The text provided does not specify a single paper title. It mentions several papers by
different authors, published in different years, and in different journals or conferences.
Some of the mentioned papers include "Quantifying memorization across neural language
models", "Extracting training data from large language models", "Deduplicating training
data mitigates privacy risks in language models", "Conditional random fields:
Probabilistic models for segmenting and labeling sequence data", and "Realtoxicityprompts:
Evaluating neural toxic degeneration in language models". Thanks for asking!


In [25]:
neat_result = textwrap.fill(openai_chain.invoke('How is the technical evolution of GPT-series model?'), width=90)
print(neat_result)

The technical evolution of the GPT-series models has been a progressive journey. It
started with GPT-1, which was developed based on a generative, decoder-only Transformer
architecture. It used a hybrid approach of unsupervised pretraining and supervised fine-
tuning. Then came GPT-2, which increased the parameter scale to 1.5B and was trained with
a large webpage dataset WebText. It performed tasks via unsupervised language modeling,
without explicit fine-tuning using labeled data. GPT-3 was released in 2020, scaling the
model parameters to an even larger size of 175B and introduced the concept of in-context
learning. The evolution continued with models like GPT-3.5, GPT-4, and GPT-4 Turbo, each
introducing new features and improvements. For instance, GPT-4 Turbo introduced a longer
context window and multimodal ability. Thanks for asking!


### Gemini

In [26]:
def create_chain(retriever, llm):

    rag_chain = (
        {"context": retriever | format_docs, "question": RunnablePassthrough()}
        | custom_rag_prompt
        | llm
        | StrOutputParser()
    )

    return rag_chain

In [74]:
gemini_chain = create_chain(
    retriever = vec_gemini.as_retriever(),
    llm = ChatGoogleGenerativeAI(model = 'gemini-pro')
)

In [75]:
neat_result = textwrap.fill(gemini_chain.invoke('Describe about llaMa model family'), width=90)
print(neat_result)

The LLaMA model family consists of a variety of language models, including LLaMA, Alpaca,
Vicuna, and PandaGPT. These models are known for their strong language understanding and
generation abilities, and have been used in a wide range of applications, including
multimodal modeling, instruction following, and dialogue generation. LLaMA is the
foundation model for many of these variants, and its release has greatly advanced the
research progress of LLMs. Thanks for asking!


In [76]:
neat_result = textwrap.fill(gemini_chain.invoke('When was the Turing test first proposed?'), width=90)
print(neat_result)

The provided text does not mention when the Turing test was first proposed, so I cannot
answer this question from the provided context.  Thanks for asking!


In [68]:
neat_result = textwrap.fill(gemini_chain.invoke('What is the title of the paper?'), width=90)
print(neat_result)

I cannot find the title of the paper within the context provided.  Thanks for asking!


In [69]:
neat_result = textwrap.fill(gemini_chain.invoke('How is the technical evolution of GPT-series model?'), width=90)
print(neat_result)

The technical evolution of GPT-series models has seen a significant increase in the number
of parameters, from 117 million in GPT-1 to 175 billion in GPT-3. This has led to a
corresponding increase in the models' performance on a wide range of natural language
processing tasks. In addition, the GPT-series models have also seen the introduction of
new features, such as the ability to generate text in response to a prompt, and the
ability to translate languages. These features have made the GPT-series models
increasingly useful for a variety of applications, including customer service, marketing,
and education. Thanks for asking!


### HuggingFace

In [58]:
hf_chain = create_chain(
    retriever = vec_hf.as_retriever(),
    llm = HuggingFaceHub(
        repo_id="declare-lab/flan-alpaca-large",
        task="text-generation",
        model_kwargs={"temperature":0.3, "max_length":1000}
    )
)

In [59]:
neat_result = textwrap.fill(hf_chain.invoke('Describe about llaMa model family'), width=90)
print(neat_result)

The LLaMA model family is a powerful language model family that is widely used in many
applications. It is based on the LLaMA architecture, which is a supervised learning
algorithm that is trained on a large dataset of language data. It is able to generate
strong language understanding and generation abilities, compared to other variants. It is
also able to learn from user-shared conversations, which makes it suitable for multimodal
tasks.


In [60]:
neat_result = textwrap.fill(hf_chain.invoke('When was the Turing test is proposed?'), width=90)
print(neat_result)

The Turing test was proposed in 1947.


In [61]:
neat_result = textwrap.fill(hf_chain.invoke('What is the title of the paper?'), width=90)
print(neat_result)

The title of the paper is "Helpful: A Guide to Using Machine Learning to Enhance Your
Research".


In [62]:
neat_result = textwrap.fill(hf_chain.invoke('How is the technical evolution of GPT-series model?'), width=90)
print(neat_result)

The technical evolution of GPT-series models is a gradual process of improvement. The
model has evolved over time, with new features and improvements being added to the model.
The model has also been improved by scaling the model parameters, which has allowed for a
key capacity leap. The model has also been improved by incorporating more features and
incorporating more advanced techniques. Finally, the model has been improved by
incorporating more advanced techniques such as in-context learning and reinforcement
learning.


## Summarization

# Make Chatbot-Like Interface

# Additional

## GPT 4o