# Giới thiệu langchain

Với sự phát triển mạnh mẽ của GenAI, các mô hình ngôn ngữ lớn LLM được sử dụng ngày càng rộng rãi với nhiều ứng dụng khác nhau. Tuy nhiên, các mô hình LLM này có các nhược điểm sau:

- Kiến thức lỗi thời
- Không thể thực hiện hành động, tương tác như tính toán, tra cứu
- Thiếu bối cảnh - gặp khó khăn trong việc kết hợp bối cảnh liên quan trước và sau đó để có các phản hồi hữu ích
- Ảo giác (`hallucination`) - LLM tự tạo ra các nội dung vô nghĩa hoặc không chính xác
- Thiếu minh bạch & thiên lệch, phụ thuộc vào dữ liệu được huấn luyện

Để giải quyết và hạn chế các nhược điểm trên, có các kỹ thuật sau:

- Tăng cường truy xuất (`retrieval augmentation`) - bổ sung kiến thức cho dữ liệu đào tạo đã lỗi thời của LLM, cung cấp các bối cảnh bên ngoài và giảm nguy cơ ảo giác
- Chuỗi (`chaining`) - tích hợp thêm các hành động bên ngoài
- Nhắc nhở (`prompt engineer`) - đưa ra các bối cảnh quan trọng để hướng dẫn các phản hồi
- Giám sát, lọc và đánh giá - đưa thêm đánh giá của con người trong luồng phản hồi của máy
- Tăng cường bộ nhớ (`memory`)
- Tinh chỉnh mô hình (`fine tuning`) - huấn luyện lại mô hình LLM cho 1 số tác vụ cụ thể

`langchain` là một framework trên python, được ra đời vào năm 2022 để xây dựng các ứng dụng hỗ trợ LLM thông qua việc xây dựng các module có sẵn. `langchain` có các cấu phần sau:

- Chuỗi (`chain`): Chain là một tập hợp các bước hoặc mô-đun liên tiếp, nơi đầu ra của một bước có thể trở thành đầu vào cho bước tiếp theo, giúp tự động hóa quy trình và quản lý các tác vụ phức tạp mà yêu cầu nhiều bước xử lý.
- Bộ công cụ (`tools`) - là các chức năng, mỗi tool thực hiện 1 tác vụ cụ thể. Ví dụ - tính toán, tra cứu hoặc kiểm tra thời tiết.
- Agent - là bộ điều phối, xác định khi nào và cách thức sử dụng tool. Agent sử dụng LLM để hiểu như cầu từ người dùng, quyết định tool phù hợp, gọi các tool theo thứ tự thích hơn và tổng hợp kết quả.
- Bộ nhớ (`memory`) - là trạng thái tồn tại giữa các lần thực hiện chuỗi hoặc agent. Các bộ nhớ có thể lưu trữ ngắn hạn hoặc dài hạn hoặc toàn bộ lịch sử, phụ thuộc vào chi phí thực hiện và mục tiêu

---

**Khi nào dùng Agent hoặc Tool?**

| **Kịch bản**                                   | **Sử dụng Agent**                                                | **Sử dụng Tools**                                           |
|------------------------------------------------|-------------------------------------------------------------------|------------------------------------------------------------|
| **Cần quyết định khi nào và cách sử dụng công cụ** | ✅ Agent sẽ chọn tool dựa trên ngữ cảnh và yêu cầu.               | ❌ Tools không tự quyết định mà phải được gọi thủ công.     |
| **Nhiệm vụ cụ thể**                            | ❌ Không cần agent, chỉ cần gọi tool phù hợp.                      | ✅ Tools xử lý nhanh gọn một nhiệm vụ độc lập.              |
| **Xử lý tác vụ phức tạp, nhiều bước**          | ✅ Agent điều phối nhiều tool để giải quyết nhiệm vụ phức tạp.     | ❌ Tools không đủ khả năng xử lý nhiệm vụ nhiều bước.       |


Trong chương này sẽ giới thiệu nhanh các khái niệm & ứng dụng cơ bản của `langchain`:

- Document - Object lưu trữ dữ liệu text & metadata
- Wrapper LLM - Mô hình LLM
- Embedding - Chuyển đổi text sang vector embedding
- Vector Store - Cơ sở dữ liệu cho phép lưu trữ vector embedding
- Retriver - Truy xuất dữ liệu từ vector stor
- Chat model - Mô hình chatbot sử dụng LLM
- Prompt template - Xây dựng template cho chatbot
- Memory - Cơ chế và cách thức lưu trữ lịch sử tương tác
- Chain - Cách thức tạo ra một chuỗi liên kết với nhau để thực hiện một nhiệm vụ
- Agent - Robot hay còn gọi là tác nhân, cho phép phân tích và thực hiện các tác vụ, bao gồm cả trong và ngoài LLM

---

Các thư viện python sẽ sử dụng

- `langchain` & hệ sinh thái langchain: Thực hiện các ứng dụng GenAI
- `pinecone-client`: Thực hiện vector database với pinecone (cần API)
- `openai`

## Documents

`Document` là một đối tượng có chứa text và các metadata veef tài liệu đó

In [43]:
from langchain.schema import Document

In [44]:
Document(page_content="This is my document. It is full of text that I've gathered from other places",
         metadata={
             'my_document_id' : 234234,
             'my_document_source' : "The LangChain Papers",
             'my_document_create_time' : 1680013019
         })

Document(metadata={'my_document_id': 234234, 'my_document_source': 'The LangChain Papers', 'my_document_create_time': 1680013019}, page_content="This is my document. It is full of text that I've gathered from other places")

Các thông tin về document trong `langchain` là không bắt buộc, ta có thể tạo ra các document mà không cần metadata như sau

In [45]:
Document(page_content = "Thông tin & hiểu biết về langchain là các kiến thức hữu ích")

Document(metadata={}, page_content='Thông tin & hiểu biết về langchain là các kiến thức hữu ích')

## Wrappers LLM

`langchain` cho phép sử dụng nhiều mô hình LLM khác nhau, bao gồm cả open-source & enterprise. Để đơn giản, ta sẽ sử dụng mô hình LLM `enterprise` với OpenAI. Key của LLM được lưu trữ trong `environment` notebook.

In [46]:
# Load environment variables
from dotenv import load_dotenv,find_dotenv
load_dotenv(find_dotenv())

True

Ta có thể khởi tạo một mô hình LLM cơ bản như sau

In [1]:
from langchain_openai import ChatOpenAI
llm = ChatOpenAI(model_name="gpt-4o-mini")
llm("explain large language models in one sentence")

OpenAIError: The api_key client option must be set either by passing api_key to the client or by setting the OPENAI_API_KEY environment variable

## Chat model

Khi tương tác với LLM thông qua chatbot, có 3 nhóm thông tin

- **System**: Thông tin background cho phép AI biết cần phải làm gì
- **Human**: Thông tin của người dùng
- **AI**: Thông tin AI phản hồi người dùng 

In [48]:
# import schema for chat messages and ChatOpenAI in order to query chatmodels GPT-3.5-turbo or GPT-4

from langchain.schema import (
    AIMessage,
    HumanMessage,
    SystemMessage
)
from langchain.chat_models import ChatOpenAI
chat = ChatOpenAI(model_name="gpt-3.5-turbo",temperature=0.3)

In [49]:
messages = [
    SystemMessage(content="You are an expert data scientist"),
    HumanMessage(content="Write a Python script that trains a neural network on simulated data ")
]
response=chat(messages)

print(response.content,end='\n')

Sure! Here is an example Python script that trains a simple neural network on simulated data using the TensorFlow library:

```python
import numpy as np
import tensorflow as tf

# Generate simulated data
np.random.seed(0)
X = np.random.rand(1000, 2)
y = np.array([1 if x1 + x2 > 1 else 0 for x1, x2 in X])

# Define the neural network architecture
model = tf.keras.models.Sequential([
    tf.keras.layers.Dense(64, activation='relu', input_shape=(2,)),
    tf.keras.layers.Dense(1, activation='sigmoid')
])

# Compile the model
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Train the model
model.fit(X, y, epochs=10, batch_size=32)

# Evaluate the model
loss, accuracy = model.evaluate(X, y)
print(f'Loss: {loss}, Accuracy: {accuracy}')
```

In this script:
1. We generate a simulated dataset with 1000 samples and 2 features.
2. We define a simple neural network with one hidden layer of 64 neurons and an output layer with a sigmoid activation function.
3. We

---

Ta cũng có thể loại bỏ hoặc đưa đầy đủ cả hướng dẫn với `system message` như sau

In [50]:
chat(
    [
        HumanMessage(content = "Đi biển ở Việt Nam thì nên đi đâu")
    ]
)

AIMessage(content='1. Phú Quốc: Đảo ngọc Phú Quốc nằm ở phía Nam của Việt Nam, nổi tiếng với bãi biển đẹp và nước biển trong xanh. Du khách có thể tham gia các hoạt động như lặn biển, thăm các hòn đảo lân cận, thưởng thức hải sản tươi ngon.\n\n2. Nha Trang: Nha Trang là một trong những điểm du lịch biển phổ biến nhất ở Việt Nam, với bãi biển dài và nước biển trong xanh. Du khách có thể tham gia các hoạt động như lặn biển, thăm các đảo lân cận, thưởng thức ẩm thực địa phương.\n\n3. Đà Nẵng: Đà Nẵng có nhiều bãi biển đẹp như Bãi biển Mỹ Khê, Bãi biển Non Nước, Bãi biển Nam Ô. Du khách cũng có thể tham quan các điểm du lịch nổi tiếng như Ngũ Hành Sơn, Bà Nà Hills, Hội An.\n\n4. Mũi Né: Mũi Né nổi tiếng với cát trắng và gió biển mạnh, là điểm đến lý tưởng cho các hoạt động như lướt ván buồm, lướt sóng, thăm các địa điểm tham quan như Đồi Cát Trắng, Suối Tiên, Đồi Cát Bay.\n\n5. Cửa Lò: Cửa Lò là một bãi biển yên bình ở Nghệ An, nổi tiếng với cát trắng và nước biển trong xanh. Du khách có t

In [51]:
# Có hướng dẫn
chat(
    [
        SystemMessage(content = "Bạn là trợ lý hướng dẫn viên du lịch và đưa gợi ý chỉ bằng một trả lời ngắn gọn"),
        HumanMessage(content = "Đi biển ở Việt Nam thì nên đi đâu")
    ]
)

AIMessage(content='Nếu bạn muốn tận hưởng biển xanh, cát trắng và không khí trong lành, hãy đến với Phú Quốc, Nha Trang, Đà Nẵng hoặc Hội An.', additional_kwargs={}, response_metadata={'token_usage': {'completion_tokens': 63, 'prompt_tokens': 72, 'total_tokens': 135, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-c76de61c-66d5-468b-b9a6-027aa00ddab8-0')

## Memory

`memory` là nhóm kỹ thuật cho phép LLM ghi nhớ về các thông tin trong quá trình tương tác

In [52]:
from langchain.chat_models import ChatOpenAI
from langchain.memory import ChatMessageHistory

chat = ChatOpenAI(model_name="gpt-3.5-turbo",temperature=0.3)
history = ChatMessageHistory()

In [53]:
chat(
    [
        HumanMessage(content = "Thủ đô của Pháp là gì?")
    ]
)

AIMessage(content='Thủ đô của Pháp là Paris.', additional_kwargs={}, response_metadata={'token_usage': {'completion_tokens': 12, 'prompt_tokens': 19, 'total_tokens': 31, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-95dfae4c-1efd-49d3-b945-3b3637838f62-0')

In [54]:
# Kiểm tra memory
history.messages

[]

Lúc này, object `memory` chưa được lưu trữ thông tin về cuộc hội thoại của người dùng, ta có thể lưu trữ lại như sau

In [55]:
history.add_ai_message("Xin chào! Tôi có thể giúp gì cho bạn?")
history.add_user_message("Thủ đô của Pháp là gì")

In [56]:
history.messages

[AIMessage(content='Xin chào! Tôi có thể giúp gì cho bạn?', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='Thủ đô của Pháp là gì', additional_kwargs={}, response_metadata={})]

## Prompts & Prompts template

`Prompt` là một đoạn văn bản hoặc yêu cầu mà người dùng nhập vào để hướng dẫn mô hình tạo ra kết quả. Prompt có thể là một câu hỏi, một chỉ dẫn cụ thể, hay một mô tả về hình ảnh, bài viết hoặc ý tưởng mà ta muốn mô hình phát triển hoặc phản hồi. Prompt giúp định hình nội dung và hướng đi cho mô hình AI để tạo ra kết quả phù hợp với yêu cầu của người sử dụng.

In [57]:
from langchain_openai import ChatOpenAI
llm = ChatOpenAI(model_name="gpt-4o-mini")

prompt = """
Today is Monday, tomorrow is Wednesday.
What is wrong with that statement?
"""

print(llm(prompt))

content='The statement is incorrect because if today is Monday, then tomorrow would be Tuesday, not Wednesday.' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 20, 'prompt_tokens': 23, 'total_tokens': 43, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_72ed7ab54c', 'finish_reason': 'stop', 'logprobs': None} id='run-2e4f38dd-401e-47a5-8793-6ceba41c405f-0' usage_metadata={'input_tokens': 23, 'output_tokens': 20, 'total_tokens': 43, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}}


---

`Prompt template` là một khuôn mẫu được thiết kế sẵn để giúp người dùng tạo ra các prompts một cách dễ dàng và hiệu quả. Nó cung cấp một cấu trúc cụ thể mà người dùng có thể điền vào để tạo ra yêu cầu cho mô hình AI. Prompt template thường được sử dụng để đảm bảo rằng đầu vào được cung cấp có độ rõ ràng và đầy đủ, giúp mô hình AI tạo ra kết quả chính xác và phù hợp.

Các prompt templates có thể bao gồm các thành phần cố định (ví dụ: cấu trúc câu) và các phần trống mà người dùng có thể điền vào để tùy chỉnh yêu cầu. Việc sử dụng template giúp tiết kiệm thời gian, giảm thiểu sự mơ hồ, và hướng đến mục tiêu rõ ràng hơn khi tương tác với AI.

In [58]:
# Import prompt and define PromptTemplate

from langchain import PromptTemplate

template = """
You are an expert data scientist with an expertise in building deep learning models. 
Explain the concept of {concept} in a couple of lines
"""

prompt = PromptTemplate(
    input_variables=["concept"],
    template=template,
)

In [59]:
# Run LLM with PromptTemplate
my_prompt = prompt.format(concept="autoencoder")
print(my_prompt)


You are an expert data scientist with an expertise in building deep learning models. 
Explain the concept of autoencoder in a couple of lines



In [60]:
llm(prompt.format(concept="autoencoder"))

AIMessage(content='An autoencoder is a type of neural network used for unsupervised learning, designed to encode input data into a lower-dimensional representation and then decode that representation back to the original input. It consists of two main components: an encoder, which compresses the data, and a decoder, which reconstructs the data, enabling tasks such as dimensionality reduction, anomaly detection, and data denoising.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 81, 'prompt_tokens': 36, 'total_tokens': 117, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_72ed7ab54c', 'finish_reason': 'stop', 'logprobs': None}, id='run-4b825bd8-bc84-430e-aac8-f6e78cfe3f55-0', usage_metadata={'input_tokens': 36, 'output_to

## Chains

`Chain` là một chuỗi các bước được liên kết với nhau để thực hiện một tác vụ cụ thể với đầu ra của bước này là đầu vào của một bước khác. Chain cho phép ta tạo ra các quy trình phức tạp & dễ quản lý khi làm việc với mô hình ngôn ngữ lớn

Ta có thể tạo chain với 2 bước như sau:

- Bước 1: Giải thích 1 thuật ngữ kỹ thuật
- Bước 2: Dùng kết quả đầu ra của bước 1, viết cô đọng và giải thích lại bằng ngôn ngữ đơn giản

In [61]:
# Tạo chain
from langchain.chains import LLMChain
chain = LLMChain(llm=llm, prompt=prompt)

# Run the chain only specifying the input variable.
print(chain.invoke("autoencoder"))

{'concept': 'autoencoder', 'text': 'An autoencoder is a type of neural network designed to learn efficient representations of data, typically for the purpose of dimensionality reduction or feature learning. It consists of two main parts: an encoder that compresses the input into a lower-dimensional latent space and a decoder that reconstructs the original input from this representation. The model is trained to minimize the reconstruction error between the input and the output.'}


In [62]:
# Define a second prompt 

second_prompt = PromptTemplate(
    input_variables=["ml_concept"],
    template="Turn the concept description of {ml_concept} and explain it to me like I'm five in 500 words",
)
chain_two = LLMChain(llm=llm, prompt=second_prompt)

---

Sau khi thực hiện xong 2 `chain`, ta có thể ghép lại thành 1 `chain` duy nhất

In [63]:
from langchain.chains import SimpleSequentialChain
overall_chain = SimpleSequentialChain(chains=[chain, chain_two], verbose=True)

# Thực hiện toàn bộ chain với input đầu vào từ chain 1
explanation = overall_chain.invoke("autoencoder")
print(explanation)



[1m> Entering new SimpleSequentialChain chain...[0m
[36;1m[1;3mAn autoencoder is a type of neural network designed to learn efficient representations (encodings) of input data by compressing it into a lower-dimensional space and then reconstructing the original input from that representation. It consists of two main components: an encoder that compresses the data and a decoder that reconstructs it, with the goal of minimizing the reconstruction error. Autoencoders are commonly used for tasks like dimensionality reduction, anomaly detection, and image denoising.[0m
[33;1m[1;3mAlright! Imagine you have a really big box of toy blocks, and you love to play with them. But sometimes, it gets really hard to find the blocks you want because there are just so many! So, what if you had a magic machine that could help you organize your blocks in a simpler way?

This magic machine is called an **autoencoder**! Think of it like a super-smart toy organizer.

### The Two Parts of the Magic M

## Vector Store

Với 1 đoạn văn bản, ta cần chia nhỏ thành các đoạn được gọi là `chunk`. Với langchain, có cấu phần chia nhỏ text thành các chunk với 2 thuộc tính chính:

- chunk_size: Số lượng ký tự tối đa cho 1 chunk
- chunk_overlap: Cho phép overlap giữa 2 đoạn liên tiếp. `chunk_overlap = 0` nghĩa là không cho phép trùng lặp giữa 2 đoạn

In [64]:
from langchain.text_splitter import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(
    chunk_size = 100,
    chunk_overlap  = 0,
    separators=["\n\n", "\n", " ", "", ".", "!"]
)

In [65]:
explanation['output']

'Alright! Imagine you have a really big box of toy blocks, and you love to play with them. But sometimes, it gets really hard to find the blocks you want because there are just so many! So, what if you had a magic machine that could help you organize your blocks in a simpler way?\n\nThis magic machine is called an **autoencoder**! Think of it like a super-smart toy organizer.\n\n### The Two Parts of the Magic Machine\n\nThe autoencoder has two special parts: the **encoder** and the **decoder**.\n\n1. **The Encoder**: This is like the part of the machine that helps you squish all your blocks. When you put your big box of toys into this machine, the encoder looks at all the blocks and figures out a way to squeeze them down into a smaller, easier-to-handle box. It tries to remember what all of your blocks look like, but it keeps only the important bits. So instead of having a big messy box, you now have a smaller, organized one!\n\n2. **The Decoder**: Now, here’s where the magic happens! 

In [66]:
# Chia thành chunk
texts = text_splitter.create_documents([explanation['output']])

Các đoạn text riêng biệt có thể xem với `page_content`

In [67]:
texts[0].page_content

'Alright! Imagine you have a really big box of toy blocks, and you love to play with them. But'

Ta có thể convert các vector text thành embedding vector với OpenAI như sau

In [68]:
from langchain_openai import OpenAIEmbeddings

In [69]:
embeddings = OpenAIEmbeddings()

---

Tạo đoạn text chunk đầu tiên thành vector embedding

In [72]:
# Turn the first text chunk into a vector with the embedding
query_result = embeddings.embed_query(texts[0].page_content)
print(f"Length of vector: {len(query_result)}")
query_result[:5]

Length of vector: 1536


[-0.004783688113093376,
 0.0018869912018999457,
 -0.011884734034538269,
 0.000676999450661242,
 -0.03792521357536316]

Ta có thể lưu trữ toàn bộ vector database với pinecone như sau

In [73]:
%%capture
pip install pinecone langchain-pinecone

In [74]:
# pip install pinecone langchain-pinecone
import os
from pinecone import Pinecone as pinecone
from langchain_pinecone  import Pinecone

pinecone(
    api_key=os.getenv('PINECONE_API_KEY'),  
)

<pinecone.control.pinecone.Pinecone at 0x7f15de5a0510>

In [75]:
embeddings

OpenAIEmbeddings(client=<openai.resources.embeddings.Embeddings object at 0x7f15d41a4c50>, async_client=<openai.resources.embeddings.AsyncEmbeddings object at 0x7f15d416ac10>, model='text-embedding-ada-002', dimensions=None, deployment='text-embedding-ada-002', openai_api_version=None, openai_api_base=None, openai_api_type=None, openai_proxy=None, embedding_ctx_length=8191, openai_api_key=SecretStr('**********'), openai_organization=None, allowed_special=None, disallowed_special=None, chunk_size=1000, max_retries=2, request_timeout=None, headers=None, tiktoken_enabled=True, tiktoken_model_name=None, show_progress_bar=False, model_kwargs={}, skip_empty=False, default_headers=None, default_query=None, retry_min_seconds=4, retry_max_seconds=20, http_client=None, http_async_client=None, check_embedding_ctx_length=True)

In [76]:
index_name = "langchain-quickstart"
search = Pinecone.from_documents(texts, embeddings, index_name=index_name)

Sau khi upload lên pinecone, ta có thể tạo thấy các đoạn text chunk tương ứng với các `vector embedding` đã được upload lên pinecone và có thể thực hiện tìm kiếm các thông tin phù hợp nhất. Quá trình này còn được gọi là `Retrievers`

In [77]:
# Do a simple vector similarity search
query = "What is magical about an autoencoder?"
result = search.similarity_search(query)

print(result)

[Document(id='38703253-5675-4cea-b19a-ab350195af10', metadata={}, page_content='So, the autoencoder is like your helpful magical toy box that learns to make organizing your toys'), Document(id='f077393d-ee67-486b-9d15-9aca9fd405a3', metadata={}, page_content='People use autoencoders for lots of things! Sometimes, they help computers understand images better'), Document(id='c5a64ce5-e288-4028-b7e5-7b7891ac2f4d', metadata={}, page_content='can rely on our little autoencoder friend!'), Document(id='6d2dc406-8f9e-4f6f-a89e-777445222012', metadata={}, page_content='Okay! Let’s think about a fun way to understand what an autoencoder is.')]


## Agent

Một trong các hạn chế rõ rệt của LLM là khả năng thực hiện các công cụ ở ngoài LLM như Python

In [78]:
%%capture
!pip install langchain-experimental;

In [79]:
from langchain import hub
from langchain.agents import AgentExecutor
from langchain_experimental.tools import PythonREPLTool

In [80]:
from langchain_core.tools import Tool
from langchain_experimental.utilities import PythonREPL

In [81]:
python_repl = PythonREPL()

In [82]:
python_repl.run("print(1+1)")

'2\n'

In [83]:
from langchain.agents import load_tools
from langchain.agents import initialize_agent
from langchain.agents import AgentType, Tool
from langchain_experimental.tools import PythonREPLTool

agent = initialize_agent(
    tools=[PythonREPLTool()],
    llm=llm,
)

In [84]:
agent.invoke("what is 2 + 2?")

{'input': 'what is 2 + 2?', 'output': '4'}

## Tài liệu tham khảo

- [Langchain in 13 minutes](https://www.youtube.com/watch?v=aywZrzNaKjs)
- [Langchain tutorials](https://github.com/anhhd/langchain-tutorials)