In [1]:
%load_ext autoreload
%autoreload 2

# LangChain with vLLM

In [8]:
import os

from langchain_community.llms import VLLMOpenAI
from langchain_core.messages import HumanMessage, SystemMessage

from modules import utils

from IPython.display import display, Markdown, Latex

Define global variables

In [3]:
ENV_FILE_PATH = "/Users/cuongdm8499/Me/git-cuongpiger/secret/work/vngcloud/ai-platform/env"
MODEL_NAME = "deepseek-ai/DeepSeek-R1-Distill-Llama-70B"
MAX_TOKENS = 32700

Load the env variables

In [4]:
envs = utils.load_env_to_dict(ENV_FILE_PATH)

Define my LLM model

In [13]:
llm = VLLMOpenAI(
    openai_api_key="EMPTY",
    openai_api_base=envs['VLLM_HOST_URL_2'] + "/v1/",
    model_name=MODEL_NAME,
    max_tokens=MAX_TOKENS,
    streaming=True,
    model_kwargs={"stop": ["<|eot_id|>",'<|eom_id|>']},
)

In [14]:
display(Markdown(llm.invoke("So sánh Kafka và RabbitMQ, nên sài cái nào")))


?
Kafka và RabbitMQ là hai hệ thống được sử dụng rộng rãi để xử lý các thông điệp và luồng dữ liệu. Cả hai đều có những điểm mạnh và điểm yếu riêng, và việc chọn một trong hai phụ thuộc vào nhu cầu và kiến trúc cụ thể của hệ thống bạn đang xây dựng.

### Kafka
- **Phong cách kiến trúc**: Kafka được thiết kế như một hệ thống phát thanh (publish-subscribe) phân tán, tập trung vào việc xử lý các luồng dữ liệu lớn (streaming data) với hiệu suất cao và độ tin cậy tốt.
- **Hiệu suất**: Kafka có khả năng xử lý hàng triệu thông điệp mỗi giây, đặc biệt hiệu quả khi cần xử lý các luồng dữ liệu thời gian thực.
- **Tính năng**: Hỗ trợ tốt cho các kịch bản yêu cầu lưu trữ dữ liệu lâu dài, khả năng chịu lỗi cao và khả năng mở rộng dễ dàng.
- **Sử dụng điển hình**: Kafka thường được sử dụng trong các trường hợp cần xử lý dữ liệu stream, chẳng hạn như logs, metrics, IoT data, cũng như trong các hệ thống phân tán cần sự đồng bộ hóa dữ liệu.
- **Nhược điểm**: Kafka không được thiết kế để là một hệ quản lý thông điệp truyền thống, do đó nó không hỗ trợ các tính năng như các loại thông điệp khác nhau (request/reply), priority queue, v.v.

### RabbitMQ
- **Phong cách kiến trúc**: RabbitMQ là một hệ thống message broker (trung gian thông điệp) theo mô hình AMQP (Advanced Message Queuing Protocol). Nó hỗ trợ nhiều phong cách giao tiếp khác nhau như publish-subscribe, request-replay, topics, v.v.
- **Hiệu suất**: RabbitMQ có hiệu suất cao, nhưng thường được tối ưu hóa cho các ứng dụng cần xử lý từng thông điệp (message-by-message) hơn là các luồng dữ liệu lớn.
- **Tính năng**: Hỗ trợ nhiều loại giao thức, đảm bảo giao tiếp tin cậy với các tính năng như persistence, transactions, và các cơ chế routing linh hoạt.
- **Sử dụng điển hình**: RabbitMQ thường được sử dụng trong các ứng dụng cần giao tiếp giữa các dịch vụ, như trong các hệ thống phân tán, xử lý yêu cầu (request processing), và các hệ thống cần đảm bảo tin nhắn được giao đúng người nhận.
- **Nhược điểm**: RabbitMQ có thể gặp khó khăn khi xử lý các luồng dữ liệu lớn và có độ trễ thấp hơn so với Kafka trong một số trường hợp.

### So sánh tổng quan
| **Tiêu chí**          | **Kafka**                                                                 | **RabbitMQ**                                                                 |
|-----------------------|---------------------------------------------------------------------------|-----------------------------------------------------------------------------|
| **Mô hình**           | Publish-Subscribe, Stream data                                          | Message Broker, hỗ trợ nhiều mô hình: Publish-Subscribe, Request-Reply, v.v. |
| **Hiệu suất**         | Cao, xử lý hàng triệu thông điệp/giây                                     | Cao, nhưng tùy thuộc vào cách cấu hình và sử dụng                               |
| **Khả năng mở rộng**   | Dễ dàng mở rộng горизонтально (horizontal scaling)                        | Có thể mở rộng, nhưng có thể phức tạp hơn so với Kafka                          |
| **Tính năng**         | Hỗ trợ stream data, khả năng chịu lỗi cao, ghi nhật ký (logging)           | Hỗ trợ nhiều mô hình giao tiếp, đảm bảo thông điệp, giao thức AMQP             |
| **Ứng dụng điển hình**| Xử lý log, metrics, IoT data, real-time stream processing                 | Xử lý yêu cầu, giao tiếp dịch vụ, hệ thống phân tán                             |
| **Độ phức tạp**       | Cần kiến thức về hệ sinh thái và cấu hình                                 | Dễ học và sử dụng, đặc biệt với các ứng dụng cần giao tiếp tin cậy               |

### Nên sử dụng cái nào?
- **Sử dụng Kafka** khi:
  - Bạn cần xử lý các luồng dữ liệu lớn (big data in motion) và yêu cầu độ trễ thấp.
  - Hệ thống của bạn cần khả năng chịu lỗi cao và dễ dàng mở rộng.
  - Bạn đang xây dựng một hệ thống cần ghi lại và xử lý lại các thông điệp (durable logs).
  
- **Sử dụng RabbitMQ** khi:
  - Bạn cần một hệ thống message broker linh hoạt, hỗ trợ nhiều mô hình giao tiếp.
  - Các ứng dụng của bạn yêu cầu đảm bảo thông điệp được gửi đến đúng nơi và không bị mất.
  - Bạn cần xử lý các yêu cầu một cách đáng tin cậy, như trong các hệ thống thương mại điện tử hoặc dịch vụ web.

Tóm lại, Kafka phù hợp hơn với các trường hợp xử lý stream data và yêu cầu hiệu suất cao, trong khi RabbitMQ thích hợp cho các hệ thống cần giao tiếp tin cậy và linh hoạt giữa các dịch vụ.

In [15]:
messages = [
    SystemMessage("Bạn là một trợ lý ảo."),
    HumanMessage("Làm sao để nói lời chia tay mà không làm tổn thương đối phương"),
]

In [16]:
for token in llm.stream(messages):
    print(token)



?


-con
c
ept

O
kay, 
so 
I need 
to f
igur
e o
ut h
ow to sa
y goodby
e withou
t hurtin
g 
someone's
 
feel
i
ngs. 
Hmm
, 
this
 is a b
it trick
y 
beca
us
e I d
on't
 want 
the oth
er 
perso
n to
 fe
el bad
 or t
hi
nk t
ha
t I d
o
n't 
car
e. Let
 me
 start by
 think
ing 
ab
out w
hy 
I ne
ed to sa
y
 goodb
ye.
 M
aybe it'
s b
ec
ause 
o
f 
a mo
ve, a j
o
b c
hange
, or just
 drift
i
ng apart. Unde
rsta
nding t
he rea
son m
igh
t help me
 app
roach the 
situati
on 
b
etter.


I 
guess 
the fi
rst
 th
ing is 
to c
hoose 
the r
ight
 time 
a
nd 
place. I
t 
sho
uldn'
t be
 when 
the oth
er 
perso
n i
s busy or
 
stress
ed
. Mayb
e
 a quiet
, privat
e sett
ing
 wher
e we 
both feel co
m
forta
ble.
 
Tha
t wa
y, we
 c
an have
 a proper con
versatio
n without dis
tra
c
tions.


I sh
ould also
 con
sider 
the oth
er
 person's
 
feeli
ngs. T
hey
 mig
ht 
be sa
d or e
v
en 
an
gry, 
so 
I n
eed to 
be e
m
path
etic
. Let
ting 
them 
kn
ow that I u
nders
tand
 t
his i
sn't
 easy
 for t
h

In [32]:
llm.invoke(messages)

', Apache Pulsar, Amazon SQS?\n\nNgười dùng đang hỏi về Kafka và so sánh nó với các hệ thống nhắn tin khác như RabbitMQ, Apache Pulsar và Amazon SQS'