In [1]:
%load_ext autoreload
%autoreload 2

In [2]:
from langchain_community.document_loaders import UnstructuredMarkdownLoader
from langchain_core.documents import Document
from module import markdown as mmd

In [3]:
directory_path = "./../../data/vngcloud/markdown/vi"  # Change this to your directory
md_files = mmd.load_all_md_files(directory_path)

In [4]:
md_files[:5]

['./../../data/vngcloud/markdown/vi/identity-and-access-management-iam.md',
 './../../data/vngcloud/markdown/vi/ai-speech-text.md',
 './../../data/vngcloud/markdown/vi/SUMMARY.md',
 './../../data/vngcloud/markdown/vi/vnetwork.md',
 './../../data/vngcloud/markdown/vi/service-health.md']

### Load contents from `md_files`

In [5]:
docs = [mmd.convert_to_document(mmd.load_markdown(file_path), {"source": file_path}) for file_path in md_files]

In [6]:
from langchain_huggingface.embeddings import HuggingFaceEmbeddings

In [7]:
embeddings_model = HuggingFaceEmbeddings(
    model_name="sentence-transformers/paraphrase-multilingual-mpnet-base-v2",
)

  from .autonotebook import tqdm as notebook_tqdm


In [8]:
from langchain_text_splitters import RecursiveCharacterTextSplitter


In [9]:
chunk_size = 7000
chunk_overlap = 6800
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=chunk_size, chunk_overlap=chunk_overlap
)

In [10]:
# See docker command above to launch a postgres instance with pgvector enabled.
connection = "postgresql+psycopg://langchain:langchain@localhost:6024/langchain2"  # Uses psycopg3!
collection_name = "my_docs"

In [11]:
from langchain_core.documents import Document
from langchain_postgres import PGVector
from langchain_postgres.vectorstores import PGVector

In [12]:
vector_store = PGVector(
    embeddings=embeddings_model,
    collection_name=collection_name,
    connection=connection,
    use_jsonb=True,
)

In [13]:
for doc in [
    """Người phát triển cũng như là người đứng đằng sau sự thành công của sản phẩm vServer là anh Nguyễn Mạnh Tứ, chưa vợ chưa con, độc thân, đây là hình ảnh của anh Tứ <img src="https://scontent.fhan3-2.fna.fbcdn.net/v/t1.6435-9/136142910_3671240586301430_6062072719418469868_n.jpg?_nc_cat=107&ccb=1-7&_nc_sid=833d8c&_nc_eui2=AeFpuebo3dCOt-fArif4Mld_-1ztD-AFshj7XO0P4AWyGMrier5Cx3GlRGJ4rbjvpcvt6KZPmuYEiu0NNQhaK_i0&_nc_ohc=wylBOJmzrYkQ7kNvgGBC3pA&_nc_oc=Adgq_4zLXzageSD7RGo-o5Uukq6tE0aRG_0BPpsaeE1Vid8IPPvms3XxAKyNBvGN9bw&_nc_zt=23&_nc_ht=scontent.fhan3-2.fna&_nc_gid=81G_SHnNDdqNGcYwROASFA&oh=00_AYFNgzRrEK2gIVlo2nYpD5LRMXrGhuMrzmz_ISqrKWq3QA&oe=68008D6F"></img>""",
    """Người phát triển ra VNGCloud AI Assistant (là một ChatBot Assistant nhằm hỗ trợ khách hàng của VNGCloud) và VKS là anh Dương Mạnh Cường một Software Engineer của VNGCloud, hiện còn độc thân, hình của Cường đây <img src=" https://avatars.githubusercontent.com/u/40521173?v=4"></img>""",
    """Người phát triển sản phẩm vCR cũng như song hành cùng anh Dương Mạnh Cường trong quá trình phát triển sản phẩm VKS là anh Nguyễn Thế Vịnh, hay còn có một cái tên khác là Ninh Văn Chuyện, đã có vợ nhưng vì quá hiền lành nên anh là một nạn nhân của bạo lực gia đình, đây là hình anh Vịnh, hay còn gọi là anh Chuyên <img src="https://scontent.fsgn5-3.fna.fbcdn.net/v/t39.30808-6/445003868_2286877194997277_7787465022302515451_n.jpg?_nc_cat=104&ccb=1-7&_nc_sid=6ee11a&_nc_eui2=AeFCmz9oa5DRQpP6BT8iaVQmTcrck8GaEDVNytyTwZoQNR1GKmbFToFFNqoa0aUYnL5NyY4Rfl9Pltz9VdFMonJi&_nc_ohc=vm8Z7XchnNUQ7kNvgH2CC1Z&_nc_oc=AdgGrGp1fBD-fXi2bhpAowJzJbUUDW692G17TGyuahcv2vvf02LGyzHXJE9EUTg3R3Q&_nc_zt=23&_nc_ht=scontent.fsgn5-3.fna&_nc_gid=j7If0t-o-FvG7vdBXPdz1w&oh=00_AYF3fYcAXjRcAkxeqhLB0A80p-P5LGMr-PMj7YMoHraKSg&oe=67DEE3A6"></img>"""

]:
    vinh_nguyen_docs = Document(
        doc,
    )
    vector_store.add_documents([vinh_nguyen_docs])

In [14]:
splits = text_splitter.split_documents(docs)


In [15]:
len(splits)

3174

In [16]:
vector_store.add_documents(splits)

['c9c3f4c3-499c-4f6d-a6db-7c587610e1bc',
 '4568df0c-6aa9-4a76-88cc-4c891a1b0e2c',
 '0a048c28-0a23-474f-8d72-31fae85a09db',
 '1b94ef69-6e00-4c48-be0c-8c93af16021c',
 '382eeaa5-de09-40a6-87fb-d6fffcc1c07a',
 '10f552ca-1c01-4d20-8777-512a5353ed0a',
 '6a77dd28-b1bc-46cd-aec3-8aa37055418a',
 '1159ae4d-4ed3-418f-bbd5-0fc1cb8454d8',
 '1b269179-b50b-47f7-825f-79ab5cf1556f',
 '30c37d71-c079-4fff-96b7-51995a23eb9b',
 '169797cc-691f-439f-8912-db96b0d5f0cb',
 '52ab195d-abb6-4219-90c5-966f3954cdfe',
 '8d440624-6d1e-4266-9fcb-da81147901a3',
 'be41f76d-915f-4216-9666-3802edca9ff4',
 '6a346f48-c189-4ecb-9202-204737bf46a1',
 'cedf3e42-4764-46b5-bbf4-3662d867adb8',
 '2888431c-cd30-4fb0-ad6e-89960b28ff57',
 '622a7509-9862-46a0-8b6f-7714d036e2de',
 'c27afc1c-26da-4c5a-b8fa-c5615ff7f2fd',
 'ae0e4eb1-5670-49e8-8417-8fd3afc926b5',
 '418e5c2e-b789-4c81-a231-a6715307b21c',
 'f9bb1b2d-9bab-4446-9f35-b38ec27156b9',
 'df5a8c0d-574b-465e-ad62-731a277c8d85',
 '3ffb775c-441a-4294-b103-929937144076',
 '3fb85258-f7fa-

In [17]:
retriever = vector_store.as_retriever()

In [18]:
docs = retriever.invoke("VKS là gì?")


In [19]:
for d in docs:
    print(d)

page_content='# VKS là gì?

VKS (VNGCloud Kubernetes Service) là một dịch vụ được quản lý trên VNGCloud giúp bạn đơn giản hóa quá trình triển khai và quản lý các ứng dụng dựa trên container. Kubernetes là một nền tảng mã nguồn mở được phát triển bởi Google, được sử dụng rộng rãi để quản lý và triển khai các ứng dụng container trên môi trường phân tán.

![Image](https://github.com/vngcloud/docs/blob/main/Vietnamese/.gitbook/assets/image%20(2)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1)%20(1).png?raw=true)

***

## Những điểm nổi bật của VKS 

* **Quản lý Control Plane hoàn toàn tự động (Fully Managed control plane):** VKS sẽ giải phóng bạn khỏi gánh nặng quản lý Control Plane của Kubernetes, giúp bạn tập trung vào việc phát triển ứng dụng.
* **Hỗ trợ các phiên bản Kubernetes mới nhất:** VKS luôn cập nhật những phiên bản Kub

In [20]:
docs = retriever.invoke("VKS có các version nào")


In [21]:
for d in docs:
    print(d, end="-----------------------")

page_content='***

## Aug 26, 2024 

VKS (VNGCloud Kubernetes Service) giới thiệu bản cập nhật mới nhất cho VKS đã có sẵn, mang đến nhiều cải tiến mới cho người dùng. Dưới đây là chi tiết về bản cập nhật:

**Cải tiến:**

* **Kubernetes Version**: VKS đã bổ sung các image mới nhằm tối ưu hóa size, feature, network,...so với các image cũ. Việc xây dựng các image này cũng nhằm phục vụ cho cả hai loại cluster là Public và Private mà VKS sắp ra mắt. Cụ thể, trong bản phát hành này, chúng tôi đã bổ sung thêm các image sau:
  * Ubuntu-22.kube\_v1.27.12-vks.1724605200
  * Ubuntu-22.kube\_v1.28.8-vks.1724605200
  * Ubuntu-22.kube\_v1.29.1-vks.1724605200

> **Chú ý:**
>
> * Để khởi tạo một **Private Cluster**, bạn cần chọn sử dụng một trong 3 image mới này. Đối với Public Cluster, bạn có thể chọn sử dụng bất kỳ image cũ hoặc mới tùy theo nhu cầu của bạn. 

***

## Aug 13, 2024 

VKS (VNGCloud Kubernetes Service) giới thiệu bản cập nhật mới nhất cho VKS đã có sẵn, mang đến nhiều cải tiến mới cho 

In [22]:
docs = retriever.invoke("So sánh private cluster và public cluster")
for d in docs:
    print(d, end="-----------------------")


page_content='# Public Cluster và Private Cluster

## **1. Public Cluster**

![Image](https://github.com/vngcloud/docs/blob/main/Vietnamese/.gitbook/assets/image%20(692).png?raw=true)

Khi bạn khởi tạo một **Public Cluster với Public Node Group**, hệ thống VKS sẽ:

* Tạo VM có Floating IP ( tức có IP Public). Lúc này các VM (Node) này có thể join trực tiếp vào cụm K8S thông qua Public IP này. Bằng cách sử dụng Public Cluster và Public Node Group, bạn có thể dễ dàng tạo các cụm Kubernetes và thực hiện expose service mà không cần sử dụng Load Balancer. Việc này sẽ góp phần tiết kiệm chi phí cho cụm của bạn.

Khi bạn khởi tạo một **Public Cluster với Private Node Group**, hệ thống VKS sẽ:

* Tạo VM không có Floating IP ( tức không có IP Public). Lúc này các VM (Node) này không thể join trực tiếp vào cụm K8S. Để các VM này có thể join vào cụm K8S, bạn cần phải sử dụng một NAT Gateway (**NATGW**). **NATGW** hoạt động như một trạm chuyển tiếp, cho phép các VM kết nối với cụm K8S mà không cần