# Module

In [3]:
# 일반 모듈
import textwrap
import openai
import logging
import sys
import dotenv
import time
from tqdm import tqdm

# llama_index 패키지
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Document
from llama_index.vector_stores.milvus import MilvusVectorStore
from llama_index.llms.openai import OpenAI
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.core.node_parser import SentenceSplitter
from llama_index.core import StorageContext
from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.core.node_parser import TokenTextSplitter

from pymilvus import Collection
from pymilvus import connections

# Setting

In [4]:
# 환경변수 가져오기
dotenv.load_dotenv()
embed_model = HuggingFaceEmbedding(model_name="BAAI/bge-m3")

### Collection Load if needed

In [5]:
connections.connect(
  alias="default", 
  host='localhost', 
  port='19530'
)

connections.connect(collection_name="wiki_bgem3")

# Load VectorDB

In [4]:
vector_store = MilvusVectorStore(
    uri="http://localhost:19530", collection_name = "wiki_bgem3")

storage_context = StorageContext.from_defaults(vector_store=vector_store)

index = VectorStoreIndex.from_vector_store(
    vector_store, storage_context=storage_context, embed_model=embed_model
)

# VectorSearch

In [7]:
search_engine = index.as_retriever(similarity_top_k=2)

In [8]:
re = []
for i in tqdm(range(100)):
    start_time = time.time()
    nodes = search_engine.retrieve("워셔액을 채우고 싶어")
    end_time = time.time()
    re.append(end_time - start_time)

100%|██████████| 100/100 [00:03<00:00, 27.82it/s]


In [9]:
sum(re)/len(re)

0.03565921306610107

In [10]:
len(re)

100

# RAG

In [12]:
rag_engine = index.as_query_engine(similarity_top_k=2, llm=llm)

In [13]:
response = rag_engine.query("워셔액을 채우고 싶어")
print(response.response)

와셔액을 채우려면 다음 단계를 따르십시오:

1. 와셔액이 부족한 경우, 보충할 와셔액을 준비합니다.
2. 후드를 열고 와셔액 탱크의 캡을 엽니다.
3. 와셔액을 보충한 후, 캡을 잠급니다.

여름철에는 일반 수돗물이나 시판되는 와셔액을 사용할 수 있지만, 겨울철에는 빙결을 방지하기 위해 겨울용 와셔액을 사용하는 것이 좋습니다.


In [14]:
for node in response.source_nodes:
    print(node)

Node ID: 0b35bedb-31f0-4bb2-8f47-268f153c0738
Text: 편의 장치 5-102와셔액 분출 앞유리 2C_WasherSwitch 와셔액을 분출하려면 스위치를 운전자 방향으 로
당기십시오. 와이퍼가 작동하면서 올라갈 때 와셔액을 분출합니다. 스위치를 당긴 채로 유지하면 와이퍼가 계속 작동하면서 올라갈
때 마다 와셔액을 분출합니다. 당긴 스위치를 놓 으면 와이퍼가 약 4회 작동한 후 자동으로 원위 치됩니다. 와셔액 분출시 실내
공기 순환  앞유리 와셔액이 분출될 때 냄새가 들어오는 것 을 막기 위해 외부 온도에 따라 실내 순환 모드및 에어컨이 자동으로
작동합니다.  •실내 순환 모드 작동 중 내기/외기 선택 버튼 을 누르면 외기 순환 모드로 전환합니다.  •외기 순환 모드
작동...
Score:  0.598

Node ID: fa45a48a-b366-46ca-98b1-c1ee2fb1e240
Text: 정기 점검 9-18 ઱੄   •브레이크액을 보충한 후에 캡이 완전히 잠겼 는지 확인하고, 브레이크액이 흘러내리면 즉
시 닦으십시오. 오일이 플라스틱 재질의 부 품을 훼손할 수 있습니다. •브레이크액이 차량의 도장 부분에 묻지 않도 록
주의하십시오. 페인트가 손상될 수 있습 니다. •브레이크액을 서늘하고 그늘진 곳에 보관하 십시오. 공기 중에 오래 노출된
브레이크액 은 품질이 보증되지 않으므로 사용하지 마십 시오. •브레이크액 탱크에 다른 성분의 액체(미네 랄 성분의 오일, 엔진
오일 등)를 넣지 마십시 오. 브레이크 장치 부품이 손상될 수 있습니 다.   ӝ   차량의 제동 및 ABS/ESC 성능을
최상으로 유 지...
Score:  0.591



In [9]:
a = (
    "sdf",
    "sdf"
)

In [10]:
type(a)

tuple

In [11]:
a

('sdf', 'sdf')

In [None]:
connections.

<pymilvus.orm.connections.Connections at 0x7c61b2fa3f50>

In [1]:
a = "http://localhost:19530"

In [2]:
a.split("/")[-1].split(":")

['localhost', '19530']

In [10]:
a = Collection(name="wiki_bgem3")

In [11]:
a.num_entities

10430454

In [12]:
import os

In [14]:
len(os.listdir("/data/sharedoc/livinai"))

8

In [15]:
os.listdir("/data/sharedoc/livinai")

['CBD방법론.pdf',
 '.bashrc',
 '.cache',
 '.bash_logout',
 '.config',
 '.profile',
 '연구논문',
 '프로젝트']

In [16]:
from glob import glob

In [17]:
file_paths = [i for i in glob(f"/data/sharedoc/livinai/**", recursive=True) if os.path.isfile(i)]

In [18]:
file_paths

['/data/sharedoc/livinai/CBD방법론.pdf',
 '/data/sharedoc/livinai/연구논문/2211.11300v3.pdf',
 '/data/sharedoc/livinai/연구논문/2410.12812v1.pdf',
 '/data/sharedoc/livinai/연구논문/2409.13373v1.pdf',
 '/data/sharedoc/livinai/연구논문/2405.13031v1.pdf',
 '/data/sharedoc/livinai/연구논문/2409.11378v1.pdf',
 '/data/sharedoc/livinai/연구논문/s41591-024-03097-1.pdf',
 '/data/sharedoc/livinai/연구논문/9795_Benchmarking_Predictive_C.pdf',
 '/data/sharedoc/livinai/연구논문/2108.05018.pdf',
 '/data/sharedoc/livinai/연구논문/2406.15319v1.pdf',
 '/data/sharedoc/livinai/연구논문/2407.12275v1.pdf',
 '/data/sharedoc/livinai/연구논문/2405.16731v1.pdf',
 '/data/sharedoc/livinai/연구논문/1904.08375.pdf',
 '/data/sharedoc/livinai/연구논문/2410.06628v1.pdf',
 '/data/sharedoc/livinai/연구논문/2410.07589v1.pdf',
 '/data/sharedoc/livinai/연구논문/2410.13070v1.pdf',
 '/data/sharedoc/livinai/연구논문/2410.15262v1.pdf',
 '/data/sharedoc/livinai/연구논문/2407.14482v1.pdf',
 '/data/sharedoc/livinai/연구논문/2408.02752v1.pdf',
 '/data/sharedoc/livinai/연구논문/2410.12788v1.pdf',
 '/data/sha