In [85]:
import os 
import torch 
import getpass
import openai
import chromadb
from llama_index import VectorStoreIndex, SimpleKeywordTableIndex, SimpleDirectoryReader
from transformers import AutoTokenizer, AutoModelForCausalLM, AutoConfig
from llama_index import SummaryIndex
from llama_index.schema import IndexNode
from transformers import TextStreamer, GenerationConfig
from llama_index.tools import QueryEngineTool, ToolMetadata
from llama_index.llms.openai import OpenAI
from llama_index.callbacks import CallbackManager
from llama_index.embeddings import HuggingFaceEmbedding
# from llama_index.agent.openai import OpenAIAgent
from llama_index.agent import OpenAIAgent
from llama_index import load_index_from_storage, StorageContext
from llama_index.node_parser import SentenceSplitter
from llama_index.objects import ObjectIndex, SimpleToolNodeMapping
from llama_index import VectorStoreIndex, SimpleDirectoryReader, ServiceContext
from llama_index.vector_stores import ChromaVectorStore
from llama_index.readers.chroma import ChromaReader

In [103]:
os.environ["OPENAI_API_KEY"] = getpass.getpass("OpenAI API Key:")
openai.api_key = os.environ["OPENAI_API_KEY"]

OpenAI API Key: ········


In [22]:
default_path = os.getcwd()
data_path = os.path.join(default_path, '../../data')
model_path = os.path.join(default_path, '../../models')
config_path = os.path.join(default_path, '../../config')

In [23]:
model_dir = os.path.join(model_path, "mistral_origin")

In [24]:
col = ['qualification', 'desc', 'features'] 

In [25]:
vector_db = chromadb.HttpClient(host='192.168.0.146')

In [26]:
desc_collection = vector_db.get_or_create_collection("desc")
feature_collection = vector_db.get_or_create_collection("feature")
qualification_collection = vector_db.get_or_create_collection("qualification")

In [50]:
qualification_collection.count()

806

In [28]:
tokenizer = AutoTokenizer.from_pretrained(os.path.join(model_dir, 'tokenizer'))   # LlamaTokenizer (x)  -> LlamaTokenizerFast (o)
model = AutoModelForCausalLM.from_pretrained(model_dir, torch_dtype=torch.float16, low_cpu_mem_usage=True) # , device_map="auto")

Loading checkpoint shards:   0%|          | 0/3 [00:00<?, ?it/s]

In [29]:
g_device = torch.device("cuda") if torch.cuda.is_available() else "cpu"

In [30]:
g_device

device(type='cuda')

In [33]:
model.to(g_device)

MistralForCausalLM(
  (model): MistralModel(
    (embed_tokens): Embedding(32000, 4096)
    (layers): ModuleList(
      (0-31): 32 x MistralDecoderLayer(
        (self_attn): MistralAttention(
          (q_proj): Linear(in_features=4096, out_features=4096, bias=False)
          (k_proj): Linear(in_features=4096, out_features=1024, bias=False)
          (v_proj): Linear(in_features=4096, out_features=1024, bias=False)
          (o_proj): Linear(in_features=4096, out_features=4096, bias=False)
          (rotary_emb): MistralRotaryEmbedding()
        )
        (mlp): MistralMLP(
          (gate_proj): Linear(in_features=4096, out_features=14336, bias=False)
          (up_proj): Linear(in_features=4096, out_features=14336, bias=False)
          (down_proj): Linear(in_features=14336, out_features=4096, bias=False)
          (act_fn): SiLU()
        )
        (input_layernorm): MistralRMSNorm()
        (post_attention_layernorm): MistralRMSNorm()
      )
    )
    (norm): MistralRMSNorm()
  

In [35]:
generation_config = GenerationConfig(
    temperature=0.8,
    do_sample=True,
    top_p=0.95,
    max_new_tokens=512,
)

In [38]:
model_name = 'kakaobank/kf-deberta-base'
embed_model = HuggingFaceEmbedding(model_name=model_name)

In [41]:
service_context = ServiceContext.from_defaults(embed_model=embed_model, llm=None)

LLM is explicitly disabled. Using MockLLM.


In [42]:
parser = SentenceSplitter(chunk_size=512, chunk_overlap=30)   # SentenceSplitter(chunk_size=1024, chunk_overlap=20)

In [43]:
embedding_service = ServiceContext.from_defaults(node_parser=parser, embed_model=embed_model, llm=None)

LLM is explicitly disabled. Using MockLLM.


In [47]:
desc_store = ChromaVectorStore(chroma_collection=desc_collection)
feature_store = ChromaVectorStore(chroma_collection=feature_collection)
qualification_store = ChromaVectorStore(chroma_collection=qualification_collection)

In [48]:
# service_context 전달 안해주면 query 시 dimension 오류 발생 
features_idx = VectorStoreIndex.from_vector_store(feature_store, service_context=embedding_service)
desc_idx = VectorStoreIndex.from_vector_store(desc_store, service_context=embedding_service)
qualification_idx = VectorStoreIndex.from_vector_store(qualification_store, service_context=embedding_service)

In [52]:
feature_query_engine = features_idx.as_query_engine(llm=model)
desc_query_engine = desc_idx.as_query_engine(llm=model)
qualification_query_engine = qualification_idx.as_query_engine(llm=model)

In [54]:
feature_query_engine.query("청년들을 위한 예금 상품").response

'Context information is below.\n---------------------\n임차보증금을 지원받고자 하는 고객 또는 임차보증금을 활용하여 생활안정자금을 지원받고자 하는 고객을 위한 전세대출 상품\n\n국민행복기금으로부터 신용보증서를 발급 받은 고객의 연24%초과 고금리대출을 제도권대출로 전환해드리기 위한 정책서민금융상품\n---------------------\nGiven the context information and not prior knowledge, answer the query.\nQuery: 청년들을 위한 예금 상품\nAnswer: '

In [57]:
desc_query_engine.query("통신사 할인 되는 카드 상품")

Response(response='Context information is below.\n---------------------\n통신요금 할인에 다양한 할인 혜택까지!\n\n주중/주말/매일 청구할인 혜택이 되는 카드\n---------------------\nGiven the context information and not prior knowledge, answer the query.\nQuery: 통신사 할인 되는 카드 상품\nAnswer: ', source_nodes=[NodeWithScore(node=TextNode(id_='478ba28a-4195-4d95-bd8f-17fdae2ef6af', embedding=None, metadata={'category': 'desc', 'name': 'SK 세븐모바일 라서 즐거운카드'}, excluded_embed_metadata_keys=[], excluded_llm_metadata_keys=['category', 'name'], relationships={<NodeRelationship.SOURCE: '1'>: RelatedNodeInfo(node_id='카드_77', node_type=<ObjectType.DOCUMENT: '4'>, metadata={'category': 'desc', 'name': 'SK 세븐모바일 라서 즐거운카드'}, hash='047f006817fb427f1d4600006effceaa5063c3e2770090b6a67ff98f3df671c9'), <NodeRelationship.PREVIOUS: '2'>: RelatedNodeInfo(node_id='6c47a3ce-deb7-4d0c-997b-0421f58a76b5', node_type=<ObjectType.TEXT: '1'>, metadata={'category': 'desc', 'name': 'KT 마이알뜰폰 우리카드'}, hash='ce7989d6f3c941ae9db7cc39d0443f934cc76250e7e3ce6ef92b8a9

In [75]:
desc_query_engine_tools = [
    QueryEngineTool(
        query_engine=desc_query_engine,
        metadata=ToolMetadata(
            name="vector_tool",
            description=(
                "금융 상품에 대한 상품 설명을 요구하는 질문에 활용될 수 있음"
            ),
        ),
    )
]

In [76]:
feature_query_engine_tools = [
    QueryEngineTool(
        query_engine=feature_query_engine,
        metadata=ToolMetadata(
            name="vector_tool",
            description=(
                "금융 상품에 대한 특징 설명을 요구하는 질문에 활용될 수 있음"
            ),
        ),
    )
]

In [77]:
qualification_query_engine_tools = [
    QueryEngineTool(
        query_engine=qualification_query_engine,
        metadata=ToolMetadata(
            name="vector_tool",
            description=(
                "금융 상품에 대한 자격 조건을 물어보는 질문에 활용될 수 있음"
            ),
        ),
    )
]

In [87]:
agents = {}
query_engines = {}
llm = OpenAI(temperature=0, model="gpt-3.5-turbo")

In [88]:
desc_agent = OpenAIAgent.from_tools(
    desc_query_engine_tools,
    llm=llm,
    verbose=True,
    system_prompt=f"""\
    너는 금융 상품에 대한 설명을 자세하게 알고 있도록 설계된 Agent야. 
    너는 항상 질문에 대답할 때 주어진 도구를 활용하여 대답을 해야 하고, 사전 지식에 의존하지 마
    """,
)

In [89]:
feature_agent = OpenAIAgent.from_tools(
    feature_query_engine_tools,
    llm=llm,
    verbose=True,
    system_prompt=f"""\
    너는 금융 상품에 대한 특징을 자세하게 알고 있도록 설계된 Agent야. 
    너는 항상 질문에 대답할 때 주어진 도구를 활용하여 대답을 해야 하고, 사전 지식에 의존하지 마
    """,
)

In [90]:
qualification_agent = OpenAIAgent.from_tools(
    qualification_query_engine_tools,
    llm=llm,
    verbose=True,
    system_prompt=f"""\
    너는 금융 상품에 대한 자격 요건을 자세하게 알고 있도록 설계된 Agent야. 
    너는 항상 질문에 대답할 때 주어진 도구를 활용하여 대답을 해야 하고, 사전 지식에 의존하지 마
    """,
)

In [98]:
all_tools = []

doc_summary = (
    f"이 컨텐츠는 금융 상품에 대한 설명을 포함하고 있다. 금융 상품 설명 관련해 궁금한 점이 있으면 이 도구를 사용해라."\
)

doc_tool = QueryEngineTool(
    query_engine=desc_agent,
    metadata=ToolMetadata(
        name=f"금융_설명",
        description=doc_summary,
    ),
)

all_tools.append(doc_tool)

In [99]:
doc_summary = (
    f"이 컨텐츠는 금융 상품에 대한 자격 요건을 포함하고 있다. 금융 상품 자격 요건 관련해 궁금한 점이 있으면 이 도구를 사용해라."\
)
qualification_tool = QueryEngineTool(
    query_engine=qualification_agent,
    metadata=ToolMetadata(
        name=f"금융_자격요건",
        description=doc_summary,
    ),
) 

all_tools.append(qualification_tool)

In [101]:
doc_summary = (
    f"이 컨텐츠는 금융 상품에 대한 특징을 포함하고 있다. 금융 상품 특징 관련해 궁금한 점이 있으면 이 도구를 사용해라."\
)
 
features_tool = QueryEngineTool(
    query_engine=feature_agent,
    metadata=ToolMetadata(
        name=f"금융_설명",
        description=doc_summary,
    ),
)

all_tools.append(features_tool)

In [104]:
from llama_index.objects import ObjectIndex, SimpleToolNodeMapping

tool_mapping = SimpleToolNodeMapping.from_objects(all_tools)
obj_index = ObjectIndex.from_objects(
    all_tools,
    tool_mapping,
    VectorStoreIndex,
)

In [105]:
from llama_index.agent import FnRetrieverOpenAIAgent

top_agent = FnRetrieverOpenAIAgent.from_retriever(
    obj_index.as_retriever(similarity_top_k=3),
    system_prompt=""" \
    너는 주어진 금융 정보를 바탕으로 질문에 대답하도록 설계된 Agent야. 
    주어진 도구에 대답할 때 항상 tools를 사용하고, 사전 지식에 의지하지 마. 
    """,
    verbose=True,
)

In [106]:
response = top_agent.query(
    "청년들을 위한 금융 상품 추천해줘" 
)

STARTING TURN 1
---------------



BadRequestError: Error code: 400 - {'error': {'message': "'금융_설명' does not match '^[a-zA-Z0-9_-]{1,64}$' - 'tools.0.function.name'", 'type': 'invalid_request_error', 'param': None, 'code': None}}