In [10]:
from dotenv import load_dotenv

load_dotenv()

True

In [13]:
from langchain_chroma import Chroma
from langchain_openai import OpenAIEmbeddings

embedding_function = OpenAIEmbeddings(model='text-embedding-3-large')
vector_store = Chroma(
    embedding_function=embedding_function,
    collection_name='real_estate_tax',
    persist_directory='./real_estate_tax_collection'
)

retriever = vector_store.as_retriever()

In [None]:
from langchain.chat_models import ChatOpenAI
from langchain.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough

llm = ChatOpenAI(model='gpt-4o',
                 temperature=0
)


template = """
당신은 질문-응답 작업을 수행하는 어시스턴트입니다.
아래에 제공된 검색된 컨텍스트를 사용하여 질문에 답변하세요.
답을 모를 경우, 모른다고 말하세요.
최대 두 문장으로, 간결하게 답변하세요.

질문: {question}
컨텍스트: {context}
답변:
"""

prompt = ChatPromptTemplate.from_template(template)

rag_chain = (
    {"context": retriever,  "question": RunnablePassthrough()} 
    | prompt 
    | llm
    | StrOutputParser() 
)

In [28]:
from datasets import Dataset

questions = [
    "종합부동산세의 부과 목적은 무엇이며, 재산세와 어떤 점에서 다른가?", 
    "1세대 1주택자가 종합부동산세 과세대상에서 제외되거나 세액 공제를 받기 위한 요건은 무엇인가?",
    "주택을 3채 이상 보유한 개인에게 적용되는 종합부동산세 세율 구조는 어떻게 되는가?",
]

gt = [
    "종합부동산세는 고액 부동산 보유자에 대한 조세 형평성과 부동산 가격 안정을 목적으로 한다.",
    "1세대 1주택자는 공시가격 요건과 연령 및 보유기간 요건을 충족하면 세액 공제를 받을 수 있다.",
    "3주택 이상 보유한 개인에게는 누진적인 고율의 종합부동산세 세율이 적용된다."
]
answers = []
contexts = []

for query in questions:
    answers.append(rag_chain.invoke(query))
    contexts.append(
        [doc.page_content for doc in retriever.get_relevant_documents(query)]
    )

data = {
    "question": questions,
    "answer": answers,
    "contexts": contexts,
    'ground_truth': gt
}

dataset = Dataset.from_dict(data)


In [31]:
from ragas import evaluate
from ragas.metrics import (
    faithfulness,
    answer_relevancy,
    context_precision,
    context_recall
)

result = evaluate(
    dataset,
    metrics=[
        faithfulness,
        answer_relevancy,
        context_precision,
        context_recall
    ],
     llm=llm  
)

df = result.to_pandas()

  from ragas.metrics import (
  from ragas.metrics import (
  from ragas.metrics import (
  from ragas.metrics import (
Evaluating:   0%|          | 0/12 [00:00<?, ?it/s]LLM returned 1 generations instead of requested 3. Proceeding with 1 generations.
Evaluating:   8%|▊         | 1/12 [00:05<00:56,  5.13s/it]LLM returned 1 generations instead of requested 3. Proceeding with 1 generations.
LLM returned 1 generations instead of requested 3. Proceeding with 1 generations.
Evaluating: 100%|██████████| 12/12 [00:45<00:00,  3.80s/it]


In [32]:
df

Unnamed: 0,user_input,retrieved_contexts,response,reference,faithfulness,answer_relevancy,context_precision,context_recall
0,"종합부동산세의 부과 목적은 무엇이며, 재산세와 어떤 점에서 다른가?","[종합부동산세법\n[시행 2023. 4. 18] [법률 제19342호, 2023. ...",종합부동산세의 부과 목적은 고액의 부동산 보유자에게 세금을 부과하여 조세부담의 형평...,종합부동산세는 고액 부동산 보유자에 대한 조세 형평성과 부동산 가격 안정을 목적으로...,0.6,0.848478,1.0,1.0
1,1세대 1주택자가 종합부동산세 과세대상에서 제외되거나 세액 공제를 받기 위한 요건은...,[과세기준일 현재 만 60세 이상인 1세대 1주택자가 제8조제4항 각 호의 어느 하...,1세대 1주택자가 종합부동산세 과세대상에서 제외되거나 세액 공제를 받기 위해서는 과...,1세대 1주택자는 공시가격 요건과 연령 및 보유기간 요건을 충족하면 세액 공제를 받...,0.2,0.849387,1.0,1.0
2,주택을 3채 이상 보유한 개인에게 적용되는 종합부동산세 세율 구조는 어떻게 되는가?,[납세의무자가 2주택 이하를 소유한 경우\n\n| 과세표준 ...,주택을 3채 이상 보유한 개인의 종합부동산세 세율 구조는 다음과 같습니다: 과세표준...,3주택 이상 보유한 개인에게는 누진적인 고율의 종합부동산세 세율이 적용된다.,1.0,0.861491,0.833333,1.0


In [None]:
#!pip install datasets
#!pip install ragas


Collecting ragas
  Downloading ragas-0.4.3-py3-none-any.whl.metadata (23 kB)
Collecting appdirs (from ragas)
  Downloading appdirs-1.4.4-py2.py3-none-any.whl.metadata (9.0 kB)
Collecting diskcache>=5.6.3 (from ragas)
  Downloading diskcache-5.6.3-py3-none-any.whl.metadata (20 kB)
Collecting instructor (from ragas)
  Downloading instructor-1.14.5-py3-none-any.whl.metadata (12 kB)
Collecting networkx (from ragas)
  Using cached networkx-3.6.1-py3-none-any.whl.metadata (6.8 kB)
Collecting scikit-network (from ragas)
  Downloading scikit_network-0.33.5-cp312-cp312-macosx_11_0_arm64.whl.metadata (4.5 kB)
Collecting docstring-parser<1.0,>=0.16 (from instructor->ragas)
  Downloading docstring_parser-0.17.0-py3-none-any.whl.metadata (3.5 kB)
Collecting openai>=1.0.0 (from ragas)
  Downloading openai-2.16.0-py3-none-any.whl.metadata (29 kB)
Collecting jiter<0.12,>=0.6.1 (from instructor->ragas)
  Downloading jiter-0.11.1-cp312-cp312-macosx_11_0_arm64.whl.metadata (5.2 kB)
INFO: pip is looking a