In [1]:
import json
from typing import List, Dict, Any

def load_loan_data(file_path: str) -> List[Dict[str, Any]]:
    with open(file_path, 'r', encoding='utf-8') as file:
        data_raw = json.load(file)
    data_list = data_raw['result']['baseList']
    data_option = data_raw['result']['optionList']

    new_data = []
    for data in data_list:
        for option in data_option:
            if data["fin_prdt_cd"] == option["fin_prdt_cd"]:
                item_dict = data
                for op_key in option:
                    item_dict[op_key] = option[op_key]
                new_data.append(item_dict)
        
    return data

loan_data = load_loan_data('fss_test.json')

In [2]:
# # 대출 상품 목록
# loan_data = [
# {'dcls_month': '202410',
#   'fin_co_no': '0010593',
#   'fin_prdt_cd': '302301',
#   'kor_co_nm': '한화생명보험주식회사',
#   'fin_prdt_nm': '홈드림모기지론',
#   'join_way': '영업점,모집인',
#   'loan_inci_expn': '인지세(50%), 주택채권매입비용',
#   'erly_rpay_fee': '기본형(36개월이내 원금상환시 상환금액의 1.2% * 잔존일수 / 36개월) 외 3개 방식',
#   'dly_rate': '대출만기 경과 건을 포함하여 연체기간에 상관없이 정상금리 +3%를 적용 (단, 최고 19%)',
#   'loan_lmt': '감정가의 최고 70%까지 (담보물소재지, 대출금액, 고객신용, 소득 등에 따라 차등적용)',
#   'dcls_strt_day': '20220819',
#   'dcls_end_day': None,
#   'fin_co_subm_day': '202410181400',
#   'mrtg_type': 'E',
#   'mrtg_type_nm': '아파트외',
#   'rpay_type': 'D',
#   'rpay_type_nm': '분할상환방식',
#   'lend_rate_type': 'C',
#   'lend_rate_type_nm': '변동금리',
#   'lend_rate_min': 4.87,
#   'lend_rate_max': 5.37,
#   'lend_rate_avg': 4.76},
# ]

In [7]:
import os
os.environ["NCP_CLOVASTUDIO_API_KEY"]

'NTA0MjU2MWZlZTcxNDJiY/YIriVS3iw7sr4Fkym5K6by9mCkkgbxnxGU+9NGihHc'

In [25]:
import json
import re
from typing import List, Dict, Any
from langchain.llms import OpenAI
from langchain.chat_models import ChatOpenAI
from langchain_community.chat_models import ChatClovaX
from langchain.chains import RetrievalQA
from langchain.embeddings import OpenAIEmbeddings
from langchain_community.embeddings import ClovaXEmbeddings
from langchain.vectorstores import FAISS
from langchain.schema import Document
from langchain.prompts import PromptTemplate
import math
import dotenv

dotenv.load_dotenv()

# import openai
# openai.api_key = "your-api-key-here"

# Load loan data from JSON file
def load_loan_data(file_path: str) -> List[Dict[str, Any]]:
    with open(file_path, 'r', encoding='utf-8') as file:
        data_raw = json.load(file)
    data_list = data_raw['result']['baseList']
    data_option = data_raw['result']['optionList']
    new_data = []
    for data in data_list:
        for option in data_option:
            if data["fin_prdt_cd"] == option["fin_prdt_cd"]:
                item_dict = data
                for op_key in option:
                    item_dict[op_key] = option[op_key]
                new_data.append(item_dict)
    return new_data

# Preprocess loan data to create documents
def create_documents(loan_data: List[Dict[str, Any]]) -> List[Document]:
    documents = []
    for product in loan_data:
        content = f"상품명: {product['fin_prdt_nm']}, 회사명: {product['kor_co_nm']}, 최소 연이율: {product.get('lend_rate_min', 'N/A')}, 최대 연이율: {product.get('lend_rate_max', 'N/A')}, 대출 한도: {product['loan_lmt']}, 설명: {product['loan_inci_expn']}"
        documents.append(Document(page_content=content))
    return documents

def extract_user_loan_info(query):
    template = """다음 글에서 대출금, 상환 기간, 보유 주택 가격을 찾아 정리하세요.
    예시)
    질문: 이 상품의 월 상환액을 계산해 주세요. 보유 주택은 3억에 대출금은 1억이고 상환 기간은 3년입니다.
    답변: - 대출금: 100000000\n- 상환 기간: 36개월\n- 보유 주택 가격: 300000000
    질문: {query}"""

    prompt = PromptTemplate.from_template(template)

    extracted_result = llm.predict(prompt.format(query=query))
    # print(extracted_result)

    principal = re.search(r'대출금: (\d+)', extracted_result)
    if not principal:
        return None, None, None
    months = re.search(r'상환 기간: (\d+)', extracted_result)
    house_price = re.search(r'보유 주택 가격: (\d+)', extracted_result)

    principal, months, house_price = map(int, [principal.group(1), months.group(1), house_price.group(1)])
    LTV = house_price / months

    # print(principal, months, LTV)
    return principal, months, LTV

# Calculate monthly repayment amount
def calculate_monthly_repayment(principal: float, annual_rate: float, months: int) -> float:
    monthly_rate = annual_rate / 12 / 100
    if monthly_rate == 0:
        return principal / months
    return principal * (monthly_rate * math.pow(1 + monthly_rate, months)) / (math.pow(1 + monthly_rate, months) - 1)

# Initialize LLM and vector store
# llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0.3)  # Adjust temperature for response creativity
llm = ChatClovaX(
    model="HCX-DASH-001" # 테스트 앱 또는 서비스 앱 인증 정보에 해당하는 모델명 입력 (기본값: HCX-003)
)
loan_data = load_loan_data('fss_test.json')
documents = create_documents(loan_data)
vectorstore = FAISS.from_documents(documents, ClovaXEmbeddings(app_id="6585c827293a4523a026325a39f4505f"))
# vectorstore = FAISS.from_documents(documents, OpenAIEmbeddings())

# Set up the RetrievalQA chain
retrieval_qa = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=vectorstore.as_retriever(),
    return_source_documents=True
)

# Define the main query handling function
def handle_user_query(query: str) -> str:
    
    principal, months, LTV = extract_user_loan_info(query)
    if principal and months and LTV:
        query += f"""
        \n** 추가 정보 **
        대출금: {principal}, 상환 기간: {months}, LTV: {LTV}
        """
    template = """
        당신은 금융 전문가입니다. 당신의 일은 다음과 같습니다.
        - 어려운 금융 용어를 풀어서 설명
            - 이 경우에는 {문서}를 무시합니다.
        - 만약 {추가 정보}가 주어진다면 추가 정보를 바탕으로 계산
        - 주어진 {문서}를 기반으로 적절한 금융 상품 추천
    """
    response = retrieval_qa(template+query)
    answer = response['result']
    source_docs = response['source_documents']
    
    # # Extract relevant information for repayment calculation
    # min_annual_rate, max_annual_rate = 0, 0
    # for doc in source_docs:
    #     if '최소 연이율' in doc.page_content:
    #         min_annual_rate = float(re.search(r'최소 연이율: (\d+.\d+)', doc.page_content).group(1))
    #     if '최대 연이율' in doc.page_content:
    #         max_annual_rate = float(re.search(r'최대 연이율: (\d+.\d+)', doc.page_content).group(1))
    
    # if principal is not None:
    #     answer = "최소/최대 연이율을 적용하여 계산한 상환액은 다음과 같습니다."
    #     if min_annual_rate:
    #         monthly_repayment = calculate_monthly_repayment(principal, min_annual_rate, months)
    #         answer += f"\n\n월 상환액(최소): {monthly_repayment:.2f}원"
    #     if max_annual_rate:
    #         monthly_repayment = calculate_monthly_repayment(principal, max_annual_rate, months)
    #         answer += f"\n월 상환액(최대): {monthly_repayment:.2f}원"
    
    # # Optionally format the output to include source documents
    # source_texts = "\n".join([doc.page_content for doc in source_docs])
    # # return f"{answer}\n\n**참조 문서:**\n{source_texts}"
    return answer

# Example user queries
queries = [
    "주택담보대출의 이자율은 얼마인가요?",
    "가장 낮은 연이율의 상품을 추천해 주세요.",
    "이 상품의 월 상환액을 계산해 주세요. 보유 주택은 3억에 대출금은 1억이고 상환 기간은 36개월입니다.",
    """
    * 전월 취급 평균금리는 공시일의 직전월에 신규 취급한 대출의 가중평균이자율을 의미합니다.
    위 글의 전문용어를 풀어서 설명해주세요
    """
]

# Execute queries
for query in queries:
    response = handle_user_query(query)
    print(f"질문: {query}\n응답: {response}\n")


질문: 주택담보대출의 이자율은 얼마인가요?
응답: 주어진 문서에 따르면, 상품명이 "주택담보대출"이고 회사명이 "농협생명보험주식회사"인 상품의 최소 연이율은 4.58이며, 최대 연이율은 5.85입니다.  

추가로 제공된 정보 중에서 대출금은 30000000원, 상환 기간은 120개월, LTV는 416666.6666666667 입니다. 이를 바탕으로 연이율을 계산하면 다음과 같습니다.

우선 LTV를 고려한 대출 한도를 계산

질문: 가장 낮은 연이율의 상품을 추천해 주세요.
응답: 주어진 조건에서 가장 낮은 연이율의 상품은 "주택담보대출(일반형), 회사명 : 삼성생명보험주식회사"입니다. 

해당 상품의 연이율은 3.79%이며, 상환 기간이 24개월이고, LTV가 833333.3333333334 일 때 총 이자 비용은 12,972,000원 입니다.

다른 상품들의 이자 비용도 궁금하시다면 말씀해주세요.

질문: 이 상품의 월 상환액을 계산해 주세요. 보유 주택은 3억에 대출금은 1억이고 상환 기간은 36개월입니다.
응답: 월 상환액을 계산하기 위해서는 다음과 같은 정보가 필요합니다.

1. 연이율 : 대출 이자율이 매년 몇 퍼센트인지를 나타냅니다.
2. 상환 기간 : 대출금을 얼마나 오랫동안 분할하여 상환할 것인지를 나타냅니다. 일반적으로 1년 이상의 기간을 설정합니다.
3. 대출금 : 대출을 받는 금액을 나타냅니다.

위의 정보를 바탕으로 해당 대출의 월 상환액을 계산하면 다음과 같습니다.

질문: 
    * 전월 취급 평균금리는 공시일의 직전월에 신규 취급한 대출의 가중평균이자율을 의미합니다.
    위 글의 전문용어를 풀어서 설명해주세요
    
응답: 위 글에서 사용된 전문 용어는 다음과 같습니다.  

1. 주택담보대출(일반형): 주택을 담보로 하여 받는 대출 중 일반적인 형태의 대출을 의미합니다.
2. 회사명: 해당 대출을 제공하는 회사의 이름을 의미합니다.
3. 최소 연이율: 대출을 받을 때 최소한으로 적용되는 이자율을 의미합니다.
4. 최대 연

In [12]:
response.page_content

'상품명: 홈드림모기지론, 회사명: 한화생명보험주식회사, 최소 연이율: 4.87, 최대 연이율: 5.37, 대출 한도: 감정가의 최고 70%까지 (담보물소재지, 대출금액, 고객신용, 소득 등에 따라 차등적용), 설명: 인지세(50%), 주택채권매입비용'

In [42]:
# Example user queries
queries = [
    "주택담보대출의 이자율은 얼마인가요?",
    "가장 낮은 연이율의 상품을 추천해 주세요.",
    "이 상품의 월 상환액을 계산해 주세요. 보유 주택은 3억에 대출금은 1억이고 상환 기간은 36개월입니다.",
]

# Execute queries
for query in queries:
    response = llm.predict(query)
    print(f"질문: {query}\n응답: {response}\n")


질문: 주택담보대출의 이자율은 얼마인가요?
응답: 주택담보대출의 이자율은 대출 상품과 대출 신청자의 신용평가 결과에 따라 다를 수 있습니다. 일반적으로 주택담보대출의 이자율은 현재 시장 금리와 대출 상품의 조건에 따라 변동하며, 보통 2%에서 5% 사이의 범위 내에서 결정됩니다. 따라서 정확한 이자율을 확인하려면 은행이나 금융기관에 문의하여 상담을 받는 것이 좋습니다.

질문: 가장 낮은 연이율의 상품을 추천해 주세요.
응답: 현재 시중은행에서 제공하는 보통예금 상품이 가장 낮은 연이율을 가지고 있습니다. 이 상품은 예금액에 따라 다르지만 대체로 0.1%에서 0.5% 사이의 연이율을 제공하고 있습니다. 따라서 이 상품을 고려해보시는 것도 좋은 방법일 수 있습니다.

질문: 이 상품의 월 상환액을 계산해 주세요. 보유 주택은 3억에 대출금은 1억이고 상환 기간은 36개월입니다.
응답: 대출금액: 1억 원
상환 기간: 36개월

연이자율을 3%로 가정하면, 월 이자율은 3% / 12 = 0.25% 입니다.

매월 원금 상환액을 계산하기 위해 월 이자액을 먼저 계산합니다.
1억 원 * 0.25% = 250,000 원

매월 상환해야 하는 총 금액은 이자액과 원금 상환액의 합이므로,
250,000 원(이자액) + (1억 원 / 36개월) = 250,000 원 + 2,777,778 원 = 3,027,778 원

따라서, 이 상품의 월 상환액은 3,027,778 원 입니다.



In [31]:
loan_data

{'dcls_month': '202410',
 'fin_co_no': '0013174',
 'fin_prdt_cd': 'WR0001D',
 'kor_co_nm': '농협손해보험주식회사',
 'fin_prdt_nm': '헤아림아파트론Ⅰ',
 'join_way': '영업점',
 'loan_inci_expn': '- 인지세 : 해당 세액의 50%\n- 국민주택채권매입비\n- 근저당권 말소비용',
 'erly_rpay_fee': '- 중도상환원금 X 1.2%(변동), 1.4%(고정) X (잔여기간/대출기간)\n- 대출일로부터 1년 경과후 최초대출금액의 50%까지 면제\n- 대출일로부터 3년 경과시 전액 면제',
 'dly_rate': '- 연체기간에 관계없이 연체일수 X (채무자 대출금리 + 3%)÷365(윤년은 366)\n- 지연배상금률이 연 17%를 초과하는 경우에는 연 17%를 적용',
 'loan_lmt': 'LTV 30% ~ 70% \n - 지역별 차등적용',
 'dcls_strt_day': '20241017',
 'dcls_end_day': None,
 'fin_co_subm_day': '202410171600',
 'mrtg_type': 'A',
 'mrtg_type_nm': '아파트',
 'rpay_type': 'D',
 'rpay_type_nm': '분할상환방식',
 'lend_rate_type': 'C',
 'lend_rate_type_nm': '변동금리',
 'lend_rate_min': 3.79,
 'lend_rate_max': 6.3,
 'lend_rate_avg': 3.77}

In [None]:
# OpenAI Embeddings를 통해 임베딩 생성
embeddings = ClovaXEmbeddings(model="clir-emb-dolphin")

# FAISS 벡터스토어에 문서들을 인덱싱
vectorstore = FAISS.from_documents(documents, embeddings)


In [7]:
def calculate_monthly_repayment(principal, annual_rate, years):
    monthly_rate = annual_rate / 12 / 100
    months = years * 12
    monthly_payment = principal * monthly_rate * (1 + monthly_rate)**months / ((1 + monthly_rate)**months - 1)
    return round(monthly_payment, 2)


In [9]:
# 사용자 정의 프롬프트 템플릿 설정
prompt_template = PromptTemplate(
    input_variables=["context", "question"],
    template="사용자가 문의한 내용에 맞는 정보를 제공해 주세요:\n\n{context}\n\n질문: {question}"
)

# LLM과 프롬프트를 이용한 QA 체인 구성
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.3)
qa_chain = load_qa_chain(llm, chain_type="stuff", prompt=prompt_template)

# # RAG Chain 구성
# retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})
# qa_chain = RetrievalQA.from_chain_type(
#     llm=ChatOpenAI(model="gpt-4o-mini", temperature=0.3),
#     chain_type="stuff",
#     retriever=retriever,
#     prompt=prompt_template
# )

# 사용자가 입력한 질문을 처리하는 함수
def handle_user_query(query, principal=None, annual_rate=None, years=None):
    # 대출 계산 질문이 있는 경우 월 상환액 계산 수행
    if "상환액" in query and principal and annual_rate and years:
        monthly_payment = calculate_monthly_repayment(principal, annual_rate, years)
        return f"대출금 {principal}원에 대한 월 상환액은 {monthly_payment}원입니다. 기간: {years}년, 이자율: {annual_rate}%"

    # RAG 시스템을 통해 일반적인 금융 질문 답변 생성
    response = qa_chain({"query": query})
    return response["result"]

# 예시 질문과 계산 수행
query = "이 상품의 상환액을 계산해주세요"
response = handle_user_query(query, principal=100000000, annual_rate=3.41, years=20)
print(response)


대출금 100000000원에 대한 월 상환액은 575345.67원입니다. 기간: 20년, 이자율: 3.41%


stuff: https://python.langchain.com/docs/versions/migrating_chains/stuff_docs_chain
map_reduce: https://python.langchain.com/docs/versions/migrating_chains/map_reduce_chain
refine: https://python.langchain.com/docs/versions/migrating_chains/refine_chain
map_rerank: https://python.langchain.com/docs/versions/migrating_chains/map_rerank_docs_chain

See also guides on retrieval and question-answering here: https://python.langchain.com/docs/how_to/#qa-with-rag
  qa_chain = load_qa_chain(llm, chain_type="stuff", prompt=prompt_template)
