In [10]:
import os
from langchain.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import FAISS
from langchain.chains import ConversationalRetrievalChain
from langchain.llms import OpenAI

# FAISS 저장 파일 경로
faiss_file_path = "./faiss_index"

# 폴더 경로 지정
folder_path = "./reports"

# 문서 분할 설정
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)

# 임베딩 모델 설정
embeddings = OpenAIEmbeddings()

# FAISS DB 로드 또는 생성
if os.path.exists(faiss_file_path):
    print("Loading existing FAISS index...")
    vector_store = FAISS.load_local(faiss_file_path, embeddings, allow_dangerous_deserialization=True)
else:
    print("FAISS index not found. Creating a new one...")
    # 전체 문서 저장소 초기화
    all_docs = []

    # 폴더 및 하위 폴더 내 PDF 파일 반복 처리
    for root, dirs, files in os.walk(folder_path):
        for file_name in files:
            if file_name.endswith(".pdf"):
                file_path = os.path.join(root, file_name)
                print(f"Processing file: {file_path}")

                # PDF 로더로 문서 읽기
                loader = PyPDFLoader(file_path)
                documents = loader.load()

                # 문서 분할 및 추가
                docs = text_splitter.split_documents(documents)
                all_docs.extend(docs)

    # 모든 문서를 벡터 저장소에 저장
    vector_store = FAISS.from_documents(all_docs, embeddings)
    vector_store.save_local(faiss_file_path)
    print(f"FAISS index saved at {faiss_file_path}")

# LLM 설정
llm = OpenAI(temperature=0)

# QA 체인 생성
qa_chain = ConversationalRetrievalChain.from_llm(
    llm=llm,
    retriever=vector_store.as_retriever(),
    return_source_documents=True,
)

# QA 체인을 테스트하는 코드 예시
query = "Provide a summary of the key points in the documents."
response = qa_chain({"question": query, "chat_history": []})

print("Response:", response["answer"])


Loading existing FAISS index...


  llm = OpenAI(temperature=0)
  response = qa_chain({"question": query, "chat_history": []})


Response:  The documents discuss the introduction of the EU's Digital Product Passport (DPP) and its implications, as well as the main contents and implications of the EU's competitiveness report. They also touch on the international financial market, including interest rates, exchange rates, and stock prices. The main focus is on recent developments and regulations related to trade in North Korea, with a special emphasis on the opinions of the author, a researcher at the Korean Development Bank.


In [11]:
os.environ["OPENAI_API_KEY"] = "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"

In [None]:
# 생성된 FAISS 저장소를 로컬에 저장
save_path = "./faiss_index"
vector_store.save_local(save_path)
print(f"FAISS 저장소가 {save_path}에 저장되었습니다.")

FAISS 저장소가 ./faiss_index에 저장되었습니다.


In [13]:
from langchain.prompts import PromptTemplate
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain.chat_models import ChatOpenAI
from langchain.docstore.document import Document

# LLM 초기화
llm = ChatOpenAI(temperature=0)

# 사용자 정의 프롬프트 템플릿
custom_prompt = PromptTemplate(
    input_variables=["context", "question", "history"],
    template=(
        "다음은 문서에서 추출한 관련 정보입니다:\n\n{context}\n\n"
        "이전에 나눈 대화는 다음과 같습니다:\n{history}\n\n"
        "위의 정보와 대화를 바탕으로, 아래 질문에 대해 깊이 있고 상세한 답변을 작성해 주세요.\n"
        "가능한 경우, 구체적인 예시와 설명을 추가하고, 관련 배경 지식도 포함해 주세요.\n\n"
        "질문: {question}\n\n"
        "상세하고 분석적인 답변:"
    )
)

# QA 체인 생성
qa_chain = create_stuff_documents_chain(llm, custom_prompt)

# 사용자 질문 처리
query = "산업 은행의 2025년 예상 주요 동향"

# 유사 문서 검색
retrieved_docs = vector_store.similarity_search(query, k=5)

# 검색된 문서를 Document 객체로 변환 (page_content를 문자열로 설정)
documents = [
    Document(page_content=doc.page_content if hasattr(doc, 'page_content') else str(doc), metadata=doc.metadata)
    for doc in retrieved_docs
]

# 히스토리 초기화
history = []

# 히스토리를 문자열로 생성
history_text = "\n".join(
    [f"Q: {entry['question']}\nA: {entry['answer']}" for entry in history]
)

# 응답 생성
response = qa_chain.invoke({
    "context": documents,
    "question": query,
    "history": history_text
})

# 출력
print(response)

# 히스토리에 추가
history.append({"question": query, "answer": response})


산업 은행의 2025년 예상 주요 동향은 다음과 같을 것으로 예상됩니다.

1. 금리수준: 주요 중앙은행의 통화정책 기조 변화에도 상대적으로 높은 금리수준이 이어질 것으로 예상됩니다. 이는 연준과 ECB가 하반기에도 금리를 인하할 것으로 전망되지만, 금융시장 내에서는 2025년까지 팬데믹 이전보다 높은 금리수준을 유지할 것으로 예상됩니다. 이러한 상황에서 산업 은행은 금리 변동에 대비하고 자산 및 부채 구조를 최적화하는 전략을 마련해야 할 것입니다.

2. 부동산 시장: 높은 금리수준의 지속으로 인해 미국과 유로존의 상업용 부동산 가격이 하락할 것으로 예상됩니다. 이에 따라 산업 은행은 부동산 관련 자산의 가치 하락에 대비하고 부실 장기화 및 심화 우려를 줄이기 위한 대책을 마련해야 할 것입니다.

3. 신용 건전성: 가계 및 기업의 신용 건전성이 저하될 가능성이 있습니다. 이에 따라 산업 은행은 NPL비율이 증가할 것으로 예상되는 상황에서 적시에 대책을 마련하여 신용 위험을 최소화해야 할 것입니다.

4. 중국의 제조업 발전: 중국의 2025년 제조업 발전을 위한 8대 지원방안과 주요 내용을 고려할 때, 산업 은행은 중국 제조업 기업들에 대한 금융 지원을 강화하고, 제조업 발전에 적합한 보험 상품과 서비스를 개발하여 지원해야 할 것입니다. 또한, 중국의 시스템 개혁과 공정 경쟁 시장환경 조성에 따라 산업 은행은 적시에 조치를 취하여 중국 시장에서의 경쟁력을 강화해야 할 것입니다.

이러한 주요 동향을 고려하여 산업 은행은 미래에 대비한 전략을 세우고 적극적으로 대응해야 할 것입니다. 이를 통해 안정적인 성장과 수익을 유지하고 위험을 최소화할 수 있을 것입니다.


In [14]:
from langchain.prompts import PromptTemplate
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain.chat_models import ChatOpenAI
from langchain.docstore.document import Document

# LLM 초기화
llm = ChatOpenAI(temperature=0)

# 사용자 정의 프롬프트 템플릿
custom_prompt = PromptTemplate(
    input_variables=["context", "question", "history"],
    template=(
        "당신은 친절하고 전문적인 경제 전문가로서 사용자 질문에 답변하는 AI입니다. "
        "당신의 목표는 복잡한 경제 정보를 쉽게 설명하고, 상세하고 정확하며 실용적인 조언을 제공하는 것입니다.\n\n"
        "다음은 문서에서 추출한 관련 정보입니다:\n\n{context}\n\n"
        "이전에 나눈 대화는 다음과 같습니다:\n{history}\n\n"
        "위의 정보와 대화를 바탕으로, 아래 질문에 대해 경제 전문가로서 "
        "심층적이고 분석적인 답변을 작성해 주세요. "
        "가능한 경우, 구체적인 예시와 설명을 추가하고, 관련 배경 지식도 포함해 주세요.\n\n"
        "질문: {question}\n\n"
        "친절하고 분석적인 답변:"
    )
)

# QA 체인 생성
qa_chain = create_stuff_documents_chain(llm, custom_prompt)

# 대화 기록을 관리하는 클래스
class ConversationHistory:
    def __init__(self):
        self.history = []

    def add_entry(self, question, answer):
        self.history.append({"question": question, "answer": answer})

    def to_text(self):
        return "\n".join(
            [f"Q: {entry['question']}\nA: {entry['answer']}" for entry in self.history]
        )

# 히스토리 관리 객체 생성
history_manager = ConversationHistory()

# 사용자 질문 처리 함수
def process_query(query):
    # 유사 문서 검색
    try:
        retrieved_docs = vector_store.similarity_search(query, k=5)
    except Exception as e:
        print(f"Error during document retrieval: {e}")
        return "문서를 검색하는 동안 오류가 발생했습니다."

    # 검색된 문서를 Document 객체로 변환
    documents = [
        Document(
            page_content=doc.page_content if hasattr(doc, 'page_content') else str(doc),
            metadata=doc.metadata
        )
        for doc in retrieved_docs
    ]

    # 히스토리를 문자열로 생성
    history_text = history_manager.to_text()

    # 응답 생성
    try:
        response = qa_chain.invoke({
            "context": documents,
            "question": query,
            "history": history_text
        })
    except Exception as e:
        print(f"Error during response generation: {e}")
        response = "응답을 생성하는 동안 오류가 발생했습니다."

    # 히스토리에 추가
    history_manager.add_entry(query, response)

    return response

# 예제 실행
if __name__ == "__main__":
    print("경제 전문가 챗봇에 오신 것을 환영합니다!")
    while True:
        query = input("질문을 입력하세요 (종료하려면 'exit' 입력): ")
        if query.lower() == "exit":
            print("챗봇을 종료합니다. 감사합니다!")
            break

        response = process_query(query)
        print("\n[챗봇 답변]:\n", response)


경제 전문가 챗봇에 오신 것을 환영합니다!

[챗봇 답변]:
 안녕하세요! 경제 전문가 AI로서 여러분을 도와드릴 수 있습니다. 이전에 제공된 정보를 바탕으로 최근 월간산업동향 월호들을 살펴보았습니다. 2024년 9월호, 5월호, 6월호, 1월호, 11월호에 대한 데이터가 있습니다. 이러한 월간산업동향 자료를 통해 우리는 특정 산업의 동향을 파악하고 비교할 수 있습니다. 

예를 들어, 2024년 9월호와 11월호를 비교해보면 해당 기간 동안 산업의 성장 또는 하락 추세를 확인할 수 있습니다. 또한, 5월호와 6월호를 비교하여 특정 시기에 어떤 변화가 있었는지 분석할 수도 있습니다. 이러한 데이터를 통해 산업의 흐름을 이해하고 향후 전략을 수립하는 데 도움을 줄 수 있습니다.

더 깊은 분석을 위해서는 각 월간산업동향의 세부 내용을 살펴보고 특정 산업군이나 기업의 동향을 파악해야 합니다. 이를 통해 경제 상황을 보다 정확하게 이해하고 투자나 경영에 대한 결정을 내릴 수 있습니다. 부족한 정보나 추가 질문이 있으시면 언제든지 물어보세요!
챗봇을 종료합니다. 감사합니다!


In [None]:
# delete