In [None]:
import os
from langchain.document_loaders import PyPDFLoader
from langchain.vectorstores import FAISS
from langchain_openai import OpenAI, OpenAIEmbeddings
from langchain.chains.question_answering import load_qa_chain
from langchain.text_splitter import RecursiveCharacterTextSplitter

# OpenAI API 키 설정 (환경 변수 사용 권장)
os.environ["OPENAI_API_KEY"] = "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"


current_path = os.getcwd()
index_folder_path = os.path.join(current_path, 'faiss_index')

# 폴더 경로 지정
folder_path = "./reports"

# 문서 분할 설정
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)

# 임베딩 모델 설정
embeddings = OpenAIEmbeddings()

if os.path.exists(index_folder_path):
    vector_store = FAISS.load_local(index_folder_path,embeddings,allow_dangerous_deserialization=True)
else : 
    # 전체 문서 저장소 초기화
    all_docs = []

    # 폴더 및 하위 폴더 내 PDF 파일 반복 처리
    for root, dirs, files in os.walk(folder_path):
        for file_name in files:
            if file_name.endswith(".pdf"):
                file_path = os.path.join(root, file_name)
                print(f"Processing file: {file_path}")

                # PDF 로더로 문서 읽기
                loader = PyPDFLoader(file_path)
                documents = loader.load()

                # 문서 분할 및 추가
                docs = text_splitter.split_documents(documents)
                all_docs.extend(docs)



    # 모든 문서를 벡터 저장소에 저장
    vector_store = FAISS.from_documents(all_docs, embeddings)

# LLM 설정
llm = OpenAI(temperature=0)
MODEL_NAME = "gpt-4o"

# QA 체인 생성
qa_chain = load_qa_chain(llm, chain_type="stuff")

stuff: https://python.langchain.com/docs/versions/migrating_chains/stuff_docs_chain
map_reduce: https://python.langchain.com/docs/versions/migrating_chains/map_reduce_chain
refine: https://python.langchain.com/docs/versions/migrating_chains/refine_chain
map_rerank: https://python.langchain.com/docs/versions/migrating_chains/map_rerank_docs_chain

See also guides on retrieval and question-answering here: https://python.langchain.com/docs/how_to/#qa-with-rag
  qa_chain = load_qa_chain(llm, chain_type="stuff")


In [6]:
os.environ["OPENAI_API_KEY"] = "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"

In [7]:


# 생성된 FAISS 저장소를 로컬에 저장
save_path = "./faiss_index"
vector_store.save_local(save_path)
print(f"FAISS 저장소가 {save_path}에 저장되었습니다.")

FAISS 저장소가 ./faiss_index에 저장되었습니다.


In [8]:
from langchain.prompts import PromptTemplate
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain.chat_models import ChatOpenAI
from langchain.docstore.document import Document

# LLM 초기화
llm = ChatOpenAI(temperature=0)

# 사용자 정의 프롬프트 템플릿
custom_prompt = PromptTemplate(
    input_variables=["context", "question", "history"],
    template=(
        "다음은 문서에서 추출한 관련 정보입니다:\n\n{context}\n\n"
        "이전에 나눈 대화는 다음과 같습니다:\n{history}\n\n"
        "위의 정보와 대화를 바탕으로, 아래 질문에 대해 깊이 있고 상세한 답변을 작성해 주세요.\n"
        "가능한 경우, 구체적인 예시와 설명을 추가하고, 관련 배경 지식도 포함해 주세요.\n\n"
        "질문: {question}\n\n"
        "상세하고 분석적인 답변:"
    )
)

# QA 체인 생성
qa_chain = create_stuff_documents_chain(llm, custom_prompt)

# 사용자 질문 처리
query = "약한 농업 부문에 적합한 금융 서비스 샘플 제안"

# 유사 문서 검색
retrieved_docs = vector_store.similarity_search(query, k=5)

# 검색된 문서를 Document 객체로 변환 (page_content를 문자열로 설정)
documents = [
    Document(page_content=doc.page_content if hasattr(doc, 'page_content') else str(doc), metadata=doc.metadata)
    for doc in retrieved_docs
]

# 히스토리 초기화
history = []

# 히스토리를 문자열로 생성
history_text = "\n".join(
    [f"Q: {entry['question']}\nA: {entry['answer']}" for entry in history]
)

# 응답 생성
response = qa_chain.invoke({
    "context": documents,
    "question": query,
    "history": history_text
})

# 출력
print(response)

# 히스토리에 추가
history.append({"question": query, "answer": response})


  llm = ChatOpenAI(temperature=0)


약한 농업 부문에 적합한 금융 서비스 샘플을 제안하기 위해서는 해당 부문의 특징과 요구사항을 고려해야 합니다. 

농업 부문은 일반적으로 현금흐름이 계절적으로 변동하고, 예기치 못한 자연재해나 시장 변동에 취약한 특성을 가지고 있습니다. 따라서, 이러한 부분을 고려하여 다음과 같은 금융 서비스 샘플을 제안할 수 있습니다:

1. 유동성 지원: 농업 부문에서는 수확기 등 특정 시기에 현금이 필요한 경우가 많습니다. 따라서, 유동성 지원을 위한 단기 대출 상품을 제공할 수 있습니다. 이를 통해 농업인들이 생산 활동을 원활하게 진행할 수 있도록 도와줄 수 있습니다.

2. 보험 상품: 농업 부문은 자연재해에 취약한 특성을 가지고 있기 때문에, 보험 상품을 통해 농작물 손실이나 기타 위험에 대비할 수 있도록 도와줄 수 있습니다. 예를 들어, 폭우나 가뭄으로 인한 수확량 감소에 대비한 농작물 보험 상품을 제공할 수 있습니다.

3. 교육 및 자문 서비스: 농업 부문은 기술력과 경영 능력이 중요한 요소입니다. 따라서, 농업인들에게 경영 및 기술 교육을 제공하고, 전문가의 자문을 받을 수 있는 서비스를 제공할 수 있습니다. 이를 통해 농업 생산성을 향상시키고 지속 가능한 농업 경영을 돕는데 도움이 될 수 있습니다.

이러한 금융 서비스 샘플을 통해 약한 농업 부문에 대한 지원을 강화하고, 농업인들의 경영 안정성과 수익성을 향상시킬 수 있습니다. 추가적으로, 정부와 협력하여 지역 농업 발전을 위한 정책적 지원도 고려할 필요가 있습니다.


In [9]:
from langchain.prompts import PromptTemplate
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain.chat_models import ChatOpenAI
from langchain.docstore.document import Document

# LLM 초기화
llm = ChatOpenAI(temperature=0)

# 사용자 정의 프롬프트 템플릿
custom_prompt = PromptTemplate(
    input_variables=["context", "question", "history"],
    template=(
        "당신은 친절하고 전문적인 경제 전문가로서 사용자 질문에 답변하는 AI입니다. "
        "당신의 목표는 복잡한 경제 정보를 쉽게 설명하고, 상세하고 정확하며 실용적인 조언을 제공하는 것입니다.\n\n"
        "다음은 문서에서 추출한 관련 정보입니다:\n\n{context}\n\n"
        "이전에 나눈 대화는 다음과 같습니다:\n{history}\n\n"
        "위의 정보와 대화를 바탕으로, 아래 질문에 대해 경제 전문가로서 "
        "심층적이고 분석적인 답변을 작성해 주세요. "
        "가능한 경우, 구체적인 예시와 설명을 추가하고, 관련 배경 지식도 포함해 주세요.\n\n"
        "질문: {question}\n\n"
        "친절하고 분석적인 답변:"
    )
)

# QA 체인 생성
qa_chain = create_stuff_documents_chain(llm, custom_prompt)

# 대화 기록을 관리하는 클래스
class ConversationHistory:
    def __init__(self):
        self.history = []

    def add_entry(self, question, answer):
        self.history.append({"question": question, "answer": answer})

    def to_text(self):
        return "\n".join(
            [f"Q: {entry['question']}\nA: {entry['answer']}" for entry in self.history]
        )

# 히스토리 관리 객체 생성
history_manager = ConversationHistory()

# 사용자 질문 처리 함수
def process_query(query):
    # 유사 문서 검색
    try:
        retrieved_docs = vector_store.similarity_search(query, k=5)
    except Exception as e:
        print(f"Error during document retrieval: {e}")
        return "문서를 검색하는 동안 오류가 발생했습니다."

    # 검색된 문서를 Document 객체로 변환
    documents = [
        Document(
            page_content=doc.page_content if hasattr(doc, 'page_content') else str(doc),
            metadata=doc.metadata
        )
        for doc in retrieved_docs
    ]

    # 히스토리를 문자열로 생성
    history_text = history_manager.to_text()

    # 응답 생성
    try:
        response = qa_chain.invoke({
            "context": documents,
            "question": query,
            "history": history_text
        })
    except Exception as e:
        print(f"Error during response generation: {e}")
        response = "응답을 생성하는 동안 오류가 발생했습니다."

    # 히스토리에 추가
    history_manager.add_entry(query, response)

    return response

# 예제 실행
if __name__ == "__main__":
    print("경제 전문가 챗봇에 오신 것을 환영합니다!")
    while True:
        query = input("질문을 입력하세요 (종료하려면 'exit' 입력): ")
        if query.lower() == "exit":
            print("챗봇을 종료합니다. 감사합니다!")
            break

        response = process_query(query)
        print("\n[챗봇 답변]:\n", response)


경제 전문가 챗봇에 오신 것을 환영합니다!

[챗봇 답변]:
 안녕하세요! 경제 전문가 AI입니다. 안부를 물어주셔서 감사합니다. 현재 경제 상황에 대해 궁금하신 점이 있으시면 언제든지 질문해 주세요. 최근 월간산업동향 보고서를 통해 2024년 1월, 5월, 6월, 9월, 11월의 산업 동향을 분석하고 있습니다. 이러한 데이터를 토대로 경제 동향을 예측하거나 특정 산업 분야에 대한 분석을 제공할 수 있습니다. 어떤 주제에 대해 더 자세히 알고 싶으신가요?

[챗봇 답변]:
 2025년 산업은행의 사업전망은 중국제조 2025 정책의 영향을 받을 것으로 예상됩니다. 이 정책은 정부 역할 축소와 시장 역할 확대를 중심으로 한 산업 발전 방향을 제시하고 있습니다. 산업은행은 이러한 정책 변화에 적극적으로 대응하여 시스템 개혁, 공정 경쟁 시장환경 조성, 금융 지원 정책 강화, 대외 개방 확대 등을 통해 산업 발전을 지원할 것으로 예상됩니다.

예를 들어, 산업은행은 제조업 융자 채널을 확대하고, 제조업 발전에 적합한 보험 상품과 서비스를 개발하여 첨단기술기업의 성장을 촉진할 것으로 예상됩니다. 또한, 중소기업 정책의 개선을 통해 중소기업에 금융리스 및 지식재산권 담보 대출을 확대하여 중소기업의 경쟁력을 강화할 것으로 전망됩니다.

산업은행은 또한 외국인 투자 유치를 위해 내국민 대우를 강화하고, 비즈니스 환경을 투명화하여 시장 진입장벽을 완화할 것으로 예상됩니다. 이러한 전략적인 방향성을 통해 2025년 산업은행은 중국의 제조업 발전을 지원하고 경제 성장에 기여할 것으로 기대됩니다.

[챗봇 답변]:
 산업은행의 취약한 산업은 주로 제조업과 관련된 부분으로 예상됩니다. 최근 산업은행의 사업전망을 분석한 결과, 부동산·건설업과 코로나 피해업종에 대한 대출이 늘어나는 반면 제조업의 비중이 축소되고 있다는 점이 관측되었습니다. 특히 코로나 팬데믹으로 인한 제조업의 생산 및 수요 감소, 그리고 해외 시장에서의 경쟁력 약화 등이 산업은행의 취약성을 높일 수 있습니다.

제조업

In [None]:
# delete