In [1]:
#OpenAPI 키 세팅
import os
import openai

# 환경 변수에서 OpenAI API 키 가져오기
api_key = os.environ.get("OPENAI_API_KEY")

# OpenAI API 키 설정
openai.api_key = api_key

In [2]:
#모델 로드
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage

#모델 초기화
model = ChatOpenAI(model="gpt-4o-mini")

In [4]:
#학습시킬 데이터 로드하기
from langchain.document_loaders import PyPDFLoader

#PDF 파일 로드. 파일의 경로 입력
loader = PyPDFLoader("/Users/hyungmin/Desktop/study/sparta_personal/UOR.pdf")

#페이지 별 문서 로드
docs = loader.load()

In [5]:
#RecursiveCharacterTextSplitter를 사용하여 청크로 나누기
from langchain.text_splitter import RecursiveCharacterTextSplitter

recursive_text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=100,
    chunk_overlap=10,
    length_function=len,
    is_separator_regex=False,
)

splits = recursive_text_splitter.split_documents(docs)

In [6]:
from langchain_openai import OpenAIEmbeddings

# OpenAI 임베딩 모델 초기화
embeddings = OpenAIEmbeddings(model="text-embedding-ada-002")


In [7]:
#벡터 스토어 생성
import faiss
from langchain_community.vectorstores import FAISS


vectorstore = FAISS.from_documents(documents=splits, embedding=embeddings)

In [8]:
#Faiss를 Retriever로 변환
retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 1})

In [9]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough

# 프롬프트 템플릿 정의
contextual_prompt = ChatPromptTemplate.from_messages([
    ("system", "Answer the question using only the following context."),
    ("user", "Context: {context}\\n\\nQuestion: {question}")
])

In [10]:
#RAG 체인 구성
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough

# 프롬프트 템플릿 정의
contextual_prompt = ChatPromptTemplate.from_messages([
    ("system", "Answer the question using only the following context."),
    ("user", "Context: {context}\\n\\nQuestion: {question}")
])

class DebugPassThrough(RunnablePassthrough):
    def invoke(self, *args, **kwargs):
        output = super().invoke(*args, **kwargs)
        print("Debug Output:", output)
        return output
# 문서 리스트를 텍스트로 변환하는 단계 추가
class ContextToText(RunnablePassthrough):
    def invoke(self, inputs, config=None, **kwargs):  # config 인수 추가
        # context의 각 문서를 문자열로 결합
        context_text = "\n".join([doc.page_content for doc in inputs["context"]])
        return {"context": context_text, "question": inputs["question"]}

# RAG 체인에서 각 단계마다 DebugPassThrough 추가
rag_chain_debug = {
    "context": retriever,                    # 컨텍스트를 가져오는 retriever
    "question": DebugPassThrough()        # 사용자 질문이 그대로 전달되는지 확인하는 passthrough
}  | DebugPassThrough() | ContextToText()|   contextual_prompt | model


In [None]:
while True: 
	print("========================")
	query = input("질문을 입력하세요: ")
	response = rag_chain_debug.invoke(query)
	print("Final Response:")
	print(response.content)



질문을 입력하세요:  창업 순서


Debug Output: 창업 순서
Debug Output: {'context': [Document(metadata={'source': '/Users/hyungmin/Desktop/study/sparta_personal/UOR.pdf', 'page': 132}, page_content='상황인경우가많이있습니다. 창업가가궁금한것을명확하게인지하고그것을\n확인하기위한실행을계획하고행하는것이가장중요합니다. \n창업가 제대로된실행\n우선순위\n를몰라서\n준비없이\n일단만남\n무서워서')], 'question': '창업 순서'}
Final Response:
창업 순서에는 다음과 같은 단계가 포함될 수 있습니다:

1. 아이디어 구체화: 창업하고자 하는 아이디어를 명확히 하고 시장의 요구를 파악합니다.
2. 시장 조사: 경쟁사 분석 및 타겟 고객의 니즈를 조사합니다.
3. 사업 계획 수립: 비즈니스 모델과 전략을 포함한 사업 계획서를 작성합니다.
4. 자금 조달: 필요한 자금을 확보하기 위한 방법을 모색합니다.
5. 법적 절차: 사업 등록 및 필요한 허가를 취득합니다.
6. 제품/서비스 개발: 실제 제품이나 서비스를 개발합니다.
7. 마케팅 및 판매 전략 수립: 고객에게 다가가기 위한 마케팅 전략을 세웁니다.
8. 실행 및 운영: 계획한 대로 사업을 운영하며, 지속적으로 개선합니다. 

각 단계에서 우선순위를 정하고, 준비 없이 실행하는 것을 피하는 것이 중요합니다.
