In [1]:
#OpenAPI 키 세팅
import os
import openai

# 환경 변수에서 OpenAI API 키 가져오기
api_key = os.environ.get("OPENAI_API_KEY")

# OpenAI API 키 설정
openai.api_key = api_key

In [2]:
#모델 로드
from langchain_openai import ChatOpenAI
from langchain_core.messages import HumanMessage

#모델 초기화
model = ChatOpenAI(model="gpt-4o-mini")

In [3]:
#학습시킬 데이터 로드하기
from langchain.document_loaders import PyPDFLoader

#PDF 파일 로드. 파일의 경로 입력
loader = PyPDFLoader("/Users/hyungmin/Desktop/study/sparta_personal/인공지능산업최신동향_2024년11월호.pdf")

#페이지 별 문서 로드
docs = loader.load()

In [4]:
# 초기 시스템 메시지 설정
system_message = [
    {"role": "system", "content": '너는 인공지능 산업 최신 동향을 알려주는 취업 컨설턴트야, 인공지능 산업에 관심이 많은 사람들을 위한 유의미한 조언을 해줘. 단, 반드시 정중한 말투로 응답하고, 마지막에는 "더 궁금하신 점이 있다면 언제든지 물어봐주세요."라고 말해'},
]

In [5]:
#RecursiveCharacterTextSplitter를 사용하여 청크로 나누기
from langchain.text_splitter import RecursiveCharacterTextSplitter

recursive_text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=100,
    chunk_overlap=10,
    length_function=len,
    is_separator_regex=False,
)

splits = recursive_text_splitter.split_documents(docs)

In [6]:
from langchain_openai import OpenAIEmbeddings

# OpenAI 임베딩 모델 초기화
embeddings = OpenAIEmbeddings(model="text-embedding-ada-002")


In [7]:
#벡터 스토어 생성
import faiss
from langchain_community.vectorstores import FAISS


vectorstore = FAISS.from_documents(documents=splits, embedding=embeddings)

In [8]:
#Faiss를 Retriever로 변환
retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 1})

In [9]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough

# 프롬프트 템플릿 정의
contextual_prompt = ChatPromptTemplate.from_messages([
    ("system", "Answer the question using only the following context."),
    ("user", "Context: {context}\\n\\nQuestion: {question}")
])

In [10]:
#RAG 체인 구성
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough

# 프롬프트 템플릿 정의
contextual_prompt = ChatPromptTemplate.from_messages([
    ("system", "Answer the question using only the following context."),
    ("user", "Context: {context}\\n\\nQuestion: {question}")
])

class DebugPassThrough(RunnablePassthrough):
    def invoke(self, *args, **kwargs):
        output = super().invoke(*args, **kwargs)
        print("Debug Output:", output)
        return output
# 문서 리스트를 텍스트로 변환하는 단계 추가
class ContextToText(RunnablePassthrough):
    def invoke(self, inputs, config=None, **kwargs):  # config 인수 추가
        # context의 각 문서를 문자열로 결합
        context_text = "\n".join([doc.page_content for doc in inputs["context"]])
        return {"context": context_text, "question": inputs["question"]}

# RAG 체인에서 각 단계마다 DebugPassThrough 추가
rag_chain_debug = {
    "context": retriever,                    # 컨텍스트를 가져오는 retriever
    "question": DebugPassThrough()        # 사용자 질문이 그대로 전달되는지 확인하는 passthrough
}  | DebugPassThrough() | ContextToText()|   contextual_prompt | model


In [None]:
while True: 
	print("========================")
	query = input("질문을 입력하세요: ")
	response = rag_chain_debug.invoke(query)
	print("Final Response:")
	print(response.content)



질문을 입력하세요:  요새 인공지능 취업 전망 알려줘


Debug Output: 요새 인공지능 취업 전망 알려줘
Debug Output: {'context': [Document(metadata={'source': '/Users/hyungmin/Desktop/study/sparta_personal/인공지능산업최신동향_2024년11월호.pdf', 'page': 1}, page_content='중 이직 고려················································18   ▹ 가트너 예측, AI로 인해 엔지니어링 인력의 80%가 역량 향상')], 'question': '요새 인공지능 취업 전망 알려줘'}
Final Response:
최근 가트너의 예측에 따르면 AI의 발전으로 인해 엔지니어링 인력의 80%가 역량 향상을 경험할 것이라고 합니다. 이는 인공지능 기술이 다양한 산업에서 필요로 하는 기술적 요구를 증가시킬 것임을 시사합니다. 따라서 인공지능 관련 분야에서의 취업 전망은 긍정적이며, 특히 AI 기술을 활용할 수 있는 인재에 대한 수요가 늘어날 것으로 보입니다.
