## law_1.docx
- pinecone store 저장
    - index name 임의
- RetrievalQA 구현
    - prompt: rlm/rag-prompt
    - 질문: 전세사기


In [1]:
import os

from dotenv import load_dotenv
from langchain import hub
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from langchain_openai import ChatOpenAI, OpenAIEmbeddings
from langchain_pinecone import PineconeVectorStore
from pinecone import Pinecone


## 환경변수 읽어오기########################################
load_dotenv()
PINECONE_API_KEY = os.getenv('PINECONE_API_KEY')
LANCHAIN_API_KEY = os.getenv('LANGCHAIN_API_KEY')

## 벡터 스토어 (데이터베이스)에서 가져오기 #################
## 임베딩 모델 지정
embedding = OpenAIEmbeddings(model='text-embedding-3-large')

pc = Pinecone(api_key=PINECONE_API_KEY)
index_name = 'law1'

## 저장된 인덱스 가져오기
## [방법 2]
database = PineconeVectorStore.from_existing_index(
    index_name=index_name,
    embedding=embedding
)

## RetrievalQA
llm = ChatOpenAI(model='gpt-4o')

prompt = hub.pull('rlm/rag-prompt')

def format_docs(docs):
    return '\n\n'.join(doc.page_content for doc in docs)

qa_chain = (
    {'context': database.as_retriever() | format_docs,
     'question': RunnablePassthrough(),
    }
    | prompt
    | llm
    | StrOutputParser()
)


# qa_chain.invoke('전세사기 피해자 대상을 알려주세요.')
qa_chain.invoke('전세사기 피해자 임대인을 알려주세요.')

  from .autonotebook import tqdm as notebook_tqdm


'전세사기 피해자의 임대인은 전세사기피해자법에서 규정하는 "임대인등"에 포함됩니다. "임대인등"에는 임대인은 물론 그 대리인, 공인중개사, 임차인 모집자, 다수 임대인의 배후 등 여러 유형의 관련자가 포함됩니다. 각 법적 정의에 따라 구체적인 임대인 관련자들이 정의되어 있습니다.'