In [215]:
from langchain.document_loaders import UnstructuredFileLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain.embeddings import OpenAIEmbeddings, CacheBackedEmbeddings
from langchain.vectorstores import FAISS
from langchain.storage import LocalFileStore
from langchain.chains import RetrievalQA
from langchain.chat_models import ChatOpenAI

cache_dir = LocalFileStore("./.cache/")
llm = ChatOpenAI(temperature=0.1)

splitter = CharacterTextSplitter.from_tiktoken_encoder(
    separator="\n", 
    chunk_size=600,
    chunk_overlap=100,
)

embedder = OpenAIEmbeddings()
cached_embedder = CacheBackedEmbeddings.from_bytes_store(embedder, cache_dir)

loarder = UnstructuredFileLoader("./files/novel.txt")
docs = loarder.load_and_split(text_splitter=splitter)
vector_store = FAISS.from_documents(docs, cached_embedder)

result = vector_store.similarity_search("김첨지가 사는 곳을 묘사해주세요")

chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="map_rerank",
    retriever=vector_store.as_retriever() 
)


chain.run("김첨지는 어떤 인물인지 설명해주세요")

[32;1m[1;3m[chain/start][0m [1m[1:chain:RetrievalQA] Entering Chain run with input:
[0m{
  "query": "김첨지는 어떤 인물인지 설명해주세요"
}
[32;1m[1;3m[chain/start][0m [1m[1:chain:RetrievalQA > 3:chain:MapRerankDocumentsChain] Entering Chain run with input:
[0m[inputs]
[32;1m[1;3m[chain/start][0m [1m[1:chain:RetrievalQA > 3:chain:MapRerankDocumentsChain > 4:chain:LLMChain] Entering Chain run with input:
[0m{
  "input_list": [
    {
      "context": "김첨지는 교묘하게도 정말 꾀꼬리 같은 소리를 내었다. 모든 사람은 일시\n에 웃었다.\n“빌어먹을 깍쟁이 같은 년, 누가 저를 어쩌나,   ‘왜 남을 귀찮게 굴어!’\n어이구 소리가 처신도 없지, 허허.”\n웃음 소리들은 높아졌다. 그러나 그 웃음 소리들이 사라도 지기 전에 김첨\n지는 훌쩍훌쩍 울기 시작하였다.\n치삼은 어이없이 주정뱅이를 바라보며,\n“금방 웃고 지랄을 하더니 우는 건 또 무슨 일인가.”\n김첨지는 연해 코를 들이마시며,\n“우리 마누라가 죽었다네.”\n“뭐, 마누라가 죽다니, 언제?”",
      "question": "김첨지는 어떤 인물인지 설명해주세요"
    },
    {
      "context": "류장으로 쏟아져 나왔다. 그 중에서 손님을 물색하는 김첨지의 눈엔 양머리\n에 뒤축 높은 구두를 신고 망토까지 두른 기생 퇴물인 듯 난봉 여학생인 듯\n한 여편네의 모양이 띄었다. 그는 슬근슬근 그 여자의 곁으로 다가들었다.\n“아씨, 인력거 아니 타시랍시요.”\n그 여학생인지 만지가 한참은 매우 때깔을 빼며 입술을 꼭 다문 채 김첨지



[36;1m[1;3m[llm/end][0m [1m[1:chain:RetrievalQA > 3:chain:MapRerankDocumentsChain > 4:chain:LLMChain > 5:llm:ChatOpenAI] [9.71s] Exiting LLM run with output:
[0m{
  "generations": [
    [
      {
        "text": "김첨지는 교묘하게도 꾀꼬리 같은 소리를 내며 사람들을 웃게 만들었지만, 갑자기 울기 시작하는 인물이다. 그의 행동들은 주변 사람들에게 혼란을 주었고, 마누라가 죽었다는 소식을 전하며 더 많은 혼란을 일으켰다.\nScore: 80",
        "generation_info": {
          "finish_reason": "stop"
        },
        "type": "ChatGeneration",
        "message": {
          "lc": 1,
          "type": "constructor",
          "id": [
            "langchain",
            "schema",
            "messages",
            "AIMessage"
          ],
          "kwargs": {
            "content": "김첨지는 교묘하게도 꾀꼬리 같은 소리를 내며 사람들을 웃게 만들었지만, 갑자기 울기 시작하는 인물이다. 그의 행동들은 주변 사람들에게 혼란을 주었고, 마누라가 죽었다는 소식을 전하며 더 많은 혼란을 일으켰다.\nScore: 80",
            "additional_kwargs": {}
          }
        }
      }
    ]
  ],
  "llm_output": {
    "token_usage": {
      "prompt_tokens": 625,
      "completion_tokens"

'김첨지는 교묘하게도 꾀꼬리 같은 소리를 내며 사람들을 웃게 만들었지만, 갑자기 울기 시작하는 인물이다. 그의 행동들은 주변 사람들에게 혼란을 주었고, 마누라가 죽었다는 소식을 전하며 더 많은 혼란을 일으켰다.'