In [1]:
!pip install langchain openai chromadb pymupdf tiktoken

Collecting chromadb
  Downloading chromadb-1.0.6-cp39-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (6.9 kB)
Collecting pymupdf
  Downloading pymupdf-1.25.5-cp39-abi3-manylinux2014_x86_64.manylinux_2_17_x86_64.whl.metadata (3.4 kB)
Collecting tiktoken
  Downloading tiktoken-0.9.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (6.7 kB)
Collecting build>=1.0.3 (from chromadb)
  Downloading build-1.2.2.post1-py3-none-any.whl.metadata (6.5 kB)
Collecting chroma-hnswlib==0.7.6 (from chromadb)
  Downloading chroma_hnswlib-0.7.6-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (252 bytes)
Collecting fastapi==0.115.9 (from chromadb)
  Downloading fastapi-0.115.9-py3-none-any.whl.metadata (27 kB)
Collecting uvicorn>=0.18.3 (from uvicorn[standard]>=0.18.3->chromadb)
  Downloading uvicorn-0.34.2-py3-none-any.whl.metadata (6.5 kB)
Collecting posthog>=2.4.0 (from chromadb)
  Downloading posthog-3.25.0-py2.py3-none-any.whl.metadata (3.0 kB)
Coll

In [4]:
!pip install langchain-community

Collecting langchain-community
  Downloading langchain_community-0.3.22-py3-none-any.whl.metadata (2.4 kB)
Collecting langchain-core<1.0.0,>=0.3.55 (from langchain-community)
  Downloading langchain_core-0.3.55-py3-none-any.whl.metadata (5.9 kB)
Collecting langchain<1.0.0,>=0.3.24 (from langchain-community)
  Downloading langchain-0.3.24-py3-none-any.whl.metadata (7.8 kB)
Collecting dataclasses-json<0.7,>=0.5.7 (from langchain-community)
  Downloading dataclasses_json-0.6.7-py3-none-any.whl.metadata (25 kB)
Collecting pydantic-settings<3.0.0,>=2.4.0 (from langchain-community)
  Downloading pydantic_settings-2.9.1-py3-none-any.whl.metadata (3.8 kB)
Collecting httpx-sse<1.0.0,>=0.4.0 (from langchain-community)
  Downloading httpx_sse-0.4.0-py3-none-any.whl.metadata (9.0 kB)
Collecting marshmallow<4.0.0,>=3.18.0 (from dataclasses-json<0.7,>=0.5.7->langchain-community)
  Downloading marshmallow-3.26.1-py3-none-any.whl.metadata (7.3 kB)
Collecting typing-inspect<1,>=0.4.0 (from dataclasses-

In [5]:
import os
from dotenv import load_dotenv
from langchain.document_loaders import PyMuPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import Chroma
from langchain.chat_models import ChatOpenAI
from langchain.chains import RetrievalQA
from IPython.display import display, Markdown

In [6]:
load_dotenv("secrets.env")
openai_api_key = os.getenv("OPENAI_API_KEY")
assert openai_api_key is not None, "OPENAI_API_KEY가 secrets.env에 없습니다."
os.environ["OPENAI_API_KEY"] = openai_api_key

In [7]:
pdf_url = "https://arxiv.org/pdf/2005.11401.pdf"
!wget -O paper.pdf $pdf_url

loader = PyMuPDFLoader("paper.pdf")
raw_documents = loader.load()

--2025-04-24 15:08:37--  https://arxiv.org/pdf/2005.11401.pdf
Resolving arxiv.org (arxiv.org)... 151.101.131.42, 151.101.67.42, 151.101.3.42, ...
Connecting to arxiv.org (arxiv.org)|151.101.131.42|:443... connected.
HTTP request sent, awaiting response... 301 Moved Permanently
Location: http://arxiv.org/pdf/2005.11401 [following]
--2025-04-24 15:08:37--  http://arxiv.org/pdf/2005.11401
Connecting to arxiv.org (arxiv.org)|151.101.131.42|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 885323 (865K) [application/pdf]
Saving to: ‘paper.pdf’


2025-04-24 15:08:37 (12.7 MB/s) - ‘paper.pdf’ saved [885323/885323]



In [8]:
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=200,
    separators=["\n\n", "\n", ".", " "]
)
documents = text_splitter.split_documents(raw_documents)

In [9]:
embedding = OpenAIEmbeddings()
vectorstore = Chroma.from_documents(documents, embedding=embedding)
retriever = vectorstore.as_retriever(search_kwargs={"k": 4})

  embedding = OpenAIEmbeddings()


In [17]:
retrieved = retriever.get_relevant_documents("summarize the academic paper")
context = "\n\n".join([doc.page_content for doc in retrieved])

  retrieved = retriever.get_relevant_documents("summarize the academic paper")


In [23]:
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

# 🧠 LLM 설정
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0)

# 📝 프롬프트 템플릿 구성
template = """
You are a helpful research assistant.
Here is the content of an academic paper:

{context}

Please summarize the paper in ko-KR with the following structure:
1. Problem Statement
2. Proposed Method
3. Main Results
4. Conclusion and Impact
"""

prompt = PromptTemplate(input_variables=["context"], template=template)

# 🔗 LLMChain으로 연결
chain = LLMChain(llm=llm, prompt=prompt)

# 🚀 실행
result = chain.invoke({"context": context})
display(Markdown(f"### 📝 요약 결과\n\n{result['text']}"))

### 📝 요약 결과

### 1. 문제 진술
이 논문은 BART 모델의 메모리 구조를 탐구하며, 파라메트릭 메모리와 비파라메트릭 메모리가 어떻게 상호작용하여 텍스트 생성을 지원하는지를 조사합니다. 특히, BART가 특정 지식을 어떻게 저장하고 활용하는지를 보여주는 예시를 통해 이론적 근거를 제시합니다.

### 2. 제안된 방법
저자들은 BART 모델을 사용하여 부분적으로 주어진 텍스트를 완성하는 실험을 수행했습니다. 예를 들어, "The Sun"이라는 부분적 디코딩을 입력으로 제공했을 때, BART는 "The Sun Also Rises"라는 소설 제목을 생성합니다. 이 과정에서 비파라메트릭 메모리가 파라메트릭 메모리에서 특정 지식을 끌어내는 데 도움을 주는 방식으로 작동함을 보여줍니다.

### 3. 주요 결과
FEVER 데이터셋을 사용한 3-way 분류 실험에서 RAG 모델은 최첨단 모델들과 비교했을 때 4.3% 이내의 성능을 보였습니다. 이들 최첨단 모델은 복잡한 파이프라인 시스템과 도메인 특화 아키텍처를 필요로 하며, 중간 검색 감독을 통해 훈련됩니다. 반면, RAG는 이러한 감독 없이도 유사한 성능을 달성했습니다.

### 4. 결론 및 영향
이 연구는 BART 모델의 메모리 구조와 텍스트 생성 과정에서의 상호작용을 이해하는 데 기여합니다. 또한, RAG 모델의 성능이 복잡한 시스템 없이도 경쟁력을 가질 수 있음을 보여주어, 향후 AI 모델 개발에 있어 효율성과 단순성을 강조하는 방향으로의 연구를 촉진할 수 있습니다.