In [19]:
# 사전 설치 : pip install langchain langchain-community langchain-text-splitters sentence-transformers faiss-cpu
# ollama 설치 : https://ollama.com/download/windows
import os
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from langchain_community.document_loaders import TextLoader
from langchain_community.vectorstores import FAISS
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.llms import Ollama
from langchain_text_splitters import RecursiveCharacterTextSplitter  # 문맥이 가능한 한 유지되도록 청크 분할(문단, 줄바꿈, 공백 등)

In [20]:
# 1. 데이터 로드
loader = TextLoader("./dataset/history.txt", encoding='UTF8')  # 텍스트 파일 로드
documents = loader.load()  # 문서 로드

In [21]:
# 2. 벡터 임베딩 생성 (Hugging Face 사용)
embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
vectorstore = FAISS.from_documents(documents, embeddings)

In [22]:
# 3. 검색기(retriever) 설정
retriever = vectorstore.as_retriever()

In [23]:
# 4. Ollama Gemma2 모델 초기화
llm = Ollama(model="gemma2", base_url="http://localhost:11434")  # Ollama 서버 설정

In [24]:
# 5. RAG 체인 구성 (LCEL 방식)
print("\nRAG 체인 구성 (LCEL 방식)...")

# 5.1. 프롬프트 템플릿 정의
template = """
당신은 질문에 답변하는 AI 어시턴트입니다.
제공된 context만을 바탕으로 질문에 답변하세요. 모르면 모른다고 답하세요.

[Context]
{context}

[Question]
{question}
"""
prompt = ChatPromptTemplate.from_template(template)

# 5.2. LCEL 체인 조합 (RetrievalQA 대체)
rag_chain = (
    {"context": retriever, "question": RunnablePassthrough()}  # 1. 검색
    | prompt                                                   # 2. 프롬프트 조합
    | llm                                                      # 3. LLM 호출
    | StrOutputParser()                                        # 4. 출력 파싱
)


RAG 체인 구성 (LCEL 방식)...


In [25]:
# 6. 질문 실행
print("\nRAG 질의 실행...")
query = "고조선은 언제 설립되었는지 알려줘."
try:
    # invoke()를 사용하여 체인 실행
    response = rag_chain.invoke(query)

    print("\n[질문]:", query)
    print("[답변]:", response)
except Exception as e:
    print(f"RAG 체인 실행 중 오류: {e}")


RAG 질의 실행...

[질문]: 고조선은 언제 설립되었는지 알려줘.
[답변]: 기원전 2333년 단군왕검에 의해 세워졌다고 전해집니다.  



In [1]:
# 사전설치 : pip install langchain langchain-community chromadb sentence-transformers langchain-text-splitters
import os
import shutil  # 오래된 벡터 저장소를 삭제하기 위해 임포트
# RAG 체인 구성에 필요한 핵심 모듈 임포트
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough

# 나머지 모듈 임포트
from langchain_community.document_loaders import TextLoader
from langchain_community.vectorstores import Chroma
from langchain_community.embeddings import SentenceTransformerEmbeddings
from langchain_community.llms import Ollama
from langchain_text_splitters import RecursiveCharacterTextSplitter  # 문맥이 가능한 한 유지되도록 청크 분할(문단, 줄바꿈, 공백 등)

# 1. 설정
# ----------------------------------------------------------------------
# 로드할 .txt 파일 경로 (요청 경로 반영)
TEXT_FILE_PATH = "./dataset/history.txt"
# ChromaDB를 저장할 로컬 디렉토리 경로 (Windows 로컬 PC에 생성됨)
PERSIST_DIRECTORY = "./chroma_store"
OLLAMA_BASE_URL = "http://localhost:11434"
OLLAMA_MODEL_NAME = "gemma2"

  from .autonotebook import tqdm as notebook_tqdm





In [2]:
# 2. 문서 로드 및 청크 분할
print(f"1. '{TEXT_FILE_PATH}' 한글 파일 로드 중...")
try:
    loader = TextLoader(TEXT_FILE_PATH, encoding='UTF8')
    documents = loader.load()
except FileNotFoundError:
    print(f"오류: 파일이 존재하지 않습니다. 경로를 확인하세요: {TEXT_FILE_PATH}")
    exit()
except Exception as e:
    print(f"파일 로드 중 오류 발생: {e}")
    exit()

text_splitter = RecursiveCharacterTextSplitter(
    # 청크 크기를 늘려 더 많은 컨텍스트가 포함되도록 함
    chunk_size=500,
    chunk_overlap=50,
    length_function=len
)
texts = text_splitter.split_documents(documents)
print(f"-> 총 {len(texts)}개의 청크로 분할되었습니다.")

1. './dataset/history.txt' 한글 파일 로드 중...
-> 총 3개의 청크로 분할되었습니다.


In [3]:
# 3. 임베딩 모델 정의
print(f"\n2. 임베딩 모델 정의")
# 한글에 특화된 HuggingFace 임베딩 모델을 로드합니다.
embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")


2. 임베딩 모델 정의


NameError: name 'HuggingFaceEmbeddings' is not defined

In [34]:
# 4. ChromaDB 벡터 저장소 생성
# ----------------------------------------------------------------------
if os.path.exists(PERSIST_DIRECTORY):
    print(f"'{PERSIST_DIRECTORY}' (기존 벡터 저장소) 삭제 중...")
    shutil.rmtree(PERSIST_DIRECTORY)

print(f"\n3. ChromaDB 벡터 저장소 생성 및 '{PERSIST_DIRECTORY}'에 저장 중...")
vectordb = Chroma.from_documents(
    documents=texts,
    embedding=embeddings,
    persist_directory=PERSIST_DIRECTORY
)
vectordb.persist()
print(f"-> 벡터 저장소가 성공적으로 저장되었습니다.")

'./chroma_store' (기존 벡터 저장소) 삭제 중...


PermissionError: [WinError 32] 다른 프로세스가 파일을 사용 중이기 때문에 프로세스가 액세스 할 수 없습니다: './chroma_store\\58a12857-0c80-4e34-be2e-499bb98cb686\\data_level0.bin'

In [None]:
# 5. Ollama LLM 및 검색기(Retriever) 정의
print(f"\n4. Ollama LLM ({OLLAMA_MODEL_NAME}) 및 검색기 초기화 중...")

try:
    llm = Ollama(model=OLLAMA_MODEL_NAME, base_url=OLLAMA_BASE_URL)
    llm.invoke("Hello") # 연결 테스트
    print("-> Ollama LLM 연결 성공.")
except Exception as e:
    print(f"오류: Ollama LLM에 연결할 수 없습니다. (URL: {OLLAMA_BASE_URL})")
    print(f"Ollama가 실행 중인지, '{OLLAMA_MODEL_NAME}' 모델이 설치되었는지 확인하세요.")
    exit()

# 벡터 저장소를 검색기(Retriever)로 변환
retriever = vectordb.as_retriever()


4. Ollama LLM (gemma2) 및 검색기 초기화 중...
-> Ollama LLM 연결 성공.


In [None]:
# 6. RAG 체인 구성 (LCEL 방식)
print("\n5. RAG 체인 구성 (LCEL 방식)...")

template = """
당신은 질문에 답변하는 AI 어시스턴트입니다.
제공된 context만을 바탕으로 질문에 답변하세요. 모르면 모른다고 답하세요.

[Context]
{context}

[Question]
{question}
"""
prompt = ChatPromptTemplate.from_template(template)

rag_chain = (
    {"context": retriever, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)


5. RAG 체인 구성 (LCEL 방식)...


In [None]:
# 7. RAG 체인 실행 (질의)
print("\n6. RAG 질의 실행...")
query = "고조선은 언제 설립되었는지 알려줘."

try:
    response = rag_chain.invoke(query)

    print("\n[질문]:", query)
    print("[답변]:", response)

except Exception as e:
    print(f"RAG 체인 실행 중 오류가 발생했습니다: {e}")


6. RAG 질의 실행...

[질문]: 고조선은 언제 설립되었는지 알려줘.
[답변]: 고조선은 기원전 2333년에 설립되었다고 전해집니다.  



In [None]:
# 사전 chroma 서버 구동 명령어(터미널) :  chroma run --host 0.0.0.0 --port 8000 --path ./chroma_store
import time
from langchain_community.vectorstores import Chroma
from langchain_community.embeddings import SentenceTransformerEmbeddings
from langchain_community.llms import Ollama
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from chromadb import HttpClient   # HttpClient: 원격 ChromaDB 서버와 통신하기 위한 클라이언트 클래스

In [None]:
# 1. 중앙 벡터 DB 서버 정보 (관리자가 알려준 IP 입력)
SERVER_HOST = "localhost"  # 실제 서버 IP로 변경 필요
SERVER_PORT = 8000

# 2. 로컬 LLM 설정 (각자 로컬에 설치된 Ollama 사용)
OLLAMA_BASE_URL = "http://localhost:11434"
OLLAMA_MODEL = "gemma2"

In [None]:
# 1. 중앙 벡터 DB 서버 연결 테스트
print(f"[접속 시도] 중앙 벡터 서버 ({SERVER_HOST}:{SERVER_PORT}) 연결 중...")
try:
    client = HttpClient(host=SERVER_HOST, port=SERVER_PORT)
    client.heartbeat()  # 연결 확인
    print("-> 서버 연결 성공!")
except Exception as e:
    print(f"\n[오류] 서버 연결 실패. IP({SERVER_HOST})와 포트({SERVER_PORT})를 확인하세요.\n{e}")
    raise

[접속 시도] 중앙 벡터 서버 (localhost:8000) 연결 중...
-> 서버 연결 성공!


In [None]:
# 2. 임베딩 모델 정의 (벡터 DB 생성 시 사용한 모델과 동일해야 함)
embeddings = SentenceTransformerEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")

In [None]:
# 3. 원격 벡터 저장소 연결
vector_store = Chroma(
    client=client,
    collection_name="langchain",  # 최초 벡터저장소 collection_name 미지정시 "langchain" 이름의 컬렉션이 자동 저장됨
    embedding_function=embeddings,
)
retriever = vector_store.as_retriever()
print("벡터 저장소 연결 완료!")

In [None]:
# 4. LLM 및 RAG 체인 구성
llm = Ollama(model=OLLAMA_MODEL, base_url=OLLAMA_BASE_URL)

template = """질문에 대해 제공된 Context만을 기반으로 답변하세요.
Context: {context}
Question: {question}
Answer:"""
prompt = ChatPromptTemplate.from_template(template)

rag_chain = (
    {"context": retriever, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

In [None]:
# 5. 질의 응답 인터랙티브 루프 (종료: exit)
print("\n[준비 완료] 질의를 시작합니다. (종료하려면 'exit' 입력)")

while True:
    query = input("\n질문 입력 > ")
    if query.lower() in ["exit", "quit", "종료"]:
        print("질의 세션을 종료합니다.")
        break
    if not query.strip():
        continue

    start_time = time.time()
    print("답변 생성 중...", end="", flush=True)
    try:
        response = rag_chain.invoke(query)
        elapsed = time.time() - start_time
        print(f"\r[답변] ({elapsed:.2f}초 소요)\n{response}\n")
    except Exception as e:
        print(f"\n[오류 발생] {e}")

In [4]:
from langchain_community.chat_message_histories import SQLChatMessageHistory

In [6]:
chat_message_history = SQLChatMessageHistory(
    session_id = "sql_chat_history",
    connection_string = "mysql+pymysql://root:123456@localhost:3306/test"
)

In [7]:
chat_message_history.add_user_message(
    "안녕. 나는 영준이야. 직업은 웹프로그래머이고 만나서 반가워!"
)

In [8]:
chat_message_history.add_user_message(
    "요즘 날씨가 추운데 건강 조심하고 즐거운 하루 보내!"
)

In [9]:
chat_message_history.messages

[HumanMessage(content='안녕. 나는 영준이야. 직업은 웹프로그래머이고 만나서 반가워!', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='요즘 날씨가 추운데 건강 조심하고 즐거운 하루 보내!', additional_kwargs={}, response_metadata={})]