In [12]:
# 04_retrieval_qa.ipynb: 질의응답 구현
from langchain.embeddings.openai import OpenAIEmbeddings

from langchain.chains import RetrievalQA
from langchain.llms import OpenAI
from langchain.vectorstores import FAISS
from langchain.prompts import PromptTemplate
import os
from dotenv import load_dotenv

# 단계 1: 환경 변수 로드
load_dotenv()
OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")

# 단계 2: 벡터스토어 로드
embeddings = OpenAIEmbeddings(openai_api_key=OPENAI_API_KEY)

# 'allow_dangerous_deserialization=True' 옵션 추가
vectorstore = FAISS.load_local("faiss_index", embeddings, allow_dangerous_deserialization=True)

print("✅ 벡터스토어가 성공적으로 로드되었습니다!")


# 단계 3: RetrievalQA 체인 설정
llm = OpenAI(openai_api_key=OPENAI_API_KEY, temperature=0)

# 사용자 지정 프롬프트 추가 (필요 시)
custom_prompt = PromptTemplate(
    input_variables=["context", "question"],
    template="다음 문맥을 바탕으로 질문에 답하세요.\n\n문맥:\n{context}\n\n질문:\n{question}\n\n답변:"
)

qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    retriever=vectorstore.as_retriever(),
    chain_type="stuff",
    return_source_documents=True  # 검색된 문서도 반환
)

# 단계 4: 질의응답 테스트
query = "자존감에 대한 실험집단 학생들의 프로그램 사전, 사후 응답 차이를 확인하기 위해 뭘 사용했지?"
result = qa_chain({"query": query})

# 결과 출력
print("🎯 답변:")
print(result["result"])

# 선택적으로 검색된 문서 확인
print("\n🔍 검색된 문서:")
for doc in result["source_documents"]:
    print(doc.page_content)


✅ 벡터스토어가 성공적으로 로드되었습니다!
🎯 답변:
 대응표본 t검정을 사용했다.

🔍 검색된 문서:
- 7 -
검증 단계평균차이유의확률분석방법보고서 제시단계3 O2-O4 표 작성
라) 결과 제시 및 해석 방법(논문 및 보고서 기술양식)<표 1> 실험집단의 자존감 사전-사후 평균 차이집단N M(평균) SD(표준편차) t p자존감사전152.85.612-2.896*.012사후153.23.597*p<.05 **<.01, ***<.001⇒ 자존감에 대한 실험집단 학생들의 프로그램 사전, 사후 응답 차이를 확인하기 위해 대응표본 t검정을 실시하였다. 분석결과, 사전자존감은 2.85점이었으나 사후자존감은 3.23점으로 약 0.48점 통계적 유의수준에서 향상된 것으로 확인되었다(t=-2.896, p=.012). 따라서 자존감에 대한 학생들의 응답점수가 사전보다 사후에 유의하게 증가하였다고 할 수 있다. 즉, 프로그램은 학생들의 자존감을 증진시키는 데에 효과적으로 기여하였음을 알 수 있다. 3) SPSS 산출방법 : (    )표본 t 검정 (연습문제)
두 집단 차이연구를 위한 통계분석 : t검증편  ■■■
- 10 -
□ 연구문제 : 체력증진 프로그램을 적용하기 전후 학생들의 체력에 차이가 있는가?독립변인(수) 종속변인(수) 독립변인척도(수준/두 표본/두 집단) 종속변인척도                 (            )□ 영가설(기각가설) : □ 대립가설(채택가설) :□ 통계분석방법 : t검증(대응표본 t검증) ▶ 대응표본 t검증 목적: 상호 독립적으로 구성되지 않은 두 표본(사전-사후)의 평균차이 검증□ SPSS 활용방법 ▶ 산출순서(성태제 data 활용, p132 참조)분석⇒평균비교⇒대응표본 t검증 Click⇒대응변수란에 비교하고자 하는 대응변수(사전체력-사후체력) 투입⇒ 확인 Click▶ output 결과 및 해석
라) 결과 제시 및 해석 방법(논문 및 보고서 기술양식)<표 1> 집단(통제집단과 실험집단)의 자존감과 내적통제성 사전평균 차이집단N M(평균)