In [11]:
from langchain_community.document_loaders import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain_community.vectorstores import Chroma
from langchain_core.runnables import RunnablePassthrough, RunnableLambda
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from dotenv import load_dotenv
import os
import re

class VectorStoreHeaderWriter:
    def __init__(self, persist_directory: str):
        load_dotenv()

        self.persist_directory = persist_directory
        self.embeddings = OpenAIEmbeddings(model="text-embedding-3-small")

        # self.vectorstore = Chroma(
        #     persist_directory=self.persist_directory,
        #     embedding_function=self.embeddings
        # )

        self.llm = ChatOpenAI(
            model_name="gpt-4.1-mini",
            temperature=0
        )

    def load_pdf_docs(self, file_path: str):
        loader = PyPDFLoader(file_path)
        documents = loader.load()

        return documents

In [13]:
vshw = VectorStoreHeaderWriter(persist_directory="./chroma_db")

sample = vshw.load_pdf_docs("../../source/original_docs/서울시 청년월세지원정책.pdf")

In [15]:
sample[0].page_content = re.sub(r'\n{3,}', '\n\n', sample[0].page_content)
sample[0].page_content = re.sub(r'\s{2,}', ' ', sample[0].page_content)

sample[0].page_content

'- 1 -\n서울특별시 공고 제 호2025-1771년 서울시 청년월세지원 모집 공고2025서울시에서는 서울특별시 청년주거 기본 조례 제 조 에 의거 청년의 주거비 “ 7 ”부담 완화를 위해 다음과 같이 년 서울시 청년월세지원 사업 참여자를 2025 ‘ ’ 모집하오니 많은 참여 바랍니다.년 월 일2025 6 4서 울 특 별 시 장사업 개요1. 사 업 명 년 서울시 청년월세지원 사업: 2025□ 지원대상 신청일 기준 : □ 서울시 월세 거주 세 세 , 19 ~39이하 청년 인 가구1서울시 청년월세지원 기수혜자 및 국토교통부 청년월세 한시 특별지원 수혜 중인 자 ,※ 년 자치구 자체 청년월세지원 사업 은평 광진 등 지원자로 선정된 사람은 지원 불가’25 ( , ) 지원내용□ ㅇ 지원금액 월 최대 : 만원 최대 개월 만원20 ( 12 /240 )\n생애 회1※ 만원 미만 월세 계약은 임대차계약서에 표기된 월세 금액만 지원 천원 단위 절사 20 ( )※ 예시 차임 월세 원은 월 만원 지원) ( ) 108,000 10 / 관리비가 포함된 경우 관리비 제외하고 월세만 지급서울형 주택바우처 수급자인 경우 바우처 수령액을 제외한 차액 지급 , ※ 서울시 청년월세 지원 대상자 최종 선정 후 개월간 지급 12※'

In [14]:
sample[0].page_content

'- 1 -\n서울특별시 공고 제 호2025-1771년 서울시 청년월세지원 모집 공고2025서울시에서는 서울특별시 청년주거 기본 조례 제 조 에 의거 청년의 주거비  “ 7 ”부담 완화를 위해 다음과 같이 년 서울시 청년월세지원 사업 참여자를 2025 ‘ ’ 모집하오니 많은 참여 바랍니다.년 월 일2025 6 4서 울 특 별 시 장사업 개요1. 사 업 명 년 서울시 청년월세지원 사업: 2025□ 지원대상 신청일 기준 : □ 서울시 월세 거주 세 세 , 19 ~39이하 청년 인 가구1서울시 청년월세지원 기수혜자 및 국토교통부 청년월세 한시 특별지원 수혜 중인 자   ,※ 년 자치구 자체 청년월세지원 사업 은평 광진 등 지원자로 선정된 사람은 지원 불가’25 ( , ) 지원내용□  ㅇ 지원금액 월 최대 : 만원 최대 개월 만원20 ( 12 /240 )\n생애 회1※ 만원 미만 월세 계약은 임대차계약서에 표기된 월세 금액만 지원 천원 단위 절사   20 ( )※ 예시 차임 월세 원은 월 만원 지원) ( ) 108,000 10 / 관리비가 포함된 경우 관리비 제외하고 월세만 지급서울형 주택바우처 수급자인 경우 바우처 수령액을 제외한 차액 지급   , ※ 서울시 청년월세 지원 대상자 최종 선정 후 개월간 지급   12※'