### Module

In [1]:
import os
from glob import glob
from langchain_community.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain.chains import RetrievalQA
from langchain_community.vectorstores import Chroma
from dotenv import load_dotenv
load_dotenv()

import textwrap
from IPython.display import display
from IPython.display import Markdown


def to_markdown(text):
  text = text.replace('•', '  *')
  return Markdown(textwrap.indent(text, '> ', predicate=lambda _: True))

# Initialize variables
documents = []
OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")

# Define the directory containing the PDF files
pdf_directory = './data'

자료를 벡터 db에 넣기

### 수강신청 웹크롤링

In [2]:
#https://web.kangnam.ac.kr/menu/f19069e6134f8f8aa7f689a4a675e66f.do?paginationInfo.currentPageNo=1&searchMenuSeq=0&searchType=ttl&searchValue=%EC%88%98%EA%B0%95

#### 웹크롤링 pdf 다운로더(폐기)

In [17]:
import requests
from bs4 import BeautifulSoup
import os

# 웹페이지 URL 입력
url = 'https://web.kangnam.ac.kr/menu/fd8c126ac0e81458620beb18302bc271.do'

# HTTP 요청을 보내 웹페이지 HTML 가져오기
response = requests.get(url)
response.raise_for_status()  # 요청이 성공했는지 확인

# BeautifulSoup을 사용하여 HTML 파싱
soup = BeautifulSoup(response.content, 'html.parser')

# 모든 PDF 링크 찾기
pdf_links = soup.find_all('a', href=lambda href: href and href.endswith('.pdf'))

# PDF 파일을 저장할 디렉토리 생성
os.makedirs('pdf_files', exist_ok=True)

# 각 PDF 파일을 다운로드하여 저장
for link in pdf_links:
    pdf_url = link['href']
    if not pdf_url.startswith('http'):  # 상대 경로인 경우
        pdf_url = url + pdf_url
    pdf_response = requests.get(pdf_url)
    pdf_response.raise_for_status()
    
    # 파일 이름 추출
    pdf_filename = os.path.join('pdf_files', pdf_url.split('/')[-1])
    
    # PDF 파일 저장
    with open(pdf_filename, 'wb') as pdf_file:
        pdf_file.write(pdf_response.content)
    
    print(f'Downloaded: {pdf_filename}')

print('All PDFs have been downloaded.')


All PDFs have been downloaded.


#### json(다중 링크) 형태 폐기

In [9]:
import json
import os

# JSON 파일이 저장된 디렉토리 경로
json_directory = './data/web_crawling_links'
json_file = 'cources.json'

# JSON 파일에서 URL과 제목 리스트 추출
def get_url_title_pairs_from_json(directory, filename):
    file_path = os.path.join(directory, filename)
    with open(file_path, 'r', encoding='utf-8') as file:
        data = json.load(file)
        url_title_pairs = [(url, title) for category in data.values() for title, url in category.items()]
    return url_title_pairs

# URL과 제목 리스트 생성
url_title_pairs = get_url_title_pairs_from_json(json_directory, json_file)


#### crawling(text)

In [19]:
import json
import os
import requests
from bs4 import BeautifulSoup

# JSON 파일이 저장된 디렉토리 경로
json_directory = './data/web_crawling_links'
json_file_paths = ['cources.json', 'college.json']

# JSON 파일에서 URL과 제목 리스트 추출
def get_url_title_pairs_from_json(directory, filenames):
    url_title_pairs = []
    for filename in filenames:
        file_path = os.path.join(directory, filename)
        with open(file_path, 'r', encoding='utf-8') as file:
            data = json.load(file)
            url_title_pairs.extend(extract_url_title_pairs(data))
    return url_title_pairs

def extract_url_title_pairs(data, parent_key=''):
    url_title_pairs = []
    if isinstance(data, dict):
        for key, value in data.items():
            new_key = f"{parent_key}_{key}" if parent_key else key
            if isinstance(value, dict):
                url_title_pairs.extend(extract_url_title_pairs(value, new_key))
            elif isinstance(value, str) and value.startswith("http"):
                url_title_pairs.append((value, new_key))
    return url_title_pairs

# 텍스트 파일을 저장할 디렉토리 경로
text_directory = './crawled_texts'
os.makedirs(text_directory, exist_ok=True)

# URL을 크롤링하여 텍스트를 추출하는 함수
def crawl_url(url):
    try:
        response = requests.get(url)
        response.raise_for_status()  # 요청에 실패하면 예외를 발생시킴
        soup = BeautifulSoup(response.text, 'html.parser')
        return soup.get_text()
    except requests.RequestException as e:
        print(f"Error fetching {url}: {e}")
        return None

# 특정 문자열 제거 함수
def remove_unwanted_text(text, unwanted_texts):
    for unwanted in unwanted_texts:
        text = text.replace(unwanted, '')
    return text

# 텍스트 파일로 저장하는 함수
def save_to_text_file(data, filename):
    file_path = os.path.join(text_directory, filename)
    with open(file_path, 'w', encoding='utf-8') as file:
        file.write(data)
    print(f"Successfully saved {filename}")

# URL을 크롤링하고 텍스트 파일로 저장
url_title_pairs = get_url_title_pairs_from_json(json_directory, json_file_paths)
print(f"Extracted URL and Title pairs: {url_title_pairs}")

unwanted_texts = [
    "경기도 용인시 기흥구 강남로 40(구갈동) 우(16979), 대표전화 : 031-280-3114, 031-280-3500, 팩스번호 : 031-280-3173Copyright ⓒ2019 Kangnam University. All right reserved.",
    "강남대학교","""
     홈페이지주메뉴주요컨텐츠언어선택아이콘LANGUAGEKOREANENGLISHCHINESESNS선택 아이콘SNS로그인사이트맵통합검색창버튼
			메뉴 열기
			
			
					로그인후 이용해주세요.
				메뉴닫기LOGIN전체메뉴대학소개About Kangnam univ대학소개
												푸른비전, 그리고 열정이 숨쉬는 바로 입니다.
											총장실
총장인사말
총장프로필
총장메세지
경영철학
역대총장학교연혁
창학이념
발자취강남비전
인재상
강남 NEW VISION 2025+학교현황
예결산공고
등록금심의위원회
대학평의원회
규정집
대학요람
대학자체평가
업무추진비학교법인
학교법인
이사회 회의록
이사회 개최강남상징
상징물
로고 및 UI
70주년 엠블렘
교가대학기구
조직도
통합전화번호부
교직원검색메뉴닫힘버튼대학About Kangnam univ대학소개
												푸른비전, 그리고 열정이 숨쉬는 바로 입니다.
											단과대학 안내
단과대학 및 학부(과)·전공 안내복지융합대학사회복지학부
실버산업학과
유니버설아트디자인학과
스포츠복지학과
음악학과경영관리대학글로벌경영학부정경학부글로벌인재대학글로벌문화학부공과대학ICT융합공학부부동산건설학부사범대학
교육학과
유아교육과
초등특수교육과
중등특수교육과KNU참인재대학KNU참인재대학융복합전공융복합전공학부(과) 개편
2023학년도
2022학년도
2021학년도
2017 ~ 2020학년도
2016학년도메뉴닫힘버튼대학원About Kangnam univ대학소개
												푸른비전, 그리고 열정이 숨쉬는 바로 입니다.
											대학원메뉴닫힘버튼학사안내About Kangnam univ대학소개
												푸른비전, 그리고 열정이 숨쉬는 바로 입니다.
											학사일정
학부 학사일정등록
등록안내
등록금반환학사
수업
학점교류
전공
다전공
휴복학
졸업
학적
전자출결시스템
증명서 발급
강의계획서교직안내
교직안내병무
학생병사
예비군
ROTC창업교육안내
창업교육과정
창업대체학점인증제
창업인증제
창업휴학대학생활안내
가이드 및 편람
교양권장도서 100권메뉴닫힘버튼교육혁신About Kangnam univ대학소개
												푸른비전, 그리고 열정이 숨쉬는 바로 입니다.
											대학교육혁신단
교육혁신센터(대학혁신지원사업)
교육성과센터
교수학습지원센터지원 시스템
KNU 참인재 시스템
이러닝 캠퍼스
e-포트폴리오비교과 프로그램
창의융합교육센터
대학일자리플러스센터
마음나눔센터
대외교류센터
중앙도서관비교과 프로그램
글로컬사회공헌센터
장애학생지원센터
미래복지융복합연구소메뉴닫힘버튼대학생활About Kangnam univ대학소개
												푸른비전, 그리고 열정이 숨쉬는 바로 입니다.
											장학·학자금대출
교내장학금
교외장학금
국가장학금
학자금대출장학금FAQ
교내
교외후생기관
후생기관IT서비스
메일서비스
무선랜(WI-FI)
Microsoft 365(Office)
windows
홈페이지 이용안내
그룹웨어 서비스

통합로그인동아리활동동아리활동상담/심리검사상담/심리검사캠퍼스안내
찾아오시는길
캠퍼스맵
무료셔틀 이용안내기타
개인정보처리방침
사이트맵총학생회
소개
활동
편의정보메뉴닫힘버튼강남광장About Kangnam univ대학소개
												푸른비전, 그리고 열정이 숨쉬는 바로 입니다.
											공지사항공지사항행사/안내행사/안내강남소식
강남뉴스
언론뉴스
강남학보
영문학보후원/기부
대학발전기금Q & AQ & A커뮤니티
자유게시판
칭찬합시다
벼룩시장
분실/습득물신고공익제보(청렴소리함)공익제보(청렴소리함)고충상담고충상담
부정청탁신고부정청탁신고메뉴닫힘버튼입학안내About Kangnam univ대학소개
												푸른비전, 그리고 열정이 숨쉬는 바로 입니다.
											입학안내메뉴닫힘버튼참인재 시스템이러닝캠퍼스중앙도서관메일캠퍼스맵통합검색창버튼information services기타서비스세계화의 뉴리더 당신의 ‘푸른꿈’이 아름답습니다.HOME학사안내학사다전공학사학사일정학부 학사일정등록등록안내등록금반환학사수업학점교류전공다전공휴복학졸업학적전자출결시스템증명서 발급강의계획서교직안내교직안내병무학생병사예비군ROTC창업교육안내창업교육과정창업대체학점인증제창업인증제창업휴학대학생활안내가이드 및 편람
교양권장도서 100권
"""
]

for url, title in url_title_pairs:
    print(f"Crawling URL: {url}")
    text = crawl_url(url)
    if text:
        # 특정 문자열 제거
        text = remove_unwanted_text(text, unwanted_texts)
        # 파일명 생성 (제목을 파일명으로 사용, 특수문자 제거)
        file_name = f"{title}.txt".replace('/', '_').replace('\\', '_').replace(':', '_').replace('*', '_').replace('?', '_').replace('"', '_').replace('<', '_').replace('>', '_').replace('|', '_')
        save_to_text_file(text, file_name)
    else:
        print(f"Failed to crawl URL: {url}")


Extracted URL and Title pairs: [('https://web.kangnam.ac.kr/menu/fd8c126ac0e81458620beb18302bc271.do?encMenuSeq=a5a508e7e77c5c739b990f33188efdac', '수강_강의계획서'), ('https://web.kangnam.ac.kr/menu/fd8c126ac0e81458620beb18302bc271.do?encMenuSeq=0eb6196506a4fcd8504a16f2fdcfb011', '수강_수강신청'), ('https://web.kangnam.ac.kr/menu/fd8c126ac0e81458620beb18302bc271.do?encMenuSeq=2c831137273abadb3d773098e872f607', '수강_계절수업'), ('https://web.kangnam.ac.kr/menu/fd8c126ac0e81458620beb18302bc271.do?encMenuSeq=d2fca573c753f30f9ae5c79dd740bdcd', '수강_재수강'), ('https://web.kangnam.ac.kr/menu/fd8c126ac0e81458620beb18302bc271.do?encMenuSeq=0c1a4788f43e44817e2cb11ffca2a77d', '수강_결석조치'), ('https://web.kangnam.ac.kr/menu/fd8c126ac0e81458620beb18302bc271.do?encMenuSeq=84ac874658806a5357608340a8314f99', '수강_시험및 성적'), ('https://web.kangnam.ac.kr/menu/fd8c126ac0e81458620beb18302bc271.do?encMenuSeq=3ec4afcce75af2be4d1b20761583c7e0', '수강_학사경고'), ('https://web.kangnam.ac.kr/menu/fd8c126ac0e81458620beb18302bc271.do?encMenuS

#### crawling(pdf)

In [33]:
import pdfcrowd
import sys
import os
import json

# JSON 파일이 저장된 디렉토리 경로
json_directory = './data/web_crawling_links'
json_file_paths = ['cources.json', 'college.json']

# JSON 파일에서 URL과 제목 리스트 추출
def get_url_title_pairs_from_json(directory, filenames):
    url_title_pairs = []
    for filename in filenames:
        file_path = os.path.join(directory, filename)
        with open(file_path, 'r', encoding='utf-8') as file:
            data = json.load(file)
            url_title_pairs.extend(extract_url_title_pairs(data))
    return url_title_pairs

def extract_url_title_pairs(data, parent_key=''):
    url_title_pairs = []
    if isinstance(data, dict):
        for key, value in data.items():
            new_key = f"{parent_key}_{key}" if parent_key else key
            if isinstance(value, dict):
                url_title_pairs.extend(extract_url_title_pairs(value, new_key))
            elif isinstance(value, str) and value.startswith("http"):
                url_title_pairs.append((value, new_key))
    return url_title_pairs

# URL 목록을 PDF로 변환하여 저장
# URL 목록을 PDF로 변환하여 저장
def convert_urls_to_pdf(url_title_pairs, output_filename):
    """
    URL 목록을 PDF로 변환하여 저장하는 함수

    Parameters:
    url_title_pairs (list of tuples): (URL, 제목) 쌍들의 목록
    output_filename (str): 저장할 PDF 파일명
    """
    try:
        # pdfcrowd 클라이언트 생성 (demo 계정 사용)
        client = pdfcrowd.HtmlToPdfClient('demo', 'ce544b6ea52a5621fb9d55f8b542d14d')
        
        # 각 URL을 개별 PDF로 저장
        for index, (url, title) in enumerate(url_title_pairs):
            temp_filename = f"./crawled_pdfs/{title}.pdf"
            client.convertUrlToFile(url, temp_filename)
            print(f"URL {index + 1} 변환 완료: {url} (제목: {title})")

        # # 개별 PDF 파일을 하나의 PDF 파일로 합치기
        # with open(output_filename, 'wb') as final_output:
        #     for index in range(len(url_title_pairs)):
        #         temp_filename = f"temp_{index}.pdf"
        #         with open(temp_filename, 'rb') as temp_file:
        #             final_output.write(temp_file.read())
        #         os.remove(temp_filename)  # 임시 파일 삭제

        # print(f"모든 URL이 '{output_filename}'로 저장되었습니다.")

    except pdfcrowd.Error as why:
        sys.stderr.write(f'Pdfcrowd Error: {why}\n')
        raise


# 텍스트 파일을 저장할 디렉토리 경로
text_directory = './crawled_texts'
os.makedirs(text_directory, exist_ok=True)

# JSON 파일에서 URL과 제목 리스트 추출
url_title_pairs = get_url_title_pairs_from_json(json_directory, json_file_paths)

# URL들을 PDF로 변환 및 저장
convert_urls_to_pdf(url_title_pairs, 'merged_urls.pdf')





URL 1 변환 완료: https://web.kangnam.ac.kr/menu/fd8c126ac0e81458620beb18302bc271.do?encMenuSeq=a5a508e7e77c5c739b990f33188efdac (제목: 수강_강의계획서)
URL 2 변환 완료: https://web.kangnam.ac.kr/menu/fd8c126ac0e81458620beb18302bc271.do?encMenuSeq=0eb6196506a4fcd8504a16f2fdcfb011 (제목: 수강_수강신청)
URL 3 변환 완료: https://web.kangnam.ac.kr/menu/fd8c126ac0e81458620beb18302bc271.do?encMenuSeq=2c831137273abadb3d773098e872f607 (제목: 수강_계절수업)
URL 4 변환 완료: https://web.kangnam.ac.kr/menu/fd8c126ac0e81458620beb18302bc271.do?encMenuSeq=d2fca573c753f30f9ae5c79dd740bdcd (제목: 수강_재수강)
URL 5 변환 완료: https://web.kangnam.ac.kr/menu/fd8c126ac0e81458620beb18302bc271.do?encMenuSeq=0c1a4788f43e44817e2cb11ffca2a77d (제목: 수강_결석조치)
URL 6 변환 완료: https://web.kangnam.ac.kr/menu/fd8c126ac0e81458620beb18302bc271.do?encMenuSeq=84ac874658806a5357608340a8314f99 (제목: 수강_시험및 성적)
URL 7 변환 완료: https://web.kangnam.ac.kr/menu/fd8c126ac0e81458620beb18302bc271.do?encMenuSeq=3ec4afcce75af2be4d1b20761583c7e0 (제목: 수강_학사경고)
URL 8 변환 완료: https://web.kangnam

### Embedding

In [2]:
from langchain_community.document_loaders import PyPDFLoader
from langchain_openai import OpenAIEmbeddings
from langchain_community.vectorstores import Chroma
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain.schema import Document
import os
from glob import glob

# PDF와 텍스트 파일을 모두 로드할 디렉토리 경로
pdf_directory = "./data/roadmap"
text_directory = "./crawled_texts"

# PDF 파일들을 로드하여 분할한 뒤 텍스트를 벡터로 변환하여 DB에 저장
def load_and_index_documents(pdf_directory, text_directory):
    documents = []
    print("start to load pdfs.")
    # PDF 파일들을 로드하여 분할
    pdf_files = glob(os.path.join(pdf_directory, '*.pdf'))
    for pdf_file in pdf_files:
        loader = PyPDFLoader(pdf_file)
        pdf_documents = loader.load()
        documents.extend(pdf_documents)
    print("start to load txts.")
    # 텍스트 파일들을 로드하여 분할
    text_files = glob(os.path.join(text_directory, '*.txt'))
    for text_file in text_files:
        with open(text_file, 'r', encoding='utf-8') as file:
            text = file.read()
            # 텍스트를 Document 객체로 변환
            text_document = Document(page_content=text, metadata={"source": text_file})
            documents.append(text_document)
    print("finished pdfs and txts loading.")
    # 분할된 텍스트를 벡터로 변환하여 ChromaDB에 저장
    chunk_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
    chunks = chunk_splitter.split_documents(documents)
    print("start to embedding data.")
    embeddings = OpenAIEmbeddings(api_key=OPENAI_API_KEY)
    vectordb = Chroma.from_documents(documents=chunks, embedding=embeddings)
    retriever = vectordb.as_retriever()
    
    return retriever

# Load and index documents from both PDF and text files
retriever = load_and_index_documents(pdf_directory, text_directory)


start to load pdfs.
start to load txts.
finished pdfs and txts loading.
start to embedding data.


#### roadmap data

In [12]:
from langchain_community.document_loaders import PyPDFLoader
from langchain_openai import OpenAIEmbeddings
from langchain_community.vectorstores import Chroma
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain.schema import Document
import os
from glob import glob

# PDF와 파일을 모두 로드할 디렉토리 경로
pdf_directory = "./data/roadmap"

# PDF 파일들을 로드하여 분할한 뒤 텍스트를 벡터로 변환하여 DB에 저장
def load_and_index_documents(pdf_directory):
    documents = []
    print("start to load pdfs.")
    # PDF 파일들을 로드하여 분할
    pdf_files = glob(os.path.join(pdf_directory, '*.pdf'))
    for pdf_file in pdf_files:
        loader = PyPDFLoader(pdf_file)
        pdf_documents = loader.load()
        documents.extend(pdf_documents)

    # 분할된 텍스트를 벡터로 변환하여 ChromaDB에 저장
    chunk_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
    chunks = chunk_splitter.split_documents(documents)
    print("start to embedding data.")
    embeddings = OpenAIEmbeddings(api_key=OPENAI_API_KEY)
    vectordb = Chroma.from_documents(documents=chunks, embedding=embeddings)
    retriever = vectordb.as_retriever()
    
    return retriever

# Load and index documents from both PDF and text files
retriever = load_and_index_documents(pdf_directory)


start to load pdfs.
start to embedding data.


### 프롬프트

In [20]:
SYS_PROMPT = """
    너는 강남대학교 공과대학 학생들의 학습로드맵과 관련된 질문에 성실하게 답변해주는 학사지원 인공지능 챗봇이야.
    {context}를 반드시 충분히 이해하고 여기에서 설명해야해. 잘하면 10달러를 줄게.
    공과대학(인공지능융합공학부, 부동산건설학부, ICT융합공학부)
    주전공에서 전기는 전공 기초고 전선은 전공 선택이야. 
    복수전공은 복기라고 된것과 복수 라고된것이 있어.


    교과목 해설 시에는 학기별(1-1학기,2-2학기 등으로 표시)로 과목과 함꼐 표 형태로 출력해줘
    '로드맵', '진출분야', '진로' 에 관해서 언급할 때는 
    사용자의 질문 중 '0000 전공'이라는 글이 입력되면 0000에 해당하는 전공에 대한 정보만 알려줘야해
    출력 양식은 다음과 같아

### 0000전공 학습로드맵 
    
#### 진출분야 및 학습로드맵
>| 진로 | 000000 |
>    |---|---| ---|
>    | 정의| ...을 가능하게 하는 지식 ... 능력 |
>    | 기대결과 | ...해서 ...할 수 있음 |
>    | 주요직무 | ...대한 평가 ...대한 업무 |
>    | 진출분야 | ...회사, ... 업종, ..., ...|
>    
    
#### 학기별 교과목 로드맵
> | 학기 | 교과목 |
> |---|---|
> | 1-1학기 | ....,.... |
> | 1-2학기 | ....,.... |
> | 2-1학기 | ....,.... |
> | 2-2학기 | ....,.... |
> | 3-1학기 | ....,.... |
> | 3-2학기 | ....,.... |
> | 4-1학기 | ....,.... |
> | 4-2학기 | ....,.... |
> 
>
> 
> 다른 전공이나 추가적인 정보가 필요하시면 언제든지 질문해주세요!
"""

INPUT_PROMPT = f"""
위의 질문에 충실하게 대답해줘. 잘하면 10달러 줄게. \\
"""

모델 선언

In [22]:
# 필요한 라이브러리 및 모듈을 임포트합니다.
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser

# 프롬프트 템플릿을 정의합니다.
# SYS_PROMPT는 시스템 메시지로, 템플릿에 포함됩니다. 
# {context}와 {question}은 실행 시 동적으로 채워질 자리표시자입니다.
template = SYS_PROMPT + '''
1.강남대학교 AI로드맵을 위한 참고 자료입니다. 다음 db를 충실히 따라주세요.:{context}
2.사용자 입력 메세지에 잘 따라줘야해 다른 언급하지 않은 정보 출력하지마. : {question}
'''

# ChatPromptTemplate.from_template() 메서드를 사용하여 프롬프트 템플릿을 생성합니다.
prompt = ChatPromptTemplate.from_template(template)

# ChatOpenAI 인스턴스를 생성하여 LLM (대규모 언어 모델)을 설정합니다.
# 여기서는 'gpt-4o' 모델을 사용하고, temperature는 0으로 설정하여 출력의 일관성을 높입니다.
model = ChatOpenAI(model='gpt-4o', temperature=0)

# 문서들을 형식화하는 함수를 정의합니다.
# 각 문서의 페이지 내용을 합쳐 하나의 문자열로 반환합니다.
def format_docs(docs):
    return '\n\n'.join(doc.page_content for doc in docs)

# RAG (Retrieval-Augmented Generation) 체인을 연결합니다.
# 이 체인은 문서 검색, 형식화, 프롬프트 적용, 모델 호출, 출력 파싱의 과정을 거칩니다.
rag_chain = (
    {'context': retriever | format_docs, 'question': RunnablePassthrough()}  # 'context'는 retriever와 format_docs를 통해 설정되고, 'question'은 그대로 전달됩니다.
    | prompt  # 프롬프트 템플릿을 적용합니다.
    | model  # 모델을 호출합니다.
    | StrOutputParser()  # 출력 파서를 통해 모델의 출력을 문자열로 변환합니다.
)

# 체인을 실행합니다.
# 입력 메시지는 질문과 답변 형식의 텍스트입니다.
input_message =  """
건축공학 전공 학생은 어떻게 해야해?
"""+INPUT_PROMPT  # 추가적인 입력 프롬프트가 이어집니다.

# to_markdown() 함수를 호출하여 체인의 결과를 마크다운 형식으로 변환합니다.
to_markdown(rag_chain.invoke(input_message))


> ### 건축공학 전공 학습로드맵
> 
> #### 진출분야 및 학습로드맵
> | 진로 | 건축공학 |
> |---|---|
> | 정의 | 건축물의 설계, 시공, 유지보수 등을 가능하게 하는 지식과 기술을 습득 |
> | 기대결과 | 건축물의 구조적 안정성, 기능성, 미적 요소를 고려하여 설계 및 시공할 수 있음 |
> | 주요직무 | 건축 설계, 시공 관리, 건축물 평가 및 유지보수 |
> | 진출분야 | 건설회사, 건축설계사무소, 공공기관, 연구소, 학계 |
> 
> #### 학기별 교과목 로드맵
> > | 학기 | 교과목 |
> > |---|---|
> > | 1-1학기 | 기초수학, 기초물리, 건축개론, 컴퓨터활용 |
> > | 1-2학기 | 미적분학, 일반물리, 건축재료학, CAD |
> > | 2-1학기 | 구조역학, 건축설계1, 건축환경공학, 건축법규 |
> > | 2-2학기 | 철근콘크리트구조, 건축설계2, 건축시공학, 건축설비 |
> > | 3-1학기 | 강구조, 건축설계3, 건축구조해석, 건축계획 |
> > | 3-2학기 | 건축설계4, 건축시공관리, 건축재료실험, 건축경제 |
> > | 4-1학기 | 건축설계5, 건축구조설계, 건축법규응용, 건축환경설계 |
> > | 4-2학기 | 졸업설계, 건축프로젝트관리, 건축기술세미나, 건축실무 |
> 
> 다른 전공이나 추가적인 정보가 필요하시면 언제든지 질문해주세요!