In [3]:
%pip install accelerate
%pip install -i https://pypi.org/simple/ bitsandbytes
%pip install transformers[torch] -U

%pip install datasets
%pip install langchain
%pip install langchain_community
%pip install PyMuPDF
%pip install sentence-transformers
%pip install faiss-cpu

Note: you may need to restart the kernel to use updated packages.
Looking in indexes: https://pypi.org/simple/
Note: you may need to restart the kernel to use updated packages.
Collecting transformers[torch]
  Downloading transformers-4.43.4-py3-none-any.whl.metadata (43 kB)
Collecting regex!=2019.12.17 (from transformers[torch])
  Downloading regex-2024.7.24-cp311-cp311-win_amd64.whl.metadata (41 kB)
Collecting tokenizers<0.20,>=0.19 (from transformers[torch])
  Using cached tokenizers-0.19.1-cp311-none-win_amd64.whl.metadata (6.9 kB)
Downloading regex-2024.7.24-cp311-cp311-win_amd64.whl (269 kB)
Using cached tokenizers-0.19.1-cp311-none-win_amd64.whl (2.2 MB)
Downloading transformers-4.43.4-py3-none-any.whl (9.4 MB)
   ---------------------------------------- 0.0/9.4 MB ? eta -:--:--
   ---------------------------------------- 9.4/9.4 MB 65.4 MB/s eta 0:00:00
Installing collected packages: regex, tokenizers, transformers
Successfully installed regex-2024.7.24 tokenizers-0.19.1 transf

In [1]:
import os
import unicodedata
import torch
import pandas as pd
from tqdm import tqdm
import fitz  # PyMuPDF
from transformers import (
    AutoTokenizer,
    AutoModelForCausalLM,
    pipeline,
    BitsAndBytesConfig
)
from accelerate import Accelerator
from peft import LoraConfig, PeftModel
# Langchain 관련
from langchain_community.document_loaders import PDFMinerLoader, PyMuPDFLoader, PDFPlumberLoader
from langchain.llms import HuggingFacePipeline
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.vectorstores import FAISS
from langchain.schema import Document
from langchain.text_splitter import RecursiveCharacterTextSplitter, MarkdownHeaderTextSplitter
from langchain.prompts import PromptTemplate
from langchain.schema.runnable import RunnablePassthrough
from langchain.schema.output_parser import StrOutputParser
from langchain.retrievers import EnsembleRetriever
from langchain_community.retrievers import BM25Retriever
from langchain_community.cross_encoders import HuggingFaceCrossEncoder
from langchain.retrievers.document_compressors import CrossEncoderReranker
from langchain.retrievers import ContextualCompressionRetriever


  from .autonotebook import tqdm as notebook_tqdm


In [2]:
import pymupdf4llm

def process_langchain_pdf(file_path):
    md_text = pymupdf4llm.to_markdown(file_path)
    
    headers_to_split_on = [
        ("#", "Header 1"),
        ("##", "Header 2"),
        ("###", "Header 3"),
    ]

    md_header_splitter = MarkdownHeaderTextSplitter(headers_to_split_on=headers_to_split_on, strip_headers=False)
    md_chunks = md_header_splitter.split_text(md_text)

    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=512, chunk_overlap=128
    )

    splits = text_splitter.split_documents(md_chunks)
    return splits

In [3]:
"""def process_langchain_pdf(file_path):
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size = 512,
        chunk_overlap = 32
    )
    docs = []
    
    loader = PDFPlumberLoader(file_path)
    documents = loader.load_and_split(text_splitter=text_splitter)
    docs.extend(documents)
    return docs

def process_pdf(file_path, chunk_size=324, chunk_overlap=126):
   
    # PDF 파일 열기
    doc = fitz.open(file_path)
    text = ''
    # 모든 페이지의 텍스트 추출
    for page in doc:
        text += page.get_text()
    # 텍스트를 chunk로 분할
    splitter = RecursiveCharacterTextSplitter(
        chunk_size=chunk_size,
        chunk_overlap=chunk_overlap,

    )
    chunk_temp = splitter.split_text(text)
    # Document 객체 리스트 생성
    chunks = [Document(page_content=t) for t in chunk_temp]
    return chunks"""

# upskyy/e5-base-korean 5gb BAAI/bge-multilingual-gemma2 : 23GB  intfloat/multilingual-e5-base jhgan/ko-sroberta-multitask BAAI/bge-m3 :16gb
def create_vector_db(chunks, model_path="upskyy/e5-base-korean"):
    """FAISS DB 생성"""
    # 임베딩 모델 설정
    model_kwargs = {'device': 'cuda'}
    encode_kwargs = {'normalize_embeddings': True}
    embeddings = HuggingFaceEmbeddings(
        model_name=model_path,
        model_kwargs=model_kwargs,
        encode_kwargs=encode_kwargs
    )
    # FAISS DB 생성 및 반환
    db = FAISS.from_documents(chunks, embedding=embeddings)
    return db

def create_bm25(chunks):
    """bm25_retriever 생성"""
    bm25_retriever = BM25Retriever.from_documents(chunks)
    bm25_retriever.k = 4
    return bm25_retriever

def normalize_path(path):
    """경로 유니코드 정규화"""
    return unicodedata.normalize('NFC', path)


def process_pdfs_from_dataframe(df, base_directory):
    """딕셔너리에 pdf명을 키로해서 DB, retriever 저장"""
    pdf_databases = {}
    unique_paths = df['Source_path'].unique()
    
    for path in tqdm(unique_paths, desc="Processing PDFs"):
        # 경로 정규화 및 절대 경로 생성
        normalized_path = normalize_path(path)
        full_path = os.path.normpath(os.path.join(base_directory, normalized_path.lstrip('./'))) if not os.path.isabs(normalized_path) else normalized_path
        
        pdf_title = os.path.splitext(os.path.basename(full_path))[0]
        print(f"Processing {pdf_title}...")
        
        # PDF 처리 및 벡터 DB 생성
        chunks = process_langchain_pdf(full_path)
        db = create_vector_db(chunks)
        db2 = create_bm25(chunks)
        # Retriever 생성
        retriever = db.as_retriever(search_type="mmr", 
                                    search_kwargs={'k': 4})
        ensemble_retriever = EnsembleRetriever(
            retrievers=[retriever, db2],  
            weights=[0.5, 0.5],  
            search_type="mmr",  
        )
        rerank_model = HuggingFaceCrossEncoder(model_name="upskyy/ko-reranker-8k") #reranker모델 로드 BAAI/bge-reranker-v2-m3 Dongjin-kr/ko-reranker, upskyy/ko-reranker-8k
        compressor = CrossEncoderReranker(model=rerank_model, top_n=3)
        compression_retriever = ContextualCompressionRetriever(base_compressor=compressor, base_retriever=ensemble_retriever)
        
        # 결과 저장
        pdf_databases[pdf_title] = {
                'db': db,
                'retriever': compression_retriever
        }
    return pdf_databases

In [4]:
base_directory = 'open' # Your Base Directory
df = pd.read_csv('open/test.csv')
pdf_databases = process_pdfs_from_dataframe(df, base_directory)

Processing PDFs:   0%|          | 0/9 [00:00<?, ?it/s]

Processing 중소벤처기업부_혁신창업사업화자금(융자)...


  warn_deprecated(
Processing PDFs:  11%|█         | 1/9 [00:04<00:36,  4.57s/it]

Processing 보건복지부_부모급여(영아수당) 지원...


Processing PDFs:  22%|██▏       | 2/9 [00:09<00:32,  4.60s/it]

Processing 보건복지부_노인장기요양보험 사업운영...


Processing PDFs:  33%|███▎      | 3/9 [00:14<00:29,  4.94s/it]

Processing 산업통상자원부_에너지바우처...


Processing PDFs:  44%|████▍     | 4/9 [00:19<00:24,  4.81s/it]

Processing 국토교통부_행복주택출자...


Processing PDFs:  56%|█████▌    | 5/9 [00:23<00:18,  4.68s/it]

Processing 「FIS 이슈 & 포커스」 22-4호 《중앙-지방 간 재정조정제도》...


Processing PDFs:  67%|██████▋   | 6/9 [00:29<00:15,  5.08s/it]

Processing 「FIS 이슈 & 포커스」 23-2호 《핵심재정사업 성과관리》...


Processing PDFs:  78%|███████▊  | 7/9 [00:35<00:10,  5.42s/it]

Processing 「FIS 이슈&포커스」 22-2호 《재정성과관리제도》...


Processing PDFs:  89%|████████▉ | 8/9 [00:40<00:05,  5.36s/it]

Processing 「FIS 이슈 & 포커스」(신규) 통권 제1호 《우발부채》...


Processing PDFs: 100%|██████████| 9/9 [00:46<00:00,  5.17s/it]


In [5]:
pdf_databases['국토교통부_행복주택출자']['retriever'].invoke('행복주택출자 사업의 사업비 추이는 어떠한가?')

[Document(metadata={'Header 1': '나. 사업설명자료', 'Header 2': '1) 사업목적·내용'}, page_content='# 나. 사업설명자료  \n## 1) 사업목적·내용  \n(단위: 백만원)  \n-  국민의 행복주거 실현을 위한 보편적 주거복지 정책의 일환으로 도심 내 다양한  \n부지를 활용하여 행복주택을 공급'),
 Document(metadata={'Header 1': '나. 사업설명자료', 'Header 2': '2) 사업개요'}, page_content='|내역사업명|구분|피보조ㆍ 피출연 등 기관명|지원 금액 (2024계획)|지원 비율(%)|보조율 법적근거 (해당 조항)|\n|---|---|---|---|---|---|\n|행복주택 출자|출자|LH|373,886|30|공공주택 특별법 제3조의2(공공주택의 재원ㆍ세 재지원 등)|\n||보자|지자체|154,897|||\n||합계||528,783|||  \n피보조ㆍ  \n지원 금액 지원  \n내역사업명 구분 피출연 등 보조율 법적근거 (해당 조항)  \n(2024계획) 비율(%)  \n기관명  \n출자 LH 373,886  \n행복주택 공공주택 특별법 제3조의2(공공주택의 재원ㆍ세  \n보자 지자체 154,897 30  \n출자 재지원 등)  \n합계 528,783  \n-----'),
 Document(metadata={'Header 2': '사  업  명'}, page_content='## 사  업  명  \n(26) 행복주택출자 (1440-408)  \n|□사업|업 코드 정보|Col3|Col4|Col5|Col6|Col7|\n|---|---|---|---|---|---|---|\n|구분|기금|소관|실국(기관)|계정|분야|부문|\n|코드|주택도시기금|국토교통부|주택토지실|주택계정|080|088|\n|명칭|||||사회복지|주택|  \n|□사업 구분 코드 명칭|업 코드 정보 기금 소관 주택도시기금 국토교통부|실국(기관) 계정 주택토지실 주택계정|분야 부문 080 088 

In [6]:
def setup_llm_pipeline():
    # 4비트 양자화 설정
    bnb_config = BitsAndBytesConfig(
        load_in_4bit=True,
        bnb_4bit_use_double_quant=True,
        bnb_4bit_quant_type="nf4",
        bnb_4bit_compute_dtype=torch.bfloat16
    )

    # 모델 ID  chan1121/dacon-9b rtzr/ko-gemma-2-9b-it sh2orc/Llama-3.1-Korean-8B-Instruct
    model_id = "chan1121/geamma2-dacon-9b"  
    # 토크나이저 로드 및 설정
    tokenizer = AutoTokenizer.from_pretrained(model_id)
    tokenizer.use_default_system_prompt = False
    pad_token_id = tokenizer.eos_token_id
    # 모델 로드 및 양자화 설정 적용
    model = AutoModelForCausalLM.from_pretrained(
        model_id,
        quantization_config=bnb_config,
        device_map="auto",
        trust_remote_code=True,
        do_sample=True)

    # HuggingFacePipeline 객체 생성
    text_generation_pipeline = pipeline(
        model=model,
        tokenizer=tokenizer,
        task="text-generation",
        temperature=0.1,
        top_k=50, # 다음 토큰을 선택할 때 상위 k개의 후보 토큰 중에서 선택. 여기에서는 상위 50개의 후보 토큰 중에서 샘플링
        #top_p=0.95, # 누적 확률이 p가 될 때까지 후보 토큰을 포함
        repetition_penalty=1.2, # 반복 패널티를 적용하여 같은 단어나 구절이 반복되는 것 방지
        return_full_text=False,
        max_new_tokens=400,
        pad_token_id=pad_token_id,
    )

    hf = HuggingFacePipeline(pipeline=text_generation_pipeline)

    return hf

# LLM 파이프라인
llm = setup_llm_pipeline()

Loading checkpoint shards: 100%|██████████| 2/2 [00:07<00:00,  3.78s/it]
  warn_deprecated(


In [6]:
def normalize_string(s):
    """유니코드 정규화"""
    return unicodedata.normalize('NFC', s)

def format_docs(docs):
    """검색된 문서들을 하나의 문자열로 포맷팅"""
    context = ""
    for doc in docs:
        context += doc.page_content
        context += '\n'
    return context

# 결과를 저장할 리스트 초기화
results = []

# DataFrame의 각 행에 대해 처리
for _, row in tqdm(df.iterrows(), total=len(df), desc="Answering Questions"):
    # 소스 문자열 정규화
    source = normalize_string(row['Source'])
    question = row['Question']

    # 정규화된 키로 데이터베이스 검색
    normalized_keys = {normalize_string(k): v for k, v in pdf_databases.items()}
    retriever = normalized_keys[source]['retriever']
    # Answer in one sentence based on the referenced document. Please do not use your context as a model is answer.
    # lora 12     You are a QA chatbot. Answer with one systematic sentence based on the document. Do not answer the document as it is. Do not use 'user: context' as the model's answer.
    # lora 14     You are a QA chatbot. Answer with one systematic sentence based on the document. Do not use 'user: context' as the model's answer.
    # 질문의 핵심만 파악하여 1-2문장으로 답변하고, 불필요한 설명은 피하며 요구된 정보만 제공하세요.
    # RAG 체인 구성
    template = """
    다음 정보를 바탕으로 질문에 답하세요:
    {context}
    질문의 핵심만 파악하여 간결하게 1-2문장으로 답변하고, 불필요한 설명은 피하며 요구된 정보만 제공하세요.
    
    user {question}

    model

    <end_of_turn><eos>  
    """
    # <end_of_turn><eos>    
    llama3_template = """
    다음 정보를 바탕으로 질문에 답하세요:
    {context}

    ### Instruction:
    {question}
    
    질문의 핵심만 파악하여 간결하게 1-2문장으로 답변하고, 불필요한 설명은 피하며 요구된 정보만 제공하세요.
    
    ### Response:

    <|eot_id|>
    """
    cld_template = """
    다음 정보를 바탕으로 질문에 답하세요:
    {context}

    질문:
    {question}
    
    간결하게 1문장으로 답변하고, 불필요한 설명은 피하며 요구된 정보만 제공하세요.
    
    답변:

    """
    prompt = PromptTemplate.from_template(cld_template)

    # RAG 체인 정의
    rag_chain = (
        {"context": retriever|format_docs, "question": RunnablePassthrough()}
        | prompt
        | llm
        | StrOutputParser()
    )

    # 답변 추론
    print(f"Question: {question}")  
    full_response = rag_chain.invoke(question)

    print(f"Answer: {full_response}\n")

    # 결과 저장
    results.append({
        "Source": row['Source'],
        "Source_path": row['Source_path'],
        "Question": question,
        "Answer": full_response
    })
    

Answering Questions:   0%|          | 0/98 [00:00<?, ?it/s]

Question: 2022년 혁신창업사업화자금(융자)의 예산은 얼마인가요?


Answering Questions:   1%|          | 1/98 [00:03<05:37,  3.47s/it]

Answer: 2022년 혁신창업사업화자금(융자)의 예산은 2,300,000백만원입니다.

Question: 중소벤처기업부의 혁신창업사업화자금(융자) 사업목적은 무엇인가요?


Answering Questions:   2%|▏         | 2/98 [00:05<04:30,  2.82s/it]

Answer: 기술력과 사업성이 우수한 중소벤처기업의 창업 활성화와 고용창출을 도모하고, 중소기업의 우수 기술을 사업화하여 기술기반 중소기업을 육성하는 것입니다.

Question: 중소벤처기업부의 혁신창업사업화자금(융자) 사업근거는 어떤 법률에 근거하고 있나요?


Answering Questions:   3%|▎         | 3/98 [00:08<04:06,  2.60s/it]

Answer: 중소기업진흥에 관한 법률 제66조, 제67조, 제74조와 중소기업창업지원법 제35조에 근거하고 있습니다.

Question: 2010년에 신규 지원된 혁신창업사업화자금은 무엇인가요?


Answering Questions:   4%|▍         | 4/98 [00:11<04:14,  2.71s/it]

Answer: 2010년에 신규 지원된 것은 재창업자금(실패 경영인에 대한 재기지원)입니다.

Question: 혁신창업사업화자금 중 2020년에 신규 지원된 자금은 무엇인가요?


Answering Questions:   5%|▌         | 5/98 [00:13<03:52,  2.50s/it]

Answer: 2020년에는 미래기술육성자금과 고성장촉진자금이 신규 지원되었습니다.

Question: 재창업자금이 재도약지원자금으로 이관된 연도는 언제인가요?


Answering Questions:   6%|▌         | 6/98 [00:15<03:46,  2.46s/it]

Answer: 2015년 1월에 재창업자금이 재도약지원자금(융자)의 내역사업으로 이관되었습니다.

Question: 창업기반지원과 신청 대상이 중복인 자금이 어떤 것이며, 이 자금이 폐지된 연도는 언제인가요?


Answering Questions:   7%|▋         | 7/98 [00:19<04:21,  2.87s/it]

Answer: 일자리창출촉진자금이 창업기반지원과 신청 대상이 중복되어 2023년 1월에 폐지되었습니다.

Question: 혁신창업사업화자금(융자) 사업을 시행하는 주체는 누구인가요?


Answering Questions:   8%|▊         | 8/98 [00:21<04:03,  2.71s/it]

Answer: 중소벤처기업진흥공단이 혁신창업사업화자금(융자) 사업을 시행하는 주체입니다.

Question: 혁신창업사업화자금(융자) 사업 집행절차는 어떻게 되나요?


Answering Questions:   9%|▉         | 9/98 [00:24<04:18,  2.91s/it]

Answer: 사업계획수립/공고 → 사전상담 및 신청 → 접수 → 서류 및 현장실사 → 평가 및 승인 → 지원결정통보 → 융자 실행의 순서로 진행됩니다.

Question: 부모급여 지원 사업의 목적은 무엇인가요?


Answering Questions:  10%|█         | 10/98 [00:30<05:36,  3.82s/it]

Answer: 부모급여 지원 사업의 목적은 출산 및 양육으로 인한 소득 손실을 보전하고 영아기 돌봄을 두텁게 지원하는 것입니다.

Question: 부모급여(영아수당)의 2024년 확정된 예산은 몇백만원인가요?


Answering Questions:  11%|█         | 11/98 [00:34<05:19,  3.67s/it]

Answer: 부모급여(영아수당)의 2024년 확정된 예산은 2,888,694백만원입니다.

Question: 부모급여 지원 사업은 어떤 법령상 근거를 갖고 추진되고 있나요?


Answering Questions:  12%|█▏        | 12/98 [00:36<04:32,  3.17s/it]

Answer: 부모급여 지원 사업은 아동수당법 제4조제5항을 법령상 근거로 추진되고 있습니다.

Question: 영아수당 도입에 대한 추진경위는 어떻게 되나요?


Answering Questions:  13%|█▎        | 13/98 [00:39<04:25,  3.13s/it]

Answer: 영아수당은 예비타당성조사 통과('21.8.), 근거법 마련('21.12.)을 거쳐 2022년 1월부터 시행되었습니다.

Question: 부모급여 지원사업은 언제부터 시행되었나요?


Answering Questions:  14%|█▍        | 14/98 [00:47<06:20,  4.53s/it]

Answer: 부모급여 지원사업은 2023년 1월부터 시행되었습니다.

Question: 보건복지부의 부모급여(영아수당) 지원 사업시행방법은 무엇이며, 사업 수혜자는 누구인가?


Answering Questions:  15%|█▌        | 15/98 [00:49<05:28,  3.96s/it]

Answer: 사업시행방법은 지자체 보조이며, 사업 수혜자는 만 0~1세 아동입니다.

Question: 노인장기요양보험 사업 운영에 대한 목적은 무엇인가요?


Answering Questions:  16%|█▋        | 16/98 [00:52<05:06,  3.74s/it]

Answer: 고령이나 노인성 질병으로 일상생활을 혼자서 수행하기 어려운 노인 등에게 신체 또는 가사 활동 등을 제공하는 노인장기요양보험에 국고를 지원하는 것입니다.

Question: 노인장기요양보험 운영지원에 대한 사업 내용을 설명해줘.


Answering Questions:  17%|█▋        | 17/98 [00:56<05:02,  3.74s/it]

Answer: 노인장기요양보험 운영지원은 일상생활을 혼자 수행하기 어려운 노인에게 신체 활동이나 가사 활동 지원을 제공하는 보험 제도의 운영을 지원하는 사업입니다.

Question: 국고지원을 받는 기타 의료급여수급권자는 누구인가요?


Answering Questions:  18%|█▊        | 18/98 [00:58<04:19,  3.24s/it]

Answer: 기타 의료급여수급권자는 이재민, 의사상자, 국가유공자, 입양아동, 국가무형문화재보유자, 북한이탈주민 등입니다.

Question: 장기요양보험가입자 및 피부양자의 자격취득과 관련하여 어떤 법률을 준용해야 하는가?


Answering Questions:  19%|█▉        | 19/98 [01:01<04:05,  3.11s/it]

Answer: 노인장기요양보험법 제11조에 따라 국민건강보험법 제5조, 제6조, 제8조부터 제11조까지의 조항을 준용해야 합니다.

Question: 노인장기요양보험법이 언제 제정되고 공포되었나?


Answering Questions:  20%|██        | 20/98 [01:04<04:03,  3.12s/it]

Answer: 노인장기요양보험법은 2007년 4월에 제정 및 공포되었습니다.

Question: 장기요양인정점수 완화가 언제 이루어졌으며, 어떤 변화가 있었나?


Answering Questions:  21%|██▏       | 21/98 [01:08<04:12,  3.28s/it]

Answer: 3등급 인정점수가 기존 53~75점에서 51~75점으로 완화되었습니다.

Question: 장기요양기관 지정갱신제의 법적 근거가 언제 마련되었는가?


Answering Questions:  22%|██▏       | 22/98 [01:11<04:00,  3.17s/it]

Answer: 장기요양기관 지정갱신제의 법적 근거는 2018년 12월에 마련되었습니다.

Question: 22.10월에 요양보호사 1명당 시설수급자 인력배치기준이 개선된 내용은 무엇인가?


Answering Questions:  23%|██▎       | 23/98 [01:14<03:53,  3.11s/it]

Answer: 요양보호사 1명당 시설수급자 인력배치기준이 2.5명에서 2.3명으로 개선되었습니다.

Question: 에너지 바우처 제도의 주요 내용은 무엇인가요?


Answering Questions:  24%|██▍       | 24/98 [01:17<03:57,  3.21s/it]

Answer: 에너지바우처는 동·하절기(7월~다음해 4월) 동안 저소득층의 에너지 비용을 지원하는 제도입니다.

Question: 에너지바우처 사업의 주요 수혜자는 누구인가요?


Answering Questions:  26%|██▌       | 25/98 [01:20<03:42,  3.05s/it]

Answer: 에너지바우처 사업의 주요 수혜자는 저소득층, 중증 및 희귀난치성질환자 세대, 한부모 및 소년소녀가정세대입니다.

Question: 2024년 에너지바우처 사업의 사업시행주체는 무엇인가요?


Answering Questions:  27%|██▋       | 26/98 [01:23<03:37,  3.02s/it]

Answer: 주어진 정보만으로는 2024년 에너지바우처 사업의 구체적인 사업시행주체를 명확히 알 수 없습니다.

Question: 하절기바우처와 동절기바우처의 2024년 예산 규모는 각각 얼마인가요?


Answering Questions:  28%|██▊       | 27/98 [01:26<03:31,  2.97s/it]

Answer: 2024년 예산에서 하절기바우처는 60,950백만원, 동절기바우처는 600,521백만원입니다.

Question: 2023년 에너지바우처 사업 예산에서 사업운영비 중 에너지복지 홍보에 얼마가 할당되었나요?


Answering Questions:  29%|██▊       | 28/98 [01:28<03:18,  2.83s/it]

Answer: 2023년 에너지바우처 사업 예산에서 에너지복지 홍보에 448백만원이 할당되었습니다.

Question: 2023년 에너지바우처 사업 예산에서 사업운영비 중 시스템 고도화에 얼마가 할당되었나요?


Answering Questions:  30%|██▉       | 29/98 [01:31<03:13,  2.80s/it]

Answer: 2023년 에너지바우처 사업 예산의 사업운영비 중 시스템 고도화에는 705백만원이 할당되었습니다.

Question: 2023년 에너지바우처 사업 예산에서 콜센터 운영에 얼마가 할당되었나요?


Answering Questions:  31%|███       | 30/98 [01:33<02:57,  2.61s/it]

Answer: 2023년 에너지바우처 사업 예산에서 콜센터 운영에 280백만원이 할당되었습니다.

Question: 2023년 에너지바우처 사업 예산에서 패널조사에 얼마가 할당되었나요?


Answering Questions:  32%|███▏      | 31/98 [01:35<02:40,  2.40s/it]

Answer: 2023년 에너지바우처 사업 예산에서 패널조사에 133.5백만원이 할당되었습니다.

Question: 2023년 에너지바우처 사업 예산에서 에너지바우처 전달체계 구축에 얼마가 할당되었나요?


Answering Questions:  33%|███▎      | 32/98 [01:36<02:19,  2.12s/it]

Answer: 2023년 에너지바우처 사업 예산에서 에너지바우처 전달체계 구축에 37.5백만원이 할당되었습니다.

Question: 2023년 에너지바우처 사업 예산에서 주택관리공단 운영지원에 얼마가 할당되었나요?


Answering Questions:  34%|███▎      | 33/98 [01:38<02:07,  1.96s/it]

Answer: 2023년 에너지바우처 사업 예산에서 주택관리공단 운영지원에 50백만원이 할당되었습니다.

Question: 에너지바우처 사업의 향후 기대효과는 무엇인가요?


Answering Questions:  35%|███▍      | 34/98 [01:40<02:10,  2.04s/it]

Answer: 저소득층의 적정수준 에너지 접근성이 높아지고, 취약계층의 에너지 비용 부담이 경감될 것으로 기대됩니다 (약 115만 세대, 세대당 평균 36.7만원 내외).

Question: 에너지바우처 사업에 대한 예비타당성조사를 어떤 조사기관이 수행했나요?


Answering Questions:  36%|███▌      | 35/98 [01:43<02:14,  2.14s/it]

Answer: KDI(한국개발연구원 공공투자관리센터)가 에너지바우처 사업에 대한 예비타당성조사를 수행했습니다.

Question: 21년 국정감사에서 에너지 바우처 사업에 대한 주요 지적사항은 무엇이었나요?


Answering Questions:  37%|███▋      | 36/98 [01:45<02:20,  2.26s/it]

Answer: 저소득층의 폭염 피해 최소화를 위해 동절기 에너지바우처 일부를 하절기에 사용할 수 있도록 제도 개선할 것을 지적했습니다.

Question: 21년 에너지바우처 사업에 대한 결산 지적사항은 무엇이었나요?


Answering Questions:  38%|███▊      | 37/98 [01:50<02:59,  2.94s/it]

Answer: 수급자 변경 등으로 예산부족이 발생하지 않도록 보건복지부·지자체와 면밀히 소통하여 예산을 편성하고 사업을 추진할 것을 지적받았습니다.

Question: 에너지 바우처 사업의 향후 추진방향 중 '취약계층의 에너지 비용 부담 완화'를 위한 계획은 무엇이었나요?


Answering Questions:  39%|███▉      | 38/98 [01:54<03:16,  3.28s/it]

Answer: 지속적 지원단가 현실화를 추진할 계획입니다.

Question: 행복주택출자 사업은 어떤 근거로 추진되고 있는가?


Answering Questions:  40%|███▉      | 39/98 [01:57<03:18,  3.36s/it]

Answer: 행복주택출자 사업은 주택도시기금법 제9조제1항가목과 공공주택특별법 제2조1호가목을 법적 근거로 추진되고 있습니다.

Question: 행복주택출자 사업은 어떤 목적으로 시행되는가?


Answering Questions:  41%|████      | 40/98 [02:00<03:02,  3.15s/it]

Answer: 행복주택출자 사업은 국민의 행복주거 실현을 위한 보편적 주거복지 정책의 일환으로 도심 내 다양한 부지를 활용하여 행복주택을 공급하는 것을 목적으로 합니다.

Question: 행복주택출자 사업의 주요 수혜자는 누구인가?


Answering Questions:  42%|████▏     | 41/98 [02:10<04:58,  5.24s/it]

Answer: 행복주택출자 사업의 주요 수혜자는 대학생, 사회초년생, 신혼부부 등 젊은층(80%)과 고령자 및 주거취약계층(20%)입니다.

Question: 행복주택출자 사업의 사업비 추이는 어떠한가?


Answering Questions:  43%|████▎     | 42/98 [02:13<04:13,  4.53s/it]

Answer: 행복주택출자 사업비는 2020년 684,607백만원에서 2024년 461,607백만원으로 전반적으로 감소하는 추세를 보입니다.

Question: 행복주택출자 사업의 사업시행주체는 누구인가?


Answering Questions:  44%|████▍     | 43/98 [02:15<03:27,  3.76s/it]

Answer: 행복주택출자 사업의 사업시행주체는 한국토지주택공사(LH)와 지자체(지방공사)입니다.

Question: 국고보조사업의 보조율은 어떠한 기준에 따라 운용되는가?


Answering Questions:  45%|████▍     | 44/98 [02:20<03:48,  4.23s/it]

Answer: 국고보조사업의 보조율은 보조금법과 일부 개별 법령에 근거하여 지방자치단체의 재정여건을 고려한 기준보조율과 차등보조율을 적용하여 운용됩니다.

Question: 프랑스의 재정조정제도에서 최근 강조되는 형평교부금은 어떤 역할을 하는가?


Answering Questions:  46%|████▌     | 45/98 [02:25<03:55,  4.45s/it]

Answer: 최근 프랑스에서는 중앙정부의 재정적자로 인해 지방자치단체 간 재원 불균형을 조정하는 수평적 형평교부금의 역할이 강조되고 있습니다.

Question: 지방재정조정제도의 목적은 무엇인가?


Answering Questions:  47%|████▋     | 46/98 [02:30<03:49,  4.42s/it]

Answer: 지방재정조정제도의 목적은 지방자치단체 간 재정력 격차 시정, 지역 간 외부 효과의 내부화를 통한 지방공공재 공급, 중앙정부의 위임사무에 대한 비용 부담 등을 통해 재정을 조정하는 것입니다.

Question: 국제적으로 성과중심 재정관리 강화 움직임이 확산된 시기는 언제인가?


Answering Questions:  48%|████▊     | 47/98 [02:40<05:10,  6.09s/it]

Answer: 2000년대 후반 금융위기 이후 성과중심 재정관리 강화 움직임이 국제적으로 확산되었습니다.

Question: 한국의 재정사업 성과관리제도는 어떠한 법을 통해 운영되고 있으며, 성과관리 기본계획과 추진계획은 어떻게 의무화되었는가?


Answering Questions:  49%|████▉     | 48/98 [02:48<05:44,  6.89s/it]

Answer: 한국의 재정사업 성과관리제도는 2007년부터 「국가재정법」을 통해 운영되어 왔으며, 2021년 12월 법 개정으로 '성과관리 기본계획'(5개년) 및 '추진계획'(연간) 수립이 의무화되었습니다.

Question: 핵심재정사업 성과관리제도를 안착시키기 위해 필요한 노력과 성과 정보를 학습의 도구로 활용하는 방안은 무엇인가?


Answering Questions:  50%|█████     | 49/98 [02:55<05:36,  6.88s/it]

Answer: 성과정보를 사용해 목표 진행 상황을 정기적으로 평가·공개하고, 작업반 간 모범사례 공유를 위한 교훈 저장소를 생성하여 성과중심의 조직문화를 형성해야 합니다.

Question: 사회보험 사각지대 발생의 주요 원인과 이로 인해 발생하는 문제는 무엇인가요?


Answering Questions:  51%|█████     | 50/98 [03:05<06:20,  7.92s/it]

Answer: 사업주의 비용절감 의도와 근로자의 실질 가처분 소득 감소로 인해 사회보험 가입이 저조해져, 특히 고용 취약계층과 소규모 사업장에서 사회보험 사각지대가 발생하고 소득단절 위험이 높아집니다.

Question: 청년일자리도약장려금은 어떤 대상을 지원하며, 어떤 방식으로 지원되는가?


Answering Questions:  52%|█████▏    | 51/98 [03:14<06:20,  8.10s/it]

Answer: 청년일자리도약장려금은 우선지원대상기업이 만 15~34세의 취업애로청년을 정규직으로 채용하고 6개월 고용유지 시 최장 2년간 지원됩니다.

Question: 수직적 재정조정제도와 수평적 재정조정제도의 차이는 무엇인가요?


Answering Questions:  53%|█████▎    | 52/98 [03:19<05:33,  7.26s/it]

Answer: 수직적 재정조정제도는 중앙-지방 간 또는 광역-기초 간 재원을 이전하는 반면, 수평적 재정조정제도는 동일 수준의 지방정부 간 재원을 재배분합니다.

Question: 지방재정조정제도는 어떤 목적을 가지고 있나요?


Answering Questions:  54%|█████▍    | 53/98 [03:23<04:41,  6.26s/it]

Answer: 지방재정조정제도는 지방자치단체 간 재정력 격차 시정, 지역 간 외부 효과 내부화, 중앙정부 위임사무 비용 부담 등을 목적으로 합니다.

Question: 중앙-지방 간 재정조정제도에서 어떤 재원을 이전하여 수직적 재정 불균형을 해소하는가?


Answering Questions:  55%|█████▌    | 54/98 [03:30<04:42,  6.42s/it]

Answer: 지방교부세, 국고보조금을 이전하여 수직적 재정 불균형을 해소합니다.

Question: 중앙정부의 예산편성은 어떤 재원 배분 문제를 결정하며, 중앙-지방 간 재정조정제도를 통해 어떤 재원을 이전하고, 이의 목적은 무엇인가?


Answering Questions:  56%|█████▌    | 55/98 [03:37<04:45,  6.63s/it]

Answer: 중앙정부의 예산편성은 민간과 공공 부문 간 재원 배분을 결정하며, 중앙-지방 간 재정조정제도를 통해 지방교부세와 국고보조금 등을 이전하여 지방정부의 기능 수행과 국가 균형발전을 목적으로 합니다.

Question: 재정사업 성과관리제도의 필요성이 대두된 시기와 한국의 재정사업 성과관리제도가 어떤 법에 근거하여 운영되고 있는지 설명하시오.


Answering Questions:  57%|█████▋    | 56/98 [03:47<05:18,  7.58s/it]

Answer: 재정사업 성과관리제도의 필요성은 1990년대에 대두되었으며, 한국의 재정사업 성과관리제도는 2007년부터 시행된 「국가재정법」에 근거하여 운영되고 있습니다.

Question: 청년일자리도약장려금은 어떤 대상을 지원하며, 어떤 방식으로 지원되는가?


Answering Questions:  58%|█████▊    | 57/98 [03:55<05:15,  7.69s/it]

Answer: 청년일자리도약장려금은 우선지원대상기업에서 만 15~34세의 취업애로청년을 정규직으로 채용 후 6개월 고용유지하는 경우 최장 2년간 지원됩니다.

Question: 재정성과관리제도는 어떤 측면에서 국정운영과 연결되는가?


Answering Questions:  59%|█████▉    | 58/98 [04:03<05:15,  7.90s/it]

Answer: 재정성과관리제도는 전략목표와 우선순위를 중심으로 재정사업을 재구조화한다는 점에서 국정운영과 연결됩니다.

Question: 성과관리의 실효성 강화를 위해 정부가 취한 조치는 무엇인가?


Answering Questions:  60%|██████    | 59/98 [04:11<05:09,  7.93s/it]

Answer: 정부는 2021년 「국가재정법」 개정을 통해 성과 중심 재정운용 강화를 위해 성과관리를 위한 별도의 장을 신설하고 성과관리 규정을 정비했습니다.

Question: 재정성과관리 관련 주요 쟁점은 무엇인가?


Answering Questions:  61%|██████    | 60/98 [04:22<05:34,  8.80s/it]

Answer: 재정사업 자율평가의 개선과 평가 중복 최소화, 그리고 재정성과관리 결과의 재정 운용 반영 및 국민에게 알기 쉬운 공개가 주요 쟁점입니다.

Question: 재정성과관리가 왜 중요한가?


Answering Questions:  62%|██████▏   | 61/98 [04:31<05:27,  8.86s/it]

Answer: 재정성과관리는 재정을 결과 지향적으로 운영하여 산출의 우선순위를 명확히 하고 국민에게 재정 활동을 알기 쉽게 설명할 수 있기 때문에 중요합니다.

Question: 재정성과관리는 무엇을 목표로 하는가?


Answering Questions:  63%|██████▎   | 62/98 [04:42<05:44,  9.57s/it]

Answer: 재정성과관리의 최종 목표는 국민이 정부가 하는 일의 목표에서 성과에 이르는 전과정을 투명하게 알 수 있게 하는 것입니다.

Question: 어떤 국제기구들이 사업을 기준으로 예산을 나누어 성과 정보를 생산하고 있는가?


Answering Questions:  64%|██████▍   | 63/98 [04:51<05:27,  9.36s/it]

Answer: OECD와 World Bank가 2000년대부터 사업을 기준으로 예산을 나누어 성과 정보를 생산할 것을 강조하기 시작했습니다.

Question: 재정성과관리의 목적은 무엇인가?


Answering Questions:  65%|██████▌   | 64/98 [04:59<05:00,  8.83s/it]

Answer: 재정성과관리의 목적은 정부 재정의 투명성, 책임성, 효율성, 효과성을 향상시키고 예산을 재분배하는 것입니다.

Question: 2021년 「국가재정법」 개정으로 어떤 규정이 신설되었는가?


Answering Questions:  66%|██████▋   | 65/98 [05:08<04:53,  8.89s/it]

Answer: 2021년 「국가재정법」 개정으로 성과 중심 재정운용 강화를 위해 성과관리를 위한 별도의 장이 신설되고 성과관리 규정이 정비되었습니다.

Question: 성과관리제도는 지출 구조조정을 위해 어떤 방향으로 추진되고 있는가?


Answering Questions:  67%|██████▋   | 66/98 [05:18<04:57,  9.29s/it]

Answer: 성과 중심의 운영을 통해 재정의 효율성을 제고하고 대국민 책임성을 강화하는 방향으로 추진되고 있습니다.

Question: 재정사업 자율평가의 목적은 무엇이며, 어떤 방식으로 제도 개선이 이루어졌는가?


Answering Questions:  68%|██████▊   | 67/98 [05:25<04:26,  8.61s/it]

Answer: 재정사업 자율평가는 재정관리 합리성을 높이기 위해 평가 대상 범위, 주기, 방식 등을 지속적으로 개선해왔습니다.

Question: 2016년 재정성과관리제도의 환류 개선사항은 무엇인가?


Answering Questions:  69%|██████▉   | 68/98 [05:36<04:38,  9.30s/it]

Answer: 2016년도 환류 개선을 통해 평가 대상 사업 전체 예산의 1% 이내에서 부처에서 자율적으로 세출구조조정을 마련하도록 하고 우수 등급 사업도 지출구조조정이 가능하게 했습니다.

Question: 2018년도에 재정성과관리제도 개선사항과, 이로 인해 어떤 효과가 발생했는가?


Answering Questions:  70%|███████   | 69/98 [05:47<04:42,  9.72s/it]

Answer: 2018년부터 기획재정부는 전수 사업에 대한 메타평가 대신 주요 핵심 사업에 대한 집중관리로 전환하여 제도 개선과 구조조정을 추진하였습니다.

Question: 재정사업 자율평가의 전면 개편을 통해 어떤 중점 추진과제가 제시되었는가?


Answering Questions:  71%|███████▏  | 70/98 [05:56<04:27,  9.56s/it]

Answer: 성과관리 사각지대 해소, 사업성과평가의 예산편성 활용 확대, 평가부담 완화와 지출구조조정 강화, 핵심 재정사업군의 전주기 관리, 성과관리 인프라 확충이 중점 추진과제로 제시되었습니다.

Question: 재정성과관리제도의 중요성과 국정운영과의 연결성은 무엇인가?


Answering Questions:  72%|███████▏  | 71/98 [06:04<04:04,  9.05s/it]

Answer: 재정성과관리제도는 프로그램 단위의 성과관리와 평가를 통해 거시적 재정총량 관리와 개별 부처의 재정사업 관리체계를 연결함으로써 국정 운영의 효율성과 책임성을 제고합니다.

Question: 재정성과관리체계 강화를 위해 정부가 어떤 제도를 제시했으며, 재정성과관리는 무엇을 목표로 하는가?


Answering Questions:  73%|███████▎  | 72/98 [06:12<03:47,  8.77s/it]

Answer: 정부는 재정성과관리체계 강화를 위해 성과계획서와 성과보고서 제출 제도를 도입했으며, 이는 재정의 투명성, 책임성, 효율성, 효과성 향상과 예산 재분배를 목표로 합니다.

Question: 재정성과관리는 어떤 과정에서 수행되며, 무엇을 증진하기 위해 활동하는가?


Answering Questions:  74%|███████▍  | 73/98 [06:21<03:44,  8.98s/it]

Answer: 재정성과관리는 재정사업의 기획에서 집행, 환류, 종료에 이르는 전 주기를 체계적으로 관리하여 지출 효율성을 증진하기 위해 수행됩니다.

Question: 재정성과관리의 목적과 우리나라의 재정성과관리제도가 프로그램 예산제도로 전환된 시기는?


Answering Questions:  76%|███████▌  | 74/98 [06:29<03:29,  8.72s/it]

Answer: 재정성과관리는 거시적 재정총량 관리와 개별 부처의 재정사업 관리체계를 연결하는 것을 목적으로 하며, 우리나라는 2006년에 프로그램 예산제도로 전환하였습니다.

Question: 2007년과 2021년에 각각 「국가재정법」이 개정되면서 성과관리 제도는 어떻게 강화되고 구체화되었으며, 이 개정의 주된 목적은 무엇인가?


Answering Questions:  77%|███████▋  | 75/98 [06:39<03:23,  8.84s/it]

Answer: 2007년 「국가재정법」 시행으로 성과관리의 기본 체계가 확립되었고, 2021년 개정을 통해 성과 중심 재정운용을 강화하기 위한 별도 장을 신설하여 성과관리 규정을 정비함으로써, 재정 운영의 효율성과 책임성을 높이는 것이 주된 목적이었습니다.

Question: 재정사업 자율평가의 목적과 제도 개선 방식은 무엇인가?


Answering Questions:  78%|███████▊  | 76/98 [06:47<03:12,  8.75s/it]

Answer: 재정사업 자율평가는 재정관리의 합리성을 높이기 위해 평가 대상, 주기, 방식 등을 지속적으로 개선하고 있으며, 최근에는 환류 방식 다변화와 평가 표준화, 제도 정비 등을 통해 실효성 제고를 추진하고 있습니다.

Question: 2015년 이전과 2016년에 재정성과 평가 결과 처리 방식과 환류 개선 방식은 어떻게 달라졌는가?


Answering Questions:  79%|███████▊  | 77/98 [06:57<03:08,  8.98s/it]

Answer: 2015년 이전에는 미흡 등급 사업에 대해 일률적 삭감을 실시했지만, 2016년부터는 부처가 평가 대상 사업 전체 예산의 1% 내에서 자율적으로 세출구조조정을 하도록 개선되었습니다.

Question: 재정관리시스템 구축과 성과관리 개편을 추진하는 주된 목적은 무엇인가?


Answering Questions:  80%|███████▉  | 78/98 [07:05<02:54,  8.73s/it]

Answer: 재정운용의 효율성과 책임성을 제고하기 위함입니다.

Question: 우리나라에서는 언제부터 발생주의 기준을 적용한 국가결산보고서에서 우발부채를 보고하고 있는가?


Answering Questions:  81%|████████  | 79/98 [07:15<02:56,  9.28s/it]

Answer: 우리나라는 2011년부터 발생주의 기준을 적용한 국가결산보고서에서 우발부채를 보고하고 있습니다.

Question: 우발부채 관련 주요 쟁점은 무엇인가?


Answering Questions:  82%|████████▏ | 80/98 [07:26<02:56,  9.83s/it]

Answer: 우발부채 관련 주요 쟁점은 우발부채 개념 및 용어 사용의 혼란, 우발부채 분류기준 재검토, 새로운 분류기준 정립입니다.

Question: 우발부채의 관리는 왜 중요한 이슈로 여겨지는가?


Answering Questions:  83%|████████▎ | 81/98 [07:33<02:30,  8.87s/it]

Answer: 우발부채의 관리는 미래의 다양한 의제의무를 포괄하여 지속가능한 재정운영을 위해 중요한 이슈로 여겨집니다.

Question: 우발부채와 부채의 차이점은 무엇인가?


Answering Questions:  84%|████████▎ | 82/98 [07:41<02:17,  8.57s/it]

Answer: 우발부채는 하나 또는 그 이상의 조건이 충족되어야 금융거래로 인식되는 반면, 부채는 이미 인식된 현재의 의무입니다.

Question: 발생주의와 현금주의의 차이는 무엇인가?


Answering Questions:  85%|████████▍ | 83/98 [07:51<02:13,  8.90s/it]

Answer: 발생주의는 경제적 거래가 발생하는 시점에, 현금주의는 현금을 수취하거나 지급한 시점에 거래를 기록하는 방식입니다.

Question: 채무지속가능성분석은 어떤 목적을 가지고 도입되었는가?


Answering Questions:  86%|████████▌ | 84/98 [08:07<02:36, 11.20s/it]

Answer: 채무지속가능성분석은 잠재적 재정위기를 감지, 예방, 해결하기 위한 목적으로 도입되었습니다.

Question: 의제의무란 무엇인가?


Answering Questions:  87%|████████▋ | 85/98 [08:16<02:16, 10.53s/it]

Answer: 의제의무란 정부의 방침, 약속 또는 관행을 통해 특정 책임을 부담하겠다고 표명함으로써 상대방에게 그 책임 이행에 대한 정당한 기대를 갖게 하는 경우 발생하는 의무를 말합니다.

Question: 국제통화기금이 재정통계 작성의 국제기준을 제시하기 위해 발간한 매뉴얼은 무엇인가?


Answering Questions:  88%|████████▊ | 86/98 [08:24<01:55,  9.62s/it]

Answer: 국제통화기금이 재정통계 작성의 국제기준을 제시하기 위해 발간한 매뉴얼은 재정통계 매뉴얼(Government Finance Statistics Manual, GFSM)입니다.

Question: 계류중인 소송사건이란 무엇인가?


Answering Questions:  89%|████████▉ | 87/98 [08:32<01:41,  9.21s/it]

Answer: 계류중인 소송사건은 정부가 원고이거나 피고인 진행 중인 법적 분쟁 사건을 말합니다.

Question: 최소운영수입보장(BTO 등) 제도란 무엇을 의미하는가?


Answering Questions:  90%|████████▉ | 88/98 [08:41<01:31,  9.20s/it]

Answer: 최소운영수입보장 제도란 주로 BTO 민간투자사업에서 실제 수입이 예상보다 낮을 경우 정부가 최소 수준의 운영수입을 보장해주는 제도입니다.

Question: 우발부채에 대한 내용으로 대표적으로 어떤 사항이 해당되는가?


Answering Questions:  91%|█████████ | 89/98 [08:50<01:22,  9.20s/it]

Answer: 대표적으로 장기임차토지의 원상회복의무, 공공금융비용, 공공손실부담 등이 우발부채에 해당됩니다.

Question: GFSM2014에서는 우발부채를 어떻게 구분하는가?


Answering Questions:  92%|█████████▏| 90/98 [09:00<01:15,  9.46s/it]

Answer: GFSM2014에서는 우발부채를 '명시적(explicit)' 및 '암묵적(implicit)' 성격으로 구분합니다.

Question: GFSM은 몇 차례의 개정을 거쳤으며, 어떠한 목적으로 GFSM 2001이 개정되었는가?


Answering Questions:  93%|█████████▎| 91/98 [09:10<01:06,  9.46s/it]

Answer: GFSM은 총 2차례(2001년, 2014년) 개정되었으며, GFSM 2001은 현재의 발생주의 기준 GFS체계를 구축하기 위해 전면 개정되었습니다.

Question: 표준화 보증이란 무엇인가?


Answering Questions:  94%|█████████▍| 92/98 [09:20<00:58,  9.70s/it]

Answer: 표준화 보증은 통상 아주 적은 금액에 대해 획일적 조건으로 대규모로 발행하는 보증을 말합니다.

Question: 표준화 보증에서 공공부문의 우발부채는 어떻게 인식되는가?


Answering Questions:  95%|█████████▍| 93/98 [09:29<00:47,  9.58s/it]

Answer: 표준화 보증에서는 채무불이행률로 인해 공공부문의 우발부채가 아니라 표준화 보증 충당부채로 인식합니다.

Question: 재정정책에서 공적보증채무와 다른 일회성 보증은 어떻게 구분되는가?


Answering Questions:  96%|█████████▌| 94/98 [09:37<00:36,  9.10s/it]

Answer: 공적보증채무는 보증인이 다른 공공부문과 민간부문 단위의 기존 채무 원리금 상환을 보증한다는 점에서 다른 일회성 보증과 구분됩니다.

Question: 미래사회보장급여에 대한 순의무란 무엇을 의미하는가?


Answering Questions:  97%|█████████▋| 95/98 [09:46<00:26,  8.95s/it]

Answer: 미래사회보장급여에 대한 순의무는 현행법과 규정에 따라 가입자가 획득한 미래 급여의 현재가치에서 미래보험료의 순현재가치를 차감한 것을 의미합니다.

Question: 국가결산보고서와 지방자치단체 회계기준에서 우발부채에 대한 용어 및 회계처리가 어떻게 다른가요?


Answering Questions:  98%|█████████▊| 96/98 [09:56<00:18,  9.26s/it]

Answer: 국가결산보고서는 '우발사항'으로 공시하는 반면, 「지방자치단체 회계기준에 관한 규칙」은 '우발손실'로 정의하여 용어 및 회계처리가 상이합니다.

Question: 우발부채란 무엇이며, 그 관리가 왜 중요한가?


Answering Questions:  99%|█████████▉| 97/98 [10:05<00:09,  9.25s/it]

Answer: 우발부채는 미래의 불확실한 사건에 의해 발생 가능한 의무로, 재정 건전성과 위기 관리를 위해 공공부문에서 중요하게 관리되어야 합니다.

Question: 보증이란 무엇이며, 어떤 형태의 보증이 재정상태표에 부채로 기록되는가? 또한 표준화 보증이란 무엇이며, 어떤 목적으로 발행되는가?


Answering Questions: 100%|██████████| 98/98 [10:16<00:00,  6.29s/it]

Answer: 보증은 명시적 우발부채의 일반적 형태이며, 파생금융상품 형태의 보증과 표준화된 보증제도 하의 충당부채 형태의 보증이 재정상태표에 부채로 기록되고, 표준화 보증은 적은 금액에 대해 획일적 조건으로 대규모 발행되는 보증으로 위험 분산을 목적으로 합니다.






In [7]:
# 제출용 샘플 파일 로드
submit_df = pd.read_csv("open/sample_submission.csv")

# 생성된 답변을 제출 DataFrame에 추가
submit_df['Answer'] = [item['Answer'] for item in results]
submit_df['Answer'] = submit_df['Answer'].fillna("데이콘")     # 모델에서 빈 값 (NaN) 생성 시 채점에 오류가 날 수 있음 [ 주의 ]

# 결과를 CSV 파일로 저장
submit_df.to_csv("./baseline_submission_cld4.csv", encoding='UTF-8-sig', index=False)

In [6]:
import csv

# CSV 파일로 저장
with open('output1.csv', mode='w', newline='', encoding='utf-8') as file:
    writer = csv.DictWriter(file, fieldnames=results[0].keys())
    writer.writeheader()  # 헤더 작성
    writer.writerows(results)  # 데이터 작성


In [15]:
import csv

# CSV 파일을 오픈해서 리스트로 변환
csv_file = 'output6.csv'  # 읽어올 CSV 파일 경로

with open(csv_file, mode='r', newline='', encoding='utf-8') as file:
    reader = csv.DictReader(file)
    data_list = [row for row in reader]


In [18]:
# 데이터를 저장할 리스트
results = []
csv_files= ['output5.csv', 'output6.csv', 'output7.csv']
# 각 CSV 파일을 순회하며 데이터 읽기
for csv_file in csv_files:
    with open(csv_file, mode='r', newline='', encoding='utf-8') as file:
        reader = csv.DictReader(file)
        # 현재 파일의 데이터를 data_list에 추가
        for row in reader:
            results.append(row)

In [19]:
results

[{'Source': '중소벤처기업부_혁신창업사업화자금(융자)',
  'Source_path': './test_source/중소벤처기업부_혁신창업사업화자금(융자).pdf',
  'Question': '2022년 혁신창업사업화자금(융자)의 예산은 얼마인가요?',
  'Answer': ' 2022년 혁신창업사업화자금(융자)의 예산 지출은 2,300,000 백만원입니다. \n'},
 {'Source': '중소벤처기업부_혁신창업사업화자금(융자)',
  'Source_path': './test_source/중소벤처기업부_혁신창업사업화자금(융자).pdf',
  'Question': '중소벤처기업부의 혁신창업사업화자금(융자) 사업목적은 무엇인가요?',
  'Answer': ' 기술력과 사업성이 우수하고 미래 성장 가능성이 높은 중소벤처기업의 창업을 활성화하고 고용창출을 도모하며, 중소기업의 우수 기술의 사업화를 촉진하여 기술기반 중소기업을 육성하는 것을 목적으로 합니다. \n'},
 {'Source': '중소벤처기업부_혁신창업사업화자금(융자)',
  'Source_path': './test_source/중소벤처기업부_혁신창업사업화자금(융자).pdf',
  'Question': '중소벤처기업부의 혁신창업사업화자금(융자) 사업근거는 어떤 법률에 근거하고 있나요?',
  'Answer': ' 법령상 근거는 중소기업진흥에 관한 법률 제66조, 제67조, 제74조입니다. \n'},
 {'Source': '중소벤처기업부_혁신창업사업화자금(융자)',
  'Source_path': './test_source/중소벤처기업부_혁신창업사업화자금(융자).pdf',
  'Question': '2010년에 신규 지원된 혁신창업사업화자금은 무엇인가요?',
  'Answer': ' 재창업자금(실패 경영인에 대한 재기지원) 입니다. \n'},
 {'Source': '중소벤처기업부_혁신창업사업화자금(융자)',
  'Source_path': './test_source/중소벤처기업부_혁신창업사업화자금(융자)

In [11]:
# 제출용 샘플 파일 로드
submit_df = pd.read_csv("open/sample_submission.csv")

# 생성된 답변을 제출 DataFrame에 추가
submit_df['Answer'] = [item['Answer'] for item in results]
submit_df['Answer'] = submit_df['Answer'].fillna("데이콘")     # 모델에서 빈 값 (NaN) 생성 시 채점에 오류가 날 수 있음 [ 주의 ]

# 결과를 CSV 파일로 저장
submit_df.to_csv("./baseline_submission_lora18.csv", encoding='UTF-8-sig', index=False)

In [9]:
torch.cuda.empty_cache()