<a href="https://colab.research.google.com/github/JakeFRCSE/AI_SpeedLearn/blob/main/baseline_with_minstral_nemo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Question - Answering with Retrieval

본 대회의 과제는 중앙정부 재정 정보에 대한 **검색 기능**을 개선하고 활용도를 높이는 질의응답 알고리즘을 개발하는 것입니다. <br>이를 통해 방대한 재정 데이터를 일반 국민과 전문가 모두가 쉽게 접근하고 활용할 수 있도록 하는 것이 목표입니다. <br><br>
베이스라인에서는 평가 데이터셋만을 활용하여 source pdf 마다 Vector DB를 구축한 뒤 langchain 라이브러리와 llama-2-ko-7b 모델을 사용하여 RAG 프로세스를 통해 추론하는 과정을 담고 있습니다. <br>( train_set을 활용한 훈련 과정은 포함하지 않으며, test_set  에 대한 추론만 진행합니다. )

# Download Library

In [None]:
!pip install accelerate
!pip install -i https://pypi.org/simple/ bitsandbytes
!pip install transformers[torch] -U

!pip install datasets
!pip install langchain
!pip install langchain_community
!pip install PyMuPDF
!pip install sentence-transformers
!pip install faiss-gpu

Collecting nvidia-cuda-nvrtc-cu12==12.1.105 (from torch>=1.10.0->accelerate)
  Using cached nvidia_cuda_nvrtc_cu12-12.1.105-py3-none-manylinux1_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-runtime-cu12==12.1.105 (from torch>=1.10.0->accelerate)
  Using cached nvidia_cuda_runtime_cu12-12.1.105-py3-none-manylinux1_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-cupti-cu12==12.1.105 (from torch>=1.10.0->accelerate)
  Using cached nvidia_cuda_cupti_cu12-12.1.105-py3-none-manylinux1_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cudnn-cu12==8.9.2.26 (from torch>=1.10.0->accelerate)
  Using cached nvidia_cudnn_cu12-8.9.2.26-py3-none-manylinux1_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cublas-cu12==12.1.3.1 (from torch>=1.10.0->accelerate)
  Using cached nvidia_cublas_cu12-12.1.3.1-py3-none-manylinux1_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cufft-cu12==11.0.2.54 (from torch>=1.10.0->accelerate)
  Using cached nvidia_cufft_cu12-11.0.2.54-py3-none-manylinux1_x86_64.whl.me

# Import Library

In [None]:
import os
import unicodedata

import torch
import pandas as pd
from tqdm import tqdm
import fitz  # PyMuPDF

from transformers import (
    AutoTokenizer,
    AutoModelForCausalLM,
    pipeline,
    BitsAndBytesConfig
)
from accelerate import Accelerator

# Langchain 관련
from langchain.llms import HuggingFacePipeline
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.vectorstores import FAISS
from langchain.schema import Document
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.prompts import PromptTemplate
from langchain.schema.runnable import RunnablePassthrough
from langchain.schema.output_parser import StrOutputParser

# Vector DB

In [None]:
def process_pdf(file_path, chunk_size=800, chunk_overlap=50):
    """PDF 텍스트 추출 후 chunk 단위로 나누기"""
    # PDF 파일 열기
    doc = fitz.open(file_path)
    text = ''
    # 모든 페이지의 텍스트 추출
    for page in doc:
        text += page.get_text()
    # 텍스트를 chunk로 분할
    splitter = RecursiveCharacterTextSplitter(
        chunk_size=chunk_size,
        chunk_overlap=chunk_overlap
    )
    chunk_temp = splitter.split_text(text)
    # Document 객체 리스트 생성
    chunks = [Document(page_content=t) for t in chunk_temp]
    return chunks


def create_vector_db(chunks, model_path="intfloat/multilingual-e5-small"):
    """FAISS DB 생성"""
    # 임베딩 모델 설정
    model_kwargs = {'device': 'cuda'}
    encode_kwargs = {'normalize_embeddings': True}
    embeddings = HuggingFaceEmbeddings(
        model_name=model_path,
        model_kwargs=model_kwargs,
        encode_kwargs=encode_kwargs
    )
    # FAISS DB 생성 및 반환
    db = FAISS.from_documents(chunks, embedding=embeddings)
    return db

def normalize_path(path):
    """경로 유니코드 정규화"""
    return unicodedata.normalize('NFC', path)


def process_pdfs_from_dataframe(df, base_directory):
    """딕셔너리에 pdf명을 키로해서 DB, retriever 저장"""
    pdf_databases = {}
    unique_paths = df['Source_path'].unique()

    for path in tqdm(unique_paths, desc="Processing PDFs"):
        # 경로 정규화 및 절대 경로 생성
        normalized_path = normalize_path(path)
        full_path = os.path.normpath(os.path.join(base_directory, normalized_path.lstrip('./'))) if not os.path.isabs(normalized_path) else normalized_path

        pdf_title = os.path.splitext(os.path.basename(full_path))[0]
        print(f"Processing {pdf_title}...")

        # PDF 처리 및 벡터 DB 생성
        chunks = process_pdf(full_path)
        db = create_vector_db(chunks)

        # Retriever 생성
        retriever = db.as_retriever(search_type="mmr",
                                    search_kwargs={'k': 3, 'fetch_k': 8})

        # 결과 저장
        pdf_databases[pdf_title] = {
                'db': db,
                'retriever': retriever
        }
    return pdf_databases


# DB 생성

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
base_directory = '/content/drive/MyDrive/기타/Dacon_Financial_NLP' # Your Base Directory
df = pd.read_csv('/content/drive/MyDrive/기타/Dacon_Financial_NLP/test.csv')
pdf_databases = process_pdfs_from_dataframe(df, base_directory)

Processing PDFs:   0%|          | 0/9 [00:00<?, ?it/s]

Processing 중소벤처기업부_혁신창업사업화자금(융자)...


  warn_deprecated(
The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


modules.json:   0%|          | 0.00/387 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/498k [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/57.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/655 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/471M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/443 [00:00<?, ?B/s]

sentencepiece.bpe.model:   0%|          | 0.00/5.07M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/17.1M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/167 [00:00<?, ?B/s]

1_Pooling/config.json:   0%|          | 0.00/200 [00:00<?, ?B/s]

Processing PDFs:  11%|█         | 1/9 [00:10<01:27, 10.88s/it]

Processing 보건복지부_부모급여(영아수당) 지원...


Processing PDFs:  22%|██▏       | 2/9 [00:14<00:47,  6.73s/it]

Processing 보건복지부_노인장기요양보험 사업운영...


Processing PDFs:  33%|███▎      | 3/9 [00:18<00:33,  5.54s/it]

Processing 산업통상자원부_에너지바우처...


Processing PDFs:  44%|████▍     | 4/9 [00:23<00:25,  5.12s/it]

Processing 국토교통부_행복주택출자...


Processing PDFs:  56%|█████▌    | 5/9 [00:26<00:17,  4.48s/it]

Processing 「FIS 이슈 & 포커스」 22-4호 《중앙-지방 간 재정조정제도》...


Processing PDFs:  67%|██████▋   | 6/9 [00:32<00:14,  5.00s/it]

Processing 「FIS 이슈 & 포커스」 23-2호 《핵심재정사업 성과관리》...


Processing PDFs:  78%|███████▊  | 7/9 [00:38<00:10,  5.40s/it]

Processing 「FIS 이슈&포커스」 22-2호 《재정성과관리제도》...


Processing PDFs:  89%|████████▉ | 8/9 [00:46<00:06,  6.13s/it]

Processing 「FIS 이슈 & 포커스」(신규) 통권 제1호 《우발부채》...


Processing PDFs: 100%|██████████| 9/9 [00:53<00:00,  5.91s/it]


# MODEL Import

In [None]:
import huggingface_hub
huggingface_hub.login("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")

The token has not been saved to the git credentials helper. Pass `add_to_git_credential=True` in this function directly or `--add-to-git-credential` if using via `huggingface-cli` if you want to set the git credential as well.
Token is valid (permission: write).
Your token has been saved to /root/.cache/huggingface/token
Login successful


In [None]:
def setup_llm_pipeline():
    # 4비트 양자화 설정
    bnb_config = BitsAndBytesConfig(
        load_in_4bit=True,
        bnb_4bit_use_double_quant=True,
        bnb_4bit_quant_type="nf4",
        bnb_4bit_compute_dtype=torch.bfloat16
    )

    # 모델 ID
    model_id = "mistralai/Mistral-Nemo-Instruct-2407"

    # 토크나이저 로드 및 설정
    tokenizer = AutoTokenizer.from_pretrained(model_id)
    tokenizer.use_default_system_prompt = False

    # 모델 로드 및 양자화 설정 적용
    model = AutoModelForCausalLM.from_pretrained(
        model_id,
        quantization_config=bnb_config,
        device_map="auto",
        trust_remote_code=True )

    # HuggingFacePipeline 객체 생성
    text_generation_pipeline = pipeline(
        model=model,
        tokenizer=tokenizer,
        task="text-generation",
        return_full_text=False,
        max_new_tokens=128,
    )

    hf = HuggingFacePipeline(pipeline=text_generation_pipeline)

    return hf

In [None]:
# LLM 파이프라인
llm = setup_llm_pipeline()

tokenizer_config.json:   0%|          | 0.00/178k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/9.26M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/414 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/623 [00:00<?, ?B/s]

model.safetensors.index.json:   0%|          | 0.00/29.9k [00:00<?, ?B/s]

Downloading shards:   0%|          | 0/5 [00:00<?, ?it/s]

model-00001-of-00005.safetensors:   0%|          | 0.00/4.87G [00:00<?, ?B/s]

model-00002-of-00005.safetensors:   0%|          | 0.00/4.91G [00:00<?, ?B/s]

model-00003-of-00005.safetensors:   0%|          | 0.00/4.91G [00:00<?, ?B/s]

model-00004-of-00005.safetensors:   0%|          | 0.00/4.91G [00:00<?, ?B/s]

model-00005-of-00005.safetensors:   0%|          | 0.00/4.91G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/5 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/116 [00:00<?, ?B/s]

  warn_deprecated(


# Langchain 을 이용한 추론

In [None]:
def normalize_string(s):
    """유니코드 정규화"""
    return unicodedata.normalize('NFC', s)

def format_docs(docs):
    """검색된 문서들을 하나의 문자열로 포맷팅"""
    context = ""
    for doc in docs:
        context += doc.page_content
        context += '\n'
    return context

# 결과를 저장할 리스트 초기화
results = []

# DataFrame의 각 행에 대해 처리
for _, row in tqdm(df.iterrows(), total=len(df), desc="Answering Questions"):
    # 소스 문자열 정규화
    source = normalize_string(row['Source'])
    question = row['Question']

    # 정규화된 키로 데이터베이스 검색
    normalized_keys = {normalize_string(k): v for k, v in pdf_databases.items()}
    retriever = normalized_keys[source]['retriever']

    # RAG 체인 구성
    template = """
    다음 정보를 바탕으로 질문에 답하세요:
    {context}

    질문: {question}

    답변:
    """
    prompt = PromptTemplate.from_template(template)

    # RAG 체인 정의
    rag_chain = (
        {"context": retriever | format_docs, "question": RunnablePassthrough()}
        | prompt
        | llm
        | StrOutputParser()
    )

    # 답변 추론
    print(f"Question: {question}")
    full_response = rag_chain.invoke(question)

    print(f"Answer: {full_response}\n")

    # 결과 저장
    results.append({
        "Source": row['Source'],
        "Source_path": row['Source_path'],
        "Question": question,
        "Answer": full_response
    })

Answering Questions:   0%|          | 0/98 [00:00<?, ?it/s]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Question: 2022년 혁신창업사업화자금(융자)의 예산은 얼마인가요?


Answering Questions:   1%|          | 1/98 [00:05<08:34,  5.30s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  2022년 혁신창업사업화자금(융자)의 예산은 2,300,000,000원입니다.

Question: 중소벤처기업부의 혁신창업사업화자금(융자) 사업목적은 무엇인가요?


Answering Questions:   2%|▏         | 2/98 [00:15<13:17,  8.31s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - (창업기반지원) 기술력과 사업성이 우수하고 미래 성장가능성이 높은 중소벤처기업의 창업을 활성화하고 고용창출을 도모
     - (개발기술사업화) 중소기업이 보유한 우수 기술의 사장을 방지하고 개발기술의 제품화·사업화를 촉진하여 기술기반 중소기업을 육성

Question: 중소벤처기업부의 혁신창업사업화자금(융자) 사업근거는 어떤 법률에 근거하고 있나요?


Answering Questions:   3%|▎         | 3/98 [00:20<10:38,  6.73s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 중소기업진흥에 관한 법률 제66조, 제67조, 제74조
     - 중소기업창업지원법 제35조

Question: 2010년에 신규 지원된 혁신창업사업화자금은 무엇인가요?


Answering Questions:   4%|▍         | 4/98 [00:25<09:19,  5.96s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2010년에 신규 지원된 혁신창업사업화자금은 '재창업자금(실패 경영인에 대한 재기지원)'입니다.

Question: 혁신창업사업화자금 중 2020년에 신규 지원된 자금은 무엇인가요?


Answering Questions:   5%|▌         | 5/98 [00:29<08:04,  5.21s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2020년에 신규 지원된 자금은 미래기술육성자금, 고성장촉진자금입니다.

Question: 재창업자금이 재도약지원자금으로 이관된 연도는 언제인가요?


Answering Questions:   6%|▌         | 6/98 [00:33<07:32,  4.92s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2015. 1
     - 재창업자금을 재도약지원자금(융자)의 내역사업으로 이관

Question: 창업기반지원과 신청 대상이 중복인 자금이 어떤 것이며, 이 자금이 폐지된 연도는 언제인가요?


Answering Questions:   7%|▋         | 7/98 [00:39<07:47,  5.13s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 창업기반지원과 신청 대상이 중복인 자금은 일자리창출촉진자금입니다.
     - 이 자금이 폐지된 연도는 2023년입니다.

Question: 혁신창업사업화자금(융자) 사업을 시행하는 주체는 누구인가요?


Answering Questions:   8%|▊         | 8/98 [00:42<07:02,  4.69s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 혁신창업사업화자금(융자) 사업은 중소벤처기업진흥공단이 시행합니다.

Question: 혁신창업사업화자금(융자) 사업 집행절차는 어떻게 되나요?


Answering Questions:   9%|▉         | 9/98 [00:57<11:21,  7.66s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 중소기업진흥공단(중진공)에서 사업계획을 수립하고 공고합니다.
     - 중소기업이 중진공과 사전상담을 하고 신청을 접수합니다.
     - 중진공이 중소기업의 서류와 현장실사를 진행합니다.
     - 융자 실행 절차는 중진공과 은행이 중소기업에 융자를 실행합니다.
     - 중진공이 중소기업에 지원결정통보를 합니다.
     - 중진공이 중소기업의 평가를 진행

Question: 부모급여 지원 사업의 목적은 무엇인가요?


Answering Questions:  10%|█         | 10/98 [01:04<11:08,  7.60s/it]You seem to be using the pipelines sequentially on GPU. In order to maximize efficiency please use a dataset
Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 부모급여 지원 사업의 목적은 출산 및 양육으로 손실되는 소득을 보전하고, 주 양육자의 직접 돌봄이 중요하다는 아동 발달의 특성에 따라 영아기 돌봄을 두텁게 지원하기 위해 부모급여 지급입니다.

Question: 부모급여(영아수당)의 2024년 확정된 예산은 몇백만원인가요?


Answering Questions:  11%|█         | 11/98 [01:06<08:19,  5.74s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  2,888,694

Question: 부모급여 지원 사업은 어떤 법령상 근거를 갖고 추진되고 있나요?


Answering Questions:  12%|█▏        | 12/98 [01:09<07:04,  4.94s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 아동수당법 제4조제5항이 부모급여 지원 사업의 법령상 근거입니다.

Question: 영아수당 도입에 대한 추진경위는 어떻게 되나요?


Answering Questions:  13%|█▎        | 13/98 [01:23<11:05,  7.83s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - '제4차 저출산‧고령사회 기본계획'에서 영아수당 도입이 5대 핵심과제로 선정되었으며, 예비타당성조사 통과(’21.8.), 근거법 마련(’21.12.), 영아수당 지원사업 시행(’22.1~) 등의 과정을 거쳐 현재까지 진행되고 있습니다. 또한, '부모급여 도입'은 대통령 공약사항 및 국정과제에 포함되어(’22.5.) '24년부터 0~11개월 아동에게 월

Question: 부모급여 지원사업은 언제부터 시행되었나요?


Answering Questions:  14%|█▍        | 14/98 [01:26<08:39,  6.18s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 부모급여 지원사업은 2022년부터 시행되었습니다.

Question: 보건복지부의 부모급여(영아수당) 지원 사업시행방법은 무엇이며, 사업 수혜자는 누구인가?


Answering Questions:  15%|█▌        | 15/98 [01:32<08:39,  6.26s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 사업시행방법: 지자체 보조
     - 사업시행주체: 보건복지부, 시‧도 및 시‧군‧구
     - 사업 수혜자: 만 0~1세 아동

Question: 노인장기요양보험 사업 운영에 대한 목적은 무엇인가요?


Answering Questions:  16%|█▋        | 16/98 [01:43<10:29,  7.67s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 노인장기요양보험 사업 운영의 목적은 고령이나 노인성 질병으로 일상생활을 혼자서 수행하기 어려운 노인들에게 신체 또는 가사 활동 등을 제공하는 노인장기요양보험에 국고지원을 하여, 효율적인 정책추진으로 노후의 건강증진 및 생활 안정을 도모하고 가족의 부담을 완화하여 국민 삶의 질을 향상시키는 것입니다.

Question: 노인장기요양보험 운영지원에 대한 사업 내용을 설명해줘.


Answering Questions:  17%|█▋        | 17/98 [01:55<11:59,  8.88s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 노인장기요양보험 운영지원은 「노인장기요양보험법」제58조에 따라 국가가 국민건강보험 공단에 지원하는 법정지원금(장기요양보험료 예상수입액의 20% 상당)으로, 공무원·사립학교 교원의 장기요양보험료국가부담분 및 차상위계층의 장기요양보험료 지원을 포함합니다.

Question: 국고지원을 받는 기타 의료급여수급권자는 누구인가요?


Answering Questions:  18%|█▊        | 18/98 [02:09<13:53, 10.42s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - (기타 의료급여수급권자 급여비용 국가부담금) 「국민기초생활 보장법」에 의한 의료
급여수급권자를 제외한 기타* 의료급여수급권자의 장기요양급여 이용에 따른 급여
비용 및 관리운영비 국고지원(서울 50%, 기타지역 80%)
* 이재민, 의사상자, 국가유공자, 입양아동, 국가무형문화재보유자, 북한이탈주민등

Question: 장기요양보험가입자 및 피부양자의 자격취득과 관련하여 어떤 법률을 준용해야 하는가?


Answering Questions:  19%|█▉        | 19/98 [02:23<15:13, 11.56s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - "국민건강보험법" 제5조, 제6조, 제8조부터 제11조까지, 제69조제1항부터 제3항까지, 제76조부터 제86조까지 및 제110조는 장기요양보험가입자·피부양자의 자격취득·상실, 장기요양보험료 등의 납부·징수 및 결손처분 등에 관하여 이를 준용한다. 이 경우 "보험료"는 "장기요양보험료"로, "건강보험

Question: 노인장기요양보험법이 언제 제정되고 공포되었나?


Answering Questions:  20%|██        | 20/98 [02:27<12:18,  9.47s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 노인장기요양보험법은 2007년 4월에 제정되고, 2008년 7월부터 시행되었습니다.

Question: 장기요양인정점수 완화가 언제 이루어졌으며, 어떤 변화가 있었나?


Answering Questions:  21%|██▏       | 21/98 [02:42<13:58, 10.89s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2012년 7월과 2013년 7월 각각 2차례에 걸쳐 장기요양인정점수 완화가 이루어졌습니다.
     - 2012년 7월의 변경 내용은 3등급 인정점수 완화: (기존) 55∼75점 → (개선) 53점∼75점 이며,
     - 2013년 7월의 변경 내용은 3등급 인정점수 완화: (기존) 53∼75점

Question: 장기요양기관 지정갱신제의 법적 근거가 언제 마련되었는가?


Answering Questions:  22%|██▏       | 22/98 [02:43<10:15,  8.10s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2018년 12월

Question: 22.10월에 요양보호사 1명당 시설수급자 인력배치기준이 개선된 내용은 무엇인가?


Answering Questions:  23%|██▎       | 23/98 [02:48<09:03,  7.25s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 요양보호사 1명당 시설수급자 인력배치기준이 개선되었습니다. 기존 1명당 2.5명으로 2.3명으로 변경되었습니다.

Question: 에너지 바우처 제도의 주요 내용은 무엇인가요?


Answering Questions:  24%|██▍       | 24/98 [03:03<11:28,  9.30s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 에너지 바우처 제도는 에너지 소외계층을 대상으로 하는 복지 지원 사업으로, 에너지법 제16조의2, 제16조의3 및 에너지 및 지원사업 특별회계법 제2조에 근거합니다.
     - 이 제도는 18대 정부 국정과제(43번)로 포함되어 2015년 11월부터 2016년 1월까지 신청과 접수를 시작으로, 매년 10월부터 다음해 4월까지 신청·접수와 11월부터 다음

Question: 에너지바우처 사업의 주요 수혜자는 누구인가요?


Answering Questions:  26%|██▌       | 25/98 [03:16<12:44, 10.47s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 에너지바우처 사업의 주요 수혜자는 에너지이용 소외계층에 속하는 사람으로서 대통령령에 정하는 요건을 갖춘 사람입니다. 구체적으로는 다음과 같은 사람들이 수혜대상입니다:
       - 저소득층
       - 중증희귀질환자 세대
       - 중증 및 희귀난치성질환자 세대
       - 한부모 및 소년소녀가정세대
       - 필수전력(연간 2,500kWh 이상) 사용자

Question: 2024년 에너지바우처 사업의 사업시행주체는 무엇인가요?


Answering Questions:  27%|██▋       | 26/98 [03:19<09:58,  8.32s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2024년 에너지바우처 사업의 사업시행주체는 한국에너지공단입니다.

Question: 하절기바우처와 동절기바우처의 2024년 예산 규모는 각각 얼마인가요?


Answering Questions:  28%|██▊       | 27/98 [03:26<09:20,  7.90s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 하절기바우처의 2024년 예산 규모는 47,143만 원입니다.
     - 동절기바우처의 2024년 예산 규모는 156,267만 원입니다.

Question: 2023년 에너지바우처 사업 예산에서 사업운영비 중 에너지복지 홍보에 얼마가 할당되었나요?


Answering Questions:  29%|██▊       | 28/98 [03:31<08:12,  7.03s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2023년 에너지바우처 사업 예산에서 사업운영비 중 에너지복지 홍보에 할당된 금액은 328백만원입니다.

Question: 2023년 에너지바우처 사업 예산에서 사업운영비 중 시스템 고도화에 얼마가 할당되었나요?


Answering Questions:  30%|██▉       | 29/98 [03:36<07:17,  6.34s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  2023년 에너지바우처 사업 예산에서 사업운영비 중 시스템 고도화에 할당된 금액은 520백만원입니다.

Question: 2023년 에너지바우처 사업 예산에서 콜센터 운영에 얼마가 할당되었나요?


Answering Questions:  31%|███       | 30/98 [03:40<06:28,  5.72s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2023년 에너지바우처 사업 예산에서 콜센터 운영에 할당된 금액은 280백만원입니다.

Question: 2023년 에너지바우처 사업 예산에서 패널조사에 얼마가 할당되었나요?


Answering Questions:  32%|███▏      | 31/98 [03:44<05:53,  5.28s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  2023년 에너지바우처 사업 예산에서 패널조사에 할당된 금액은 131.7백만원입니다.

Question: 2023년 에너지바우처 사업 예산에서 에너지바우처 전달체계 구축에 얼마가 할당되었나요?


Answering Questions:  33%|███▎      | 32/98 [03:49<05:39,  5.15s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2023년 에너지바우처 사업 예산에서 에너지바우처 전달체계 구축에 할당된 금액은 37.5백만원입니다.

Question: 2023년 에너지바우처 사업 예산에서 주택관리공단 운영지원에 얼마가 할당되었나요?


Answering Questions:  34%|███▎      | 33/98 [03:54<05:23,  4.98s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2023년 에너지바우처 사업 예산에서 주택관리공단 운영지원에 할당된 금액은 50백만원입니다.

Question: 에너지바우처 사업의 향후 기대효과는 무엇인가요?


Answering Questions:  35%|███▍      | 34/98 [04:08<08:13,  7.71s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 에너지바우처 사업은 저소득층과 에너지 소외계층을 대상으로 에너지를 지원하여 그들의 생활에 직접적인 영향을 미칩니다. 향후 기대효과는 다음과 같이 예상됩니다:
       1. **에너지 소외계층의 복지 향상**: 에너지바우처는 저소득층과 에너지 소외계층에게 에너지를 제공함으로써 그들의 생활환경을 개선시키고, 특히 겨울철 난방과 여름철 냉방에 도움을 줍니다.
       2. **가계 경제적 부담 감소**: 에너지바우처는 가계

Question: 에너지바우처 사업에 대한 예비타당성조사를 어떤 조사기관이 수행했나요?


Answering Questions:  36%|███▌      | 35/98 [04:14<07:45,  7.38s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - KDI(한국개발연구원 공공투자관리센터)가 2014년 8월에 에너지바우처 지원사업(2014년도 예비타당성조사 보고서)를 작성하였습니다.

Question: 21년 국정감사에서 에너지 바우처 사업에 대한 주요 지적사항은 무엇이었나요?


Answering Questions:  37%|███▋      | 36/98 [04:19<06:37,  6.41s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 저소득층의 폭염 피해 최소화를 위해 동절기 에너지바우처 일부를 하절기에 사용할 수 있도록 제도 개선할 것

Question: 21년 에너지바우처 사업에 대한 결산 지적사항은 무엇이었나요?


Answering Questions:  38%|███▊      | 37/98 [04:26<06:42,  6.60s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 21년 결산 지적사항은 수급자 변경 등으로 예산부족이 발생하지 않도록 급여 선정기준 등의 변경계획 등에 대하여 보건복지부·지자체와 면밀히 소통하여 예산을 편성하고 사업을 추진할 것 이었다.

Question: 에너지 바우처 사업의 향후 추진방향 중 '취약계층의 에너지 비용 부담 완화'를 위한 계획은 무엇이었나요?


Answering Questions:  39%|███▉      | 38/98 [04:39<08:40,  8.68s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2023년부터 주거·교육급여 수급세대 중 더위·추위민감계층까지 영구적으로 확대
     - 동절기 에너지바우처 지원단가를 15.9만원에서 30.4만원으로 한시적으로 인상(15.2만원→30.4만원)
     - 2024년부터 하절기 에너지바우처 지원단가를 0.3만원 인상(하절기 평균 4만원→4.3만원)

Question: 행복주택출자 사업은 어떤 근거로 추진되고 있는가?


Answering Questions:  40%|███▉      | 39/98 [04:47<08:17,  8.43s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 행복주택출자 사업은 주택도시기금법 제9조제1항가목에 근거로 진행되고 있습니다. 해당 조항은 기금의 주택계정 사용 용도를 명시하고 있으며, 행복주택출자(1440-408)가 그 하나입니다.

Question: 행복주택출자 사업은 어떤 목적으로 시행되는가?


Answering Questions:  41%|████      | 40/98 [04:53<07:19,  7.58s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 행복주택출자 사업은 국민의 행복주거 실현을 위한 보편적 주거복지 정책의 일환으로 도심 내 다양한 부지를 활용하여 행복주택을 공급하는 목적으로 시행된다.

Question: 행복주택출자 사업의 주요 수혜자는 누구인가?


Answering Questions:  42%|████▏     | 41/98 [05:00<07:10,  7.55s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 행복주택출자 사업의 주요 수혜자는 대
학
생
・사
회
초
년
생・
신혼부
부 등 젊
은층(80%), 고
령자 및 주
거취약
계층
(20%)입니다.

Question: 행복주택출자 사업의 사업비 추이는 어떠한가?


Answering Questions:  43%|████▎     | 42/98 [05:12<08:13,  8.82s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2022년 결산 금액은 564,342 백만원, 2023년 계획 금액은 684,607 백만원, 2024년 계획 금액은 461,607 백만원입니다.
     - 2023년 계획 금액에 비해 2024년 계획 금액이 22.8% 감소한 것을 볼 수 있습니다.

Question: 행복주택출자 사업의 사업시행주체는 누구인가?


Answering Questions:  44%|████▍     | 43/98 [05:16<06:47,  7.41s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 행복주택출자 사업의 사업시행주체는 한국토지주택공사(LH)와 지자체(지방공사)입니다.

Question: 국고보조사업의 보조율은 어떠한 기준에 따라 운용되는가?


Answering Questions:  45%|████▍     | 44/98 [05:21<06:07,  6.80s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 국고보조사업의 보조율은 지방자치단체의 재정여건을 고려하여 적용되고 있습니다. 기준보조율과 차등보조율을 적용하여 운용하고 있습니다.

Question: 프랑스의 재정조정제도에서 최근 강조되는 형평교부금은 어떤 역할을 하는가?


Answering Questions:  46%|████▌     | 45/98 [05:33<07:24,  8.39s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  프랑스의 재정조정제도에서 최근 강조되는 형평교부금은 재정력이 약한 지방정부에 재정력을 강하게 가진 중앙정부로부터 지원을 제공하여 재정적 불균형을 조정하고, 재정력이 약한 지방정부의 재정력을 강화시키는 역할을 합니다. 이는 재정력이 약한 지방정부의 재정적 형평성을 보장하고, 중앙정부와 지방정부의 재정적 책임을 공정하게 분담하는 데 기여합니다.

Question: 지방재정조정제도의 목적은 무엇인가?


Answering Questions:  47%|████▋     | 46/98 [05:40<06:50,  7.89s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 지방자치단체 간 재정력 격차의 시정, 지역 간 외부 효과의 내부화를 통한 지방공공재 공급, 중앙정부의 위임사무에 대한 비용 부담 등을 목적으로 재정을 조정하는 일련의 조치를 의미합니다.

Question: 국제적으로 성과중심 재정관리 강화 움직임이 확산된 시기는 언제인가?


Answering Questions:  48%|████▊     | 47/98 [05:47<06:22,  7.50s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  2000년대 후반 금융위기로 인한 영향으로, 2007년 기준 70% 이상의 OECD 국가에서 예결산 문서에 비재무적 성과정보를 포함하는 것이 국제적으로 확산되기 시작했습니다.

Question: 한국의 재정사업 성과관리제도는 어떠한 법을 통해 운영되고 있으며, 성과관리 기본계획과 추진계획은 어떻게 의무화되었는가?


Answering Questions:  49%|████▉     | 48/98 [06:01<07:54,  9.49s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  한국의 재정사업 성과관리제도는 2006년 4대 재정개혁을 통해 프로그램 예산제도를 근간으로 하는 제도가 정착되어 운영되고 있다. 이후 2007년 「국가재정법」이 시행되면서 최소한의 법 조항으로 운영되어 왔다. 2021년 12월 법 개정을 통해 별도의 장(章)이 신설되어 개념 및 체계가 명확화되었으며, 재정사업 성과관리가 '성과목표관리'와 '성과평가'로 명시되고 용

Question: 핵심재정사업 성과관리제도를 안착시키기 위해 필요한 노력과 성과 정보를 학습의 도구로 활용하는 방안은 무엇인가?


Answering Questions:  50%|█████     | 49/98 [06:15<08:51, 10.84s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 핵심재정사업 성과관리제도를 안착시키기 위해 필요한 노력과 성과 정보를 학습의 도구로 활용하는 방안은 다음과 같이 제안할 수 있습니다:
       1. **성과정보의 유용성 개선**: 성과정보의 유용성을 개선함으로써 더 많은 성과정보의 사용을 촉진할 수 있습니다. 이를 위해, 성과정보를 제공하는 방식과 내용을 개선하고, 성과정보를 이해하고 활용하기 쉬운 형태로 제공해야 합니다.
       2. **의사결정에서의 성과정보 사용**: 의사결정

Question: 사회보험 사각지대 발생의 주요 원인과 이로 인해 발생하는 문제는 무엇인가요?


Answering Questions:  51%|█████     | 50/98 [06:29<09:26, 11.79s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  사회보험 사각지대 발생의 주요 원인은 다음과 같습니다:
     - 사업주의 비용절감: 사업주가 사회보험 가입을 피하기 위해 저임금 근로자나 임시직 근로자를 채용하거나, 가입을 미루거나 하지 않는 경우
     - 보험 가입에 따른 근로자의 실질 가처분 소득 감소: 사회보험 가입으로 인해 근로자의 실질 가처분 소득이 감소할 수 있기 때문에, 근로자가 사회보험 가입을 꺼릴 수 있습니다
     - 고용 취약계층과 소규모

Question: 청년일자리도약장려금은 어떤 대상을 지원하며, 어떤 방식으로 지원되는가?


Answering Questions:  52%|█████▏    | 51/98 [06:43<09:47, 12.50s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 청년일자리도약장려금은 만 15~34세의 취업애로청년을 지원하는 한시사업으로, ’22년부터 ’24년까지 진행된다.
     - 이 장려금은 우선지원대상기업에서 정규직으로 채용한 만 15~34세의 취업애로청년을 6개월 이상 고용유지하는 경우 최장 2년간 지원된다.
     - ’23년에는 8,891억원의 예산이 투입되며, 장려금의 지원 규모는 최장 

Question: 수직적 재정조정제도와 수평적 재정조정제도의 차이는 무엇인가요?


Answering Questions:  53%|█████▎    | 52/98 [06:57<09:59, 13.04s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 수직적 재정조정제도는 중앙정부와 지방정부 간(수직적) 재원을 재배분하는 제도를 말합니다. 이는 정부 층위에 따라 발생하는 지출과 자체수입 간 차이인 수직적 재정불균형을 해소하기 위해 중앙-지방 간 또는 광역-기초 간에 지방교부세, 국고보조금, 조정교부금(자치구 조정교부금, 시·군 조정 교부금) 재원을 이전하는 것을 의미합니다.
     - 수평적 재정조정제도는

Question: 지방재정조정제도는 어떤 목적을 가지고 있나요?


Answering Questions:  54%|█████▍    | 53/98 [07:04<08:20, 11.13s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 지방자치단체 간 재정력 격차의 시정, 지역 간 외부 효과의 내부화를 통한 지방공공재 공급, 중앙정부의 위임사무에 대한 비용 부담 등을 목적으로 재정을 조정하는 일련의 조치를 의미합니다.

Question: 중앙-지방 간 재정조정제도에서 어떤 재원을 이전하여 수직적 재정 불균형을 해소하는가?


Answering Questions:  55%|█████▌    | 54/98 [07:08<06:41,  9.12s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 지방교부세
     - 국고보조금
     - 조정교부금 (자치구 조정교부금, 시·군 조정교부금)

Question: 중앙정부의 예산편성은 어떤 재원 배분 문제를 결정하며, 중앙-지방 간 재정조정제도를 통해 어떤 재원을 이전하고, 이의 목적은 무엇인가?


Answering Questions:  56%|█████▌    | 55/98 [07:23<07:37, 10.65s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  중앙정부의 예산편성은 결국 민간과 공공 부문 사이의 재원 배분의 문제이며 중앙과 지방 사이의 재원 배분 문제이다. 중앙정부가 지방자치단체에 얼마의 재원을 어떤 기준에 의해 배분할 것인가에 대한 답은 지방재정조정 제도를 통해 찾을 수 있다. 우리나라의 중앙-지방 간 재정조정제도에서는 지방교부세와 국고보조금을 중심으로 수직적 재정조정이 이루어지고 있다. 지방교부세와 국고보조금은 중앙정부로부터 지방자치단체로

Question: 재정사업 성과관리제도의 필요성이 대두된 시기와 한국의 재정사업 성과관리제도가 어떤 법에 근거하여 운영되고 있는지 설명하시오.


Answering Questions:  57%|█████▋    | 56/98 [07:37<08:10, 11.68s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 재정사업 성과관리제도의 필요성이 대두된 시기는 1990년대 후반부터입니다. 이 시기는 전 세계적으로 금융위기가 발생하고, 국제적으로 성과중심 재정관리 강화의 움직임이 확산되면서, 재정사업의 실효성을 제고하기 위한 노력이 시작되었습니다.
     - 한국의 재정사업 성과관리제도는 2006년 4대 재정개혁을 통해 정착되어 운영되고 있습니다. 이 개혁의 일환으로 프로그램 예산제도를 근간으로 하는 재정

Question: 청년일자리도약장려금은 어떤 대상을 지원하며, 어떤 방식으로 지원되는가?


Answering Questions:  58%|█████▊    | 57/98 [07:51<08:29, 12.43s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 청년일자리도약장려금은 만 15~34세의 취업애로청년을 지원하는 한시사업으로, ’22년부터 ’24년까지 진행된다.
     - 이 장려금은 우선지원대상기업에서 정규직으로 채용한 만 15~34세의 취업애로청년을 6개월 이상 고용유지하는 경우 최장 2년간 지원된다.
     - ’23년에는 8,891억원의 예산이 투입되며, 장려금의 지원 규모는 최장 

Question: 재정성과관리제도는 어떤 측면에서 국정운영과 연결되는가?


Answering Questions:  59%|█████▉    | 58/98 [07:57<07:04, 10.60s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  재정성과관리제도는 전략목표와 우선순위를 중심으로 재정사업을 재구조화한다는 점에서 국정운영과 연결되고, 지출 우선순위 측면에서 재정을 중장기 시계로 확장시켜 줍니다.

Question: 성과관리의 실효성 강화를 위해 정부가 취한 조치는 무엇인가?


Answering Questions:  60%|██████    | 59/98 [08:11<07:35, 11.69s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 재정사업 평가 대상 평가 기준, 절차, 방법 등을 표준화하고 부담 완화 및 지출 효율화
     - 다기화된 재정사업 평가제도를 통합 및 연계하는 정비 방안을 마련하여 시행
     - 중기재정사업 성과관리를 발표
     - 성과관리 사각지대 해소, 사업성과평가의 예산편성 활용 확대를 위한 중점 추진과제를 제시
     - 핵심사업평가를 위한 핵심 재정사업군을 선별하여 5년간 전주기 관리
     - 사업별

Question: 재정성과관리 관련 주요 쟁점은 무엇인가?


Answering Questions:  61%|██████    | 60/98 [08:17<06:14,  9.86s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 재정성과관리제도의 실효성 제고
     - 환경 변화에 대한 적응
     - 평가 및 피평가자 피로
     - 재정사업 자율평가의 전면 개편

Question: 재정성과관리가 왜 중요한가?


Answering Questions:  62%|██████▏   | 61/98 [08:31<06:51, 11.12s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  재정성과관리는 재정의 투명성, 책임성, 효율성, 효과성, 예산 재분배 등을 목적으로 합니다. 이를 통해 정부는 국민에게 재정의 투명성을 제공하고, 예산의 효율적인 사용을 위해 노력할 수 있습니다. 또한, 재정성과관리는 예산의 편성에서 집행, 결산에 이르는 전 과정에서 수행되며, 예산 편성 과정에서부터 시작되어 연간 성과지표와 목표치를 관리하고, 각 부처는 자율평가를 수행하고, 재정당국인 기획재정부는 지표의 적

Question: 재정성과관리는 무엇을 목표로 하는가?


Answering Questions:  63%|██████▎   | 62/98 [08:45<07:12, 12.02s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  재정성과관리는 지출 효율성을 증진하기 위해 재정지출이 달성해야 할 목표를 정확히 설정하고, 이의 달
성도를 지속적으로 관리하는 활동입니다. 재정의 목적 달성 여부는 효율성, 형평성 등 다양한 가치를 통해 평
가될 수 있으며, 이를 위해 정부는 각종 측정 수단을 구비하여 계획 대비 집행 성과를 수집하고 이 성과 정보를 환
류하여 차년도 예산을 합리적으로 편성하기 위해 노력하고 있습니다. 프로그램 예산체계는 각 부처에서 동질적인 사업
의 묶음인

Question: 어떤 국제기구들이 사업을 기준으로 예산을 나누어 성과 정보를 생산하고 있는가?


Answering Questions:  64%|██████▍   | 63/98 [08:49<05:30,  9.45s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  OECD, World Bank 등은 2000년대부터 사업을 기준으로 예산을 나누어 성과 정보를 생산할 것을 강조하기 시작했습니다.

Question: 재정성과관리의 목적은 무엇인가?


Answering Questions:  65%|██████▌   | 64/98 [09:02<06:02, 10.66s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 정부 재정의 투명성·책임성, 효율성·효과성, 예산재분배 등을 향상시키는 데 목적이 있다.
     - 사업 전략체계별 재원 배분, 성과목표와 달성도, 주요 수혜자에 대한 정보를 집약적으로 제공하여 투명성 및 책임성을 향상시키는 데 목적이 있다.
     - 연간 성과관리 결과 도출된 문제점 등을 사업 관리에 환류(managerial feedback)하여 사업 성과를 제고하고 효과성을 향상시키는 데 목적이 있다.

Question: 2021년 「국가재정법」 개정으로 어떤 규정이 신설되었는가?


Answering Questions:  66%|██████▋   | 65/98 [09:16<06:21, 11.56s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2021년 「국가재정법」 개정으로, 동 법에 의한 재정사업 평가와 개별 법령에 따라 실시되는 평가 대상 중복이 최소화되도록 하는 규정을 신설하여, 재정성과관리를 위한 재정사업 평가와 개별 법령에 따라 실시되는 평가 간의 관계를 최초로 규정
     - 사업을 임무와 전략 체계에 따라 구조화하고, 프로그램, 단위사업별 성과지표를 구비하여 재정 투입 성과를 직관적으로 알기 쉽도록 체계화

Question: 성과관리제도는 지출 구조조정을 위해 어떤 방향으로 추진되고 있는가?


Answering Questions:  67%|██████▋   | 66/98 [09:30<06:36, 12.39s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2022년도에는 지출구조조정 기준이 변경되었습니다. 기존의 부처의 자발적·주도적 추진과 부처 차관 주재 구조조정 추진TF 구성만 있던 것이, 각 부처별로 사업별 성과 목표달성도를 상대평가하여 하위 15%를 미흡 등급 배분하고, 관련 예산 1% 구조조정 추진을 포함하게 되었습니다. 또한, 예산 규모 기준 등급 배분 도입으로 소액사업 위주로 미흡 등급 배분되는 관행을

Question: 재정사업 자율평가의 목적은 무엇이며, 어떤 방식으로 제도 개선이 이루어졌는가?


Answering Questions:  68%|██████▊   | 67/98 [09:44<06:41, 12.95s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 재정사업 자율평가의 목적은 재정사업의 효과성과 효율성을 평가하고, 재정사업의 구조조정을 통한 재정의 정상화와 지속가능성을 확보하는 데 있다.
     - 제도 개선은 다음과 같이 이루어졌다:
       - 2006년부터 2015년까지는 재정사업 자율평가를 통해 모든 사업의 1/3을 3년 주기로 점검하였다.
       - 2016년에는 전체 사업을 점검하고, 2017년부터는 메타 평가를

Question: 2016년 재정성과관리제도의 환류 개선사항은 무엇인가?


Answering Questions:  69%|██████▉   | 68/98 [09:55<06:05, 12.17s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2016년도 환류 개선을 통해 평가 대상 사업 전체 예산의 1% 이내에서 부처에서 자율적으로 세출구조조정을 할 수 있도록 하였으며, 우수 등급 사업도 지출구조조정이 가능하게 하였고, 구조조정이 어려운 사업에 대해서는 성과관리 개선대책을 제출하게 하였습니다. 현재도 이 틀에서 환류가 진행되고 있습니다.

Question: 2018년도에 재정성과관리제도 개선사항과, 이로 인해 어떤 효과가 발생했는가?


Answering Questions:  70%|███████   | 69/98 [10:08<06:01, 12.46s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2018년도에는 재정성과관리제도 개선사항으로, 재정사업의 평가대상과 평가기준을 명확히 하고, 평가결과를 
       반영한 예산편성, 평가결과 활용을 위한 정보화, 평가결과 공개를 위한 제도 마련 등이 이루어졌습니다.
     - 이로 인해, 재정사업의 투명성, 책임성, 효율성, 효과성 등이 향상되었으며, 예산재분배도 개선되었습니다.

Question: 재정사업 자율평가의 전면 개편을 통해 어떤 중점 추진과제가 제시되었는가?


Answering Questions:  71%|███████▏  | 70/98 [10:22<06:02, 12.95s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 
(과기정통부, 행안부 등에서 실시하는 재정사업 평가 대상 평가 기준, 절차, 방법 등을 표준화하고 부담 완화 및 지출 효율화)
     - 
(다기화된 재정사업 평가제도를 통합 및 연계하는 정비 방안을 마련하여 시행)
     - 
(성과관리 사각지대 해소, 사업성과평가의 예산편성 활용 확대를 위한 중점 추진과제를 제시)
     - 
(평가부담 완화를 위한 개선과 함께

Question: 재정성과관리제도의 중요성과 국정운영과의 연결성은 무엇인가?


Answering Questions:  72%|███████▏  | 71/98 [10:36<05:59, 13.32s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 재정성과관리제도는 재정을 프로그램 단위로 구분하고, 사전 목표와 사후 평가 결과를 중심으로 관리하는 것을 의미합니다. 이는 재정수지, 국가채무 등 재정 전체에 대한 총량 관리에서는 보지 못하는 미시적인 부분까지 재정을 관리하는 것으로, 총량 관리와 보완적인 관계입니다.
     - 재정성과관리제도는 전략목표와 우선순위를 중심으로 재정사업을 재구조화한다는 점에서 국정운영과 연결되고, 지출 우선순위 측면에서 재정을 중장기 시계로 확장시켜 줍

Question: 재정성과관리체계 강화를 위해 정부가 어떤 제도를 제시했으며, 재정성과관리는 무엇을 목표로 하는가?


Answering Questions:  73%|███████▎  | 72/98 [10:50<05:53, 13.58s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 재정성과관리체계 강화를 위해 정부가 제시한 제도는 다음과 같습니다:
       - 「국가재정법」 개정으로 재정사업 평가와 개별 법령에 따라 실시되는 평가 간의 관계를 최초로 규정
       - 사전 목표에 대한 사후 측정 및 평가, 유사한 사업 묶음 간의 표준화된 비교를 위한 재정사업 평가제도의 발전을 함께 수반
       - 재정사업에 대한 자율평가를 수행하고, 재정당국인 기획재정부가 지표가 적정한지 점검하고 개별 재정

Question: 재정성과관리는 어떤 과정에서 수행되며, 무엇을 증진하기 위해 활동하는가?


Answering Questions:  74%|███████▍  | 73/98 [11:01<05:18, 12.74s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  재정성과관리는 재정사업의 기획에서 집행, 환류, 종료에 이르는 전 주기를 체계적으로 관리하여 효율적 재정 운용을 뒷받침하고, 관련 정보를 국민에게 공개하여 책임성을 확보하는 것을 의미합니다. 재정성과관리는 지출 효율성을 증진하기 위해 재정지출이 달성해야 할 목표를 정확히 설정하고, 이의 달성도를 지속적으로 관리하는 활동입니다.

Question: 재정성과관리의 목적과 우리나라의 재정성과관리제도가 프로그램 예산제도로 전환된 시기는?


Answering Questions:  76%|███████▌  | 74/98 [11:11<04:45, 11.89s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 재정성과관리의 목적은 재정사업의 기획에서 집행, 환류, 종료에 이르는 전 주기를 체계적으로 관리하여 효율적 재정 운용을 뒷받침하고, 관련 정보를 국민에게 공개하여 책임성을 확보하는 것을 의미
     - 우리나라의 재정성과관리제도가 프로그램 예산제도로 전환된 시기는 2006년이다.

Question: 2007년과 2021년에 각각 「국가재정법」이 개정되면서 성과관리 제도는 어떻게 강화되고 구체화되었으며, 이 개정의 주된 목적은 무엇인가?


Answering Questions:  77%|███████▋  | 75/98 [11:25<04:49, 12.58s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2007년 「국가재정법」의 개정으로, 과거에 단발적으로 이루어진 성과관리 제도를 종합하여, 성과관리의 기본 단위, 성과 측정과 보고를 위한 체계 확립을 통해, 공개를 통한 투명성 확보 및 책임성 향상에 기여하였다.
     - 2021년 「국가재정법」의 개정으로, 재정성과관리 체계의 운영 결과를 종합하고 발전시킬 수 있도록 개선하고, 재정사업의 프로그램, 단위사업별 성과지표를 구비

Question: 재정사업 자율평가의 목적과 제도 개선 방식은 무엇인가?


Answering Questions:  78%|███████▊  | 76/98 [11:38<04:38, 12.68s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 재정사업 자율평가의 목적은 재정사업의 효과성과 효율성을 평가하고, 재정사업의 지출구조조정을 통한 재정의 정상화와 지속가능성을 확보하는 데 있다.
     - 제도 개선 방식은 다음과 같이 진행된다:
       ① 일반평가, 특별평가, 보조사업평가 등 기획재정부 주관 사업평가를 통한 구조조정 추진
       ② 평가표준화, 평가제도 정비 등

Question: 2015년 이전과 2016년에 재정성과 평가 결과 처리 방식과 환류 개선 방식은 어떻게 달라졌는가?


Answering Questions:  79%|███████▊  | 77/98 [11:52<04:36, 13.14s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2015년 이전에는 각 부처가 3년 주기로 사업을 점검하고, 기획재정부가 메타 평가 방식으로 전수를 평가했습니다. 그러나, 단위 사업 내 성과가 우수한 세부사업이 삭감되는 일도 발생하고, 구조조정이 어려운 사업의 평가를 통한 환류가 어려웠습니다.
     - 2016년에는 연구개발사업을 포함시키고, 평가 주기를 전 사업에 걸쳐 매년 평가하는 것으로 변경한 통합재정사업 평가제도를 시행했습니다. 이로 인해 환류 방식을 개선하여

Question: 재정관리시스템 구축과 성과관리 개편을 추진하는 주된 목적은 무엇인가?


Answering Questions:  80%|███████▉  | 78/98 [12:03<04:10, 12.51s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 재정관리시스템 구축과 성과관리 개편을 추진하는 주된 목적은 재정의 투명성, 책임성, 효율성, 효과성, 예산재분배 등을 향상시키는 데 있다. 이를 통해 국민에게 재정의 투명성을 제공하고, 재정운용의 효율성을 제고하며, 재정의 효과성을 높이고, 예산의 재분배를 합리적으로 할 수 있다.

Question: 우리나라에서는 언제부터 발생주의 기준을 적용한 국가결산보고서에서 우발부채를 보고하고 있는가?


Answering Questions:  81%|████████  | 79/98 [12:07<03:06,  9.80s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 2010년부터 발생주의 기준을 적용한 국가결산보고서에서 우발부채를 보고하고 있습니다.

Question: 우발부채 관련 주요 쟁점은 무엇인가?


Answering Questions:  82%|████████▏ | 80/98 [12:21<03:20, 11.14s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 우발부채 개념 및 용어 사용의 혼란
     - 우발부채 분류기준 재검토, 새로운 분류기준 정립
     - 발생주의 회계기준을 적용한 국가결산보고서가 10년간 작성되었으나 우발부채의 인식과 공시는 크게 달라지지 않음
     - 우리나라는 국가회계기준, 지방회계기준, 한국채택국제회계기준(K-IFRS) 등에서 우발부채를 광의적 개념에만 정의하고 있어 용어 사용 혼란 및 체계적 관리 한

Question: 우발부채의 관리는 왜 중요한 이슈로 여겨지는가?


Answering Questions:  83%|████████▎ | 81/98 [12:35<03:25, 12.09s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 국제기준 재정통계 산출에 발생주의 회계기준이 적용되면서 미래의 다양한 의무(constructive obligation)를 포괄하는 우발부채 관리에 대한 중요성 인식
     - 공공부문에서는 재정건전성, 재정위기 관리 등 다양한 관점에서 중요하게 다뤄져야 할 필요
     - GFSM2014에서는 '명시적 우발부채'와 '암묵적 우발부채'로 세분화하여 우발부채 범주를 구체적으로 다룸
     - 우리나라는

Question: 우발부채와 부채의 차이점은 무엇인가?


Answering Questions:  84%|████████▎ | 82/98 [12:49<03:21, 12.60s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 우발부채는 미래에 특정 사건(들)이 일어나지 않는 한 발생하지 않는 의무로, 하나 또는 그 이상의 조건이 충족되어야 금융거래로 인식된다는 점에서 ‘부채’와 차이가 있다.
     - 부채는 현재 존재하는 의무로, 금융거래로 이미 인식된 상태이다.
     - 우발부채는 재정위험을 발생시키는 구체적 원인이 될 수 있으며, 의도적인 공공정책이나 재정위기와 같이 예기치 못한 사건으로 인해 발생할 수 있다.

Question: 발생주의와 현금주의의 차이는 무엇인가?


Answering Questions:  85%|████████▍ | 83/98 [13:00<03:00, 12.05s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  발생주의(accrual basis)란 '경제적 거래가 발생하는 시점'에 거래를 기록하는 방식입니다. 반면 현금주의(cash basis)는 '현금을 수취하거나 지급한 시점'에 거래를 기록하는 방식입니다. 즉, 발생주의는 거래가 실제로 발생한 시점을 기준으로, 현금주의는 현금이 실제로 수취되거나 지급된 시점을 기준으로 거래를 기록한다는 차이가 있습니다.

Question: 채무지속가능성분석은 어떤 목적을 가지고 도입되었는가?


Answering Questions:  86%|████████▌ | 84/98 [13:09<02:35, 11.10s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  채무지속가능성분석(Debt Sustainability Analysis, DSA)은 공공부문과 대외채무 지속가능성 분석에 관한 공식적인 체계로, 잠재적 재정위기 감지, 예방, 해결을 위한 IMF의 노력으로 2002년에 도입되었다(IMF, 2013).

Question: 의제의무란 무엇인가?


Answering Questions:  87%|████████▋ | 85/98 [13:21<02:27, 11.34s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  의제의무(擬制義務, constructive obligation)란 발표된 정부방침 또는 구체적이고 유효한 약속이나 과거의 실무관행 등을 통해 중앙관서 또는 기금이 특정 책임을 부담한다는 것을 표명함으로써 상대방이 그 책임을 이행할 것이라는 정당한 기대를 가지게 되는 경우 발생하는 의무를 말한다(「충당부채, 우발부채, 우발자산 회계처리지침」, 2018).

Question: 국제통화기금이 재정통계 작성의 국제기준을 제시하기 위해 발간한 매뉴얼은 무엇인가?


Answering Questions:  88%|████████▊ | 86/98 [13:35<02:25, 12.16s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 국제통화기금(IMF)은 재정통계 작성의 국제기준을 제시하기 위해 1986년 재정통계 매뉴얼(Government Finance Statistics Manual, GFSM)을 처음 발간하였으며, 이후 2001년과 2014년 총 2차례의 개정이 있었다. 재정통계 매뉴얼의 발간(또는 개정) 연도에 따라 각각 GFSM1986, GFSM2001, GFSM2014로 지칭된다(IMF, 

Question: 계류중인 소송사건이란 무엇인가?


Answering Questions:  89%|████████▉ | 87/98 [13:43<02:00, 10.95s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 계류중인 소송사건은 아직 해결되지 않은 법정 소송사건에서 비롯되는 청구권을 말합니다. 예를 들어, 정부가 다른 당사자에게 손상 또는 손실에 대해 청구한 소송사건이 이에 해당합니다. 이러한 소송사건은 우발자산이 될 수 있습니다.

Question: 최소운영수입보장(BTO 등) 제도란 무엇을 의미하는가?


Answering Questions:  90%|████████▉ | 88/98 [13:55<01:53, 11.40s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  최소운영수입보장(BTO 등) 제도는 주로 BTO(BUILD-TRANSFER-OPERATE) 민간투자사업에서 실시협약서 상 추정 수입보다 실제 수입이 미치지 못하는 경우 정부가 최소운영수입을 보장해 주는 제도를 말합니다. 이 제도는 주로 도로, 철도, 항만과 관련된 민간투자사업에서 적용되며, 보장기간은 15~30년 동안 지급액을 보장합니다.

Question: 우발부채에 대한 내용으로 대표적으로 어떤 사항이 해당되는가?


Answering Questions:  91%|█████████ | 89/98 [14:10<01:50, 12.25s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 미래 발생이 불확실한 잠재적 의무 or 부채 인식기준을 충족하지 못한 현재의무
     - 과거의 거래나 사건으로 발생하였으나, 경제적 편익이 있는 자원을 유출할 현재의무가 확인이 되지 않은 ‘잠재적 의무’
     - 현재의무가 부채로 인식되지 않는 ‘현재의무’
     - 재정위험(fiscal risk)을 발생시키는 구체적 원인이 되며, 의도적인 공공정책이나 재정위기와 같이 예기치 못한 사건으로 인해 발생할 수 있음
     -

Question: GFSM2014에서는 우발부채를 어떻게 구분하는가?


Answering Questions:  92%|█████████▏| 90/98 [14:24<01:42, 12.84s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  GFSM2014에서는 우발부채를 크게 명시적 우발부채와 암묵적 우발부채로 구분합니다. 명시적 우발부채는 규정된 조건 발생시 경제적 가치의 지급을 요구하는 법적 또는 계약에 의한 금융협정으로서, 일회성 보증과 기타 명시적 우발부채로 구분됩니다. 일회성 보증은 개별적이고 보증인의 우발부채로 간주됩니다. 기타 명시적 우발부채로는 잠재적인 법적 청구권, 배

Question: GFSM은 몇 차례의 개정을 거쳤으며, 어떠한 목적으로 GFSM 2001이 개정되었는가?


Answering Questions:  93%|█████████▎| 91/98 [14:33<01:22, 11.77s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  GFSM은 1986년 첫 발간 이래 현재까지 총 2차례의 개정이 있었다. 특히, GFSM 2001은 전면 개정을 통해 현재의 발생주의 기준 GFS체계를 구축하였으며, GFSM2014는 SNA, PSDS 등 다른 국제통계기준과 부합하도록 더 구체화했다.

Question: 표준화 보증이란 무엇인가?


Answering Questions:  94%|█████████▍| 92/98 [14:40<01:01, 10.31s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  표준화 보증은 통상 아주 적은 금액에 대해 획일적 조건으로 대규모로 발행하는 보증을 말합니다. 수출(무역)신용 보증, 환보증, 다양한 중소기업 자금대출 보증 등이 그 예시입니다.

Question: 표준화 보증에서 공공부문의 우발부채는 어떻게 인식되는가?


Answering Questions:  95%|█████████▍| 93/98 [14:51<00:52, 10.42s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  표준화 보증은 공공부문에서 부채로 인식됩니다. 이는 국제공공부문회계기준(IPSAS)과 IMF의 공공부문부채통계(PSDS)에서도 동일한 우발부채 개념을 적용하고 있기 때문입니다. 따라서, 표준화 보증은 명시적 우발부채로 분류되며, 재무제표(재정상태표)에 직접 인식됩니다.

Question: 재정정책에서 공적보증채무와 다른 일회성 보증은 어떻게 구분되는가?


Answering Questions:  96%|█████████▌| 94/98 [15:05<00:46, 11.59s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer: 
    공적보증채무는 보증인이 기타 공공부문과 민간부문 단위 기존 채무의 원리금 상환을 보증한다는 점에서 다른 일회성 보증과 구분되며, 재정정책 및 분석에서 중요합니다. 반면, 다른 일회성 보증에는 신용보증, 조건부 ‘신용 가용성’ 보증, 조건부 신용지원 등이 포함됩니다. 신용보증은 인출하지 않은 자금을 미래에 사용할 수 있도록 해주는 보증으로, 자금이 실제로 제공되기 전까지는 금

Question: 미래사회보장급여에 대한 순의무란 무엇을 의미하는가?


Answering Questions:  97%|█████████▋| 95/98 [15:12<00:30, 10.26s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  미래사회보장급여에 대한 순의무는 현행법과 규정에 따라 이미 가입자가 획득한 미래 급여의 현재가치에서 현행법과 규정에 따른 사회보장제도의 미래보험료의 순현재가치를 차감한 것을 의미합니다.

Question: 국가결산보고서와 지방자치단체 회계기준에서 우발부채에 대한 용어 및 회계처리가 어떻게 다른가요?


Answering Questions:  98%|█████████▊| 96/98 [15:27<00:22, 11.48s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  - 국가결산보고서에서는 우발부채를 재무제표상 부채로 인식하지 않으며, 주석에 공시합니다. 주석에는 계류중인 소송사건, 담보제공자산, 지급보증, 중요한 계약사항 등 9가지 항목이 포함되며, 가능하면 우발부채 추정금액, 자원의 유출 금액 및 시기 관련 불확실성 정도, 발생부채 또는 우발상황 등을 정의하고, 이를 근거로 인식한 우발부채 현황을 결산보고서 주석 등에 공시

Question: 우발부채란 무엇이며, 그 관리가 왜 중요한가?


Answering Questions:  99%|█████████▉| 97/98 [15:41<00:12, 12.33s/it]Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


Answer:  우발부채는 미래 발생이 불확실한 잠재적 의무나 부채 인식기준을 충족하지 못한 현재의무로, 과거의 거래나 사건으로 발생하였으나, 경제적 편익이 있는 자원을 유출할 현재의무가 확인이 되지 않은 '잠재적 의무' 또는 △편익이 있는 자원의 유출가능성이 매우 높지 않거나, △금액을 신뢰성 있게 추정할 수 없어 부채로 인식하지 않는 '현재의무'를 의미합니다. 우발부채는 재정위험을 발생시키는 구체적

Question: 보증이란 무엇이며, 어떤 형태의 보증이 재정상태표에 부채로 기록되는가? 또한 표준화 보증이란 무엇이며, 어떤 목적으로 발행되는가?


Answering Questions: 100%|██████████| 98/98 [15:55<00:00,  9.75s/it]

Answer:  보증이란 피보증처의 부채에 대해 지급을 보증하는 것을 말합니다. 보증은 피보증처가 부채를 상환하지 못하는 경우 대신 상환하는 것을 의미합니다. 국가의 지급보증 중 보증채무는 원채무자의 상환능력이 없는 경우 국민의 재정부담을 초래할 수 있어 국가채무에 준하는 관리 필요성이 있습니다.

     보증은 일회성 보증과 표준화 보증으로 구분됩니다. 일회성 보증은 개별적이고 보증인의 보전요구의 위험성에






# Submission

In [None]:
# 제출용 샘플 파일 로드
submit_df = pd.read_csv('/content/drive/MyDrive/기타/Dacon_Financial_NLP/sample_submission.csv')

# 생성된 답변을 제출 DataFrame에 추가
submit_df['Answer'] = [item['Answer'] for item in results]
submit_df['Answer'] = submit_df['Answer'].fillna("데이콘")     # 모델에서 빈 값 (NaN) 생성 시 채점에 오류가 날 수 있음 [ 주의 ]

# 결과를 CSV 파일로 저장
submit_df.to_csv("/content/drive/MyDrive/기타/Dacon_Financial_NLP/minstral_nemo_submission.csv", encoding='UTF-8-sig', index=False)