In [1]:
# Model
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline, BitsAndBytesConfig
from langchain_huggingface import HuggingFacePipeline
import torch
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from langchain.prompts import PromptTemplate
# Vector stores
import fitz  # PyMuPDF
import pdfplumber
from langchain_community.vectorstores import FAISS
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_community.document_loaders import PyMuPDFLoader, PDFPlumberLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.retrievers import BM25Retriever, KNNRetriever
from langchain.retrievers import EnsembleRetriever
from langchain_community.vectorstores import FAISS
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_community.document_loaders import PyMuPDFLoader, PDFPlumberLoader
from langchain_community.retrievers import BM25Retriever, KNNRetriever
from langchain.retrievers import EnsembleRetriever
from langchain_teddynote.retrievers import KiwiBM25Retriever
from langchain.docstore.document import Document
from concurrent.futures import ThreadPoolExecutor
import pandas as pd
import unicodedata
import time
import re
# etc
import os
import pandas as pd
from tqdm import tqdm
import unicodedata
import logging

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
# sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
# intfloat/multilingual-e5-small
# jhgan/ko-sroberta-multitask


In [3]:
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

def get_embedding():
    embeddings = HuggingFaceEmbeddings(
        model_name='jhgan/ko-sroberta-multitask',
        model_kwargs={'device': 'cuda'},
        encode_kwargs={'normalize_embeddings': True})
    return embeddings

def normalize_string(s):
    """유니코드 정규화 및 인코딩 문제 해결"""
    try:
        normalized = unicodedata.normalize('NFC', s)
        return normalized.encode('utf-8', errors='replace').decode('utf-8')
    except Exception as e:
        logging.error(f"Error normalizing string: {e}")
        return s

def clean_text(text):
    """불필요한 공백 및 특수 문자 처리"""
    text = text.replace("�", "").replace("", "")  # 잘못된 인코딩 문자 제거
    text = re.sub(r'[^가-힣a-zA-Z0-9\s]', '', text)
    # 여러 공백을 하나로 줄임
    text = ' '.join(text.split())
    return text

def extract_text_and_tables(pdf_path):
    text_content = ""
    try:
        # fitz를 사용한 텍스트 추출
        doc = fitz.open(pdf_path)
        for page in doc:
            text = page.get_text("text")
            if text:
                text = clean_text(normalize_string(text))
                text_content += text + "\n"

        # pdfplumber를 사용한 표 추출
        with pdfplumber.open(pdf_path) as pdf:
            for page in pdf.pages:
                tables = page.extract_tables()
                if tables:
                    text_content += "\n__table__\n"
                    for table in tables:
                        if table:
                            for row in table:
                                processed_row = []
                                for cell in row:
                                    if cell is None:
                                        processed_row.append(" ")  # 병합된 셀 처리
                                    else:
                                        cell_text = normalize_string(clean_text(str(cell).strip()))
                                        if "\n" in cell_text:
                                            cell_text = " ".join(cell_text.split())
                                        processed_row.append(cell_text)
                                row_text = " | ".join(processed_row)
                                text_content += row_text + "\n"
                    text_content += "__end_table__\n"
    except Exception as e:
        print(f"Error extracting text and tables from {pdf_path}: {e}")
    return text_content

class CustomPDFLoader:
    def __init__(self, file_path):
        self.file_path = file_path

    def load(self):
        documents = []
        try:
            # 텍스트와 표를 모두 추출
            text_content = extract_text_and_tables(self.file_path)

            # 메타데이터 생성 및 Document 객체로 변환
            metadata = {
                "source": self.file_path,
            }
            documents.append(Document(page_content=text_content, metadata=metadata))
        except Exception as e:
            print(f"Error loading PDF file {self.file_path}: {e}")
        return documents

def chunk_documents(documents):
    adjusted_documents = []
    for doc in documents:
        content = doc.page_content
        chunks = []
        
        # 표 구분자를 기준으로 분할
        table_sections = content.split("__table__")
        
        for section in table_sections:
            if "__end_table__" in section:
                table_content = section.split("__end_table__")[0]
                chunks.append(table_content)
            else:
                chunk_splitter = RecursiveCharacterTextSplitter(
                    chunk_size=1000,  # 텍스트 청크 크기를 키움
                    chunk_overlap=200,
                    separators=["\n\n", ".", "\n"]
                )
                normal_chunks = chunk_splitter.split_text(section)
                chunks.extend(normal_chunks)

        for chunk in chunks:
            adjusted_documents.append(Document(page_content=chunk, metadata=doc.metadata))
    
    return adjusted_documents

def format_docs(docs):
    context = ""
    for doc in docs:
        context += doc.page_content
        context += '\n\n'
    return context

def make_db(df):
    documents = []
    pdf_files = df['Source_path'].unique()

    # tqdm으로 파일 처리 진행 상황 표시
    with ThreadPoolExecutor() as executor:
        results = list(tqdm(executor.map(load_pdf_file, pdf_files), total=len(pdf_files), desc="Processing PDFs"))
    
    for result in results:
        documents.extend(result)
    
    # 정규화
    for doc in documents:
        doc.page_content = normalize_string(doc.page_content)
    
    # 표가 망가지지 않도록 청크 분할 처리
    chunks = chunk_documents(documents)
    print(f"Total number of chunks: {len(chunks)}")
    
    # FAISS DB 만들기 (메타데이터 포함)
    faiss = FAISS.from_documents(chunks, embedding=get_embedding())
    bm = BM25Retriever.from_documents(chunks)
    
    return faiss, bm

def load_pdf_file(pdf_file):
    try:
        pdf_loader = CustomPDFLoader(pdf_file)
        return pdf_loader.load()
    except Exception as e:
        print(f"Skipping corrupted file {pdf_file}: {e}")
        return []

train_df = pd.read_csv('train.csv')
test_df = pd.read_csv('test.csv')

In [4]:
def fewshot_db(df):
    df = df.drop('SAMPLE_ID', axis=1)
    df = df.drop('Source_path', axis=1)
    df = df.to_dict(orient='records')
    print("Loaded Fewshot Set:", len(df))
    to_vectorize = ["\n\n".join(normalize_string(value) for value in example.values()) for example in df]
    faiss = FAISS.from_texts(to_vectorize, embedding=get_embedding())
    bm = BM25Retriever.from_texts(to_vectorize)
    knn = KNNRetriever.from_texts(to_vectorize, embeddings=get_embedding())
    return faiss, bm

In [5]:

train_df = pd.read_csv('train.csv')
test_df = pd.read_csv('test.csv')

pypdf 이건 x

표가 많기 때문에

PyMuPDFLoader 나 PDFPlumberLoader를 쓰고

표를 이미지로 불러오기도 하는데 이런경우 추가적인 전처리가 필요함

In [6]:
train_df = pd.read_csv('train.csv')
test_df = pd.read_csv('test.csv')


def normalize_string(s):
    return unicodedata.normalize('NFC', s)

def format_docs(docs):
    """검색된 문서들을 하나의 문자열로 포맷팅"""
    context = ""
    for i, doc in enumerate(docs):
        #context += f"Document {i+1}\n"
        context += doc.page_content
        context += '\n\n'
    return context

In [7]:
# train_faiss_db, train_bm_retrievier, knn_retriever = make_db(train_df) 
# test_faiss_db, test_bm_retrievier, test_knn_retriever = make_db(test_df)
# fewshot_faiss_db, fewshot_bm_retrievier, fewshot_knn_retriever = fewshot_db(train_df)

In [8]:
# train_k = 1
# train_bm_retrievier.k = train_k
# knn_retriever.k = train_k
# faiss_retriever = train_faiss_db.as_retriever(search_kwargs={'k':train_k} )
# train_ensemble_retriever = EnsembleRetriever(
#     retrievers=[train_bm_retrievier,knn_retriever, faiss_retriever], weights=[0.3,0.3, 0.4]
# )

# test_k = 3
# test_bm_retrievier.k = test_k
# test_knn_retriever.k = test_k
# test_faiss_retriever = test_faiss_db.as_retriever(search_kwargs={'k':test_k} )
# test_ensemble_retriever = EnsembleRetriever(
#     retrievers=[test_bm_retrievier,test_knn_retriever, test_faiss_retriever], weights=[0.3,0.3, 0.4]
# )

# fewshot_k = 2
# fewshot_bm_retrievier.k = fewshot_k
# fewshot_knn_retriever.k = fewshot_k
# fewshot_faiss_retriever = fewshot_faiss_db.as_retriever(search_kwargs={'k':fewshot_k} )
# fewshot_ensemble_retriever = EnsembleRetriever(
#     retrievers=[fewshot_bm_retrievier,fewshot_knn_retriever, fewshot_faiss_retriever], weights=[0.3,0.3, 0.4]
# )


In [9]:
def setup_llm_pipeline(model_id = "meta-llama/Meta-Llama-3.1-8B-Instruct"):
    # 토크나이저 로드 및 설정
        # 양자화 설정 적용
    bnb_config = BitsAndBytesConfig(
    load_in_4bit=True, 
    bnb_4bit_use_double_quant=True, 
    bnb_4bit_quant_type="nf4", 
    bnb_4bit_compute_dtype=torch.bfloat16
    )
    model = AutoModelForCausalLM.from_pretrained(model_id, quantization_config=bnb_config,low_cpu_mem_usage=True)
    tokenizer = AutoTokenizer.from_pretrained(model_id)
    terminators = [
    tokenizer.eos_token_id,
    tokenizer.convert_tokens_to_ids("<|eot_id|>")
    ]

    text_generation_pipeline = pipeline(
        model=model,
        tokenizer=tokenizer,
        task="text-generation",
        return_full_text=False,
        temperature = 0.5,
        max_new_tokens=256,
        eos_token_id = terminators,
        pad_token_id = tokenizer.eos_token_id
    )

    llm = HuggingFacePipeline(pipeline=text_generation_pipeline)

    return llm
llm = setup_llm_pipeline()

Loading checkpoint shards: 100%|██████████| 4/4 [00:07<00:00,  1.89s/it]


In [10]:
def extract_answer(response):
    # AI: 로 시작하는 줄을 찾아 그 이후의 텍스트만 추출
    lines = response.split('\n')
    for line in lines:
        line = line.replace('**', '')
        if line.startswith('Answer:'):
            return line.replace('Answer:', '').strip()
        if line.startswith('assistant:'):
            return line.replace('assistant:', '').strip()
    return response.strip()  # AI: 를 찾지 못한 경우 전체 응답을 정리해서 반환

def fewshot_ex(fewshot_retriever, train_retriever, q, verbose=False):
    query = normalize_string(q)
    fewshot_results = fewshot_retriever.invoke(normalize_string(query)) #Document(page_content='중소벤처기업부_창업사업화지원\n\n창업사업화지원의 사업목적은 무엇인가?\n\n창업사업화지원의 사업목적은 창업기업의 성장단계별, 초격차 분야별, 글로벌화 지원체계를 구축‧운영하여 혁신 기술창업을 활성화하고 창업기업 성장 및 생존율 제고하는 것이다.')
    fewshot_str = ""
    i = 1
    for result in fewshot_results:
    
        result = result.page_content.split('\n\n')
        buff_str = f"<|start_header_id|>system<|end_header_id|>Example{i}\n<|eot_id|>\n\n"
        i+=1
        buff_str += "<|start_header_id|>user<|end_header_id|>\n"
        question = result[1]
        buff_str += f"Question\n{question}\n\n"
        if train_retriever is not None:
            buff_str += f"Context\n"
            docs = train_retriever.invoke(normalize_string(question))
            if verbose:
                print("Fewshot Q |",len(docs),"|",question)
            buff_str += format_docs(docs)
            buff_str += "<|eot_id|>\n\n"
        else: 
            buff_str += "<|eot_id|>\n\n"
        if verbose:
            print("Fewshot Q |",question)
        buff_str += f"<|start_header_id|>assistant<|end_header_id>\n{result[2]}<|eot_id|>"
        fewshot_str += buff_str    
        
    return fewshot_str

def run (train,test,fewshot,dataset,llm,verbose=False):
    results = []
    for i, row in (dataset.iterrows()):

        full_template = "<|begin_of_text|>"
        full_template += """<|start_header_id|>system<|end_header_id|>
You are the financial expert who helps me with my financial information Q&As.
You earn 10 points when you answer me and follow the rules and lose 7 points when you don't.
Please use contexts to answer the question.
Please your answers should be concise.
Please answers must be written in Korean.
Please answer in 1-3 sentences.
Answer like the question-answer examples given.
<|eot_id|>
"""
        question = row['Question']        
        if verbose:
            print(f"====={i}/{len(dataset)}{'='*255}")
            print("Question: ", question)
        
        fewshot_str = fewshot_ex(fewshot, train, question,verbose)
        full_template += fewshot_str
        full_template += """ """
        contexts = test.invoke(normalize_string(question))
        if verbose:
            print("Context Number|",len(contexts),end="|")
        contexts = format_docs(contexts)
        full_template += """<|start_header_id|>user<|end_header_id|>\nQuestion\n{input}\n\n"""
        full_template += f"""Context\n{contexts}<|eot_id|>\n\n"""
        full_template += """<|start_header_id|>assistant<|end_header_id>\n"""
        
        prompt = PromptTemplate.from_template(full_template)
        qa_chain = (
        {
            "input": RunnablePassthrough(),
        }
        | prompt
        | llm
        | StrOutputParser()
        )

        answer = qa_chain.invoke(input=question)
        answer = extract_answer(answer)
        results.append({
            "Question": question,
            "Answer": answer,
            "Source": row['Source']
        })
        if verbose:
            print("=====Answer=====\n", results[-1]['Answer'])
            try:
                print("=====REAL Answer=====\n",row['Answer'])
            except:
                pass
    return results

In [11]:
from collections import Counter
def calculate_f1_score(true_sentence, predicted_sentence, sum_mode=True):

    #공백 제거
    true_sentence = ''.join(true_sentence.split())
    predicted_sentence = ''.join(predicted_sentence.split())
    
    true_counter = Counter(true_sentence)
    predicted_counter = Counter(predicted_sentence)

    #문자가 등장한 개수도 고려
    if sum_mode:
        true_positive = sum((true_counter & predicted_counter).values())
        predicted_positive = sum(predicted_counter.values())
        actual_positive = sum(true_counter.values())

    #문자 자체가 있는 것에 focus를 맞춤
    else:
        true_positive = len((true_counter & predicted_counter).values())
        predicted_positive = len(predicted_counter.values())
        actual_positive = len(true_counter.values())

    #f1 score 계산
    precision = true_positive / predicted_positive if predicted_positive > 0 else 0
    recall = true_positive / actual_positive if actual_positive > 0 else 0
    f1_score = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0
    
    return precision, recall, f1_score

def calculate_average_f1_score(true_sentences, predicted_sentences):
    
    total_precision = 0
    total_recall = 0
    total_f1_score = 0
    
    for true_sentence, predicted_sentence in zip(true_sentences, predicted_sentences):
        precision, recall, f1_score = calculate_f1_score(true_sentence, predicted_sentence)
        total_precision += precision
        total_recall += recall
        total_f1_score += f1_score
    
    avg_precision = total_precision / len(true_sentences)
    avg_recall = total_recall / len(true_sentences)
    avg_f1_score = total_f1_score / len(true_sentences)
    
    return {
        'average_precision': avg_precision,
        'average_recall': avg_recall,
        'average_f1_score': avg_f1_score
    }

In [12]:
# from sklearn.model_selection import KFold
# import copy

# weight = [0.5,0.5]
# train_faiss_db, train_bm_retrievier = make_db(train_df) 

# train_k = 1
# train_bm_retrievier.k = train_k
# #knn_retriever.k = train_k
# faiss_retriever = train_faiss_db.as_retriever(search_type="mmr",search_kwargs={'k':train_k} )
# train_ensemble_retriever = EnsembleRetriever(
#     retrievers=[train_bm_retrievier, faiss_retriever], weights=weight
# )

# test_bm_retrievier = copy.deepcopy(train_bm_retrievier)
# test_k = 2
# test_bm_retrievier.k = test_k
# #test_knn_retriever.k = test_k
# test_faiss_retriever = train_faiss_db.as_retriever(search_type="mmr",search_kwargs={'k':test_k} )
# test_ensemble_retriever = EnsembleRetriever(
#     retrievers=[test_bm_retrievier, test_faiss_retriever], weights=weight
# )

# fewshot_k = 1

# k_folds = 4
# fold_results = []
# kf = KFold(n_splits=k_folds, shuffle=True, random_state=52)
# for fold, (train_index, val_index) in enumerate(kf.split(train_df)):
#     fold_result = []
#     train_set = train_df.iloc[train_index]
#     val_set = train_df.iloc[val_index]
    
    
#     fewshot_faiss_db, fewshot_bm_retrievier = fewshot_db(train_set)

    
#     fewshot_bm_retrievier.k = fewshot_k
#     fewshot_faiss_retriever = fewshot_faiss_db.as_retriever(search_kwargs={'k':fewshot_k} )
#     fewshot_ensemble_retriever = EnsembleRetriever(
#         retrievers=[fewshot_bm_retrievier, fewshot_faiss_retriever], weights=weight
#     )
#     pred = run(train_ensemble_retriever, test_ensemble_retriever, fewshot_ensemble_retriever, val_set, llm, verbose=True)
#     result = pd.DataFrame()
#     result['pred'] = [result['Answer'] for result in pred]
#     val_set.index = range(len(val_set))
#     result['gt'] = val_set['Answer']
        
#     result = calculate_average_f1_score(result['gt'], result['pred'])
#     print(result)
#     fold_results.append(result)
#     break

py pdf 0.663

ptmu 0.6740735793987513

PDFPlumberLoader 0.6516317411146649 0.655995454987313(0.4), 0.6578699067809993(0.2), 0.6578699067809993(0.1)

PDFPlumberLoader NEW:  0.6508706361694363, 0.6545265117992998 (0.4)

In [13]:
from save_module import save


weight = [0.5,0.5]
# train_faiss_db, train_bm_retrievier = make_db(train_df) 
test_faiss_db, test_bm_retrievier = make_db(test_df)
fewshot_faiss_db, fewshot_bm_retrievier = fewshot_db(train_df)

# train_k = 1
# train_bm_retrievier.k = train_k
# #knn_retriever.k = train_k
# faiss_retriever = train_faiss_db.as_retriever(search_type="mmr",search_kwargs={'k':train_k} )
# train_ensemble_retriever = EnsembleRetriever(
#     retrievers=[train_bm_retrievier, faiss_retriever], weights=weight
# )

test_k = 2
test_bm_retrievier.k = test_k
#test_knn_retriever.k = test_k
test_faiss_retriever = test_faiss_db.as_retriever(search_type="mmr",search_kwargs={'k':test_k} )
test_ensemble_retriever = EnsembleRetriever(
    retrievers=[test_bm_retrievier, test_faiss_retriever], weights=weight
)

fewshot_k = 2
fewshot_bm_retrievier.k = fewshot_k
#fewshot_knn_retriever.k = fewshot_k
fewshot_faiss_retriever = fewshot_faiss_db.as_retriever(search_type="mmr",search_kwargs={'k':fewshot_k} )
fewshot_ensemble_retriever = EnsembleRetriever(
    retrievers=[fewshot_bm_retrievier, fewshot_faiss_retriever], weights=weight
)

results = run(None, test_ensemble_retriever, fewshot_ensemble_retriever, test_df, llm, verbose=True)
save(results)

2024-08-17 03:33:47,944 - INFO - Loading PDF file: ./test_source/중소벤처기업부_혁신창업사업화자금(융자).pdf
2024-08-17 03:33:47,946 - INFO - Loading PDF file: ./test_source/보건복지부_부모급여(영아수당) 지원.pdf
2024-08-17 03:33:47,948 - INFO - Loading PDF file: ./test_source/보건복지부_노인장기요양보험 사업운영.pdf
2024-08-17 03:33:47,950 - INFO - Loading PDF file: ./test_source/산업통상자원부_에너지바우처.pdf
2024-08-17 03:33:47,957 - INFO - Loading PDF file: ./test_source/국토교통부_행복주택출자.pdf
2024-08-17 03:33:47,965 - INFO - Loading PDF file: ./test_source/「FIS 이슈 & 포커스」 22-4호 《중앙-지방 간 재정조정제도》.pdf
2024-08-17 03:33:47,967 - INFO - Loading PDF file: ./test_source/「FIS 이슈 & 포커스」 23-2호 《핵심재정사업 성과관리》.pdf
2024-08-17 03:33:47,974 - INFO - Loading PDF file: ./test_source/「FIS 이슈&포커스」 22-2호 《재정성과관리제도》.pdf
2024-08-17 03:33:47,977 - INFO - Loading PDF file: ./test_source/「FIS 이슈 & 포커스」(신규) 통권 제1호 《우발부채》.pdf
2024-08-17 03:33:57,503 - INFO - Total number of chunks: 115
2024-08-17 03:33:57,613 - INFO - PyTorch version 2.3.1+cu118 available.
2024-08-17 03:33:57,

Loaded Fewshot Set: 496


2024-08-17 03:34:04,148 - INFO - Load pretrained SentenceTransformer: jhgan/ko-sroberta-multitask


Question:  2022년 혁신창업사업화자금(융자)의 예산은 얼마인가요?
Fewshot Q | 2022년 R&D 예산은 최근 10년간 어떤 변화를 보였는가?
Fewshot Q | 창업사업화지원 사업의 2022년 결산 기준 예산 규모는 얼마인가?
Fewshot Q | 새만금개발청의 2024년도 '프로그램목표 Ⅰ-1'의 예산은 얼마인가요?
Fewshot Q | 정부가 '지역활성화 투자 펀드'를 조성하기 위해 어떤 자금을 활용할 예정이며, 어떤 방식으로 운용될 것인가?
Context Number| 4|

  attn_output = torch.nn.functional.scaled_dot_product_attention(


=====Answer=====
 2022년 혁신창업사업화자금(융자)의 예산은 230,000백만원입니다.
Question:  중소벤처기업부의 혁신창업사업화자금(융자) 사업목적은 무엇인가요?
Fewshot Q | 창업사업화지원의 사업목적은 무엇인가?
Fewshot Q | 2024년 중소벤처기업부의 창업사업화지원 사업에서 어떤 기관들이 사업시행주체로 참여하는가?
Fewshot Q | 창업사업화지원 사업의 2022년 결산 기준 예산 규모는 얼마인가?
Context Number| 4|=====Answer=====
 중소벤처기업부의 혁신창업사업화자금(융자) 사업목적은 유망한 창업기업의 RD 및 해외진출 지원을 강화하고, 창업기업의 글로벌 경쟁력 확보를 위한 재정투자 방향에 중점을 두어 창업기업의 성장 및 생존율을 제고하는 것이다.
Question:  중소벤처기업부의 혁신창업사업화자금(융자) 사업근거는 어떤 법률에 근거하고 있나요?
Fewshot Q | 사업근거는 어떤 법령에 근거하고 있나요?
Fewshot Q | 창업사업화지원 사업의 법령상 근거는 무엇인가요?
Fewshot Q | 2024년 중소벤처기업부의 창업사업화지원 사업에서 어떤 기관들이 사업시행주체로 참여하는가?
Fewshot Q | 소규모주택정비사업에서 애로요인을 해소하기 위해 가로주택정비사업 금융지원을 강화하였는데, 어떤 대책을 통해 개선하려고 하는가?
Context Number| 4|=====Answer=====
 중소벤처기업부의 혁신창업사업화자금(융자) 사업근거는 「중소기업진흥에 관한 법률」 제66조, 제67조, 제74조에 근거하고 있습니다.
Question:  2010년에 신규 지원된 혁신창업사업화자금은 무엇인가요?
Fewshot Q | 청년일자리창출지원 사업의 목적은 무엇인가요?
Fewshot Q | 창업사업화지원의 사업목적은 무엇인가?
Fewshot Q | 2024년 고용노동부의 청년 일자리 창출지원 사업의 확정 예산은 몇백만원이며, 목적은 무엇인가요?
Fewshot Q | 산업혁신지원 부문 주요 변

You seem to be using the pipelines sequentially on GPU. In order to maximize efficiency please use a dataset


=====Answer=====
 부모급여의 수급권자는 18세 미만의 아동을 양육하는 부모 또는 양육인으로, 아동의 부양을 위한 급여를 지원받을 수 있는 부양의무자가 없거나, 부양의무자가 있으나 부양능력이 없거나 부양을 받을 수 없는 사람입니다.
Question:  부모급여(영아수당)의 2024년 확정된 예산은 몇백만원인가요?
Fewshot Q | 노인일자리 및 사회활동 지원 사업의 2024년 예산 확정액은 몇백만원인가요?
Fewshot Q | 2024년 정부 예산안에서 출산·양육 부담 경감을 위해 어떤 정책이 시행되고 있는가?
Fewshot Q | 노인일자리 및 사회활동 지원 사업의 예산 총괄표에서 2023년 예산은 몇백만원인가요?
Context Number| 4|=====Answer=====
 2888백만원입니다.
Question:  부모급여 지원 사업은 어떤 법령상 근거를 갖고 추진되고 있나요?
Fewshot Q | 생계급여와 관련된 법령상 근거는 무엇인가?
Fewshot Q | 보건복지부의 노인일자리 및 사회활동지원 사업의 보조율 법적 근거는?
Fewshot Q | 전세임대 정책은 어떤 근거로 추진되고 있는가?
Fewshot Q | 사업근거는 어떤 법령에 근거하고 있나요?
Context Number| 4|=====Answer=====
 아동수당법 제4조제5항
Question:  영아수당 도입에 대한 추진경위는 어떻게 되나요?
Fewshot Q | 보건복지부의 생계급여지원 사업은 국고보조율의 비중이 어떻게 되나요?
Fewshot Q | 2024년 정부 예산안에서 출산·양육 부담 경감을 위해 어떤 정책이 시행되고 있는가?
Fewshot Q | 국가첨단전략산업 특화단지에 대한 지원 계획은 어떻게 되어 있는가?
Fewshot Q | 직업능력개발 수당을 받기 위해 어떤 절차를 거쳐야 하나요?
Context Number| 3|=====Answer=====
 영아수당은 2024년부터 0개월 아동에 월 100만원을 부모급여로 지급하는 것으로 추진 중이다.
Questio