In [1]:
# Model
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline, BitsAndBytesConfig
from langchain_huggingface import HuggingFacePipeline
import torch
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from langchain.prompts import PromptTemplate
# Vector stores
import fitz  # PyMuPDF 
import pdfplumber
from langchain_community.vectorstores import FAISS
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_community.document_loaders import PyMuPDFLoader, PDFPlumberLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter, KonlpyTextSplitter, MarkdownHeaderTextSplitter, MarkdownTextSplitter
from langchain_community.retrievers import BM25Retriever, KNNRetriever
from langchain.retrievers import EnsembleRetriever
from langchain_community.vectorstores import FAISS
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_community.document_loaders import PyMuPDFLoader, PDFPlumberLoader ,UnstructuredPDFLoader
from langchain_community.retrievers import BM25Retriever, KNNRetriever 
from langchain.retrievers import EnsembleRetriever
from langchain_teddynote.retrievers import KiwiBM25Retriever, OktBM25Retriever
from langchain.docstore.document import Document
from concurrent.futures import ThreadPoolExecutor
import pandas as pd
import unicodedata
import pymupdf4llm
import time
import re
from konlpy.tag import Okt
from pdf2image import convert_from_path
import pytesseract
from konlpy.tag import Kkma
# etc
import os
import pandas as pd
from tqdm import tqdm
import unicodedata
import logging
from PyPDF2 import PdfReader
from seed_module import seed_everything
from langchain_community.document_transformers import LongContextReorder
import json
device = 'cuda' if torch.cuda.is_available() else 'cpu'  # GPU 사용 가능 여부 및 MPS 지원 여부 확인
print(device)
seed_everything(52)

  from .autonotebook import tqdm as notebook_tqdm


cuda


In [2]:
# intfloat/multilingual-e5-small
# jhgan/ko-sroberta-multitask

def get_embedding():
    
    embeddings = HuggingFaceEmbeddings(
        model_name='jhgan/ko-sroberta-multitask',
        model_kwargs={'device': device},
        
        encode_kwargs={'normalize_embeddings': True})
    return embeddings
def normalize_string(s):
    try:
        normalized = unicodedata.normalize('NFC', s)
        return normalized.encode('utf-8', errors='replace').decode('utf-8')
    except Exception:
        return s
def clean_text(text):
    text = text.replace("�", " ").replace("", " ")  # 잘못된 인코딩 문자 제거
    return text

def format_docs(docs):
    context = ""
    
    for doc in docs:
        # Header 정보를 순서대로 추가
        for header_level in range(1, 6):
            header_key = f'Header{header_level}'
            if header_key in doc.metadata:
                context += f"{header_key}: {doc.metadata[header_key]}\n"
        # 문서 내용 추가
        context += doc.page_content
        context += '\n---\n'
    return context


In [3]:
def process_pdf(pdf_path): 
    md_text = pymupdf4llm.to_markdown(pdf_path)

    headers_to_split_on = [
        ("#", "Header 1"),
        ("##", "Header 2"),
        ("###", "Header 3"),
        ("####", "Header 4"),

    ]

    md_header_splitter = MarkdownHeaderTextSplitter(headers_to_split_on=headers_to_split_on, strip_headers=True)
    splits = md_header_splitter.split_text(md_text)

    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=800, chunk_overlap=40
    )

    splits = text_splitter.split_documents(splits)

    for i in splits:
        metadata = {'Source_path': pdf_path}
        i.metadata = {**i.metadata, **metadata}
    return splits


def make_db(df):
    documents = []
    
    pdf_files = df['Source_path'].unique()
    for pdf_file in tqdm(pdf_files):
        # 문서 로드
        documents.extend(process_pdf(pdf_file))
        
    print(f"Total number of documents: {len(documents)}")

    faiss = FAISS.from_documents(documents, embedding=get_embedding())
    return faiss

In [3]:
def fewshot_db(df):
    df = df.drop('SAMPLE_ID', axis=1)
    df = df.drop('Source_path', axis=1)
    df = df.to_dict(orient='records')
    print("Loaded Fewshot Set:", len(df))
    to_vectorize = ["\n\n".join(normalize_string(value) for value in example.values()) for example in df]
    faiss = FAISS.from_texts(to_vectorize, embedding=get_embedding())
    # bm = BM25Retriever.from_texts(to_vectorize)
    # knn = KNNRetriever.from_texts(to_vectorize, embeddings=get_embedding())
    return faiss

In [5]:
train_df = pd.read_csv('train.csv', encoding='utf-8')
test_df = pd.read_csv('test.csv', encoding='utf-8')

In [6]:
def format_docs(docs):
    context = ""
    for doc in docs:
        # Header 정보를 순서대로 추가
        for header_level in range(1, 6):
            header_key = f'Header {header_level}'
            if header_key in doc.metadata:
                context += f"{header_key}: {doc.metadata[header_key]}\n"
        
        # 문서 내용 추가
        context += doc.page_content
        context += '\n\n'
    return context



### Model

In [7]:
def setup_llm_pipeline(model_id = "meta-llama/Meta-Llama-3.1-8B-Instruct"):
    # 토크나이저 로드 및 설정
        # 양자화 설정 적용
    bnb_config = BitsAndBytesConfig(
    load_in_4bit=True, 
    bnb_4bit_quant_type="nf4", 
    bnb_4bit_compute_dtype=torch.bfloat16
    )
    model = AutoModelForCausalLM.from_pretrained(model_id, quantization_config=bnb_config,low_cpu_mem_usage=True)
    
    # # 일부 중요한 레이어는 FP16으로 유지
    # for name, module in model.named_modules():
    #     if "attention" in name or "ffn" in name:  # 중요한 레이어 식별 (예: attention 및 ffn)
    #         module.to(torch.float16)  # 이 부분은 16비트로 유지
    
    tokenizer = AutoTokenizer.from_pretrained(model_id)
    terminators = [
    tokenizer.eos_token_id,
    tokenizer.convert_tokens_to_ids("<|eot_id|>")
    ]

    text_generation_pipeline = pipeline(
        model=model,
        tokenizer=tokenizer,
        task="text-generation",
        return_full_text=False,
        max_new_tokens=1024,
        eos_token_id = terminators,
        pad_token_id = tokenizer.eos_token_id
    )

    llm = HuggingFacePipeline(pipeline=text_generation_pipeline)

    return llm
# ghost-x/ghost-8b-beta-1608
# OpenBuddy/openbuddy-llama3.1-8b-v22.3-131k
llm = setup_llm_pipeline()

Loading checkpoint shards: 100%|██████████| 4/4 [00:19<00:00,  4.77s/it]


### 점수

In [8]:
from collections import Counter
def calculate_f1_score(true_sentence, predicted_sentence, sum_mode=True):

    #공백 제거
    true_sentence = ''.join(true_sentence.split())
    predicted_sentence = ''.join(predicted_sentence.split())
    
    true_counter = Counter(true_sentence)
    predicted_counter = Counter(predicted_sentence)

    #문자가 등장한 개수도 고려
    if sum_mode:
        true_positive = sum((true_counter & predicted_counter).values())
        predicted_positive = sum(predicted_counter.values())
        actual_positive = sum(true_counter.values())

    #문자 자체가 있는 것에 focus를 맞춤
    else:
        true_positive = len((true_counter & predicted_counter).values())
        predicted_positive = len(predicted_counter.values())
        actual_positive = len(true_counter.values())

    #f1 score 계산
    precision = true_positive / predicted_positive if predicted_positive > 0 else 0
    recall = true_positive / actual_positive if actual_positive > 0 else 0
    f1_score = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0
    
    return precision, recall, f1_score

def calculate_average_f1_score(true_sentences, predicted_sentences):
    
    total_precision = 0
    total_recall = 0
    total_f1_score = 0
    
    for true_sentence, predicted_sentence in zip(true_sentences, predicted_sentences):
        precision, recall, f1_score = calculate_f1_score(true_sentence, predicted_sentence)
        total_precision += precision
        total_recall += recall
        total_f1_score += f1_score
    
    avg_precision = total_precision / len(true_sentences)
    avg_recall = total_recall / len(true_sentences)
    avg_f1_score = total_f1_score / len(true_sentences)
    
    return {
        'average_precision': avg_precision,
        'average_recall': avg_recall,
        'average_f1_score': avg_f1_score
    }

### RUN

In [9]:

def extract_answer(response):
    # AI: 로 시작하는 줄을 찾아 그 이후의 텍스트만 추출
    lines = response.split('\n')
    for line in lines:
        line = line.replace('**', '')
        if line.startswith('Answer:'):
            return line.replace('Answer:', '').strip()
        if line.startswith('assistant:'):
            return line.replace('assistant:', '').strip()
    return response.strip()  # AI: 를 찾지 못한 경우 전체 응답을 정리해서 반환

def rerun(question,context,answer,llm,num_repeat):
    full_template = "<|begin_of_text|>"
    full_template += """<|start_header_id|>system<|end_header_id|>당신은 이전 답변을 검증하는 챗봇입니다. 질문과 문맥, 이전 답변을 참고해서 지시사항을 따르세요. 지시사항을 따를 때 서론 없이 출력하세요.<|eot_id|>"""
    full_template += """<|start_header_id|>user<|end_header_id|>Question: {question} \n\nContexts: {context} \n\nPrevious Answer: {answer} \n\n"""
    full_template += """{input}<|eot_id|>"""
    full_template += """<|start_header_id|>assistant<|end_header_id|>"""
    
    prompt = PromptTemplate(template=full_template)
    chain = (
    {
        "question": RunnablePassthrough(),
        "context": RunnablePassthrough(),
        "answer": RunnablePassthrough(),
        "input": RunnablePassthrough(),
    }
    | prompt
    | llm
    | StrOutputParser()
    )
    return chain.invoke({"question":question,"context":context,"answer":answer,"input":"핵심 단어들을 바탕으로, 한 문장으로 간결한 요약문을 평문으로 작성하세요. 만약 한 문장이고 질문에 충분한 설명이 된다면 그대로 출력하세요."})

def run(test_faiss,fewshot_retriever,train_faiss,dataset,llm,k=3,verbose=False):
    results = []
    
    
    source_path = dataset.iloc[0]['Source_path']
    docs = test_faiss.similarity_search(
    query="",  # 유사도 기반이 아닌 메타데이터 필터링만 사용하므로 query는 빈 값으로
    filter={"Source_path": source_path},
    k = 99,
    fetch_k = 20000
    )
    buff_faiss = FAISS.from_documents(docs, embedding=get_embedding())
    faiss_retriever_mmr = buff_faiss.as_retriever(search_type="mmr",search_kwargs={"k": k})
    # faiss_retriever_sim = buff_faiss.as_retriever(search_kwargs={"k": k})
    # knn_retriever = KNNRetriever.from_documents(docs, embeddings=get_embedding())
    # knn_retriever.k = k
    bm_retriever = OktBM25Retriever.from_documents(docs)
    bm_retriever.k = k

    ensemble_retriever = EnsembleRetriever(retrievers=[faiss_retriever_mmr,bm_retriever], weight=[0.5,0.5])

    
    for i, row in (dataset.iterrows()):
        if source_path != row['Source_path']:   
            source_path = row['Source_path']
            docs = test_faiss.similarity_search(
                query="",  # 유사도 기반이 아닌 메타데이터 필터링만 사용하므로 query는 빈 값으로
                filter={"Source_path": source_path},
                k = 99,
                fetch_k = 20000
            )
            buff_faiss = FAISS.from_documents(docs, embedding=get_embedding())
            faiss_retriever_mmr = buff_faiss.as_retriever(search_type="mmr",search_kwargs={"k": k})
            # faiss_retriever_sim = buff_faiss.as_retriever(search_kwargs={"k": k})
            # knn_retriever = KNNRetriever.from_documents(docs, embeddings=get_embedding())
            # knn_retriever.k = k
            bm_retriever = OktBM25Retriever.from_documents(docs)
            bm_retriever.k = k

            ensemble_retriever = EnsembleRetriever(retrievers=[faiss_retriever_mmr,bm_retriever], weight=[0.5,0.5])

            
        full_template = "<|begin_of_text|>"
        full_template += """<|start_header_id|>system<|end_header_id|>
당신은 유용한 금융 정보 Question-Answer Model 입니다.
user의 문맥 정보에서 핵심 내용을 찾아 답변을 작성하세요. 
답을 지어내지 마세요. 만약 문맥 정보에 정답이 없다면 모른다고 답하세요.
객관적이고 공식적인 문체를 사용하세요. 단위는 꼭 표기하세요.
서론 없이 본론만 간결하게 평문으로 작성하세요.<|eot_id|>
"""
        question = row['Question']          
        # full_template += """ """
        contexts = ensemble_retriever.invoke(normalize_string(question))
        
        # reordering = LongContextReorder()
        # contexts = reordering.transform_documents(contexts)
        
        
        contexts = format_docs(contexts)
        
        
        full_template += "<|start_header_id|>user<|end_header_id|>"
        full_template += "Question: {input}\n\n<|eot_id|>"
        full_template += "Contexts: {contexts}"
        full_template += """<|eot_id|>"""
        full_template += """<|start_header_id|>assistant<|end_header_id>"""
        
        prompt = PromptTemplate(template=full_template, input_variables=["contexts","input"])
        qa_chain = (
        {
            "contexts": RunnablePassthrough(),
            "input": RunnablePassthrough(),
        }
        | prompt
        | llm
        | StrOutputParser()
        )

        answer = qa_chain.invoke({'input':question,'contexts':contexts})
        answer = extract_answer(answer)
        lines = answer.split('\n')
        if  len(lines) > 1 or '|' in answer or ':' in answer or "다음과 같습니다." in answer:
            previous = answer
            try:
                before = calculate_f1_score(row['Answer'],answer)[2]
            except:
                before = None
            answer = rerun(question=question,
                           context=contexts,
                           answer=answer,
                           llm=llm,
                           num_repeat=1)
        answer = extract_answer(answer)
        results.append({
            "Question": question,
            "Answer": answer,
            "Source": row['Source']
        })
        if verbose:
            print(f"{i}/{len(dataset)}")
            print("Question: ", question, end=" | ")
            print("Context Number |",len(contexts))
            try:
                print(calculate_f1_score(row['Answer'],answer)[2],end=" | ")
            except:
                pass
            print("Answer: ", results[-1]['Answer'])
            try:
                print("Before: ",before," | ",previous)  
                
                previous = None
                before = None
            except:
                pass
            
            try:
                print("REAL Answer: ",row['Answer'])
            except:
                pass
            
            print()
        torch.cuda.empty_cache()
    return results

### 케이폴드

In [10]:
# from sklearn.model_selection import KFold
# import copy
# k_folds = 4
# fold_results = []
# kf = KFold(n_splits=k_folds, shuffle=True, random_state=52)
# for fold, (train_index, val_index) in enumerate(kf.split(train_df)):
#     fold_result = []
#     train_set = train_df.iloc[train_index]
#     val_set = train_df.iloc[val_index]

#     faiss = make_db(val_set)

#     pred = run(faiss,val_set, llm, verbose=True)
#     result = pd.DataFrame()
#     result['pred'] = [result['Answer'] for result in pred]
#     val_set.index = range(len(val_set))
#     result['gt'] = val_set['Answer']
        
#     result = calculate_average_f1_score(result['gt'], result['pred'])
#     print(result)
#     fold_results.append(result)
#     break

### 실전

In [None]:
fewshot_db = fewshot_db(train_df)
fewshot_retriever = fewshot_db.as_retriever(search_kwargs={"k": 3})

In [11]:
from save_module import save
train_faiss = make_db(train_df)
test_faiss= make_db(test_df)




results = run(test_faiss,fewshot_retriever,train_faiss, test_df, llm, k=3,verbose=True)
save(results)

100%|██████████| 9/9 [00:11<00:00,  1.29s/it]


Total number of documents: 196


  attn_output = torch.nn.functional.scaled_dot_product_attention(


0/98
Question:  2022년 혁신창업사업화자금(융자)의 예산은 얼마인가요? | Context Number | 705
Answer:  2022년 혁신창업사업화자금(융자의 예산은 2,300,000 백만원입니다.

1/98
Question:  중소벤처기업부의 혁신창업사업화자금(융자) 사업목적은 무엇인가요? | Context Number | 1600
Answer:  중소벤처기업부의 혁신창업사업화자금(융자) 사업목적은 창업 활성화 및 고용 창출을 위하여 지원을 시작한 것입니다.

2/98
Question:  중소벤처기업부의 혁신창업사업화자금(융자) 사업근거는 어떤 법률에 근거하고 있나요? | Context Number | 1582
Answer:  중소벤처기업부의 혁신창업사업화자금(융자) 사업근거는 중소기업진흥에 관한 법률 제66조, 제67조, 제74조, 중소기업창업지원법 제35조에 근거하고 있어요.

3/98
Question:  2010년에 신규 지원된 혁신창업사업화자금은 무엇인가요? | Context Number | 1682
Answer:  2010년에 신규 지원된 혁신창업사업화자금은 재창업자금(실패 경영인에 대한 재기지원)이란 것을 의미합니다.

4/98
Question:  혁신창업사업화자금 중 2020년에 신규 지원된 자금은 무엇인가요? | Context Number | 1709
Answer:  혁신창업사업화자금 중 2020년에 신규 지원된 자금은 없을 것 같습니다.

5/98
Question:  재창업자금이 재도약지원자금으로 이관된 연도는 언제인가요? | Context Number | 1685
Answer:  재창업자금이 재도약지원자금으로 이관된 연도는 2015년입니다.

6/98
Question:  창업기반지원과 신청 대상이 중복인 자금이 어떤 것이며, 이 자금이 폐지된 연도는 언제인가요? | Context Number | 1813
Answer:  

7/98
Question:  혁신창업사업화자금(융자) 사업을 시행하는 주체는 누구인가요? | Con

You seem to be using the pipelines sequentially on GPU. In order to maximize efficiency please use a dataset


9/98
Question:  부모급여 지원 사업의 목적은 무엇인가요? | Context Number | 1668
Answer:  1. 부모급여 지원 사업의 목적은 출산 및 양육으로 손실되는 소득을 보전하고 주 양육자의 직접 돌봄이 중요한 아동 발달의 특성에 따라 영아기 돌봄을 두텁게 지원하기 위하여 부모급여 지급입니다.
Before:  None  |  None

10/98
Question:  부모급여(영아수당)의 2024년 확정된 예산은 몇백만원인가요? | Context Number | 2245
Answer:  2024 년 부모급여(영아수당)의 예산은 2,888,694 백만원입니다.
Before:  None  |  None

11/98
Question:  부모급여 지원 사업은 어떤 법령상 근거를 갖고 추진되고 있나요? | Context Number | 1617
Answer:  부모급여 지원 사업의 법령상 근거는 아동수당법 제4조 제5항입니다.
Before:  None  |  None

12/98
Question:  영아수당 도입에 대한 추진경위는 어떻게 되나요? | Context Number | 2245
Answer:  영아수당 도입에 대한 추진경위는 예비타당성조사 통과(’21.8.), 근거법 마련(’21.12.), 영아수당 지원사업 시행(’22.1~), ‘부모급여 도입’ 대통령 공약사항 및 국정과제[*]에 포함(’22.5.) 등입니다.
Before:  None  |  영아수당 도입에 대한 추진경위는 다음과 같습니다.

13/98
Question:  부모급여 지원사업은 언제부터 시행되었나요? | Context Number | 1666
Answer:  부모급여 지원사업은 2022년 1월부터 시행되었습니다.
Before:  None  |  None

14/98
Question:  보건복지부의 부모급여(영아수당) 지원 사업시행방법은 무엇이며, 사업 수혜자는 누구인가? | Context Number | 1617
Answer:  1. 보건복지부의 부모급여(영아수당) 지



15/98
Question:  노인장기요양보험 사업 운영에 대한 목적은 무엇인가요? | Context Number | 2937
Answer:  노인장기요양보험 사업 운영에 대한 목적은 노후의 건강증진 및 생활 안정을 도모하고 가족의 부담을 완화하여 국민 삶의 질을 향상하기 위하여 노인장기요양보험에 국고지원을 함으로써 효율적인 정책추진을 목적으로 합니다.
Before:  None  |  None

16/98
Question:  노인장기요양보험 운영지원에 대한 사업 내용을 설명해줘. | Context Number | 2343
Answer:  노인장기요양보험 운영지원에 대한 사업 내용은 고령이나 노인성 질병으로 일상생활을 혼자서 수행하기 어려운 노인 등에게 신체 또는 가사 활동 등을 제공하는 노인장기요양보험에 대한 국고지원을 통해 효율적인 정책 추진으로 노후의 건강증진 및 생활 안정을 도모하고 가족의 부담을 완화하여 국민 삶의 질을 향상하는 것입니다.
Before:  None  |  1. 노인장기요양보험 운영지원에 대한 사업 내용은 다음과 같습니다. 

노인장기요양보험 사업운영은 고령이나 노인성 질병으로 일상생활을 혼자서 수행하기 어려운 노인 등에게 신체 또는 가사 활동 등을 제공하는 노인장기요양보험에 대한 국고지원을 통해 효율적인 정책 추진으로 노후의 건강증진 및 생활 안정을 도모하고 가족의 부담을 완화하여 국민 삶의 질을 향상합니다.

사업운영은 「노인장기요양보험법」 제58조에 따라 국가가 국민건강보험 공단에 지원하는 법정지원금(장기요양보험료 예상수입액의 20% 상당)을 포함합니다.

또한, 공무원·사립학교 교원의 장기요양 보험료 국가부담분 및 차상위계층의 장기요양 보험료 지원, 기타 의료급여수급권자의 장기요양 급여 이용에 따른 급여 비용 및 관리운영비 국고지원(서울 50%, 기타지역 80%), 이재민, 의사상자, 국가유공자, 입양아동, 국가무형문화재보유자, 북한이탈주민 등에 대한 노인장기요양보험 사업추진에 필요한 경비, 장기요양기관 재무회계프로그램 구축·운영에



23/98
Question:  에너지 바우처 제도의 주요 내용은 무엇인가요? | Context Number | 3140
Answer:  에너지 바우처 제도의 주요 내용은 경제적 부담 등으로 에너지 이용에 어려움을 겪는 에너지 소외계층에게 전기·가스·지역난방 등 에너지 이용에 필요한 비용을 지원하는 제도입니다.
Before:  None  |  에너지 바우처 제도의 주요 내용은 다음과 같습니다. 

1.  경제적 부담 등으로 에너지 이용에 어려움을 겪는 에너지 소외계층에게 전기·가스·지역난방 등 에너지 이용에 필요한 비용을 지원하는 제도입니다.
2.  하절기바우처 : 하절기 냉방 등을 위한 전기요금을 가상카드 형태로 지원
3.  동절기바우처 : 동절기 난방 등을 위한 연탄, 등유, LPG, 전기, 도시가스, 지역난방 등 연료비를 가상카드, 실물카드 형태로 지원
4.  연탄쿠폰 : 연탄보일러를 사용하는 대상 가구에 연탄 구입 비용을 연탄쿠폰 형태로 지원
5.  등유바우처 : 등유보일러를 사용하는 대상 가구에 동절기 난방을 위한 난방용 등유 구입비용을 실물카드 형태로 지원

24/98
Question:  에너지바우처 사업의 주요 수혜자는 누구인가요? | Context Number | 3297
Answer:  에너지바우처 사업의 주요 수혜자는 노인, 장애인, 영유아, 임산부, 중증‧희귀‧중증난치질환자, 한부모, 소년소녀가정 포함 세대, 연탄쿠폰을 사용하는 기초생활수급자, 차상위계층, 기타 소외계층, 등유를 사용하는 생계‧의료급여(중위소득 40%이하) 수급세대 중, 한부모‧소년소녀가정세대입니다.
Before:  None  |  None

25/98
Question:  2024년 에너지바우처 사업의 사업시행주체는 무엇인가요? | Context Number | 2901
Answer:  2024 년 에너지바우처 사업의 사업시행주체는 한국에너지공단, 한국광해광업공단입니다.
Before:  None  |  None

26/98
Question:  하절기바우처와 동절기바우처의 20



38/98
Question:  행복주택출자 사업은 어떤 근거로 추진되고 있는가? | Context Number | 2125
Answer:  행복주택출자 사업은 주택도시기금법 제9조 제1항 가목 및 공공주택 특별법 제2조 1호 가목에 근거하고 있습니다.
Before:  None  |  None

39/98
Question:  행복주택출자 사업은 어떤 목적으로 시행되는가? | Context Number | 2125
Answer:  행복주택출자 사업은 국민의 행복주거 실현을 위한 보편적 주거복지 정책의 일환으로 도심 내 다양한 부지를 활용하여 행복주택을 공급하는 목적으로 시행되고 있습니다.
Before:  None  |  None

40/98
Question:  행복주택출자 사업의 주요 수혜자는 누구인가? | Context Number | 2125
Answer:  행복주택출자 사업의 주요 수혜자는 대학생・사회초년생・신혼부부 등 젊은층(80%), 고령자 및 주거취약계층(20%)입니다.
Before:  None  |  None

41/98
Question:  행복주택출자 사업의 사업비 추이는 어떠한가? | Context Number | 2245
Answer:  행복주택출자 사업의 최근 5년간 투입된 사업비는 1,267,123백만원, 1,105,291백만원, 775,293백만원, 684,607백만원, 528,783백만원입니다.
Before:  None  |  행복주택출자 사업의 최근 5년간 투입된 사업비는 다음과 같습니다.

42/98
Question:  행복주택출자 사업의 사업시행주체는 누구인가? | Context Number | 2613
Answer:  행복주택출자 사업의 사업시행주체는 한국토지주택공사(LH)와 지자체(지방공사)입니다.
Before:  None  |  None



