참고: https://flonelin.wordpress.com/2024/05/15/ragretrieval-augmented-generation-%ED%8F%89%EA%B0%80-%EB%B0%A9%EB%B2%95/

In [10]:
###### source document 준비 ######

In [6]:
import fitz  # PyMuPDF
from tqdm import tqdm

# PDF 파일에서 텍스트를 추출하는 함수
def extract_text_from_pdf(pdf_path):
    doc = fitz.open(pdf_path)
    texts = []
    for page_num in range(len(doc)):
        page = doc.load_page(page_num)
        text = page.get_text()
        texts.append({"text": text, "source": f"page_{page_num + 1}"})
    return texts

# PDF 파일 경로
pdf_path = r"D:\[24]ICT_Practice\practice_file\(2024)포트미스_가이드북.pdf"

# PDF 파일에서 텍스트 추출
ds = extract_text_from_pdf(pdf_path)

In [7]:
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.docstore.document import Document as LangchainDocument
 
# 데이터셋에서 각 문서를 처리하여 LangchainDocument 객체 리스트로 생성
langchain_docs = [LangchainDocument(page_content=doc["text"], metadata={"source": doc["source"]}) for doc in tqdm(ds)]
 
#  문서를 특정 크기의 청크로 분할하기 위한 설정
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=2000,
    chunk_overlap=200,
    add_start_index=True,
    separators=["\n\n", "\n", ".", " ", ""],
)
 
# 모든 문서를 분할하여 처리된 문서 리스트에 추가
docs_processed = []
for doc in langchain_docs:
    docs_processed += text_splitter.split_documents([doc])

100%|███████████████████████████████████████████████████████████████████████████████| 43/43 [00:00<00:00, 84992.97it/s]


In [8]:
# 결과 확인
print(docs_processed)

[Document(metadata={'source': 'page_1', 'start_index': 0}, page_content='가이드북\n글로벌 리더로 도약하기 위한'), Document(metadata={'source': 'page_2', 'start_index': 0}, page_content='글로벌 물류 중심\n대한민국\n해운산업\n리더국가\n고객과 \n함께하는 \n미래\n해운업 \n상생을 통한\n해운강국 건설\n가이드북\n글로벌 리더로 도약하기 위한\nCONTENTS\n세계 해운산업 리더국가 실현\n우리나라 항만을 글로벌 물류 중심지로\n해운, 조선 상생을 통한 해운강국 건설\n04\n06\n08\n10\n12\n14\n16\n18\n20\n22\n24\n26\n28\n포트미스 주요 서비스\n포트미스 이용 환경\n포트미스 회원가입 절차\n입·출항 선박에 대한 선박제원 등록\n(변경) 절차 업무 흐름\n외항선 민원신고 절차\n내항선 민원신고 절차\n외항선입항(출항)신고(최초,변경)\n승무원/승객명부\n강제도선 면제신청\n예선사용 면제신청\n선박평형수신고\n선박보안정보통보신고\n저속운항선박지원신청\n저속운항선박 인센티브 신청\n항만시설사용허가신청서(선석신청)\n항만시설사용료(정박료)면제신청\n30\n32\n34\n36\n38\n40\n42\n44\n48\n58\n80\n위험물 반입신고 /\n위험물 일람표신고\n통합화물신고\n외항입항(출항)신고(최종)\n항만시설사용신고(화물료)\n화물료 대납경비 청구\n국가관리연안항신고 및\n연안항 화물료 신고\n서북도서출항신고\n월정료선박사용신청\n선박수리신고 신청 /\n선박수리허가 신청\n상계/환급 신청\n포트미스 히스토리\n부록 신고서식\n항만시설 사용료 디지털 방식 \n03\n02 • PORT-MIS'), Document(metadata={'source': 'page_3', 'start_index': 0}, page_content='해운산업 리더국가 실현\n글로벌 경갱력을 갖춘 고부가가치 스마트 항만 실현\n우리

In [23]:
# 전체 문서를 하나의 큰 텍스트 블록으로 결합
combined_text = " ".join([doc.page_content for doc in docs_processed])

In [11]:
###### 질문 생성을 위한 agent setup ######

In [21]:
import openai
import os

# OpenAI API 키 설정 (환경 변수로 설정하는 것이 일반적)
openai.api_key = "개인키입력"

# GPT-4를 호출하는 함수 정의
def call_llm(prompt, model="gpt-3.5-turbo", temperature=0):
    messages = [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": prompt}
    ]
    response = openai.chat.completions.create(
        model=model,
        messages=messages,
        temperature=temperature, 
        max_tokens=1000
    )
    answer = response.choices[0].message.content
    return answer

# 함수를 호출하여 테스트 프롬프트로 모델을 실행하고 출력 결과 확인
print(call_llm("This is a test context"))

Great! How can I assist you with your test context today?


In [22]:
QA_generation_prompt = """
당신의 임무는 주어진 맥락을 바탕으로 사실적인 질문과 답변을 작성하는 것입니다.
당신의 사실적 질문은 맥락에서 구체적이고 간결한 사실 정보로 답변될 수 있어야 합니다.
사실적 질문은 사용자가 검색 엔진에 물을 수 있는 방식으로 구성되어야 합니다.
이는 사실적 질문이 "해당 글에 따르면"이나 "맥락에 따르면"과 같은 표현을 포함해서는 안 된다는 것을 의미합니다.
 
다음과 같이 답변을 제공하세요:
 
Output:::
Factoid question: (당신의 사실적 질문)
Answer: (사실적 질문에 대한 답변)
 
이제 여기에 맥락이 있습니다.
 
Context: {context}\n
Output:::"""

In [24]:
import random
 
N_GENERATIONS = 50  # QA 쌍 50개 생성

print(f"Generating {N_GENERATIONS} QA couples...")

outputs = []
for _ in tqdm(range(N_GENERATIONS)):
    # 임의로 청크를 선택
    sampled_context = random.choice(docs_processed)
    # QA 쌍 생성
    output_QA_couple = call_llm(QA_generation_prompt.format(context=sampled_context.page_content))
    try:
        # 생성된 텍스트에서 질문과 답변을 추출
        question = output_QA_couple.split("Factoid question: ")[-1].split("Answer: ")[0].strip()
        answer = output_QA_couple.split("Answer: ")[-1].strip()
        assert len(answer) < 300, "Answer is too long"  # 답변 길이 제한 검사

        outputs.append(
            {
                "context": sampled_context.page_content,  # 문맥
                "question": question,  # 질문
                "answer": answer,  # 답변
                "source_doc": sampled_context.metadata["source"],  # 문서 출처 정보
            }
        )
    except:
        continue

Generating 50 QA couples...


100%|██████████████████████████████████████████████████████████████████████████████████| 50/50 [01:18<00:00,  1.58s/it]


In [25]:
# 결과 출력
for output in outputs:
    print(f"Context: {output['context']}")
    print(f"Question: {output['question']}")
    print(f"Answer: {output['answer']}")
    print(f"Source: {output['source_doc']}\n")

Context: ▶ 위험물 반입신고 / 위험물일람표 신고
- 
위험물을 무역항의 수상구역등으로 반입시 반입 24시간 전에 신고
- 
다만, 위험물을 육상으로 반입하는 경우에는 무역항의 육상구역으로 위험물을 들여오기 전까지, 전(前) 출항지로부터 
반입 항까지의 운항 시간이 24시간 이내이고, 해상으로 위험물을 반입하는 경우에는 무역항의 수상구역등으로 위험
물을 들여오기 전까지 신고
선박입출항법 제32조1항, 시행규칙 제14조 1항
근거
법령
(담당자)수리
 • 
업무담당자: 민원 신고문서 심사후 이상이 없으면 수리
처리
7
신고 문서검토 
및 저장
• 신고내역 확인 및 저장
• 담당자 반려시 반려에 대한 내용 확인 후 재신고
4
수리
7
민원 신고
완료
8
• 위험물 반입신고 / 위험물 일람표 신고 완료
입항신고
• 선박 입항 전까지 입항 예정정보를 신고(최초)
2
위험물 신고
• 
선박에 싣고있는 위험물질 품목 및 중량, 위험물질 등급, 
하역장소 등을 신고
• 위험물 반입신고서, 위험물 일람표 신고
3
오류통보(반려)
6
• 
업무담당자 : 민원 신고서에 오류가 있는 경우 오류내용 
입력 후 (반려)처리
• 
민원인 : 반려 내용 확인 후 신고서를 수정하여 재신고
(담당자)민원 
신고문서 확인
(수리/반려)
• 
업무담당자는 민원 신고 문서 심사 후 수리 or 오류
통보(반려)처리
• 
반려시에는 민원인이 반려 내용을 확인할 수 있도록 
반려 사유를 입력
5
8  위험물 반입신고 / 위험물일람표 신고
가. 신고 업무 흐름도
나. 신고 업무 흐름도 설명
신고 프로그램 
접속
• 해양수산부(포트미스) : www.portmis.go.kr
    
PORT-MIS신고 → 위험물 → 위험물 반입신고/
	
	
위험물 일람표 신고
• KL-NET(프리즘 3.0) : https://www.plism.com
• KTNET(ulogishub) : https://www.ulogishub.com  
1
(담당자)민원 신고문서 확인
(수리/반려)
5
민원 신고 완

In [26]:
##### 평가(Critique) agent setup #####

In [27]:
question_groundedness_critique_prompt = """
제공된 맥락과 질문이 주어집니다.
당신의 임무는 제공된 맥락을 가지고 주어진 질문에 명확하게 대답할 수 있는지에 대한 '총 평가' 점수를 제공하는 것입니다.
1부터 5까지의 점수로 평가하며, 1점은 맥락을 가지고 전혀 대답할 수 없음을 의미하고, 5점은 질문을 맥락으로 분명하고 명확하게 대답할 수 있음을 의미합니다.
 
다음과 같이 답변해 주세요:
 
답변:::
평가: (점수를 준 이유에 대한 내용)
총 평가: (1에서 5 사이의 숫자로 점수를 제공)
 
'평가:'와 '총 평가:'에 대한 값이 꼭 포함되어야 합니다.
 
이제 질문과 맥락이 있습니다.
 
질문: {question}\n
맥락: {context}\n
답변::: """
 
question_relevance_critique_prompt = """
질문이 주어집니다.
당신의 임무는 이 질문이 "포트미스(해운항만물류정보시스템) 사이트"를 사용하는 소비자들에게 얼마나 유용한지 대표하는 '총 평가' 점수를 제공하는 것입니다.
1점은 전혀 유용하지 않음을, 5점은 매우 유용함을 의미하는 1에서 5까지의 점수로 평가하세요.

다음과 같이 답변해 주세요:
 
답변:::
평가: (점수를 준 이유에 대한 내용)
총 평가: (1에서 5 사이의 숫자)
 
'평가:'와 '총 평가:'에 대한 값이 꼭 포함되어야 합니다.
 
이제 질문이 있습니다.
 
질문: {question}\n
답변::: """
 
question_standalone_critique_prompt = """
질문이 주어집니다.
당신의 임무는 이 질문이 얼마나 맥락에 독립적인지 나타내는 '총 평가' 점수를 제공하는 것입니다.
1점은 추가 정보가 필요함을 의미하며, 5점은 질문이 스스로 이해가 가능함을 의미합니다.
예를 들어, '맥락에서'나 '문서에서'와 같은 특정 설정을 언급하는 경우 점수는 1이어야 합니다.
질문에 Gradio, Hub, Hugging Face 또는 Space와 같은 기술적 용어나 약어가 포함되어 있어도 상관없지만, 문서를 통해 질문 내용을 이해할 수 있는 운영자에게 명확해야 합니다.
 
예를 들어, "ViT 모델이 어느 체크포인트에서 가져오는가?"는 특정 맥락이 암시되어 있기 때문에 1점을 받아야 합니다.

질문이 주어집니다.
당신의 임무는 이 질문이 얼마나 맥락에 독립적인지 나타내는 '총 평가' 점수를 제공하는 것입니다.
1점은 추가 정보가 필요함을 의미하며, 5점은 질문이 스스로 이해가 가능함을 의미합니다.
예를 들어, '맥락에서'나 '문서에서'와 같은 특정 설정을 언급하는 경우 점수는 1이어야 합니다.
질문에 포트미스 가이드북과 관련된 기술적 용어나 약어가 포함되어 있어도 상관없지만, 문서를 통해 질문 내용을 이해할 수 있는 운영자에게 명확해야 합니다.

예를 들어, "저속운항선박지원신청은 어느 체크포인트에서 가져오는가?"는 특정 맥락이 암시되어 있기 때문에 1점을 받아야 합니다.


다음과 같이 답변해 주세요:
 
답변:::
평가: (점수를 준 이유에 대한 내용)
총 평가: (1에서 5 사이의 숫자)
 
'평가:'와 '총 평가:'에 대한 값이 꼭 포함되어야 합니다.
 
이제 질문이 있습니다.
 
질문: {question}\n
답변::: """

In [38]:
for output in tqdm(outputs):
    evaluations = {
        "groundedness": call_llm(
            question_groundedness_critique_prompt.format(context=output["context"], question=output["question"]),
        ),
        "relevance": call_llm(
            question_relevance_critique_prompt.format(question=output["question"]),
        ),
        "standalone": call_llm(
            question_standalone_critique_prompt.format(question=output["question"]),
        ),
    }
    try:
        for criterion, evaluation in evaluations.items():
            print(f"Evaluating {criterion}: {evaluation}")  # Debugging line
            # '평가:'와 '총 평가:'를 기준으로 분리
            eval_parts = evaluation.split("평가:")
            score_parts = evaluation.split("총 평가:")
            
            if len(eval_parts) > 1 and len(score_parts) > 1:
                eval_text = eval_parts[1].split("총 평가:")[0].strip()
                score = int(score_parts[1].strip())
                output.update(
                    {
                        f"{criterion}_score": score,
                        f"{criterion}_eval": eval_text,
                    }
                )
            else:
                print(f"Unexpected response format for {criterion}: {evaluation}")
    except Exception as e:
        print(f"Error processing {criterion}: {e}")  # Error logging line
        continue

  2%|█▋                                                                                 | 1/49 [00:04<03:21,  4.19s/it]

Evaluating groundedness: 평가: 맥락에서 위험물을 무역항의 수상구역으로 반입할 때의 신고 시기에 대한 명확한 정보가 제공되었습니다.
총 평가: 5


Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템) 사이트는 위험물을 무역항의 수상구역으로 반입할 때 신고 시기에 대한 명확하고 상세한 정보를 제공합니다. 해당 정보를 통해 사용자들은 신고 시기를 정확히 파악할 수 있습니다.

총 평가: 5
Evaluating standalone: 평가: 질문이 구체적이며 명확하게 이해할 수 있습니다.
총 평가: 5


  4%|███▍                                                                               | 2/49 [00:08<03:18,  4.21s/it]

Evaluating groundedness: 답변:::
평가: The information included in the "특별 또는 추가 보안조치 내용" section is related to the special or additional security measures.
총 평가: 5
Evaluating relevance: 평가: "특별 또는 추가 보안조치 내용" 섹션에는 사용자들이 안전하게 정보를 제공하고 전송할 수 있도록 필요한 추가적인 보안 조치에 대한 정보가 포함되어 있습니다.
총 평가: 5
Evaluating standalone: 평가: 질문이 명확하게 구성되어 있으며 추가 정보나 특정 맥락이 필요하지 않습니다.
총 평가: 5

답변: "특별 또는 추가 보안조치 내용" 섹션에는 추가적인 보안 조치나 특별한 보안 관련 정보가 포함되어 있습니다.
Error processing standalone: invalid literal for int() with base 10: '5\n\n답변: "특별 또는 추가 보안조치 내용" 섹션에는 추가적인 보안 조치나 특별한 보안 관련 정보가 포함되어 있습니다.'


  6%|█████                                                                              | 3/49 [00:15<04:07,  5.38s/it]

Evaluating groundedness: 답변: 외항입항신고를 최초로 제출하는 경우에는 다음 단계를 거쳐야 합니다.
1. 승무원/승객명부 제출
2. 선박평형수신고
3. 선박보안 정보통보
4. 항만시설사용 허가신고(화물료) 제출
5. 외항입항신고(최종) 제출
6. 화물료 대납 경비청구

평가: 맥락에서 외항선 민원신고 절차와 포트미스 신고 업무 안내가 제공되어 있어서 외항입항신고 절차를 명확하게 설명할 수 있습니다.
총 평가: 5
Evaluating relevance: 평가: 외항입항신고 절차에 대한 명확한 안내가 필요하다.
총 평가: 3

외항입항신고를 최초로 제출하는 경우, 먼저 포트미스(해운항만물류정보시스템) 사이트에 접속하여 해당 서비스를 선택한 후, 필요한 정보를 입력하고 제출해야 합니다. 이후 해당 정보는 관련 기관에 전달되어 처리됩니다.
Error processing relevance: invalid literal for int() with base 10: '3\n\n외항입항신고를 최초로 제출하는 경우, 먼저 포트미스(해운항만물류정보시스템) 사이트에 접속하여 해당 서비스를 선택한 후, 필요한 정보를 입력하고 제출해야 합니다. 이후 해당 정보는 관련 기관에 전달되어 처리됩니다.'


  8%|██████▊                                                                            | 4/49 [00:21<04:26,  5.92s/it]

Evaluating groundedness: 평가: 주어진 맥락에서 외항선 입항신고와 승무원/승객명부에 대한 정보가 제공되었습니다. 외항선 입항신고에서 선박이 입항 전에 신고해야 하는 정보는 선박 입항 전까지 입항 예정정보를 신고해야 합니다.
총 평가: 5

Evaluating relevance: 평가: 외항선 입항신고에 대한 정보가 명확하게 제공되어 있습니다.
총 평가: 4

외항선 입항신고에서 선박이 입항 전에는 선박의 이름, IMO 번호, 입항 예정일 및 시간, 선박의 국적, 선박의 종류, 선박의 길이, 선박의 톤수, 선박의 운항사, 선박의 대리인, 선박의 운항지, 선박의 최종 목적지, 선박의 현재 위치, 선박의 현재 속도, 선박의 ETA(예상 도착 시간), 선박의 ETA 위치 등의 정보를 신고해야 합니다.
Error processing relevance: invalid literal for int() with base 10: '4\n\n외항선 입항신고에서 선박이 입항 전에는 선박의 이름, IMO 번호, 입항 예정일 및 시간, 선박의 국적, 선박의 종류, 선박의 길이, 선박의 톤수, 선박의 운항사, 선박의 대리인, 선박의 운항지, 선박의 최종 목적지, 선박의 현재 위치, 선박의 현재 속도, 선박의 ETA(예상 도착 시간), 선박의 ETA 위치 등의 정보를 신고해야 합니다.'


 10%|████████▍                                                                          | 5/49 [00:26<04:00,  5.46s/it]

Evaluating groundedness: 답변:::
평가: 맥락에서 공무원과 위탁운영인력의 총 인원이 명시되어 있습니다. 공무원 6명과 위탁운영인력 17명으로 총 23명이 참여하고 있습니다.
총 평가: 5
Evaluating relevance: 평가: 이 질문은 포트미스 사이트를 사용하는 소비자들에게 직접적인 유용한 정보를 제공하지는 않습니다.  
총 평가: 1

해운항만물류정보시스템(PORT-MIS) 운영에 참여하는 공무원과 위탁운영인력의 총 인원은 알려진 정보가 없어서 정확한 숫자를 제공할 수 없습니다.
Error processing relevance: invalid literal for int() with base 10: '1\n\n해운항만물류정보시스템(PORT-MIS) 운영에 참여하는 공무원과 위탁운영인력의 총 인원은 알려진 정보가 없어서 정확한 숫자를 제공할 수 없습니다.'


 12%|██████████▏                                                                        | 6/49 [00:31<03:43,  5.21s/it]

Evaluating groundedness: 평가: PORT-MIS는 전국 무역항에서 선박의 입항, 출항, 항만이용, 항만물류, 해운, 선원, 선박 등의 민원사무 처리 및 정보관리를 지원하는 시스템입니다.
총 평가: 5

Evaluating relevance: 평가: PORT-MIS는 무역항에서 수입 및 수출 화물의 추적, 관리, 및 정보 제공을 지원합니다.
총 평가: 5
Evaluating standalone: 평가: 질문에서 PORT-MIS가 무역항에서 어떤 업무를 지원하는지에 대한 추가 맥락이 없습니다.
총 평가: 1

PORT-MIS는 무역항에서 운항하는 선박들의 정보를 관리하고 처리하는데 사용되는 시스템입니다.
Error processing standalone: invalid literal for int() with base 10: '1\n\nPORT-MIS는 무역항에서 운항하는 선박들의 정보를 관리하고 처리하는데 사용되는 시스템입니다.'


 14%|███████████▊                                                                       | 7/49 [00:36<03:33,  5.08s/it]

Evaluating groundedness: 답변:::
평가: PORT-MIS에서 고지서를 직접 출력할 수 있는 방법은 www.portmis.go.kr에 접속하여 항만민원 ➡ 조회/발급/사용료 ➡ 사용료 ➡ [고지서 출력(민원인)] 메뉴를 선택하고 출력할 고지서를 검색하여 출력대상을 선택한 후 개별 고지서 출력 클릭하여 프린트 또는 pdf 파일로 저장하는 방법입니다.
총 평가: 5
Evaluating relevance: 평가: 포트미스 사이트에서 고지서를 직접 출력할 수 있는 방법은 매우 간단하고 직관적으로 제공되어 있습니다. 사용자들이 쉽게 접근하여 필요한 작업을 수행할 수 있습니다.

총 평가: 5
Evaluating standalone: 평가: PORT-MIS에 대한 추가 정보가 필요합니다.
총 평가: 1


 16%|█████████████▌                                                                     | 8/49 [00:40<03:14,  4.75s/it]

Evaluating groundedness: 평가: 맥락에서 PORT-MIS를 통해 납부확인서를 출력하는 방법에 대한 구체적인 절차가 설명되어 있습니다.
총 평가: 5


Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템) 사이트의 납부확인서 출력 기능은 사용자들이 결제 및 납부 정보를 편리하게 확인할 수 있어서 매우 유용합니다.
총 평가: 5
Evaluating standalone: 평가: PORT-MIS에 대한 추가 정보가 필요합니다.
총 평가: 1


 18%|███████████████▏                                                                   | 9/49 [00:45<03:20,  5.01s/it]

Evaluating groundedness: 평가: PORT-MIS는 Port Management Information System의 약자로, 항구 관리 정보 시스템을 의미합니다. 위험물 반입신고서에서의 PORT-MIS는 항구에서의 정보 시스템을 통해 위험물을 관리하고 추적하는데 사용될 수 있습니다.

총 평가: 4
Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템) 사이트는 해양운송에서 위험물 선언서와 관련하여 정보를 제공하고 관리하는데 도움을 줍니다. 이를 통해 소비자들은 안전하고 효율적인 해운물류 서비스를 이용할 수 있습니다.

총 평가: 4


Evaluating standalone: 평가: 질문은 명확하게 제시되어 있으며 추가적인 맥락이나 정보 없이도 이해할 수 있습니다.
총 평가: 5

답변: The purpose of a PORT-MIS in the context of a hazardous materials declaration form is to provide a standardized system for reporting and tracking hazardous materials being transported through ports. It helps ensure compliance with regulations, improve safety measures, and facilitate communication between relevant parties involved in the transportation of hazardous materials.
Error processing standalone: invalid literal for int() with base 10: '5\n\n답변: The purpose of a PORT-MIS in the context of a hazardous materials declaration form is to provide a standardized system for report

 20%|████████████████▋                                                                 | 10/49 [00:51<03:26,  5.30s/it]

Evaluating groundedness: 평가: 주어진 맥락에서 ebXML 민원신고와 EDI 민원신고의 신고방식은 각각 직접 신고와 중계망사업자를 통한 신고임을 알 수 있습니다.
총 평가: 5


Evaluating relevance: 평가: 질문에 대한 답변이 필요한 내용을 명확히 이해하고 있음.
총 평가: 5

ebXML 민원신고와 EDI 민원신고의 신고방식은 각각 전자 비즈니스 표준인 ebXML과 전자 데이터 교환(EDI)을 활용하여 민원을 신고하는 방식입니다. ebXML은 XML을 기반으로 하는 표준화된 전자 비즈니스 프로세스를 지원하며, EDI는 구조화된 데이터를 교환하는 표준화된 방법론을 의미합니다. 두 방식 모두 전자화된 데이터를 안전하게 교환하고 처리함으로써 민원 처리 과정을 효율적으로 관리할 수 있습니다.
Error processing relevance: invalid literal for int() with base 10: '5\n\nebXML 민원신고와 EDI 민원신고의 신고방식은 각각 전자 비즈니스 표준인 ebXML과 전자 데이터 교환(EDI)을 활용하여 민원을 신고하는 방식입니다. ebXML은 XML을 기반으로 하는 표준화된 전자 비즈니스 프로세스를 지원하며, EDI는 구조화된 데이터를 교환하는 표준화된 방법론을 의미합니다. 두 방식 모두 전자화된 데이터를 안전하게 교환


 22%|██████████████████▍                                                               | 11/49 [00:55<03:06,  4.90s/it]

Evaluating groundedness: 평가: 맥락만으로는 어떤 주제에 대한 가이드북인지 명확히 알 수 없습니다.
총 평가: 2
Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템) 사이트는 해운항만물류 정보와 관련된 다양한 주제에 대한 가이드북을 제공합니다. 이 가이드북은 해운항만물류에 대한 기본 개념부터 심층적인 정보까지 포함하고 있습니다.

총 평가: 4.5
Error processing relevance: invalid literal for int() with base 10: '4.5'


 24%|████████████████████                                                              | 12/49 [01:02<03:17,  5.34s/it]

Evaluating groundedness: 평가: 제공된 맥락을 통해 포트미스 이용 환경에서 제공되는 서비스는 항만민원신고 및 신고 결과 조회, 항만사용료 납부 및 조회, 다양한 통계 정보 제공, 모바일을 통한 민원신고 및 신고 결과 조회, 선박에 대한 관제 현황 정보 조회, EDI 및 ebXML 응답문서 조회 기능, 민간운영 프로그램을 통한 항만민원신고 및 신고 결과 조회 등이 포함됩니다.
총 평가: 5
Evaluating relevance: 평가: 포트미스 이용 환경에서 제공되는 서비스는 실시간 선적 정보 조회, 화물 추적 및 위치 확인, 예약 및 운송 신청, 물류 관리 등이 있습니다.
총 평가: 5
Evaluating standalone: 평가: 질문이 명확하게 서비스에 대한 정보를 요구하고 있으며, 추가 맥락이나 특정 용어가 없어도 이해할 수 있습니다.
총 평가: 5

답변: 포트미스 이용 환경에서 제공되는 서비스는 포트미스 플랫폼을 통해 제공되는 다양한 서비스로, 예를 들어 포트미스 가이드북, 포트미스 API, 포트미스 모델 등이 있습니다.
Error processing standalone: invalid literal for int() with base 10: '5\n\n답변: 포트미스 이용 환경에서 제공되는 서비스는 포트미스 플랫폼을 통해 제공되는 다양한 서비스로, 예를 들어 포트미스 가이드북, 포트미스 API, 포트미스 모델 등이 있습니다.'


 27%|█████████████████████▊                                                            | 13/49 [01:05<02:51,  4.76s/it]

Evaluating groundedness: 답변:::
평가: 담당자(수리)와 담당자(반려)가 외항입항신고 최종으로 누구인지 명확하게 확인할 수 있습니다.
총 평가: 5
Evaluating relevance: 평가: 외항입항신고 담당자 정보를 쉽게 찾을 수 있습니다.
총 평가: 4
Evaluating standalone: 평가: 질문에는 특정 맥락이나 추가 정보가 없어서 쉽게 이해할 수 있습니다.
총 평가: 5


 29%|███████████████████████▍                                                          | 14/49 [01:21<04:42,  8.08s/it]

Evaluating groundedness: 평가: 주어진 맥락을 통해 항만시설사용료(정박료)면제를 받기 위한 절차에 대한 내용을 명확하게 설명할 수 있습니다.
총 평가: 5

항만시설사용료(정박료)면제를 받기 위한 절차는 다음과 같습니다:
1. 항만시설사용허가신청: 지정기간, 지정시설, 사용목적, 면제 사유를 신청합니다.
2. 면제사유 선택 및 증빙서류 제출: 면제사유 발생시 선박료를 면제받고자 할 때, 면제사유를 선택하고 해당하는 증빙서류를 제출합니다.
3. 항만시설사용료(정박료)면제신청: 면제사유 중 "접안시설 부족"을 선택한 경우에는 "선 접안 선박"에 대한 정보를 입력합니다.
4. 민원 신고 및 확인: 민원 신고서를 제출하고, 업무담당자는 신고 문서를 심사 후 승인 또는 반려 처리합니다.
5. 첨부서류 제출: 각 면제코드에 맞는 증빙서류를 제출합니다.
6. 오류통보(반려) 및 수정: 반려시에는 반려 사유를 확인하고, 신고서를 수정하여 재신고합니다.
7. 신고 프로그램 접속: 해양수산부(포트미스) 또는 기타 신고 프로그램을 통해 항만시설사용료(정박료)면제신청을 진행합니다.
Error processing groundedness: invalid literal for int() with base 10: '5\n\n항만시설사용료(정박료)면제를 받기 위한 절차는 다음과 같습니다:\n1. 항만시설사용허가신청: 지정기간, 지정시설, 사용목적, 면제 사유를 신청합니다.\n2. 면제사유 선택 및 증빙서류 제출: 면제사유 발생시 선박료를 면제받고자 할 때, 면제사유를 선택하고 해당하는 증빙서류를 제출합니다.\n3. 항만시설사용료(정박료)면제신청: 면제사유 중 "접안시


 31%|█████████████████████████                                                         | 15/49 [01:27<04:17,  7.57s/it]

Evaluating groundedness: 평가: 제공된 맥락에서 해운항만물류정보시스템(PORT-MIS)의 운영방식과 포함된 업무 내용이 명확하게 설명되어 있습니다.
총 평가: 5

해운항만물류정보시스템(PORT-MIS)의 운영방식에 포함된 업무 내용은 해운항만물류정보센터와 해운항만물류정보 재해복구센터로 구성되어 있으며, 각각의 운영방식과 업무 내용이 상세히 설명되어 있습니다.
Error processing groundedness: invalid literal for int() with base 10: '5\n\n해운항만물류정보시스템(PORT-MIS)의 운영방식에 포함된 업무 내용은 해운항만물류정보센터와 해운항만물류정보 재해복구센터로 구성되어 있으며, 각각의 운영방식과 업무 내용이 상세히 설명되어 있습니다.'


 33%|██████████████████████████▊                                                       | 16/49 [01:31<03:30,  6.39s/it]

Evaluating groundedness: 평가: 고지서를 PORT-MIS를 통해 출력하는 방법에 대한 상세한 설명이 주어졌습니다. 사용자가 어디에서 고지서를 출력할 수 있는지에 대한 명확한 안내가 있습니다.
총 평가: 5


Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템) 사이트를 사용하는 소비자들에게 고지서를 출력할 수 있는 기능이 쉽게 찾아지지 않고, 사용자 경험이 불편할 수 있습니다.
총 평가: 2
Evaluating standalone: 평가: PORT-MIS에 대한 추가 정보가 필요합니다.
총 평가: 1


 35%|████████████████████████████▍                                                     | 17/49 [01:36<03:12,  6.03s/it]

Evaluating groundedness: 평가: 주어진 맥락에서 내항입항신고 절차에 대한 구체적인 내용이 명시되어 있습니다. 내항입항신고는 최초, 변경, 최종으로 나뉘며, 승객명부와 함께 담당자(수리)에게 신고해야 합니다.
총 평가: 5
Evaluating relevance: 평가: 포트미스 사이트에서 내항입항신고 절차에 대한 상세하고 명확한 안내가 제공되어 있습니다. 필요한 단계와 양식에 대한 설명이 자세히 나와 있어 사용자들이 쉽게 따라 할 수 있습니다.

총 평가: 5
Evaluating standalone: 평가: 질문에는 추가적인 맥락이나 정보가 필요합니다. 내항입항신고를 하는 절차가 어떤 상황에서 이루어지는지에 대한 정보가 더 필요합니다.
총 평가: 1


 37%|██████████████████████████████                                                    | 18/49 [01:42<03:06,  6.00s/it]

Evaluating groundedness: 평가: PORT-MIS는 선박운항관리, 화물관리, 사용료관리, 물동량통계, 정보연계 등 항만민원 서비스와 해운민원 서비스를 제공하는데, 이를 통해 항만물류정보시스템을 운영하고 있습니다.
총 평가: 5

Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템) 사이트는 해운항만물류 정보를 제공하고 관리하는 주요 업무를 수행합니다. 이를 통해 사용자들은 선적, 창고, 운송 등 물류 관련 업무를 효율적으로 관리하고 추적할 수 있습니다.

총 평가: 4
Evaluating standalone: 평가: 질문이 명확하게 주요 업무에 대한 정보를 요구하고 있으며, 추가 맥락이나 특정 용어를 요구하지 않습니다.
총 평가: 5

답변:::
PORT-MIS의 주요 업무는 선박 운항 정보 및 관련 데이터를 관리하고 분석하여 효율적인 운항 지원 및 관리를 제공하는 것입니다.
Error processing standalone: invalid literal for int() with base 10: '5\n\n답변:::\nPORT-MIS의 주요 업무는 선박 운항 정보 및 관련 데이터를 관리하고 분석하여 효율적인 운항 지원 및 관리를 제공하는 것입니다.'


 39%|███████████████████████████████▊                                                  | 19/49 [01:45<02:37,  5.26s/it]

Evaluating groundedness: 답변:::
평가: 맥락에서 PORT-MIS의 정의와 약어의 전체적인 설명이 명확하게 제공됩니다.
총 평가: 5


Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템) 사이트의 정보가 쉽게 이해되고 접근하기 편리하다.
총 평가: 4
Evaluating standalone: 평가: PORT-MIS에 대한 추가 정보가 필요함을 나타냄  
총 평가: 1


 41%|█████████████████████████████████▍                                                | 20/49 [01:49<02:21,  4.88s/it]

Evaluating groundedness: 평가: 위험물을 무역항의 수상구역으로 반입할 때 신고를 해야 하는 시간은 반입 24시간 전에 신고해야 합니다.
총 평가: 5

위험물을 무역항의 수상구역으로 반입할 때는 반입 24시간 전에 신고해야 합니다.
Error processing groundedness: invalid literal for int() with base 10: '5\n\n위험물을 무역항의 수상구역으로 반입할 때는 반입 24시간 전에 신고해야 합니다.'


 43%|███████████████████████████████████▏                                              | 21/49 [01:54<02:18,  4.93s/it]

Evaluating groundedness: 평가: 국가관리 연안항은 국가안보나 영해관리, 기상악화 등 유사시 선박의 대피를 주목적으로 하는 항만이다.
총 평가: 5

해당 맥락에서 국가관리 연안항이 국가안보나 영해관리, 기상악화 등 유사시 선박의 대피를 주목적으로 한다는 명확한 정보가 제공되었기 때문에 5점을 줍니다.
Error processing groundedness: invalid literal for int() with base 10: '5\n\n해당 맥락에서 국가관리 연안항이 국가안보나 영해관리, 기상악화 등 유사시 선박의 대피를 주목적으로 한다는 명확한 정보가 제공되었기 때문에 5점을 줍니다.'


 45%|████████████████████████████████████▊                                             | 22/49 [02:00<02:16,  5.05s/it]

Evaluating groundedness: 평가: 선박 명부에 포함되는 정보 항목은 선박명, 호출부호ㆍ선박번호 또는 IMO번호, 해당 연도 입항횟수, 번호, 성명, 성별, 국적, 생년월일, 승선ㆍ하선 구분, 승선지/승선일, 여객ㆍ임시 승선자 구분, 차량 번호이다.
총 평가: 5

Evaluating relevance: 평가: 선박 명부에 포함되는 정보 항목은 선박의 이름, IMO 번호, 선적회사, 선박의 현재 위치 및 상태 등이 있습니다.
총 평가: 4
Evaluating standalone: 평가: 질문이 명확하게 구성되어 있고 추가 맥락이나 정보가 필요하지 않습니다.
총 평가: 5

답변: 선박 명부에 포함되는 정보 항목은 선박의 등록 번호, 선명, 선종, 선주, 선원 수, 톤수, 길이, 폭, 깊이, 등록 일자 등이 있습니다.
Error processing standalone: invalid literal for int() with base 10: '5\n\n답변: 선박 명부에 포함되는 정보 항목은 선박의 등록 번호, 선명, 선종, 선주, 선원 수, 톤수, 길이, 폭, 깊이, 등록 일자 등이 있습니다.'


 47%|██████████████████████████████████████▍                                           | 23/49 [02:04<02:02,  4.72s/it]

Evaluating groundedness: 답변:::
평가: "특별 또는 추가 보안조치 내용" 섹션에는 특별하거나 추가적인 보안 조치에 관한 정보가 포함되어 있습니다.
총 평가: 5
Evaluating relevance: 평가: "특별 또는 추가 보안조치 내용" 섹션에는 사용자들이 개인정보를 안전하게 보호하기 위한 추가적인 보안 조치에 대한 정보가 포함되어 있습니다.
총 평가: 4
Evaluating standalone: 평가: 질문이 특정 맥락을 요구하지 않고 명확하게 이해할 수 있습니다.
총 평가: 5

답변: "특별 또는 추가 보안조치 내용" 섹션에는 추가적인 보안 조치나 특별한 보안 관련 정보가 포함되어 있습니다.
Error processing standalone: invalid literal for int() with base 10: '5\n\n답변: "특별 또는 추가 보안조치 내용" 섹션에는 추가적인 보안 조치나 특별한 보안 관련 정보가 포함되어 있습니다.'


 49%|████████████████████████████████████████▏                                         | 24/49 [02:08<01:56,  4.67s/it]

Evaluating groundedness: 평가: 주로 상계 신청은 지방해양수산청을 통해 이루어지며, 환급 신청은 항만공사를 통해서 많이 이루어집니다.
총 평가: 5

Evaluating relevance: 평가: 상계 신청을 주로 하는 기관을 찾을 때 포트미스(해운항만물류정보시스템) 사이트는 상당히 유용합니다. 해당 사이트를 통해 관련 기관의 연락처, 신청 방법 및 절차 등을 쉽게 확인할 수 있습니다.

총 평가: 4.5
Error processing relevance: invalid literal for int() with base 10: '4.5'


 51%|█████████████████████████████████████████▊                                        | 25/49 [02:16<02:10,  5.46s/it]

Evaluating groundedness: 평가: 항만시설사용허가신청서(선석신청)의 신고 내용은 사용 시설코드, 사용목적, 사용기간, 양하·적하 화물 내용 등을 포함합니다.
총 평가: 5

해당 맥락에서 제공된 정보에 따르면 항만시설사용허가신청서(선석신청)의 신고 내용은 사용 시설코드, 사용목적, 사용기간, 양하·적하 화물 내용 등을 포함하고 있습니다.
Error processing groundedness: invalid literal for int() with base 10: '5\n\n해당 맥락에서 제공된 정보에 따르면 항만시설사용허가신청서(선석신청)의 신고 내용은 사용 시설코드, 사용목적, 사용기간, 양하·적하 화물 내용 등을 포함하고 있습니다.'


 53%|███████████████████████████████████████████▌                                      | 26/49 [02:21<02:02,  5.34s/it]

Evaluating groundedness: 평가: 제공된 맥락에서 PORT-MIS에서 납부확인서를 출력하는 방법에 대한 구체적인 설명이 포함되어 있습니다. 사용자가 온라인 결제 후 납부확인서를 출력하는 과정을 단계별로 설명하고 있습니다.
총 평가: 5


Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템) 사이트의 납부확인서 출력 기능은 사용자들이 결제 및 납부 정보를 편리하게 확인할 수 있도록 도와줍니다. 이 기능을 통해 사용자들은 자신의 결제 내역을 쉽게 조회하고 관리할 수 있습니다.

총 평가: 4


Evaluating standalone: 평가: 질문에는 PORT-MIS 시스템에 대한 특정 맥락이 암시되어 있습니다. 추가 정보가 필요합니다.
총 평가: 1


 55%|█████████████████████████████████████████████▏                                    | 27/49 [02:25<01:53,  5.14s/it]

Evaluating groundedness: 평가: 맥락에서 선박수리 허가신청서 및 신고서에 대한 언급이 있지만, 구체적으로 필요한 문서에 대한 명시적인 정보가 부족합니다.
총 평가: 2
Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템) 사이트에서 선박 수리 허가를 신청하는 데 필요한 문서에 대한 정보를 찾기 어려웠습니다. 필요한 문서에 대한 명확한 안내가 부족했습니다.
총 평가: 2
Evaluating standalone: 답변:::
평가: 질문이 명확하고 추가 정보 없이도 이해할 수 있습니다.
총 평가: 5


 57%|██████████████████████████████████████████████▊                                   | 28/49 [02:29<01:39,  4.74s/it]

Evaluating groundedness: 평가: 맥락에서 PORT-MIS를 통해 고지서를 출력하는 방법에 대한 상세한 설명이 제공되었습니다.
총 평가: 5


Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템) 사이트를 통해 고지서를 출력하는 기능은 매우 직관적이고 쉽게 접근할 수 있습니다. 사용자들은 메뉴에서 고지서 출력 옵션을 선택하고 필요한 정보를 입력하면 빠르게 고지서를 출력할 수 있습니다.

총 평가: 5


Evaluating standalone: 평가: PORT-MIS에 대한 추가 정보가 필요합니다.
총 평가: 1


 59%|████████████████████████████████████████████████▌                                 | 29/49 [02:33<01:28,  4.41s/it]

Evaluating groundedness: 평가: 제공된 맥락에서 포트미스의 모바일서비스로 KL-NET, PLISM 3.0, KTNET, UlogisHub 등이 제공된다는 정보가 명확하게 나와 있습니다.
총 평가: 5


Evaluating relevance: 평가: 포트미스의 모바일서비스는 편리하고 사용하기 쉽습니다. 정보에 빠르게 접근할 수 있어서 유용합니다.
총 평가: 4
Evaluating standalone: 평가: 질문에서 '포트미스 이용 환경'이라는 맥락이 명확히 언급되어 있어 추가 정보 없이도 이해 가능합니다.
총 평가: 5


 61%|██████████████████████████████████████████████████▏                               | 30/49 [02:36<01:19,  4.18s/it]

Evaluating groundedness: 평가: 맥락에서 화물료 대납경비 청구 시 수수료가 어떻게 청구되는지에 대한 구체적인 절차와 내용이 설명되어 있습니다.
총 평가: 5


Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템) 사이트는 화물료 대납경비 청구 시 수수료에 대한 정보를 명확하게 제공하고 있습니다. 사용자들이 필요한 정보를 쉽게 찾을 수 있도록 구성되어 있습니다.

총 평가: 4


Evaluating standalone: 평가: 질문이 특정 맥락을 요구하지 않고 명확하게 이해할 수 있습니다.
총 평가: 5


 63%|███████████████████████████████████████████████████▉                              | 31/49 [02:41<01:16,  4.27s/it]

Evaluating groundedness: 평가: 맥락에서 사용자 ID와 사용자명 등 회원정보를 입력해야 하는 단계는 "회원가입 정보 작성" 단계입니다.
총 평가: 5
Evaluating relevance: 평가: 포트미스 회원가입 절차에 대한 설명이 명확하고 쉽게 이해할 수 있음.
총 평가: 4

포트미스 회원가입 절차에서 사용자 ID와 사용자명 등 회원정보를 입력해야 하는 단계는 "회원정보 입력" 단계입니다.
Error processing relevance: invalid literal for int() with base 10: '4\n\n포트미스 회원가입 절차에서 사용자 ID와 사용자명 등 회원정보를 입력해야 하는 단계는 "회원정보 입력" 단계입니다.'


 65%|█████████████████████████████████████████████████████▌                            | 32/49 [02:46<01:16,  4.50s/it]

Evaluating groundedness: 답변:::
평가: 서북도서출항신고에 해당되는 도서는 백령도, 대청도, 소청도, 연평도 등 북방한계선에 인접한 도서입니다.
총 평가: 5
Evaluating relevance: 평가: 포트미스 사이트에서 서북도서출항신고에 해당되는 도서들을 쉽게 찾을 수 있습니다. 정보가 명확하고 정확하게 제공되어 있습니다.
총 평가: 5

포트미스 사이트는 서북도서출항신고에 해당되는 도서들을 찾는 데 매우 유용한 정보를 제공하고 있습니다.
Error processing relevance: invalid literal for int() with base 10: '5\n\n포트미스 사이트는 서북도서출항신고에 해당되는 도서들을 찾는 데 매우 유용한 정보를 제공하고 있습니다.'


 67%|███████████████████████████████████████████████████████▏                          | 33/49 [02:51<01:14,  4.66s/it]

Evaluating groundedness: 평가: 맥락만으로는 선박평형수 입항 보고서에 대한 구체적인 내용이 제공되지 않습니다.
총 평가: 1
Evaluating relevance: 평가: 선박평형수 입항 보고서는 선박의 평형수 정보를 포함하고 있습니다. 이 정보는 선박의 안전운항을 위해 중요한 요소이며, 선박의 안전성을 평가하는 데 도움이 됩니다.

총 평가: 4
Evaluating standalone: 평가: 질문이 구체적이며 명확한 내용을 요구하고 있습니다.
총 평가: 5

답변: 선박평형수 입항 보고서에는 선박의 평형수 상태, 선박의 운항 및 항해 정보, 선박의 승무원 정보, 그리고 선박의 화물 정보 등이 포함될 수 있습니다.
Error processing standalone: invalid literal for int() with base 10: '5\n\n답변: 선박평형수 입항 보고서에는 선박의 평형수 상태, 선박의 운항 및 항해 정보, 선박의 승무원 정보, 그리고 선박의 화물 정보 등이 포함될 수 있습니다.'


 69%|████████████████████████████████████████████████████████▉                         | 34/49 [02:55<01:06,  4.44s/it]

Evaluating groundedness: 평가: 제공된 맥락에서 포트미스 이용 환경에서 제공되는 모바일 서비스에 대한 구체적인 정보가 제공되고 있습니다. 모바일서비스에 대한 설명과 기능들이 명확하게 나열되어 있습니다.
총 평가: 5


Evaluating relevance: 평가: 포트미스의 모바일 서비스는 편리하고 사용하기 쉽습니다. 사용자들이 언제 어디서나 해운항만물류정보를 확인할 수 있어서 매우 편리합니다.
총 평가: 5
Evaluating standalone: 평가: 질문이 명확하게 제공된 맥락에 독립적이며 추가 정보 없이도 이해 가능합니다.
총 평가: 5


 71%|██████████████████████████████████████████████████████████▌                       | 35/49 [02:59<01:01,  4.37s/it]

Evaluating groundedness: 답변:::
평가: "특별 또는 추가 보안조치 내용" 섹션에는 특별한 또는 추가적인 보안 조치에 관한 정보가 포함되어 있습니다.
총 평가: 5
Evaluating relevance: 평가: "특별 또는 추가 보안조치 내용" 섹션에는 사용자의 개인정보 보호를 강화하기 위한 추가적인 보안 조치 및 안내사항이 포함되어 있습니다.
총 평가: 4
Evaluating standalone: 평가: 질문이 명확하게 구성되어 있고 추가적인 맥락이나 정보를 요구하지 않습니다.
총 평가: 5

답변:::
"특별 또는 추가 보안조치 내용" 섹션에는 추가적인 보안 조치나 특별한 조치에 대한 정보가 포함되어 있습니다.
Error processing standalone: invalid literal for int() with base 10: '5\n\n답변:::\n"특별 또는 추가 보안조치 내용" 섹션에는 추가적인 보안 조치나 특별한 조치에 대한 정보가 포함되어 있습니다.'


 73%|████████████████████████████████████████████████████████████▏                     | 36/49 [03:04<00:57,  4.42s/it]

Evaluating groundedness: 평가: 주어진 맥락에서 외항선 입항신고와 승무원/승객명부에 대한 정보가 명확하게 제공되었습니다. 선박이 입항 전에 신고해야 하는 정보는 선박 입항 전까지의 입항 예정정보를 최초로 신고해야 하며, 실제 선박 입항 후에는 최종적으로 입항을 신고해야 합니다. 또한, 승무원/승객명부에는 선박에 탑승한 승무원/승객의 인적사항을 신고해야 합니다.
총 평가: 5
Evaluating relevance: 평가: 외항선 입항신고에 대한 정보가 명확하게 제공되어 있습니다.
총 평가: 4
Evaluating standalone: 평가: 질문이 명확하게 이해되지만, 추가적인 맥락이나 설명이 필요합니다.
총 평가: 3


 76%|█████████████████████████████████████████████████████████████▉                    | 37/49 [03:09<00:55,  4.60s/it]

Evaluating groundedness: 평가: 맥락에서 PORT-MIS가 언급되었지만 구체적인 설명이 없습니다.
총 평가: 2
Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템) 사이트는 해양운송에서 위험물 선언서와 관련하여 정보를 제공하고 관리하는데 도움을 줍니다. 이를 통해 소비자들은 안전하고 효율적인 해운물류 서비스를 이용할 수 있습니다.

총 평가: 4.5
Error processing relevance: invalid literal for int() with base 10: '4.5'


 78%|███████████████████████████████████████████████████████████████▌                  | 38/49 [03:14<00:51,  4.72s/it]

Evaluating groundedness: 평가: 국가관리 연안항은 국가안보 또는 영해관리에 중요하거나 기상악화 등 유사시 선박의 대피를 주목적으로 하는 항만입니다.
총 평가: 5

해당 맥락에서 명확하게 국가관리 연안항의 주요 목적을 설명하고 있습니다.
Error processing groundedness: invalid literal for int() with base 10: '5\n\n해당 맥락에서 명확하게 국가관리 연안항의 주요 목적을 설명하고 있습니다.'


 80%|█████████████████████████████████████████████████████████████████▎                | 39/49 [03:18<00:44,  4.48s/it]

Evaluating groundedness: 평가: 맥락만으로는 "Cargo [Import, Export] Status Report"의 목적에 대한 구체적인 정보가 제공되지 않습니다.
총 평가: 1
Evaluating relevance: 평가: "Cargo [Import, Export] Status Report"의 목적은 해운항만물류정보시스템 사용자들에게 현재 화물의 수입 또는 수출 상태를 제공하여 화물 추적 및 관리를 돕는 것입니다.
총 평가: 5
Evaluating standalone: 답변:::
평가: 질문이 명확하게 정의되어 있으며 추가 맥락이나 정보가 필요하지 않습니다.
총 평가: 5


 82%|██████████████████████████████████████████████████████████████████▉               | 40/49 [03:21<00:36,  4.07s/it]

Evaluating groundedness: 평가: 포트미스 주요 서비스에 대한 명시적인 정보가 제공되고 있습니다.
총 평가: 5


Evaluating relevance: 평가: 포트미스는 선적, 입항, 통관, 창고관리, 운송 등 다양한 물류 서비스를 제공합니다.
총 평가: 5
Evaluating standalone: 평가: 질문에서 명시적으로 언급된 맥락이 없어서 추가 정보가 필요함.
총 평가: 1


 84%|████████████████████████████████████████████████████████████████████▌             | 41/49 [03:24<00:31,  3.98s/it]

Evaluating groundedness: 평가: 맥락만으로는 "PORT-MIS" 문서의 목적을 명확히 알 수 없습니다.
총 평가: 1
Evaluating relevance: 평가: "PORT-MIS" 문서의 목적은 해운항만물류정보시스템을 사용하는 소비자들에게 항만 및 물류 정보를 효과적으로 제공하여 물류 활동을 최적화하고 효율성을 향상시키는 것입니다.
총 평가: 5
Evaluating standalone: 평가: 질문에서 "PORT-MIS" 문서에 대한 목적을 명시적으로 언급하고 있으므로 추가 정보가 필요함.
총 평가: 1


 86%|██████████████████████████████████████████████████████████████████████▎           | 42/49 [03:28<00:27,  3.89s/it]

Evaluating groundedness: 평가: 맥락에서 PORT-MIS를 통해 납부확인서를 출력하는 방법에 대한 구체적인 절차가 설명되어 있습니다.
총 평가: 5


Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템) 사이트의 납부확인서 출력 기능은 사용자들이 결제 및 납부 정보를 편리하게 확인할 수 있어서 매우 유용합니다.
총 평가: 5


Evaluating standalone: 평가: 질문에는 PORT-MIS 시스템에 대한 특정 맥락이 암시되어 있습니다. 추가 정보가 필요합니다.
총 평가: 1


 88%|███████████████████████████████████████████████████████████████████████▉          | 43/49 [03:32<00:23,  3.85s/it]

Evaluating groundedness: 평가: 월정료 1년 선납시 사용료 10% 할인이 제공된다는 정보가 명확하게 제공됩니다.
총 평가: 5
Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템) 사이트의 할인 혜택 정보를 찾기 쉽고 명확하게 제공하고 있습니다.
총 평가: 5


Evaluating standalone: 평가: 질문이 특정 맥락을 요구하지 않고 명확하게 이해할 수 있습니다.
총 평가: 5

답변: 월정료 1년 선납 시에는 10% 할인 혜택이 제공됩니다.
Error processing standalone: invalid literal for int() with base 10: '5\n\n답변: 월정료 1년 선납 시에는 10% 할인 혜택이 제공됩니다.'


 90%|█████████████████████████████████████████████████████████████████████████▋        | 44/49 [03:37<00:21,  4.26s/it]

Evaluating groundedness: 평가: 주어진 맥락에서 강제 도선 면제신청을 위해 필요한 조건에 대한 명시적인 정보가 제공되지 않았습니다.
총 평가: 2
Evaluating relevance: 평가: 강제 도선 면제신청에 대한 정보가 쉽게 찾아볼 수 있음.
총 평가: 4
Evaluating standalone: 평가: 질문이 특정 맥락을 요구하지 않고 독립적으로 이해 가능합니다.
총 평가: 5

답변:
강제 도선 면제신청을 위해 필요한 조건은 해당 선박이 국제해사기구(IMO)의 규정에 따라 강제 도선 면제를 받을 수 있는 상황에 있는지를 확인하는 것이 중요합니다. 선박의 특성, 운항 경로, 환경 등이 강제 도선 면제를 받을 수 있는 조건을 충족하는지를 검토해야 합니다. 또한, 해당 규정에 따라 제출해야 하는 서류나 절차에 대한 이해도 필요합니다.
Error processing standalone: invalid literal for int() with base 10: '5\n\n답변:\n강제 도선 면제신청을 위해 필요한 조건은 해당 선박이 국제해사기구(IMO)의 규정에 따라 강제 도선 면제를 받을 수 있는 상황에 있는지를 확인하는 것이 중요합니다. 선박의 특성, 운항 경로, 환경 등이 강제 도선 면제를 받을 수 있는 조건을 충족하는지를 검토해야 합니다. 또한, 해당 규정에 따라 제출해야 하는 서류나 절차에 대한 이해도 


 92%|███████████████████████████████████████████████████████████████████████████▎      | 45/49 [03:41<00:16,  4.10s/it]

Evaluating groundedness: 평가: 주어진 맥락에서 내항입항신고 절차에 대한 명시적인 안내가 없습니다.
총 평가: 1
Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템) 사이트는 내항입항신고 절차에 대한 자세한 안내와 사용자 친화적인 인터페이스를 제공합니다. 필요한 정보를 쉽게 입력하고 제출할 수 있도록 안내가 명확하게 되어 있습니다.

총 평가: 5


Evaluating standalone: 평가: 질문에는 추가적인 맥락이나 정보가 없어서 명확히 이해할 수 있습니다.
총 평가: 5


 94%|████████████████████████████████████████████████████████████████████████████▉     | 46/49 [03:45<00:12,  4.09s/it]

Evaluating groundedness: 답변:::
평가: PORT-MIS에서 고지서를 출력하는 방법은 온라인으로 가능하며, PORT-MIS 웹사이트에 접속하여 메뉴를 따라가면 고지서를 출력할 수 있습니다.
총 평가: 5
Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템) 사이트의 고지서 출력 기능은 매우 직관적이고 쉽게 접근할 수 있습니다. 사용자들이 필요한 고지서를 빠르게 찾아서 출력할 수 있어서 편리합니다.

총 평가: 5


Evaluating standalone: 답변:::
평가: PORT-MIS에 대한 추가 정보가 필요합니다.
총 평가: 1


 96%|██████████████████████████████████████████████████████████████████████████████▋   | 47/49 [03:49<00:08,  4.12s/it]

Evaluating groundedness: 평가: PORT-MIS는 전국 무역항에서 선박의 입항, 출항, 항만이용, 항만물류, 해운, 선원, 선박 등의 민원사무 처리 및 정보관리를 지원하는 시스템입니다.
총 평가: 5

Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템)는 무역항에서 화물 추적, 입출항 정보 제공, 물류 정보 관리 등 다양한 업무를 지원합니다.
총 평가: 5
Evaluating standalone: 평가: 질문이 명확하게 제시되어 있으며 추가적인 맥락이나 정보가 필요하지 않습니다.
총 평가: 5

답변: PORT-MIS는 무역항에서 다양한 업무를 지원하는 시스템입니다.
Error processing standalone: invalid literal for int() with base 10: '5\n\n답변: PORT-MIS는 무역항에서 다양한 업무를 지원하는 시스템입니다.'


 98%|████████████████████████████████████████████████████████████████████████████████▎ | 48/49 [03:53<00:04,  4.02s/it]

Evaluating groundedness: 평가: PORT-MIS는 전국 무역항에서 선박의 입항/출항, 항만이용, 항만물류, 해운, 선원, 선박 등의 민원사무 처리 및 정보관리를 지원하는 시스템입니다.
총 평가: 5

Evaluating relevance: 평가: 포트미스(해운항만물류정보시스템)는 무역항에서 화물 추적, 입출항 정보 제공, 물류 정보 관리 등 다양한 업무를 지원합니다.
총 평가: 5
Evaluating standalone: 평가: 질문에서 PORT-MIS가 무역항에서 어떤 업무를 지원하는지에 대한 추가 맥락이 없습니다.
총 평가: 1


100%|██████████████████████████████████████████████████████████████████████████████████| 49/49 [03:56<00:00,  4.84s/it]

Evaluating groundedness: 평가: 제공된 맥락에서 포트미스 이용 환경에서 제공되는 모바일 서비스에 대한 구체적인 정보가 명시적으로 나와 있습니다. 모바일서비스에 대한 설명과 기능들이 명확하게 제시되어 있습니다.
총 평가: 5


Evaluating relevance: 평가: 포트미스의 모바일 서비스는 편리하고 사용하기 쉽습니다. 사용자들이 언제 어디서나 해운항만물류정보를 확인할 수 있어서 유용합니다.
총 평가: 5
Evaluating standalone: 평가: 질문이 명확하게 제공된 맥락에 독립적이며 추가 정보 없이도 이해 가능합니다.
총 평가: 5





In [39]:
import pandas as pd
 
pd.set_option("display.max_colwidth", None)

generated_questions = pd.DataFrame.from_dict(outputs)

print("Evaluation dataset before filtering:")
display(
    generated_questions[
        [
            "question",
            "answer",
            "groundedness_score",
            "relevance_score",
            "standalone_score",
        ]
    ]
)
generated_questions = generated_questions.loc[
    (generated_questions["groundedness_score"] >= 4)
    & (generated_questions["relevance_score"] >= 4)
    & (generated_questions["standalone_score"] >= 4)
]
print("============================================")
print("Final evaluation dataset:")
display(
    generated_questions[
        [
            "question",
            "answer",
            "groundedness_score",
            "relevance_score",
            "standalone_score",
        ]
    ]
)

Evaluation dataset before filtering:


Unnamed: 0,question,answer,groundedness_score,relevance_score,standalone_score
0,위험물을 무역항의 수상구역으로 반입할 때 신고는 언제 해야 하나요?,위험물을 무역항의 수상구역으로 반입할 때는 반입 24시간 전에 신고해야 합니다.,5.0,5.0,5.0
1,"What information is included in the ""특별 또는 추가 보안조치 내용"" section?",The contents of the special or additional security measures.,5.0,5.0,
2,외항입항신고를 최초로 제출하는 경우 어떤 단계를 거쳐야 하는가?,승무원/승객명부를 담당자(수리)에게 제출해야 합니다.,5.0,,
3,외항선 입항신고에서 선박이 입항 전에 어떤 정보를 신고해야 하는가?,선박이 외항선 입항신고에서 선박이 입항 전에는 입항 예정정보를 신고해야 합니다.,5.0,,
4,해운항만물류정보시스템(PORT-MIS) 운영에 참여하는 공무원과 위탁운영인력의 총 인원은 몇 명인가요?,"공무원 6명, 위탁운영인력 17명으로 총 23명이 참여합니다.",5.0,,
5,PORT-MIS는 무역항에서 어떤 업무를 지원하는 시스템인가요?,"전국 무역항 선박의 입항`출항, 항만이용 및 항만물류, 해운`선원`선박 등의 민원사무 처리 및 정보관리에 관한 업무를 지원하는 시스템입니다.",5.0,5.0,
6,PORT-MIS에서 고지서를 직접 출력할 수 있는 방법은 무엇인가요?,포트미스 접속 후 항만민원 ➡ 조회/발급/사용료 ➡ 사용료 ➡ [고지서 출력(민원인)] 메뉴 선택하여 출력할 고지서를 검색하고 출력대상을 선택한 후 개별 고지서 출력 클릭하여 프린트 또는 pdf 파일로 저장할 수 있습니다.,5.0,5.0,1.0
7,PORT-MIS에서 납부확인서를 출력하는 방법은 무엇인가요?,"PORT-MIS에 접속한 후 항만민원 ➡ 조회/발급/사용료 ➡ 사용료 ➡ [사용료 납부확인서] 메뉴를 선택하여 정보를 조회하고, 원하는 출력대상을 선택한 후 납부확인서를 출력할 수 있습니다.",5.0,5.0,1.0
8,What is the purpose of a PORT-MIS in the context of a hazardous materials declaration form?,A PORT-MIS is used as an appendix in the hazardous materials declaration form.,4.0,4.0,
9,ebXML 민원신고와 EDI 민원신고의 신고방식은 무엇인가요?,"ebXML 민원신고는 민원업체가 직접 신고하는 방식이며, EDI 민원신고는 중계망사업자를 통한 신고 방식입니다.",5.0,,


Final evaluation dataset:


Unnamed: 0,question,answer,groundedness_score,relevance_score,standalone_score
0,위험물을 무역항의 수상구역으로 반입할 때 신고는 언제 해야 하나요?,위험물을 무역항의 수상구역으로 반입할 때는 반입 24시간 전에 신고해야 합니다.,5.0,5.0,5.0
12,외항입항신고를 최종으로 담당자(수리)와 담당자(반려)가 누구인가요?,"외항입항신고를 최종으로 담당자(수리)는 해당 업무를 처리하는 담당자이며, 담당자(반려)는 해당 업무를 거부하는 담당자입니다.",5.0,4.0,5.0
28,포트미스 이용 환경에서 제공되는 모바일서비스는 무엇인가요?,"포트미스 이용 환경에서 제공되는 모바일서비스는 민원신고 및 신고 결과 조회, 선박에 대한 관제 현황 정보 조회, EDI 및 ebXML 응답문서 조회 기능을 제공합니다.",5.0,4.0,5.0
29,화물료 대납경비 청구 시 수수료는 어떻게 청구되나요?,"대납한 화물료 고지금액의 수수료는 익월에 3%로 청구되며, 보안료는 6.8%로 청구됩니다.",5.0,4.0,5.0
33,포트미스 이용 환경에서 제공되는 모바일 서비스는 무엇인가요?,"포트미스 이용 환경에서 제공되는 모바일 서비스는 민원신고 및 신고 결과 조회, 선박 관제 현황 정보 조회, 그리고 EDI, ebXML 응답문서 조회 기능을 포함합니다.",5.0,5.0,5.0
48,포트미스 이용 환경에서 제공되는 모바일 서비스는 무엇인가요?,"포트미스 이용 환경에서 제공되는 모바일 서비스는 민원신고 및 신고 결과 조회, 선박 관제 현황 정보 조회, 그리고 EDI, ebXML 응답문서 조회 기능을 포함합니다.",5.0,5.0,5.0


In [40]:
##### 검증 데이터셋 기준으로 RAG 결과 획득 #####

In [45]:
#pip install datasets

In [46]:
import datasets
eval_dataset = datasets.Dataset.from_pandas(generated_questions, split="train", preserve_index=False)

In [56]:
import json
from typing import Optional
from langchain.chat_models.base import BaseChatModel
from langchain.vectorstores.base import VectorStore
from transformers import RagTokenizer, RagRetriever, RagSequenceForGeneration

def run_rag_tests(
    eval_dataset: datasets.Dataset,
    llm: BaseChatModel,
    knowledge_index: VectorStore,
    output_file: str,
    reranker: Optional[RagSequenceForGeneration] = None,
    verbose: Optional[bool] = True,
    test_settings: Optional[str] = None,
):
    """주어진 데이터셋에 RAG 테스트를 수행하고 결과를 지정된 출력 파일에 저장합니다."""
    try:  # 기존 결과 로드 시도
        with open(output_file, "r") as f:
            outputs = json.load(f)
    except:
        outputs = []
 
    for example in tqdm(eval_dataset):  # 데이터셋 반복 처리
        question = example["question"]
        if question in [output["question"] for output in outputs]:
            continue
 
        answer, relevant_docs = answer_with_rag(question, llm, knowledge_index, reranker=reranker)
        if verbose:
            print("=======================================================")
            print(f"Question: {question}")
            print(f"Answer: {answer}")
            print(f'True answer: {example["answer"]}')
        result = {
            "question": question,
            "true_answer": example["answer"],
            "source_doc": example["source_doc"],
            "generated_answer": answer,
            "retrieved_docs": [doc for doc in relevant_docs],
        }
        if test_settings:
            result["test_settings"] = test_settings
        outputs.append(result)
 
        with open(output_file, "w") as f:  # 결과 파일 저장
            json.dump(outputs, f)

In [57]:
##### 검증 프롬프트 #####

In [58]:
EVALUATION_PROMPT = """###작업 설명:
지시사항(내부에 입력이 포함될 수 있음), 평가할 응답, 5점을 받은 참조 답안, 그리고 평가 기준을 나타내는 점수 루브릭이 제공됩니다.
1. 주어진 평가 기준에 따라 응답의 질을 엄격하게 평가하는 상세한 피드백을 작성합니다.
2. 피드백 작성 후, 1에서 5 사이의 정수 점수를 작성합니다. 점수 루브릭을 참조해야 합니다.
3. 출력 형식은 다음과 같습니다: \"Feedback: {{평가 기준에 대한 피드백 작성}} [RESULT] {{1에서 5 사이의 정수}}"
4. 다른 서문, 결론, 설명은 생성하지 말고, 출력에 [RESULT]를 반드시 포함하세요.
 
###평가할 지시사항:
{instruction}
 
###평가할 응답:
{response}
 
###참조 답안 (점수 5):
{reference_answer}
 
###점수 루브릭:
[응답이 참조 답안에 기반하여 정확하고 사실적인가?]
점수 1: 응답이 완전히 정확하지 않거나 사실적이지 않습니다.
점수 2: 응답이 대부분 정확하지 않거나 사실적이지 않습니다.
점수 3: 응답이 어느 정도 정확하고 사실적입니다.
점수 4: 응답이 대부분 정확하고 사실적입니다.
점수 5: 응답이 완전히 정확하고 사실적입니다.
 
###피드백:"""
 
from langchain.prompts.chat import (
    ChatPromptTemplate,
    HumanMessagePromptTemplate,
)
from langchain.schema import SystemMessage
 
 
evaluation_prompt_template = ChatPromptTemplate.from_messages(
    [
        SystemMessage(content="당신은 공정한 평가자 언어 모델입니다."),
        HumanMessagePromptTemplate.from_template(EVALUATION_PROMPT),
    ]
)

In [59]:
##### 평가 함수 #####

In [63]:
from langchain.chat_models import ChatOpenAI

eval_chat_model = ChatOpenAI(model="gpt-3.5-turbo", temperature=0, api_key="키입력")
evaluator_name = "GPT3.5"
 
def evaluate_answers(
    answer_path: str,
    eval_chat_model: BaseChatModel,
    evaluator_name: str,
    evaluation_prompt_template: ChatPromptTemplate,
) -> None:
    """생성된 답변을 평가합니다. 보다 나은 체크포인팅을 위해 주어진 답변 파일을 현장에서 수정합니다."""
    answers = []
    if os.path.isfile(answer_path):  # 기존 생성물이 있으면 불러옵니다
        answers = json.load(open(answer_path, "r"))
 
    for experiment in tqdm(answers):
        if f"eval_score_{evaluator_name}" in experiment:
            continue
 
        eval_prompt = evaluation_prompt_template.format_messages(
            instruction=experiment["question"],
            response=experiment["generated_answer"],
            reference_answer=experiment["true_answer"],
        )
        eval_result = eval_chat_model.invoke(eval_prompt)
        feedback, score = [item.strip() for item in eval_result.content.split("[RESULT]")]
        experiment[f"eval_score_{evaluator_name}"] = score
        experiment[f"eval_feedback_{evaluator_name}"] = feedback
 
        with open(answer_path, "w") as f:
            json.dump(answers, f)

In [64]:
##### 테스트 실행 #####

In [74]:
...모르겠어요...

SyntaxError: invalid syntax (1897770250.py, line 1)