In [None]:
import numpy as np
import math

In [None]:
## Copy from VisualFinal
def get_scores(data, key):
    data_class = []
    data_mask = []
    signal = "STOP"

    for line in data:
        line = line.strip()
        if signal == "START":
            if "[Classification]" in line:
                elements = line.split(",")
                scores_class = [float(element.split(" ")[-1]) for element in elements]
                data_class.append(scores_class)
            if "[Segmentation]" in line:
                elements = line.split(",")
                scores_mask = [float(element.split(" ")[-1]) for element in elements]
                data_mask.append(scores_mask)
                signal = "STOP"
        if key in line:
            signal = "START"
            epoch = int((line.split(" ")[-1])[:-1])
            
    return np.array(data_class), np.array(data_mask)

In [None]:
## Copy from VisualFinal
def parse_data (file_path):
    file = open(file_path, "r")
    data = file.read().split("\n")[1:]
    file.close()

    train_data_class, train_data_mask = get_scores(data, "[TRAIN]")
    eval_data_class, eval_data_mask = get_scores(data, "[EVAL]")
    test_data_class, test_data_mask = get_scores(data, "[TEST]")

    return train_data_class, train_data_mask, eval_data_class, eval_data_mask, test_data_class, test_data_mask
     

In [None]:
def process_result(data, out_file_path):
    PROCESSING_RANGE_SEGMENTATION = 30
    PROCESSING_RANGE_CLASSIFICATION = 80
    LABELS = ["Classification Accuracy (Test)", "Classification Dice Score (Test)", "Classification F1 (Test)",
            "Segmentation Accuracy (Test)", "Segmentation Dice Score (Test)"]
  
    f = open(out_file_path, "w")
    for i in range(data.shape[1]):
        scores = data[:, i]
        if "F1" in LABELS[i]:
            scores = scores * 100
        if "Classification" in LABELS[i]:
            print(f"{LABELS[i]}:")
            f.write("\n")
            f.write(f"{LABELS[i]}:\n")
            mean = round(np.mean(scores[-PROCESSING_RANGE_CLASSIFICATION:]), 3)
            standard_deviation = round(np.std(scores[-PROCESSING_RANGE_CLASSIFICATION:]), 3)
            standard_error = round(standard_deviation/(math.sqrt(PROCESSING_RANGE_CLASSIFICATION)), 3)
            print(f"Mean: {mean}, Standard Error: {standard_error}, Standard Deviation: {standard_deviation}")
            f.write(f"Mean: {mean}, Standard Error: {standard_error}, Standard Deviation: {standard_deviation}\n")
        else:
            print(f"{LABELS[i]}:")
            f.write("\n")
            f.write(f"{LABELS[i]}:\n")
            mean = round(np.mean(scores[-PROCESSING_RANGE_SEGMENTATION:]), 3)
            standard_deviation = round(np.std(scores[-PROCESSING_RANGE_SEGMENTATION:]), 3)
            standard_error = round(standard_deviation/(math.sqrt(PROCESSING_RANGE_SEGMENTATION)), 3)
            print(f"Mean: {mean}, Standard Error: {standard_error}, Standard Deviation: {standard_deviation}")
            f.write(f"Mean: {mean}, Standard Error: {standard_error}, Standard Deviation: {standard_deviation}\n")
        print("")
    f.close()

Accuracy,  Dice Similarity Coefficient (DSC) and F1 score được sử dụng trong việc đánh giá mô hình

Đối với phân đoạn:
- Accuracy được đo lường bằng tổng số pixel được dự đoán chính xác trên tổng số pixel trong một hình ảnh phổi
- DSC được tính toán dựa trên sự chồng chéo của true prediction (P) của tổn thương phổi và the ground truth (G)

$$DSC(P,G) = \frac{2 * |P \cap G|}{|P| + |G|}$$

Đối với phân loại:
- Accuracy được đo lường các dự đoán đúng trên tổng số hình ảnh đầu vào
- DSC được tính toán dựa trên số lượng mẫu true positive (TP) trên tổng số true positive, false positive (FP) và false negative (FN)

$$DSC = \frac{TP}{TP + FP + FN}$$

- Ngoài ra, hiệu suất phân loại được coi là sự cân bằng giữa Precision (Pre) và Recall (Re) bằng cách sử dụng F1 score

$$F1 \, Score = \frac{2 * Pre * Re}{Pre + Re}$$

In [None]:
# file_path =  r'D:\YSC2023\Implementation\Final_Output\CRNet_PNG_256\train_log' 
# file_path =  r'D:\YSC2023\Implementation\Final_Output\CRNet_HU_256\train_log'
# file_path =  r'D:\YSC2023\Implementation\Final_Output\OriginalIncoNet_PNG_256\train_log'
# file_path =  r'D:\YSC2023\Implementation\Final_Output\OriginalIncoNet_HU_256\train_log'
# file_path =  r'D:/YSC2023/Implementation/Final_Output/XNet_HU_256/train_log'
# file_path =  r'D:/YSC2023/Implementation/Final_Output/XNet_PNG_256/train_log'
# file_path =  r'D:/YSC2023/Implementation/Final_Output/XNet_CAP_HU_256/train_log'
# file_path =  r'D:/YSC2023/Implementation/Final_Output/XNet_CAP_PNG_256/train_log'

# Original_Image
# file_path =  r'D:/YSC2023/Implementation/Final_Output_DatasetSplit/Original_Image/CRNet_HU_256/train_log'
# file_path =  r'D:/YSC2023/Implementation/Final_Output_DatasetSplit/Original_Image/CRNet_PNG_256/train_log'
# file_path =  r'D:/YSC2023/Implementation/Final_Output_DatasetSplit/Original_Image/OriginalIncoNet_HU_256/train_log'
# file_path =  r'D:/YSC2023/Implementation/Final_Output_DatasetSplit/Original_Image/OriginalIncoNet_PNG_256/train_log'
# file_path =  r'D:/YSC2023/Implementation/Final_Output_DatasetSplit/Original_Image/XNet_HU_256/train_log'
# file_path =  r'D:/YSC2023/Implementation/Final_Output_DatasetSplit/Original_Image/XNet_PNG_256/train_log'

# Lung_Mask
# file_path =  r'D:/YSC2023/Implementation/Final_Output_DatasetSplit/Lung_Mask/CRNet_HU_256/train_log'
# file_path =  r'D:/YSC2023/Implementation/Final_Output_DatasetSplit/Lung_Mask/CRNet_PNG_256/train_log'
# file_path =  r'D:/YSC2023/Implementation/Final_Output_DatasetSplit/Lung_Mask/OriginalIncoNet_HU_256/train_log'
# file_path =  r'D:/YSC2023/Implementation/Final_Output_DatasetSplit/Lung_Mask/OriginalIncoNet_PNG_256/train_log'
file_path =  r'D:/YSC2023/Implementation/Final_Output_DatasetSplit/Lung_Mask/XNet_HU_256/train_log'
# file_path =  r'D:/YSC2023/Implementation/Final_Output_DatasetSplit/Lung_Mask/XNet_PNG_256/train_log


# file_path = file_path.replace("Final_Output", "Model Results")
_, _, _, _, test_data_class, test_data_mask = parse_data(file_path)
file_path = file_path.replace("Final_Output_DatasetSplit", "Model Results DatasetSplit")
out_file_path = file_path.replace("train_log", "train_result")
process_result(np.concatenate((test_data_class, test_data_mask), axis=1), out_file_path)