텐서보드로부터 값 뽑아내는 작업, 근데 이제 여러 텐서보드 로그를 취합하는.

valid_AUROC 기준 최고성능인 epoch의 통계값들을 뽑아내면 된다.

In [6]:
from tensorboard.backend.event_processing import event_accumulator
import pandas as pd

In [7]:
# 사전 변수 넣기
tensorboard_dirs_txt = '/home/hschoi/leehyunwon/ECG-SNN/new_server/ver7/statistics/tensorboard_to_pandas/faultD_1.txt'
output_file_name = 'faultD_1.csv'

tags = ['train_Loss','train_Accuracy','train_F1_micro','train_F1_weighted','train_AUROC_macro','train_AUROC_weighted','train_auprc', 'valid_Loss','valid_Accuracy','valid_F1_micro','valid_F1_weighted', 'valid_AUROC_macro','valid_AUROC_weighted','valid_auprc']
usable_tags = ['valid_Accuracy','valid_F1_weighted', 'valid_AUROC_macro', 'valid_auprc'] # 일반적인 경우 아래 대신 이거 선택
# usable_tags = ['valid_AUROC_macro'] # stride 보려면 이것만 있어도 될 듯

In [8]:
with open(tensorboard_dirs_txt, 'r', encoding='utf-8') as file:
    tensorboard_dirs = file.read().splitlines()

In [9]:
# 병합된 데이터 저장용 리스트
highest_rows = []

for dir_path in tensorboard_dirs: # 각 로그마다
    print(f"Processing TensorBoard log: {dir_path}")
    ea = event_accumulator.EventAccumulator(dir_path)
    ea.Reload() # 텐서보드 로그 뽑아서 변수에 넣기기
    
    data = {} # 수집된 데이터를 저장할 딕셔너리
    epoch_time_map = {}  # 에포크와 wall_time 매핑

    # 태그(메트릭) 별로 에포크와 값 빼내서 저장
    for tag in tags:
        if tag in ea.Tags()["scalars"]:  # 태그가 존재하는지 확인
            events = ea.Scalars(tag)
            data[tag] = {
                "epoch": [event.step for event in events],  # step을 epoch으로 사용
                "value": [event.value for event in events],
            }
            # epoch -> wall_time 매핑 (처음 태그에서만 추출)
            if not epoch_time_map:
                epoch_time_map = {event.step: event.wall_time for event in events}
        else:
            print(f"Tag '{tag}' not found in the TensorBoard logs.")

    # 태그별 데이터프레임 생성
    dataframes = {tag: pd.DataFrame(values) for tag, values in data.items()}

    # 단일 데이터프레임으로 병합 (Epoch 기준)
    merged_df = pd.DataFrame({"epoch": dataframes[tags[0]]["epoch"]})  # 첫 태그의 epoch 사용
    for tag in tags:
        if tag in dataframes:
            merged_df[tag] = dataframes[tag]["value"]

    # 필요한 태그로 필터링
    filtered_df = merged_df[['epoch'] + [tag for tag in usable_tags if tag in merged_df.columns]] # 에포크도 보고 싶으니 추가

    # 가장 높은 AUROC 값을 갖는 행 추출
    if "valid_AUROC_macro" in filtered_df.columns:
        highest_row = filtered_df.loc[filtered_df['valid_AUROC_macro'].idxmax()].copy()  # 명시적 복사
        highest_row["source_dir"] = dir_path.split('/')[-1]  # 로그 출처 추가

        # 학습 시간 계산
        highest_epoch = int(highest_row['epoch'])
        # print(highest_epoch) # 확인 필요

        # 최고 에포크가 0으로 나오는 경우는 편의상 1로 계산..
        if highest_epoch == 0 : 
            print("최고 에포크 0, 편의상 1로 변경")
            highest_epoch = 1
        if highest_row['epoch'] == 0 : 
            print("최고 에포크 0, 편의상 1로 변경")
            highest_row['epoch'] = 1

        if highest_epoch in epoch_time_map:
            start_time = min(epoch_time_map.values())  # 첫 epoch 시작 시간
            end_time = epoch_time_map[highest_epoch]  # 최고 성능 epoch의 시간
            elapsed_time = (end_time - start_time) / 60 # 경과 시간 계산 (분)
            highest_row["total elapsed minute"] = elapsed_time
            highest_row["minute per epoch"] = elapsed_time / highest_row['epoch']
        else:
            highest_row["total elapsed minute"] = None
            highest_row["minute per epoch"] = None  # 해당 에포크 시간 데이터 없음

        highest_rows.append(highest_row)

# 최종 병합
final_df = pd.DataFrame(highest_rows)

# 결과 확인
print("\nFinal DataFrame with Highest AUROC Rows:")
print(final_df)

Processing TensorBoard log: /home/hschoi/leehyunwon/ECG-SNN/new_server/ver7/IF/tensorboard/faultD/1_hidden_128/burst_faultD_2025-05-03-19-22-11_fold1
Processing TensorBoard log: /home/hschoi/leehyunwon/ECG-SNN/new_server/ver7/IF/tensorboard/faultD/1_hidden_128/burst_faultD_2025-05-03-19-22-11_fold2
Processing TensorBoard log: /home/hschoi/leehyunwon/ECG-SNN/new_server/ver7/IF/tensorboard/faultD/1_hidden_128/burst_faultD_2025-05-03-19-22-11_fold3
Processing TensorBoard log: /home/hschoi/leehyunwon/ECG-SNN/new_server/ver7/IF/tensorboard/faultD/1_hidden_128/burst_faultD_2025-05-03-19-22-11_fold4
Processing TensorBoard log: /home/hschoi/leehyunwon/ECG-SNN/new_server/ver7/IF/tensorboard/faultD/1_hidden_128/burst_faultD_2025-05-03-19-22-11_fold5
Processing TensorBoard log: /home/hschoi/leehyunwon/ECG-SNN/new_server/ver7/IF/tensorboard/faultD/1_hidden_128/filter_CNN_2D_faultD_2025-05-06-04-23-15_fold1
Processing TensorBoard log: /home/hschoi/leehyunwon/ECG-SNN/new_server/ver7/IF/tensorboard/f

In [10]:
# 저장하기
final_df.to_csv(output_file_name, index=False)