# Interview Data Combining

In [1]:
# #!/usr/bin/env python3
# # -*- coding: utf-8 -*-

# """
# 이 스크립트는 g1~g24 사이에 존재하는 junior, senior 인터뷰 파일들을 한데 모아
# - junior 관련 파일은 merged_junior.txt
# - senior 관련 파일은 merged_senior.txt
# 로 합쳐준다.

# 규칙:
# 1) g{i}_junior와 g{i}_senior 패턴이 들어간 파일(.txt, .csv)을 순서대로 읽어온다.
# 2) 파일 이름 뒤에 "_type"이 있을 수도 있으므로, 만약 있으면 그것도 포함한다.
#    예: g2_junior_type.txt, g2_junior_type.csv 등
# 3) 없는 파일은 스킵한다(에러가 나지 않도록 예외처리).
# 4) 'g24_senior & junior(p96)_type.txt'라는 예외 파일은 무시한다.
# 5) 최종 결과는 merged_junior.txt, merged_senior.txt로 저장한다.
# """

# import os

# def merge_interviews(output_junior='merged_junior.txt', 
#                      output_senior='merged_senior.txt'):
#     # 최종적으로 쌓인 내용을 저장할 파일을 오픈(쓰기 모드, 필요 시 인코딩 설정)
#     with open(output_junior, 'w', encoding='utf-8') as j_out, \
#          open(output_senior, 'w', encoding='utf-8') as s_out:
        
#         # g1부터 g24까지 순회
#         for i in range(1, 25):
#             # ==========================
#             #  Junior 파일 합치기
#             # ==========================
#             # 주어진 조건에 따라 '_junior'가 들어간 파일명을 구성
#             possible_junior_names = [
#                 f"../data/interview/g{i}_junior.txt",
#                 f"../data/interview/g{i}_junior_type.txt",
#                 f"../data/interview/g{i}_junior_type.csv"
#             ]
            
#             for fname in possible_junior_names:
#                 # 예외적으로 무시해야 하는 파일은 건너뛴다
#                 if fname == "g24_senior & junior(p96)_type.txt":
#                     continue
                
#                 if os.path.exists(fname):
#                     try:
#                         with open(fname, 'r', encoding='utf-8') as f:
#                             content = f.read()
#                             # 구분을 위해 파일명과 함께 기록해 줄 수도 있음
#                             # 예: j_out.write(f"\n===== {fname} =====\n")
#                             j_out.write(content)
#                             j_out.write("\n")  # 파일 간 구분을 위한 줄바꿈
#                     except Exception as e:
#                         # 파일을 열 수 없거나 다른 오류가 날 때는 스킵
#                         print(f"Warning: 파일 {fname} 처리 중 오류 발생 -> {e}")
            
#             # ==========================
#             #  Senior 파일 합치기
#             # ==========================
#             # 주어진 조건에 따라 '_senior'가 들어간 파일명
#             possible_senior_names = [
#                 f"../data/interview/g{i}_senior.txt",
#                 f"../data/interview/g{i}_senior_type.txt",
#                 f"../data/interview/g{i}_senior_type.csv"
#             ]
            
#             for fname in possible_senior_names:
#                 # 예외적으로 무시해야 하는 파일은 건너뛴다
#                 if fname == "g24_senior & junior(p96)_type.txt":
#                     continue
                
#                 if os.path.exists(fname):
#                     try:
#                         with open(fname, 'r', encoding='utf-8') as f:
#                             content = f.read()
#                             s_out.write(content)
#                             s_out.write("\n")
#                     except Exception as e:
#                         print(f"Warning: 파일 {fname} 처리 중 오류 발생 -> {e}")

# if __name__ == "__main__":
#     merge_interviews()


In [3]:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import os

def merge_interviews():
    # Define output files for groups B and C
    junior_files = {
        "B": "../data/mergedInterview/merged_junior_B.txt",
        "C": "../data/mergedInterview/merged_junior_C.txt"
    }
    senior_files = {
        "B": "../data/mergedInterview/merged_senior_B.txt",
        "C": "../data/mergedInterview/merged_senior_C.txt"
    }
    
    # Define the numbers belonging to group C
    group_c_numbers = {2, 3, 6, 8, 11, 12, 13, 14, 15, 18, 22, 24}

    # Open all output files
    with open(junior_files["B"], 'w', encoding='utf-8') as j_b, \
         open(junior_files["C"], 'w', encoding='utf-8') as j_c, \
         open(senior_files["B"], 'w', encoding='utf-8') as s_b, \
         open(senior_files["C"], 'w', encoding='utf-8') as s_c:
        
        # Iterate over files g1 to g24
        for i in range(1, 25):
            # Determine group (B or C)
            group = "C" if i in group_c_numbers else "B"
            
            # Select the correct file handles based on group
            j_out = j_c if group == "C" else j_b
            s_out = s_c if group == "C" else s_b
            
            # ==========================
            #  Junior Files
            # ==========================
            possible_junior_names = [
                f"../data/interview/g{i}_junior.txt",
                f"../data/interview/g{i}_junior_type.txt",
                f"../data/interview/g{i}_junior_type.csv"
            ]
            
            for fname in possible_junior_names:
                if fname == "g24_senior & junior(p96)_type.txt":
                    continue
                
                if os.path.exists(fname):
                    try:
                        with open(fname, 'r', encoding='utf-8') as f:
                            content = f.read()
                            j_out.write(content)
                            j_out.write("\n")
                    except Exception as e:
                        print(f"Warning: Error processing file {fname} -> {e}")
            
            # ==========================
            #  Senior Files
            # ==========================
            possible_senior_names = [
                f"../data/interview/g{i}_senior.txt",
                f"../data/interview/g{i}_senior_type.txt",
                f"../data/interview/g{i}_senior_type.csv"
            ]
            
            for fname in possible_senior_names:
                if fname == "g24_senior & junior(p96)_type.txt":
                    continue
                
                if os.path.exists(fname):
                    try:
                        with open(fname, 'r', encoding='utf-8') as f:
                            content = f.read()
                            s_out.write(content)
                            s_out.write("\n")
                    except Exception as e:
                        print(f"Warning: Error processing file {fname} -> {e}")

if __name__ == "__main__":
    merge_interviews()
