In [1]:
import json
import pandas as pd
from pathlib import Path

# ===========================================
# 1. CSV 로드 (현재 재직자 명단)
# ===========================================
csv_path = r"C:\Users\LEEJUHWAN\Desktop\애니파이브\백업\새로받은 user\인사정보_부서코드추가.csv"
df_employees = pd.read_csv(csv_path, encoding='utf-8-sig')

# 재직자 이름 set
current_employees = set(df_employees['사원명'].dropna().str.strip())
print(f"재직자 수: {len(current_employees)}")
print(f"재직자 샘플: {list(current_employees)[:10]}")

재직자 수: 156
재직자 샘플: ['이재춘', '이예나', '이승원', '신성호', '박윤지', '연차료', '경영기획팀', '경동윤', '김별님', 'office2']


In [2]:
# ===========================================
# 2. cmds 파일 경로 리스트 (여기에 추가하면 됨)
# ===========================================
cmds_files = [
    r"C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2025\documents_2025_03.cmds",
    r"C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2020\documents_2020_03.cmds",
    r"C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2015\documents_2015_03.cmds",
    r"C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2010\documents_2010_03.cmds",
    r"C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\누락\251127_04.cmds",
    r"C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\누락\approval_opinion.cmds",
    r"C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\누락\new_documents_20,25.cmds",
    r"C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\누락\documents_수정분.cmds"
    
    # 여기에 파일 추가
    # r"C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2020\documents_2020_04.cmds",
    # r"C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2021\documents_2021_01.cmds",
]

print(f"처리할 파일 수: {len(cmds_files)}")
for f in cmds_files:
    print(f"  - {f}")

처리할 파일 수: 8
  - C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2025\documents_2025_03.cmds
  - C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2020\documents_2020_03.cmds
  - C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2015\documents_2015_03.cmds
  - C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2010\documents_2010_03.cmds
  - C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\누락\251127_04.cmds
  - C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\누락\approval_opinion.cmds
  - C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\누락\new_documents_20,25.cmds
  - C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\누락\documents_수정분.cmds


In [3]:
# ===========================================
# 3. cmds에서 모든 이름 추출
# ===========================================
def extract_names_from_cmds(file_path):
    """cmds 파일에서 drafter.name과 activities[].name 추출"""
    names = set()
    
    with open(file_path, 'r', encoding='utf-8') as f:
        for line_num, line in enumerate(f, 1):
            line = line.strip()
            if not line.startswith('addDocument '):
                continue
            
            try:
                # 'addDocument ' 제거 후 JSON 파싱
                json_str = line[12:]  # 'addDocument ' = 12글자
                doc = json.loads(json_str)
                
                # drafter.name 추출
                drafter_name = doc.get('drafter', {}).get('name', '')
                if drafter_name:
                    names.add(drafter_name.strip())
                
                # activities[].name 추출
                for activity in doc.get('activities', []):
                    act_name = activity.get('name', '')
                    if act_name:
                        names.add(act_name.strip())
                        
            except json.JSONDecodeError as e:
                print(f"JSON 파싱 에러 - 파일: {file_path}, 라인: {line_num}")
                continue
    
    return names

# 모든 파일에서 이름 수집
all_names = set()
for cmds_file in cmds_files:
    print(f"처리 중: {cmds_file}")
    names = extract_names_from_cmds(cmds_file)
    print(f"  → 추출된 이름 수: {len(names)}")
    all_names.update(names)

print(f"\n총 고유 이름 수: {len(all_names)}")

처리 중: C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2025\documents_2025_03.cmds
  → 추출된 이름 수: 193
처리 중: C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2020\documents_2020_03.cmds
JSON 파싱 에러 - 파일: C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2020\documents_2020_03.cmds, 라인: 271
JSON 파싱 에러 - 파일: C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2020\documents_2020_03.cmds, 라인: 279
JSON 파싱 에러 - 파일: C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2020\documents_2020_03.cmds, 라인: 288
JSON 파싱 에러 - 파일: C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2020\documents_2020_03.cmds, 라인: 383
JSON 파싱 에러 - 파일: C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2020\documents_2020_03.cmds, 라인: 410
JSON 파싱 에러 - 파일: C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2020\documents_2020_03.cmds, 라인: 450
JSON 파싱 에러 - 파일: C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2020\documents_2020_03.cmds, 라인: 525
JSON 파싱 에러 - 파일: C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2020\documents_2020_03.cmds, 라인: 532
JSON 파싱 에러 - 파일: C:\Users\LEEJUHWAN\Desktop\애니파이브\전자결재\2020\documents_2020_03.cmds, 라인: 546
JSON 파싱 에러

In [4]:
# ===========================================
# 4. 퇴사자 추출 (cmds에 있는데 CSV에 없는 이름)
# ===========================================
resigned_employees = all_names - current_employees

print(f"퇴사자 수: {len(resigned_employees)}")
print("\n=== 퇴사자 명단 ===")
for name in sorted(resigned_employees):
    print(name)

퇴사자 수: 335

=== 퇴사자 명단 ===
CEO
PHAM NHU QUYNH
강대환
강성원
강원준
강정례
강현우
강혜민
개인고충상담
고성철
고송령
고아라
고영현
고원태
고지희
고화석
곽유미
구겸회
권민선
권봉찬
권석현
권순숙
권재국
권정윤
금종화
금혜진
김광림
김광석
김규일
김기동
김기두
김기범
김남배
김대일
김대화
김대환
김도현
김도형
김동국
김동력
김명상
김명찬
김묘경
김문철
김미영
김미화
김민선
김병구
김봉민
김상진
김상태
김성권
김성수
김성연
김성은
김수경
김수빈
김수열
김수철
김수현
김승범
김아름
김영석
김영원
김영재
김왕수
김용화
김우석
김원
김은미
김은영
김은진
김은하
김익석
김장엽
김재범
김재영
김재원
김정미
김정민
김준호
김지명
김지원
김지훈
김진영
김진인
김진현
김찬배
김태림
김태영
김태완
김태원
김태정
김태희
김하늘
김하응
김학선
김학수
김현길
김현성
김현수
김현숙
김현중
김형철
김형환
김혜원
김홍엽
김환용
나경석
남궁연욱
남정한
노병우
류광수
류형우
마상미
문규원
문선영
문한수
민경욱
민영창
박규리
박근록
박기호
박미영
박미혜
박민영
박민혁
박상권
박상안
박상택
박선용
박영준
박인수
박정현
박종경
박창열
박형남
박형석
박혜영
박희철
방기훈
방인영
배설희
배현찬
백경호
백승덕
백유라
서강석
서다혜
서영규
서용석
서용희
성정은
소성현
소유섭
손경준
손동철
손한석
송명근
송병호
송원규
송재훈
송종대
신대원
신병철
신영준
신용철
신정훈
신지수
신진우
심경수
심동명
안민찬
안소현
안재흥
양기훈
양태웅
엄윤정
오경진
오주환
오지영
왕정현
원성재
원정윤
유경동
유대곤
유동엽
유병찬
유상권
유석철
유선오
유영민
유재현
유정
유지은
유태경
윤다솔
윤석현
윤인식
윤지훈
윤창근
윤철희
음경민
이가희
이경재
이경주
이관운
이나연
이난경
이동진
이동하
이동희
이두진
이령빈
이민경
이민곤
이상규
이석주
이성권
이성재
이성현
이세원
이송연
이승근
이승민
이승철A
이승철B
이시우
이시운
이아영
이완우
이우창
이원하
이유리
이은주
이은희
이재민
이종수
이종원
이종

In [5]:
# ===========================================
# 5. 결과를 DataFrame으로 정리 & 저장 (선택)
# ===========================================
df_resigned = pd.DataFrame({'퇴사자명': sorted(resigned_employees)})
print(df_resigned)

# 파일로 저장하고 싶으면 주석 해제
df_resigned.to_csv(r"C:\Users\LEEJUHWAN\Desktop\퇴사자명단.csv", index=False, encoding='utf-8-sig')
print("퇴사자명단.csv 저장 완료")

               퇴사자명
0               CEO
1    PHAM NHU QUYNH
2               강대환
3               강성원
4               강원준
..              ...
330             황국하
331             황규섭
332             황근영
333             황선대
334             황정아

[335 rows x 1 columns]
퇴사자명단.csv 저장 완료
