# 엑셀 파일 업데이트

### 퇴사 날짜를 지정하는 컬럼 설정

In [44]:
# pandas 라이브러리를 pd라는 별칭으로 임포트
import pandas as pd

# 사용할 엑셀 파일 경로 지정
file_path = "employee.xlsx"

# pandas의 read_excel()함수를 사용: 엑셀 파일을 읽어오기
excel_data = pd.read_excel(file_path, sheet_name=None)

# 읽어온 엑셀 데이터에서 'Sheet1' 시트를 선택하여 DataFrame 형태로 저장
sheet1_df = excel_data['Sheet1']

# 데이터프레임 형태의 sheet1_df에 '퇴사 날짜'라는 새로운 열을 추가
# : 초기값은 비워둠
# : Not a Time: 시간 데이터가 없음을 의미
sheet1_df['퇴사 날짜'] = pd.NaT

# 변경된 Sheet1 데이터를 다시 excel_data에 저장
# : 원래의 Sheet1 데이터가 업데이트
excel_data['Sheet1'] = sheet1_df

# 변경된 데이터를 파일로 저장
with pd.ExcelWriter(file_path, engine='openpyxl', mode='w') as writer:
    # 모든 시트를 순회
    for sheet_name, df in excel_data.items():
        # 각 시트를 파일에 저장, 시트이름은 각 시트이름 그대로
        df.to_excel(writer, sheet_name=sheet_name, index=False)

### 생성된 퇴사 날짜 열에 데이터(퇴사 날짜)를 추가하는 경우
### : 추가된 해당 행의 소속을 파악하여 그 소속의 고용보험 가입자 현황 시트로 
### : 퇴사 날짜의 열에 값이 추가되도록 설정

In [46]:
# 엑셀 파일 읽기
file_path = "employee.xlsx"
excel_data = pd.read_excel(file_path, sheet_name=None)
sheet1_df = excel_data['Sheet1']

# '퇴사 날짜' 열을 datetime 타입으로 변환
sheet1_df['퇴사 날짜'] = pd.to_datetime(sheet1_df['퇴사 날짜'], errors='coerce')

# 퇴사 날짜와 소속에 따른 퇴사 인원 집계
leaving_counts = sheet1_df[sheet1_df['퇴사 날짜'].notna()].groupby(['소속', sheet1_df['퇴사 날짜'].dt.month]).size()

# 각 소속의 '고용보험 가입자 현황' 시트 업데이트 및 '총계' 계산
for sheet_name, df in excel_data.items():
    if "고용보험 가입자 현황" in sheet_name:
        employment_insurance_df = df
        affiliation = sheet_name.split('_')[0]

        # 퇴사 인원 업데이트
        for month in range(1, 13):
            count = leaving_counts.get((affiliation, month))
            if count is not None:
                employment_insurance_df.loc[employment_insurance_df['Unnamed: 0'] == '퇴사인원', f'{month}월'] = count

        excel_data[sheet_name] = employment_insurance_df

# 변경된 데이터를 파일로 저장
with pd.ExcelWriter(file_path, engine='openpyxl', mode='w') as writer:
    for sheet_name, df in excel_data.items():
        df.to_excel(writer, sheet_name=sheet_name, index=False)

# 엑셀 파일 접속

## 퇴사 날짜 열 '2024-01-17' 저장 > 위 코드 다시 실행

In [52]:
import pandas as pd

# 엑셀 파일 읽기
file_path = "employee.xlsx"
excel_data = pd.read_excel(file_path, sheet_name=None)

# 'Sheet1' 데이터 불러오기
sheet1_df = excel_data['Sheet1']

# 'Sheet1'의 초기 행 수 저장 (추가된 데이터를 식별하기 위함)
# Sheet1의 원래 행의 개수를 저장 > 데이터 추가를 비교하기 위함
initial_rows = sheet1_df.shape[0]

# 마지막 행의 'no' 컬럼 값을 가져옵니다.
# 새 데이터에 사용할 값: iloc: 인덱스 번호를 검색(-1은 제일 마지막 데이터를 찾아옴)
last_no = sheet1_df['no'].iloc[-1]

# 새 데이터에 사용할 'no' 값은 마지막 'no' 값에 1을 더한 값입니다.
new_no = last_no + 1

# 예시 데이터 추가
new_data = pd.DataFrame([{
    "no": new_no, "이름": "새 직원", "분야": "개발", "급수": "중급",
    "부서": "개발부", "직위": "주임", "최초 입사일": pd.to_datetime("2024-04-11"),
    "주소": "서울시 어딘가", "휴대폰 번호": "010-1234-5678", "소속": "A",
    "퇴사 날짜": pd.NaT
}])

# DataFrame을 합침
# concat(): 같은 데이터 타입의 값을 서로 더해주는 함수
sheet1_df = pd.concat([sheet1_df, new_data], ignore_index=True)

# 'Sheet1'에서 추가된 데이터 확인
# iloc[-1:]: 기존의 마지막 열부터 추가된 행까지를 읽어오는 기능
added_data = sheet1_df.iloc[-1:]  # 마지막 행이 추가된 데이터

# 각 소속의 '고용보험 가입자 현황' 시트 업데이트
for index, row in added_data.iterrows(): # 추가된 데이터를 행별로 반복 처리
    affiliation = row['소속'] # 현재 행의 '소속' 컬럼의 값을 변수에 저장
    joining_month = row['최초 입사일'].month # '최초 입사일'에서 월 정보를 추출
    month_column = f"{joining_month}월" # 월 정보를 f'{}' 문자열로 변환하여 열 이름을 생성

    # 해당 소속의 '고용보험 가입자 현황' 시트 이름을 생성
    employment_insurance_sheet = f"{affiliation}_고용보험 가입자 현황"
    # 해당 시트의 DataFrame을 가져옴
    employment_insurance_df = excel_data[employment_insurance_sheet]

    # 입사인원 업데이트'
    # 'Unnamed: 0' 열에서 '입사인원'행을 찾고
    # 해당 월의 열을 선택하여 입사인원 수를 1 증가
    # fillna(0)는 해당 월의 데이터가 비워져있으면 0으로 취급
    employment_insurance_df.loc[employment_insurance_df['Unnamed: 0'] == '입사인원', month_column] = \
        employment_insurance_df.loc[employment_insurance_df['Unnamed: 0'] == '입사인원', month_column].fillna(0) + 1

    # 업데이트된 고용보험 가입자 현황 저장
    excel_data[employment_insurance_sheet] = employment_insurance_df
    
    # 변경된 Sheet1 데이터를 excel_data에 다시 저장
    excel_data['Sheet1'] = sheet1_df

# 변경된 데이터를 파일로 저장
with pd.ExcelWriter(file_path, engine='openpyxl', mode='w') as writer:
    for sheet_name, df in excel_data.items():
        df.to_excel(writer, sheet_name=sheet_name, index=False)

In [35]:
# 엑셀 파일 다시 읽기
file_path = "employee.xlsx"
excel_data = pd.read_excel(file_path, sheet_name=None)

# 각 'A_고용보험 가입자 현황', 'B_고용보험 가입자 현황', 'C_고용보험 가입자 현황' 시트의 '총계' 계산 및 업데이트
for sheet_name, df in excel_data.items():
    if "고용보험 가입자 현황" in sheet_name:
        # 해당 소속의 고용보험 가입자 현황 시트
        employment_insurance_df = df

        # 각 월에 대한 재직인원, 입사인원, 퇴사인원 계산 및 총계 업데이트
        for month in range(1, 13):
            month_column = f"{month}월"
            # 재직인원, 입사인원, 퇴사인원을 추출하고 NaN은 0으로 대체
            in_service = employment_insurance_df.loc[employment_insurance_df['Unnamed: 0'] == '재직인원', month_column].fillna(0).values[0]
            joined = employment_insurance_df.loc[employment_insurance_df['Unnamed: 0'] == '입사인원', month_column].fillna(0).values[0]
            left = employment_insurance_df.loc[employment_insurance_df['Unnamed: 0'] == '퇴사인원', month_column].fillna(0).values[0]

            # 총계 계산 및 업데이트
            total = in_service + joined - left
            employment_insurance_df.loc[employment_insurance_df['Unnamed: 0'] == '총계', month_column] = total

        # 업데이트된 고용보험 가입자 현황 저장
        excel_data[sheet_name] = employment_insurance_df

# 변경된 데이터를 파일로 다시 저장
with pd.ExcelWriter(file_path, engine='openpyxl', mode='w') as writer:
    for sheet_name, df in excel_data.items():
        df.to_excel(writer, sheet_name=sheet_name, index=False)