<a href="https://colab.research.google.com/github/rtajeong/ChatGPT_for_Management/blob/main/8_making_excel_using_gpt.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 엑셀 파일을 만들기 위한 GPT
- 경영학과 학생을 위한 응용 예

## 예제 1: 월간 매출 보고서 생성
- 매달 제품별 매출 데이터를 엑셀로 정리하고 보고서를 작성해야 한다고 가정한다.
- GPT 도움: GPT를 사용해 자동으로 데이터를 엑셀에 정리하고, 총 매출을 계산하며 간단한 서식을 적용한다.
- 라이브러리 'openpyxl' 사용

In [1]:
from openpyxl import Workbook
from openpyxl.styles import Font

# 새로운 엑셀 파일 생성
workbook = Workbook()
sheet = workbook.active
sheet.title = "월간 매출 보고서"

# 헤더 추가
headers = ["제품명", "1월 매출", "2월 매출", "3월 매출", "총 매출"]
sheet.append(headers)

# 데이터 추가
data = [
    ["제품 A", 1200, 1500, 1300],
    ["제품 B", 1800, 1700, 2000],
    ["제품 C", 1100, 1400, 1350]
]
for row in data:
    total_sales = sum(row[1:])  # 총 매출 계산
    sheet.append(row + [total_sales])

# 헤더를 굵게 표시
for col in range(1, len(headers) + 1):
    sheet.cell(row=1, column=col).font = Font(bold=True)

# 파일 저장
workbook.save("monthly_sales_report.xlsx")
print("엑셀 파일 'monthly_sales_report.xlsx' 생성 완료!")


엑셀 파일 'monthly_sales_report.xlsx' 생성 완료!


## 예제 2: 예산 관리 파일 자동 생성
- 상황: 월별 예산과 실제 사용 금액을 비교해 변동 폭을 기록해야 한다고 가정한다.
- GPT의 도움: GPT는 데이터를 정리하고 변동 폭을 계산해 엑셀 파일로 저장한다.


In [2]:
from openpyxl import Workbook

# 엑셀 파일 생성
workbook = Workbook()
sheet = workbook.active
sheet.title = "예산 관리"

# 헤더 추가
sheet.append(["월", "예산 (만원)", "실제 사용 (만원)", "변동 폭 (만원)"])

# 데이터 추가
data = [
    ["1월", 200, 195],
    ["2월", 250, 240],
    ["3월", 300, 310],
]
for row in data:
    variance = row[1] - row[2]  # 변동 폭 계산
    sheet.append(row + [variance])

# 파일 저장
workbook.save("budget_management.xlsx")
print("엑셀 파일 'budget_management.xlsx' 생성 완료!")


엑셀 파일 'budget_management.xlsx' 생성 완료!


## 예제 3: 프로젝트 일정 관리 파일 생성
- 상황: 프로젝트별 일정과 상태를 기록해야 한다고 가정한다.
- GPT의 도움: GPT는 팀에서 사용할 수 있는 일정 관리 파일을 생성해 준다.

In [3]:
from openpyxl import Workbook

# 엑셀 파일 생성
workbook = Workbook()
sheet = workbook.active
sheet.title = "프로젝트 일정 관리"

# 헤더 추가
sheet.append(["프로젝트명", "시작일", "종료일", "상태"])

# 데이터 추가
sheet.append(["프로젝트 A", "2024-01-01", "2024-02-28", "진행 중"])
sheet.append(["프로젝트 B", "2024-02-01", "2024-04-30", "계획 중"])
sheet.append(["프로젝트 C", "2024-03-01", "2024-06-30", "완료"])

# 파일 저장
workbook.save("project_schedule.xlsx")
print("엑셀 파일 'project_schedule.xlsx' 생성 완료!")


엑셀 파일 'project_schedule.xlsx' 생성 완료!


## 예제 4: 대량 데이터 처리 및 피벗 테이블 생성
- 상황: 수천 개의 거래 데이터를 분석하여 월별, 카테고리별 매출 합계를 자동으로 요약해야 한다.
- Excel 파일을 생성하고 수정할 수 있는 도구
  - openpyxl:
    - 엑셀(.xlsx) 파일을 직접 생성, 읽기, 수정할 수 있는 라이브러리.
    - 엑셀의 서식, 도형, 차트, 조건부 서식 등을 자유롭게 조작 가능.
  - pandas.ExcelWriter():
    - 데이터프레임(DataFrame)을 엑셀로 저장할 때 사용
    - 여러 sheet에 데이터 저장
    - openpyxl을 엔진으로 사용할 경우 기존 파일 수정 가능

In [5]:
import pandas as pd
import numpy as np

# 데이터 생성
dates = pd.date_range(start="2024-01-01", end="2024-12-31", freq="D").tolist()
categories = ["Food", "Transport", "Utilities", "Entertainment", "Health"]
sales = [round(x, 2) for x in np.random.uniform(10, 500, len(dates) * len(categories))]

# 카테고리 반복 맞춤
categories_repeated = categories * (len(sales) // len(categories))
categories_repeated = categories_repeated[:len(sales)]

# 데이터프레임 생성
data = {
    "Date": dates * len(categories),
    "Category": categories_repeated,
    "Sales": sales
}
df = pd.DataFrame(data)

# 동일한 엑셀 파일에 저장
output_file_path = "transaction_data_with_pivot.xlsx"

with pd.ExcelWriter(output_file_path, engine='openpyxl') as writer:
    # 원본 데이터 저장
    df.to_excel(writer, index=False, sheet_name="Original Data")

    # 피벗 테이블 생성 및 저장
    df["Month"] = pd.to_datetime(df["Date"]).dt.to_period("M")
    pivot_table = df.pivot_table(values="Sales", index="Month", columns="Category", aggfunc="sum")
    pivot_table.to_excel(writer, sheet_name="Pivot Table Summary")

print(f"파일이 저장되었습니다: {output_file_path}")


파일이 저장되었습니다: transaction_data_with_pivot.xlsx


- GPT 사용의 장점:
  - 자동화: 반복적인 데이터 입력과 계산 작업을 빠르게 수행.
  - 효율성: 엑셀 작업 시간을 대폭 단축.
  - 사용자 맞춤화: 데이터와 서식을 사용자가 원하는 대로 설정 가능

## 예제 5: 데이터 시각화 포함 대시보드 생성
- 상황: 월별 매출 데이터를 시각화하여 그래프와 함께 대시보드를 엑셀 파일로 생성해야 한다.

In [6]:
from openpyxl import Workbook
from openpyxl.chart import BarChart, Reference

# 엑셀 데이터 생성
workbook = Workbook()
sheet = workbook.active
sheet.title = "월별 매출 데이터"

# 데이터 추가
sheet.append(["월", "매출"])
sales_data = [
    ["1월", 15000],
    ["2월", 18000],
    ["3월", 20000],
    ["4월", 22000],
    ["5월", 25000]
]
for row in sales_data:
    sheet.append(row)

# 차트 생성
chart = BarChart()
data = Reference(sheet, min_col=2, min_row=1, max_row=len(sales_data) + 1, max_col=2)
categories = Reference(sheet, min_col=1, min_row=2, max_row=len(sales_data) + 1)
chart.add_data(data, titles_from_data=True)
chart.set_categories(categories)
chart.title = "월별 매출"
chart.x_axis.title = "월"
chart.y_axis.title = "매출"

# 차트를 시트에 추가
sheet.add_chart(chart, "E2")

# 파일 저장
workbook.save("monthly_sales_dashboard.xlsx")
print("엑셀 대시보드 생성 완료!")


엑셀 대시보드 생성 완료!


## 예제 6: 복잡한 데이터 클리닝 및 분석
- 상황: 거래 데이터가 불완전하고 누락된 값이 많아 클리닝과 분석 작업이 필요하다. 예를 들어:
  - 누락된 값을 평균으로 대체.
  - 날짜 범위로 데이터를 필터링.
  - 최종 데이터 요약 및 저장.

In [7]:
import pandas as pd

# 샘플 데이터 생성
data = {
    "Date": ["2024-01-01", "2024-01-02", None, "2024-01-04", "2024-01-05"],
    "Category": ["Food", "Transport", "Food", None, "Utilities"],
    "Sales": [200, None, 150, 300, None]
}
df = pd.DataFrame(data)

# 데이터 클리닝
df["Date"] = pd.to_datetime(df["Date"])  # 날짜 변환
# 누락된 Date 항에는 Interpolate 적용
df["Date"] = df["Date"].interpolate(method="linear", limit_direction="both")
# Convert the interpolated values back to dates with daily frequency
df["Date"] = pd.to_datetime(df["Date"].dt.floor("D"))
# df["Date"] = df["Date"].fillna("ffill")
# df["Date"] = df["Date"].fillna("bfill")
df["Category"] = df["Category"].fillna("Unknown")  # 누락된 카테고리 채우기
df["Sales"] = df["Sales"].fillna(df["Sales"].mean())  # 누락된 매출 평균으로 채우기

# 날짜 범위 필터링 (1월 데이터만)
df_filtered = df[(df["Date"] >= "2024-01-01") & (df["Date"] < "2024-02-01")]

# 최종 데이터 저장
df_filtered.to_excel("cleaned_transaction_data.xlsx", index=False)
print("데이터 클리닝 및 요약 완료!")


데이터 클리닝 및 요약 완료!


## 예제 7: 복잡한 엑셀 템플릿 자동 생성
- 상황: 경영팀에서 여러 부서의 KPI(Key Performance Indicator)를 관리하는 엑셀 템플릿을 만들어야 하는 경우.
- GPT 도움:
  - 부서별 시트 생성: 각 부서에 대해 개별 시트를 만들고 공통 KPI 양식을 설정
  - 자동 계산 열 추가: 목표 대비 성과율(%) 자동 계산.
  - 조건부 서식: 성과율(%)이 특정 기준 이하일 경우 색상 강조 표시.
  - 요약 시트 추가: 모든 부서의 KPI 데이터를 종합 요약.

In [8]:
from openpyxl import Workbook
from openpyxl.styles import Font, PatternFill
from openpyxl.utils import get_column_letter

# 부서별 데이터 생성
department_data = {
    "HR": [
        {"KPI": "Employee Retention", "Target": 95, "Achieved": 92},
        {"KPI": "Recruitment Time", "Target": 30, "Achieved": 28},
        {"KPI": "Training Hours", "Target": 100, "Achieved": 90},
    ],
    "Finance": [
        {"KPI": "Budget Accuracy", "Target": 98, "Achieved": 97},
        {"KPI": "Cost Reduction", "Target": 5, "Achieved": 4},
        {"KPI": "Invoice Processing Time", "Target": 10, "Achieved": 12},
    ],
    "Marketing": [
        {"KPI": "Lead Generation", "Target": 500, "Achieved": 450},
        {"KPI": "Social Media Engagement", "Target": 10000, "Achieved": 9500},
        {"KPI": "Campaign ROI", "Target": 150, "Achieved": 140},
    ],
    "Sales": [
        {"KPI": "Monthly Revenue", "Target": 100000, "Achieved": 95000},
        {"KPI": "Customer Acquisition", "Target": 50, "Achieved": 55},
        {"KPI": "Customer Retention", "Target": 85, "Achieved": 80},
    ],
}

# 엑셀 파일 생성
workbook = Workbook()

# 부서별 시트 생성
for dept, kpi_data in department_data.items():
    sheet = workbook.create_sheet(title=dept)
    sheet.append(["KPI", "Target", "Achieved", "Performance (%)"])

    # 데이터 추가
    for row in kpi_data:
        performance = (row["Achieved"] / row["Target"]) * 100
        sheet.append([row["KPI"], row["Target"], row["Achieved"], round(performance, 2)])

    # 헤더 스타일링
    for col in range(1, 5):
        cell = sheet.cell(row=1, column=col)
        cell.font = Font(bold=True)
        cell.fill = PatternFill(start_color="FFD700", end_color="FFD700", fill_type="solid")

    # 열 너비 조정
    for col in range(1, 5):
        sheet.column_dimensions[get_column_letter(col)].width = 25

    # 조건부 서식 추가 (Performance < 90%인 경우 빨간색 강조)
    for row in range(2, len(kpi_data) + 2):
        performance_cell = sheet.cell(row=row, column=4)
        if performance_cell.value < 90:
            performance_cell.fill = PatternFill(start_color="FF9999", end_color="FF9999", fill_type="solid")

# 요약 시트 생성
summary_sheet = workbook.create_sheet(title="Summary")
summary_sheet.append(["Department", "KPI", "Target", "Achieved", "Performance (%)"])

# 요약 데이터 추가
for dept, kpi_data in department_data.items():
    for row in kpi_data:
        performance = (row["Achieved"] / row["Target"]) * 100
        summary_sheet.append([dept, row["KPI"], row["Target"], row["Achieved"], round(performance, 2)])

# 기본 시트 제거
del workbook["Sheet"]

# 파일 저장
workbook.save("realistic_department_kpi_template.xlsx")
print("엑셀 파일 'realistic_department_kpi_template.xlsx' 생성 완료!")


엑셀 파일 'realistic_department_kpi_template.xlsx' 생성 완료!


## 실습과제:


- 제목: 맞춤형 데이터 활용 및 Excel 템플릿 생성
- 목표:
  - 데이터의 중요성을 이해하고, 직접 데이터를 생성하거나 수집한다.
  - Python을 활용해 데이터를 처리하고, Excel 파일로 저장하는 방법을 익힌다.
  - 현실적인 데이터를 기반으로 데이터 시각화 및 분석 과정을 경험한다.
- 세부 내용:
  1. 데이터 준비: 아래 두 가지 중 하나 선택
     - 실제 데이터 수집: 공공 데이터 포털(Kaggle, 데이터.go.kr 등)에서 부서별 데이터셋을 수집. 반드시 각 부서에 맞는 고유한 KPI 데이터를 포함해야 함.
     - 데이터 생성: 특정 시나리오(예: 신제품 출시, 직원 만족도 평가 등)를 설정하고 가상의 데이터를 작성.
     - (*) 부서별로 고유한 KPI 포함하고 Target(목표 값)과 Achieved(달성 값)을 반드시 포함한다.
  2. Python으로 데이터 처리 및 Excel 출력
     - Excel 파일 생성:
       - 각 부서에 대해 개별 시트를 생성하고 데이터를 저장.
       - 성과율(Performance %) 계산 열 추가.
       - 조건부 서식 적용 (성과율 90% 미만인 경우 강조 표시).
     - 요약 시트 생성:
       - 모든 부서 데이터를 통합한 요약 시트를 추가.
  3. 그래프 생성 추가
    - 각 부서의 KPI 데이터를 바탕으로 그래프를 생성한다.
    - 그래프는 Excel 파일에 포함되며, 다음과 같은 시각적 요소를 포함해야 한다.
      - 막대 그래프 (Bar Chart): 각 KPI의 목표(Target) 대비 달성(Achieved) 비교.
      - 파이 차트 (Pie Chart): 성과율(Performance %)을 부서별로 비교.
    - 그래프는 각 부서 시트에 추가한다.
      - 막대 그래프는 해당 부서의 데이터를 나타냄.
      - 파이 차트는 요약 시트에 추가하여 전체 부서의 성과율 비교.
  4. 아래 GPT 활용 예제 참고 가능.

## GPT 활용 예제 1: GPT로 데이터 생성
- 프롬프트 예:
```
  Generate realistic KPI data for HR, Finance, Marketing, and
  Sales departments. Each department should have 5 KPIs with
  Target and Achieved values. Include performance descriptions
  for each KPI.
```

## GPT 활용 예제 2: GPT로 Python 코드 생성
- 프롬프트 예:
  ```
  Write Python code to create an Excel file with
  department-specific KPI data for HR, Finance, Marketing, and
  Sales. Include performance percentage calculations and
  conditional formatting for cells below 90%."
  ```


## GPT 활용 예제 3: GPT로 데이터 분석
- 프롬프트 예:
  ```
  Analyze the following KPI data for HR, Finance, Marketing, and
  Sales departments. Identify departments or KPIs that are
  underperforming (performance < 90%) and suggest possible
  actions for improvement.
  ```


## GPT 활용 예제 4: GPT로 데이터 분석 보고서 작성하기
- 프롬프트 예:
  ```
  Below is the data analysis result for the KPI performance of
  various departments. Please generate a report summarizing the
  key findings, identifying underperforming KPIs, and suggesting
  possible improvements.

     Data Summary:
       o HR Department:
         - Employee Retention: Target = 95, Achieved = 92, Performance = 96.8%
         - Recruitment Time: Target = 30, Achieved = 28, Performance = 93.3%
       o Sales Department:
         ...
  ```


## GPT 활용 예제 5: GPT로 데이터 분석 그래프 그리기
- 프롬프트 예:
  - 단일 부서 데이터로 막대 그래프
   ```
   Generate Python code to create a bar chart using matplotlib
   for the following data:
   - Department: HR
   - KPI Data:
     - Employee Retention: Target = 95, Achieved = 92
     - Recruitment Time: Target = 30, Achieved = 28
     - Training Hours: Target = 100, Achieved = 90

   The bar chart should compare Target and Achieved values for each KPI.
```
  - 부서별 성과율을 비교하는 파이 차트
```
   Generate Python code to create a pie chart comparing the
   performance percentage of the following departments:
     - HR: 93%
     - Finance: 96%
     - Marketing: 89%
     - Sales: 92%

   The pie chart should include percentage labels for each department.
```
  - 요약 데이터를 사용해 복합 그래프 생성
```
  Generate Python code to create a combination chart using
  matplotlib. The chart should include:
    1. A bar chart showing the achieved values for each KPI in the "Finance" department.
    2. A line chart overlay showing the target values for the same KPIs.
  KPI Data:
    - Budget Accuracy: Target = 98, Achieved = 97
    - Cost Reduction: Target = 5, Achieved = 4
    - Invoice Processing Time: Target = 10, Achieved = 12
```


--------------------------------------------------