In [8]:
# 기본 라이브러리
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# 그래프 기본 테마 설정
# https://coldbrown.co.kr/2023/07/%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EC%8B%A4%EC%A0%84%ED%8E%B8-08-seaborn-sns-set%EC%9D%84-%ED%86%B5%ED%95%B4-%EC%8A%A4%ED%83%80%EC%9D%BC-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0/
sns.set()

# 그래프 기본 설정
# plt.rcParams['font.family'] = 'Malgun Gothic'
plt.rcParams['font.family'] = 'AppleGothic'
plt.rcParams['figure.figsize'] = 12, 6
plt.rcParams['font.size'] = 14
plt.rcParams['axes.unicode_minus'] = False

# 복잡한 통계 처리를 위한 라이브러리
from scipy import stats

In [9]:
import matplotlib.pyplot as plt
import matplotlib.font_manager as fm
import seaborn as sns

# 윈도우 기본 한글 폰트 설정 (예: 'Malgun Gothic')
plt.rc('font', family='Malgun Gothic')

# 마이너스 부호 깨지는 것도 방지
plt.rcParams['axes.unicode_minus'] = False

### 데이터 불러오기

In [11]:
df = pd.read_csv('Pizza Sales Dataset.csv')
df.head()

FileNotFoundError: [Errno 2] No such file or directory: 'Pizza Sales Dataset.csv'

In [None]:
df.columns

### 컬럼명 한국어로 바꾸기

In [None]:
df.rename(columns={
    'pizza_id': '피자 ID',
    'order_id': '주문 ID',
    'pizza_name_id': '피자 이름 ID',
    'quantity': '주문 수량',
    'order_date': '주문 날짜',
    'order_day': '주문 요일',
    'order_time': '주문 시간',
    'unit_price': '단가',
    'total_price': '총액',
    'pizza_size': '피자 사이즈',
    'pizza_category': '피자 종류',
    'pizza_ingredients': '피자 재료 목록',
    'pizza_name': '피자 이름'
}, inplace=True)

In [None]:
# 결측치 확인 : 없음
df.isna().sum()

In [None]:
df.info()

### 분석 시작

1. 날짜/시간 데이터 정리 주문 날짜, 주문 시간 datetime 타입으로 변환

In [None]:
# 날짜 + 시간 합쳐서 datetime 열 만들기
df['주문일시'] = pd.to_datetime(df['주문 날짜'] + ' ' + df['주문 시간'])

# 요일도 숫자로 변경
# 영어 요일 → 한글 매핑
요일_매핑 = {
    'Monday': '월요일',
    'Tuesday': '화요일',
    'Wednesday': '수요일',
    'Thursday': '목요일',
    'Friday': '금요일',
    'Saturday': '토요일',
    'Sunday': '일요일'
}

df['주문 요일'] = df['주문 요일'].map(요일_매핑)

# 순서 설정
요일_순서 = ['월요일', '화요일', '수요일', '목요일', '금요일', '토요일', '일요일']
df['주문 요일'] = pd.Categorical(df['주문 요일'], categories=요일_순서, ordered=True)

df['요일_번호'] = df['주문일시'].dt.dayofweek  # 월=0 ~ 일=6
df['시간대'] = df['주문일시'].dt.hour

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

# 요일별 주문 수
sns.countplot(data=df, x='주문 요일', order=['월요일', '화요일', '수요일', '목요일', '금요일', '토요일', '일요일'])
plt.title('요일별 주문 수')
plt.show()

# 시간대별 주문량
sns.histplot(df['시간대'], bins=24, kde=True)
plt.title('시간대별 주문 분포')
plt.xlabel('시간')
plt.show()

2. 피자 종류별 주문수량, 사이즈별 평균 총액

In [None]:
# 피자 종류별 총 주문 수량
df.groupby('피자 종류')['주문 수량'].sum().sort_values(ascending=False).plot(kind='bar')
plt.title('피자 종류별 총 주문 수량')
plt.ylabel('수량')
plt.show()

# 피자 사이즈별 평균 총액
df.groupby('피자 사이즈')['총액'].mean().sort_values().plot(kind='barh')
plt.title('사이즈별 평균 구매 금액')
plt.xlabel('평균 총액')
plt.show()

1. 요일별+시간대별 주문량
- 요일과 시간대별 주문이 몰리는 패턴 시각화 가능
- '언제' 주문이 집중되는지 파악. 마케팅 타이밍, 인력배치, 프로모션 시간 설정

2. 피자 종류/사이즈별 판매량
- '무엇' 이 잘 팔리는지 파악. 인기메뉴 집중, 재고 및 가격정책, 메뉴개선방향? 설정??

3. 가설 설정
- 대형 사이즈 피자는 저녁에 팔림 > 피자 사이즈별 시간대 히트맵
- 특정 요일에 특정 피자종류 > 요일 vs 피자 종류 크로스탭(?)
- 매출이 주로 몇 개 피자에 집중되어 있다? > 총액 기준 상위메뉴 추출

4. 마케팅 제안~~~
- 수요일 오후는 주문량이 낮으니 “1+1 이벤트” 진행
- 점심엔 M 사이즈, 저녁엔 L 사이즈를 강조 
- 인기 없는 피자 → 재료 조합 바꾸거나 묶음 할인 ㅇㅇㅇㅇㅇ

### 1. 시간대별 주문량 분석 (피크타임 파악)

In [None]:
# 시간 추출
df['order_hour'] = pd.to_datetime(df['주문 시간']).dt.hour

# 시간대별 주문량 집계
hourly_order_counts = df['order_hour'].value_counts().sort_index()
print(hourly_order_counts)