# 라이브러리 호출

In [None]:
!pip install koreanize-matplotlib

In [None]:
import matplotlib.pyplot as plt
import koreanize_matplotlib
import pandas as pd
import numpy as np

# 데이터 불러오기

In [None]:
df = pd.read_csv('원본파일')

In [None]:
df.columns

In [None]:
df['상품별 합계']

# 요일별 매출 확인

In [None]:
# 누적된 매출 합계를 통해 어떤 요일에 가장 손님이 붐비는지, 가장 높은 매출액 확인

result_df = df.groupby('요일').sum()
result_df

In [None]:
# 요일 별 매출 합계 데이터 시각화

plt.figure(figsize=(10,7))
plt.title('요일 별 매출 합계 (단위 = 원)') # 제목
plt.bar(result_df.index,result_df['상품별 합계'],color='skyblue')

# 막대그래프 위에 금액 넣기
for index, value in enumerate(result_df['상품별 합계']):
    formatted_value = "{:,.0f}".format(value)  # 1000단위로 콤마 찍기
    plt.text(index, value, formatted_value, ha='center', va='bottom')

plt.show()

# 시각화 결과, 주밀 > 월요일 금요일 > 나머지 주중 순으로 매출액이 높음
# 참고) 매달 첫째 주 화요일은 정기휴무일 > 화요일 매출액이 다른 요일들보다 월등히 더 낮음 (누적이기 때문에 한 회차 빠진다고 생각하면 됨)

# 요일별 매출액 평균 확인

In [None]:
df = pd.read_excel('전처리엑셀파일')
df

In [None]:
# 날짜로 한 번 묶고 그 이후에 요일로 묶기
df['결제일'] = pd.to_datetime(df['결제일']) # datetime을 통해 결제일 처리에 용이하도록 함
df['요일'] = df['결제일'].dt.day_name() # 요일 컬럼 생성

In [None]:
by_date = df.groupby('결제일').sum() # groupby 결제일을 통해 결제일 별 누적 매출액 구하기
by_date['요일'] = by_date.index.day_name() # groupby(결제일(=날짜)) 한 df에 요일 컬럼 더하기
by_date

In [None]:
# 결제일 별 요일이 나타나고, 결제일 별 판매금액 누적 컬럼 생성 완료
by_date_mean = by_date.groupby('요일').mean() # 요일 별 평균 구하기 mean 메서드 사용
by_date_mean

by_date_mean.index

In [None]:
# 데이터 시각화
plt.figure(figsize=(13,7))
plt.bar(by_date_mean.index,by_date_mean['상품별 합계'],color='green',alpha=0.6)
plt.title('요일 별 매출액 평균(단위=원)')

# 막대그래프 위에 금액 넣기
for index, value in enumerate(by_date_mean['상품별 합계']):
    formatted_value = "{:,.0f}".format(value)  # 1000단위로 콤마 찍기
    plt.text(index, value+3, formatted_value, ha='center', va='bottom')

# 월별 매출액 합계

In [None]:
# 월을 추출한 column 생성
df['월'] = df['결제일'].dt.month
df['연'] = df['결제일'].dt.year

In [None]:
# groupby 연 & 월을 통한 데이터 확인
month_df = df.groupby(['연','월']).sum()
month_df

In [None]:
month_df = month_df.reset_index() # index 초기화 - 단일 index로 변환 (groupby 2번 -> multi index)
month_df

In [None]:
# 데이터 시각화 (연-월 별 판매 합계) (2022년 2월~2023년 5월)
plt.figure(figsize=(13,7))
plt.title('연-월 별 매출액 합계(단위=원)')
plt.bar(range(len(month_df)), month_df['상품별 합계'],color='pink')
plt.plot(range(len(month_df)), month_df['상품별 합계'],color='red',linewidth=3) # 추이를 보기 위한 line graph 그리기

# 각 막대 위에 값을 표시하기 위한 반복문
for index, value in enumerate(month_df['상품별 합계']):
    formatted_value = "{:,.0f}".format(value)  # 1000단위로 콤마 찍기
    plt.text(index, value, formatted_value, ha='center', va='bottom')

# x축 레이블 설정
x_labels = [f"{year}-{month}" for year, month in zip(month_df['연'], month_df['월'])]
plt.xticks(range(len(month_df)), x_labels)

plt.show()

# 시간대별 매출 확인

In [None]:
df['시간대'] = pd.to_datetime(df['결제시간']).dt.hour
df.columns

In [None]:
hour_sum = df.groupby('시간대')['상품별 합계'].sum()
hour_mean = df.groupby('시간대')['상품별 합계'].mean()
hour_sum

In [None]:
df['시간대']

In [None]:
plt.figure(figsize=(13,8))
plt.bar(hour_sum.index,hour_sum)
plt.title('시간 별 매출 합계 (1시간 별, 단위=원)')
plt.xlim(8,19)

각 막대 위에 값을 표시하기 위한 반복문
for index, value in enumerate(hour_sum):
    formatted_value = "{:,.0f}".format(value)  # 1000단위로 콤마 찍기
    plt.text(index+7, value+1, formatted_value, ha='center', va='bottom')

plt.show()

# 매출 대비 MD판매액 확인



In [None]:
df = pd.read_csv('매출데이터')

In [None]:
# 월을 추출한 column 생성
df['월'] = df['결제일'].dt.month
df['연'] = df['결제일'].dt.year

In [None]:
# groupby 연 & 월을 통한 데이터 확인
month_df = df.groupby(['연','월']).sum()
month_df

In [None]:
month_df = month_df.reset_index() # index 초기화 - 단일 index로 변환 (groupby 2번 -> multi index)
month_df

In [None]:
df.head()

In [None]:
filt = df['카테고리'] == "MD"

In [None]:
md = df[filt].groupby(['연','월']).sum()
md

In [None]:
# index 초기화 (for 데이터 시각화)
md = md.reset_index()
md

In [None]:
md['md 매출액 비율'] = md['']

In [None]:
# 데이터 시각화
plt.figure(figsize=(12,7))
plt.bar(range(len(md)),md['상품별 합계'],color='lightseagreen')
plt.title('월별 MD 판매량(오프라인 매장) (단위=원)')

# x축 레이블 설정
x_labels = [f"{year}-{month}" for year, month in zip(md['연'], md['월'])]
plt.xticks(range(len(month_df)), x_labels)

# 각 막대 위에 값을 표시하기 위한 반복문
for index, value in enumerate(md['상품별 합계']):
    formatted_value = "{:,.0f}".format(value)  # 1000단위로 콤마 찍기
    plt.text(index, value, formatted_value, ha='center', va='bottom')

plt.show()

In [None]:
# 연-월 별 판매 합계 (2022년 2월~2023년 5월)
plt.figure(figsize=(17,7))
plt.title('연-월 별 매출액 합계 중 MD 판매액(단위=원)')
plt.bar(range(len(month_df)), month_df['상품별 합계'],color='pink')

# 각 막대 위에 값을 표시하기 위한 반복문
for index, value in enumerate(month_df['상품별 합계']):
    formatted_value = "{:,.0f}".format(value)  # 1000단위로 콤마 찍기
    plt.text(index, value, formatted_value, ha='center', va='bottom')



# MD 매출
plt.bar(range(len(md)),md['상품별 합계'],color='lightcoral',alpha=0.8)

# x축 레이블 설정
x_labels = [f"{year}-{month}" for year, month in zip(md['연'], md['월'])]
plt.xticks(range(len(month_df)), x_labels)

# 각 막대 위에 값을 표시하기 위한 반복문
for index, value in enumerate(md['상품별 합계']):
    formatted_value = "{:,.0f}".format(value)  # 1000단위로 콤마 찍기
    plt.text(index, value, formatted_value, ha='center', va='bottom')

plt.show()