In [3]:
# 기본 라이브러리
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# 그래프 기본 테마 설정
# https://coldbrown.co.kr/2023/07/%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EC%8B%A4%EC%A0%84%ED%8E%B8-08-seaborn-sns-set%EC%9D%84-%ED%86%B5%ED%95%B4-%EC%8A%A4%ED%83%80%EC%9D%BC-%EC%84%A4%EC%A0%95%ED%95%98%EA%B8%B0/
sns.set()

# 그래프 기본 설정
# plt.rcParams['font.family'] = 'Malgun Gothic'
plt.rcParams['font.family'] = 'AppleGothic'
plt.rcParams['figure.figsize'] = 12, 6
plt.rcParams['font.size'] = 14
plt.rcParams['axes.unicode_minus'] = False

# 복잡한 통계 처리를 위한 라이브러리
from scipy import stats

### 데이터 확인하기

In [5]:
df = pd.read_excel('pizza_data.xlsx')

In [6]:
df.head()

Unnamed: 0,Order ID,Restaurant Name,Location,Order Time,Delivery Time,Delivery Duration (min),Pizza Size,Pizza Type,Toppings Count,Distance (km),...,Topping Density,Order Month,Payment Category,Estimated Duration (min),Delay (min),Is Delayed,Pizza Complexity,Traffic Impact,Order Hour,Restaurant Avg Time
0,ORD001,Domino's,"New York, NY",2024-01-05 18:30:00,2024-01-05 18:45:00,15,Medium,Veg,3,2.5,...,1.2,January,Online,6.0,9.0,False,6,2,18,30.259434
1,ORD002,Papa John's,"Los Angeles, CA",2024-02-14 20:00:00,2024-02-14 20:25:00,25,Large,Non-Veg,4,5.0,...,0.8,February,Online,12.0,13.0,False,12,3,20,28.186275
2,ORD003,Little Caesars,"Chicago, IL",2024-03-21 12:15:00,2024-03-21 12:35:00,20,Small,Vegan,2,3.0,...,0.666667,March,Online,7.2,12.8,False,2,1,12,28.844221
3,ORD004,Pizza Hut,"Miami, FL",2024-04-10 19:45:00,2024-04-10 20:10:00,25,XL,Cheese Burst,5,4.5,...,1.111111,April,Offline,10.8,14.2,False,20,2,19,29.948454
4,ORD005,Marco's Pizza,"Dallas, TX",2024-05-05 13:00:00,2024-05-05 13:20:00,20,Medium,Non-Veg,3,2.0,...,1.5,May,Online,4.8,15.2,False,6,3,13,30.286458


In [8]:
df.columns

Index(['Order ID', 'Restaurant Name', 'Location', 'Order Time',
       'Delivery Time', 'Delivery Duration (min)', 'Pizza Size', 'Pizza Type',
       'Toppings Count', 'Distance (km)', 'Traffic Level', 'Payment Method',
       'Is Peak Hour', 'Is Weekend', 'Delivery Efficiency (min/km)',
       'Topping Density', 'Order Month', 'Payment Category',
       'Estimated Duration (min)', 'Delay (min)', 'Is Delayed',
       'Pizza Complexity', 'Traffic Impact', 'Order Hour',
       'Restaurant Avg Time'],
      dtype='object')

In [10]:
# 컬럼명 변경
df.rename(columns={
    'Order ID': '주문 ID',
    'Restaurant Name': '레스토랑 이름',
    'Location': '위치',
    'Order Time': '주문 시간',
    'Delivery Time': '배달 완료 시간',
    'Delivery Duration (min)': '배달 소요 시간 (분)',
    'Pizza Size': '피자 사이즈',
    'Pizza Type': '피자 종류',
    'Toppings Count': '토핑 개수',
    'Distance (km)': '거리 (km)',
    'Traffic Level': '교통 수준',
    'Payment Method': '결제 방식',
    'Is Peak Hour': '피크 시간 여부',
    'Is Weekend': '주말 여부',
    'Delivery Efficiency (min/km)': '배달 효율 (분/km)',
    'Topping Density': '토핑 밀도',
    'Order Month': '주문 월',
    'Payment Category': '결제 분류',
    'Estimated Duration (min)': '예상 소요 시간 (분)',
    'Delay (min)': '지연 시간 (분)',
    'Is Delayed': '지연 여부',
    'Pizza Complexity': '피자 복잡도',
    'Traffic Impact': '교통 영향',
    'Order Hour': '주문 시각 (시 단위)',
    'Restaurant Avg Time': '레스토랑 평균 준비 시간'
}, inplace=True)

# 변경 결과 확인
print(df.columns)


Index(['주문 ID', '레스토랑 이름', '위치', '주문 시간', '배달 완료 시간', '배달 소요 시간 (분)', '피자 사이즈',
       '피자 종류', '토핑 개수', '거리 (km)', '교통 수준', '결제 방식', '피크 시간 여부', '주말 여부',
       '배달 효율 (분/km)', '토핑 밀도', '주문 월', '결제 분류', '예상 소요 시간 (분)', '지연 시간 (분)',
       '지연 여부', '피자 복잡도', '교통 영향', '주문 시각 (시 단위)', '레스토랑 평균 준비 시간'],
      dtype='object')


In [12]:
df['교통 영향']

0       2
1       3
2       1
3       2
4       3
       ..
999     2
1000    1
1001    2
1002    3
1003    2
Name: 교통 영향, Length: 1004, dtype: int64