In [10]:
# 필요한 라이브러리 불러오기
import pandas as pd

In [11]:
# ===================== 1. 데이터 로드 =====================
# 캠페인 데이터 파일 경로 설정
campaign_file_path = "../data/campaign_data.csv"

# CSV 파일을 데이터프레임으로 로드
df_campaign = pd.read_csv(campaign_file_path)

In [12]:
# ===================== 2. 데이터 확인 =====================
# 데이터프레임 기본 정보 출력
print("=== 캠페인 데이터 정보 ===")
print(df_campaign.info())  # 데이터프레임의 구조 및 컬럼 정보 확인

# 데이터의 상위 5개 행 출력
print("\n=== 캠페인 데이터 샘플 ===")
print(df_campaign.head())  # 데이터의 상위 5개 행을 출력하여 확인


=== 캠페인 데이터 정보 ===
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1000 entries, 0 to 999
Data columns (total 5 columns):
 #   Column         Non-Null Count  Dtype
---  ------         --------------  -----
 0   CampaignID     1000 non-null   int64
 1   CustomerID     1000 non-null   int64
 2   Participation  1000 non-null   int64
 3   Clicks         1000 non-null   int64
 4   Revenue        1000 non-null   int64
dtypes: int64(5)
memory usage: 39.2 KB
None

=== 캠페인 데이터 샘플 ===
   CampaignID  CustomerID  Participation  Clicks  Revenue
0           4           1              1       2      548
1           1           2              1      19      224
2           5           3              0       0        0
3           1           4              0       0        0
4           5           5              0       0        0


In [13]:
# ===================== 3. 결측치 처리 =====================
# 각 컬럼별 결측치 개수 확인
print("\n=== 결측치 개수 확인 ===")
print(df_campaign.isna().sum())  # 모든 컬럼의 결측치 개수 출력

# 결측치가 있는 경우 제거 (현재 데이터에는 결측치 없음)
df_campaign = df_campaign.dropna()


=== 결측치 개수 확인 ===
CampaignID       0
CustomerID       0
Participation    0
Clicks           0
Revenue          0
dtype: int64


In [14]:
df_campaign.head()

Unnamed: 0,CampaignID,CustomerID,Participation,Clicks,Revenue
0,4,1,1,2,548
1,1,2,1,19,224
2,5,3,0,0,0
3,1,4,0,0,0
4,5,5,0,0,0


In [15]:
# ===================== 4. 캠페인 참여율 분석 =====================
# 전체 캠페인 고객 수 계산
total_customers = df_campaign.shape[0]  # 전체 고객 수

# 캠페인 참여 고객 수 계산
participating_customers = df_campaign[df_campaign["Participation"] == 1].shape[0]  # 캠페인 참여 고객 수

# 캠페인 참여율 계산
participation_rate = (participating_customers / total_customers) * 100  # 백분율 변환

# 캠페인 참여율 출력
print("\n=== 캠페인 참여율 분석 ===")
print(f"전체 고객 수: {total_customers}명")
print(f"캠페인 참여 고객 수: {participating_customers}명")
print(f"캠페인 참여율: {participation_rate:.2f}%")


=== 캠페인 참여율 분석 ===
전체 고객 수: 1000명
캠페인 참여 고객 수: 474명
캠페인 참여율: 47.40%


In [16]:
# ===================== 5. 캠페인 참여 여부에 따른 매출 비교 =====================
# 캠페인 참여 고객과 비참여 고객의 평균 매출 계산
avg_revenue_participation = df_campaign[df_campaign["Participation"] == 1]["Revenue"].mean()  # 참여 고객 평균 매출
avg_revenue_non_participation = df_campaign[df_campaign["Participation"] == 0]["Revenue"].mean()  # 비참여 고객 평균 매출

# 평균 매출 비교 출력
print("\n=== 캠페인 참여 여부에 따른 평균 매출 비교 ===")
print(f"캠페인 참여 고객 평균 매출: {avg_revenue_participation:.2f}")
print(f"캠페인 비참여 고객 평균 매출: {avg_revenue_non_participation:.2f}")


=== 캠페인 참여 여부에 따른 평균 매출 비교 ===
캠페인 참여 고객 평균 매출: 553.61
캠페인 비참여 고객 평균 매출: 0.00


In [17]:
# ===================== 6. 캠페인별 평균 매출 분석 =====================
# 각 캠페인별 평균 매출 계산
df_campaign_revenue = df_campaign.groupby("CampaignID")["Revenue"].mean().reset_index()

# 컬럼명 변경 (캠페인별 평균 매출)
df_campaign_revenue.rename(columns={"Revenue": "AvgRevenue"}, inplace=True)

# 캠페인별 평균 매출 출력
print("\n=== 캠페인별 평균 매출 분석 ===")
df_campaign_revenue


=== 캠페인별 평균 매출 분석 ===


Unnamed: 0,CampaignID,AvgRevenue
0,1,242.723404
1,2,272.314286
2,3,279.441624
3,4,257.236111
4,5,259.164021


In [18]:
# ===================== 7. 캠페인별 클릭 수 및 매출 비교 =====================
# 각 캠페인별 평균 클릭 수 및 평균 매출 계산
df_campaign_clicks_revenue = df_campaign.groupby("CampaignID")[["Clicks", "Revenue"]].mean().reset_index()

# 컬럼명 변경 (캠페인별 평균 클릭 수 및 매출)
df_campaign_clicks_revenue.rename(columns={"Clicks": "AvgClicks", "Revenue": "AvgRevenue"}, inplace=True)

# 캠페인별 평균 클릭 수 및 매출 출력
print("\n=== 캠페인별 평균 클릭 수 및 매출 분석 ===")
df_campaign_clicks_revenue


=== 캠페인별 평균 클릭 수 및 매출 분석 ===


Unnamed: 0,CampaignID,AvgClicks,AvgRevenue
0,1,4.952128,242.723404
1,2,5.228571,272.314286
2,3,5.096447,279.441624
3,4,5.175926,257.236111
4,5,5.047619,259.164021
