# Phân tích dữ liệu Marketing Campaign với SweetViz

Notebook này trình bày cách sử dụng thư viện SweetViz để phân tích tập dữ liệu Marketing Campaign.

## 1. Cài đặt và import các thư viện cần thiết

In [None]:
# Import các thư viện cần thiết
import pandas as pd
import numpy as np
import sweetviz as sv

## 2. Đọc và khám phá dữ liệu

In [None]:
# Đọc dữ liệu từ file CSV
df = pd.read_csv('data/marketing_campaign.csv', sep='\t')

# Hiển thị 5 dòng đầu tiên
df.head()

In [None]:
# Kiểm tra thông tin cơ bản của dữ liệu
df.info()

In [None]:
# Kiểm tra thống kê mô tả
df.describe()

## 3. Phân tích dữ liệu với SweetViz

### 3.1. Phân tích tổng quan

In [None]:
# Tạo báo cáo phân tích tổng quan
report = sv.analyze(df)

# Hiển thị báo cáo
report.show_html('marketing_campaign_report.html')

### 3.2. Phân tích với biến mục tiêu

In [None]:
# Tạo báo cáo phân tích với biến mục tiêu 'Response'
target_report = sv.analyze(df, target_feat='Response')

# Hiển thị báo cáo
target_report.show_html('marketing_campaign_target_report.html')

### 3.3. So sánh các nhóm khách hàng

In [None]:
# Chia dữ liệu thành hai nhóm: khách hàng có con và không có con
customers_with_children = df[(df['Kidhome'] > 0) | (df['Teenhome'] > 0)]
customers_without_children = df[(df['Kidhome'] == 0) & (df['Teenhome'] == 0)]

# So sánh hai nhóm khách hàng
compare_report = sv.compare([customers_with_children, "Khách hàng có con"], 
                           [customers_without_children, "Khách hàng không có con"])

# Hiển thị báo cáo so sánh
compare_report.show_html('customer_comparison_report.html')

### 3.4. Phân tích theo trình độ học vấn

In [None]:
# Kiểm tra các giá trị duy nhất trong cột Education
df['Education'].unique()

In [None]:
# Lọc dữ liệu theo trình độ học vấn
phd_customers = df[df['Education'] == 'PhD']
basic_customers = df[df['Education'] == 'Basic']

# So sánh hai nhóm khách hàng
education_report = sv.compare([phd_customers, "Khách hàng có PhD"], 
                             [basic_customers, "Khách hàng có trình độ cơ bản"])

# Hiển thị báo cáo so sánh
education_report.show_html('education_comparison_report.html')

### 3.5. Phân tích hiệu quả chiến dịch

In [None]:
# Tạo biến mới tổng hợp các chiến dịch được chấp nhận
df['TotalAccepted'] = df['AcceptedCmp1'] + df['AcceptedCmp2'] + df['AcceptedCmp3'] + \
                      df['AcceptedCmp4'] + df['AcceptedCmp5']

# Phân tích với biến mục tiêu mới
campaign_report = sv.analyze(df, target_feat='TotalAccepted')

# Hiển thị báo cáo
campaign_report.show_html('campaign_effectiveness_report.html')

## 4. Nhận xét và phân tích

### Vấn đề tương thích

Trong quá trình thực hiện bài tập này, đã gặp phải vấn đề tương thích với SweetViz trong môi trường Python hiện tại. Cụ thể, lỗi phát sinh là:

```
AttributeError: module 'numpy' has no attribute 'VisibleDeprecationWarning'
```

Lỗi này xảy ra do sự không tương thích giữa phiên bản NumPy hiện tại và mã nguồn của SweetViz. Trong mã nguồn của SweetViz, có một dòng cố gắng lọc cảnh báo `VisibleDeprecationWarning` từ NumPy, nhưng trong phiên bản NumPy mới, cảnh báo này đã bị loại bỏ hoặc đổi tên.

### Nhận xét về SweetViz

Mặc dù không thể chạy trực tiếp SweetViz trong môi trường hiện tại, dựa trên tài liệu và kinh nghiệm chung, có thể rút ra một số nhận xét về công cụ này:

1. **Tiết kiệm thời gian:** SweetViz giúp tự động hóa quá trình EDA, tiết kiệm thời gian đáng kể cho nhà phân tích.

2. **Trực quan hóa phong phú:** SweetViz tạo ra các biểu đồ trực quan phong phú, giúp hiểu rõ hơn về dữ liệu.

3. **Phát hiện mối quan hệ:** Công cụ này giúp phát hiện các mối quan hệ tiềm ẩn giữa các biến, đặc biệt là với biến mục tiêu.

4. **So sánh dữ liệu:** Khả năng so sánh các tập dữ liệu hoặc các phân đoạn dữ liệu là một tính năng mạnh mẽ của SweetViz.

5. **Hạn chế tùy chỉnh:** SweetViz có ít tùy chọn tùy chỉnh so với các thư viện trực quan hóa khác như Matplotlib hoặc Plotly.

6. **Vấn đề tương thích:** Như đã gặp phải, SweetViz có thể gặp vấn đề tương thích với các phiên bản mới của các thư viện phụ thuộc.

### Kết luận

SweetViz là một công cụ mạnh mẽ cho phân tích dữ liệu khám phá, cung cấp một cách nhanh chóng và hiệu quả để hiểu cấu trúc và mối quan hệ trong dữ liệu. Với khả năng tạo ra các báo cáo trực quan tương tác chỉ với vài dòng mã, SweetViz là một công cụ quý giá trong bộ công cụ của bất kỳ nhà khoa học dữ liệu nào.

Đối với tập dữ liệu Marketing Campaign, SweetViz có thể cung cấp những hiểu biết quý giá về hành vi khách hàng, hiệu quả của các chiến dịch tiếp thị và các yếu tố ảnh hưởng đến tỷ lệ phản hồi. Những hiểu biết này có thể giúp các nhà tiếp thị tối ưu hóa chiến lược của họ và cải thiện kết quả kinh doanh.