In [2]:
from pymongo import MongoClient

# Kết nối với MongoDB
client = MongoClient("mongodb+srv://nguyenminhy7714:minhy112@cluster0.xxkrzas.mongodb.net")  
db = client["telco_churn"]

In [5]:
def search_by_customer_id(customer_id):
    # Pipeline để gộp dữ liệu từ các collection và hiển thị toàn bộ thông tin
    pipeline = [
        {"$match": {"customerID": customer_id}},
        {"$lookup": {
            "from": "contract_info",
            "localField": "customerID",
            "foreignField": "customerID",
            "as": "contract"
        }},
        {"$lookup": {
            "from": "internet_service",
            "localField": "customerID",
            "foreignField": "customerID",
            "as": "internet"
        }},
        {"$unwind": "$contract"},
        {"$unwind": "$internet"},
        {"$project": {
            "_id": 0,
            "contract._id": 0,
            "internet._id": 0
        }}
    ]

    # Thực thi truy vấn
    result = list(db.churn_info.aggregate(pipeline))
    
    if result:
        return result[0]  # Trả về thông tin khách hàng đầu tiên (nếu có)
    else:
        return None

# Tạo chỉ mục để tăng tốc độ tìm kiếm
db.churn_info.create_index("customerID")

'customerID_1'

In [6]:
customer_id = "7590-VHVEG"  # Thay bằng CustomerID thực tế
customer_info = search_by_customer_id(customer_id)

if customer_info:
    print("Thông tin khách hàng:")
    print(f"CustomerID: {customer_info['customerID']}")
    print(f"Churn: {customer_info['Churn']}")
    print("Contract Info:")
    for key, value in customer_info['contract'].items():
        print(f"  {key}: {value}")
    print("Internet Service Info:")
    for key, value in customer_info['internet'].items():
        print(f"  {key}: {value}")
else:
    print(f"Không tìm thấy khách hàng với CustomerID: {customer_id}")

Thông tin khách hàng:
CustomerID: 7590-VHVEG
Churn: No
Contract Info:
  customerID: 7590-VHVEG
  Contract: Month-to-month
  PaperlessBilling: Yes
  PaymentMethod: Electronic check
Internet Service Info:
  customerID: 7590-VHVEG
  InternetService: DSL
  OnlineSecurity: No
  OnlineBackup: Yes
  DeviceProtection: No
  TechSupport: No
  StreamingTV: No
  StreamingMovies: No


In [8]:
def filter_customers(payment_method=None, internet_service=None, churn=None):
    # Điều kiện lọc
    match_conditions = {}
    if payment_method:
        match_conditions["contract.PaymentMethod"] = payment_method
    if internet_service:
        match_conditions["internet.InternetService"] = internet_service
    if churn:
        match_conditions["Churn"] = churn

    # Pipeline để lọc và hiển thị toàn bộ thông tin
    pipeline = [
        {"$lookup": {
            "from": "contract_info",
            "localField": "customerID",
            "foreignField": "customerID",
            "as": "contract"
        }},
        {"$lookup": {
            "from": "internet_service",
            "localField": "customerID",
            "foreignField": "customerID",
            "as": "internet"
        }},
        {"$unwind": "$contract"},
        {"$unwind": "$internet"},
        {"$project": {
            "_id": 0,
            "contract._id": 0,
            "internet._id": 0
        }}
    ]

    # Thêm điều kiện lọc nếu có
    if match_conditions:
        pipeline.append({"$match": match_conditions})

    # Thực thi truy vấn
    results = list(db.churn_info.aggregate(pipeline))
    return results

In [11]:
filtered_customers = filter_customers(payment_method="Electronic check", internet_service="Fiber optic", churn="Yes")

if filtered_customers:
    print(f"Tìm thấy {len(filtered_customers)} khách hàng thỏa mãn điều kiện:")
    for i, customer in enumerate(filtered_customers, 1):
        print(f"\nKhách hàng {i}:")
        print(f"CustomerID: {customer['customerID']}")
        print(f"Churn: {customer['Churn']}")
        print("Contract Info:")
        for key, value in customer['contract'].items():
            print(f"  {key}: {value}")
        print("Internet Service Info:")
        for key, value in customer['internet'].items():
            print(f"  {key}: {value}")
else:
    print("Không tìm thấy khách hàng nào thỏa mãn điều kiện.")

Tìm thấy 849 khách hàng thỏa mãn điều kiện:

Khách hàng 1:
CustomerID: 9237-HQITU
Churn: Yes
Contract Info:
  customerID: 9237-HQITU
  Contract: Month-to-month
  PaperlessBilling: Yes
  PaymentMethod: Electronic check
Internet Service Info:
  customerID: 9237-HQITU
  InternetService: Fiber optic
  OnlineSecurity: No
  OnlineBackup: No
  DeviceProtection: No
  TechSupport: No
  StreamingTV: No
  StreamingMovies: No

Khách hàng 2:
CustomerID: 9305-CDSKC
Churn: Yes
Contract Info:
  customerID: 9305-CDSKC
  Contract: Month-to-month
  PaperlessBilling: Yes
  PaymentMethod: Electronic check
Internet Service Info:
  customerID: 9305-CDSKC
  InternetService: Fiber optic
  OnlineSecurity: No
  OnlineBackup: No
  DeviceProtection: Yes
  TechSupport: No
  StreamingTV: Yes
  StreamingMovies: Yes

Khách hàng 3:
CustomerID: 7892-POOKP
Churn: Yes
Contract Info:
  customerID: 7892-POOKP
  Contract: Month-to-month
  PaperlessBilling: Yes
  PaymentMethod: Electronic check
Internet Service Info:
  custom

In [10]:
def statistics():
    # Pipeline thống kê theo PaymentMethod, InternetService, Churn
    pipeline = [
        {"$lookup": {
            "from": "contract_info",
            "localField": "customerID",
            "foreignField": "customerID",
            "as": "contract"
        }},
        {"$lookup": {
            "from": "internet_service",
            "localField": "customerID",
            "foreignField": "customerID",
            "as": "internet"
        }},
        {"$unwind": "$contract"},
        {"$unwind": "$internet"},
        {"$group": {
            "_id": {
                "PaymentMethod": "$contract.PaymentMethod",
                "InternetService": "$internet.InternetService",
                "Churn": "$Churn"
            },
            "count": {"$sum": 1}
        }},
        {"$sort": {"count": -1}}
    ]

    # Thực thi truy vấn
    stats = list(db.churn_info.aggregate(pipeline))

    # Phân tích phương thức thanh toán phổ biến nhất
    payment_stats = list(db.contract_info.aggregate([
        {"$group": {"_id": "$PaymentMethod", "count": {"$sum": 1}}},
        {"$sort": {"count": -1}},
        {"$limit": 1}
    ]))
    popular_payment = payment_stats[0]["_id"] if payment_stats else "Không xác định"
    popular_count = payment_stats[0]["count"] if payment_stats else 0

    # Xác định loại dịch vụ Internet có tỷ lệ churn cao nhất
    churn_stats = list(db.churn_info.aggregate([
        {"$lookup": {
            "from": "internet_service",
            "localField": "customerID",
            "foreignField": "customerID",
            "as": "internet"
        }},
        {"$unwind": "$internet"},
        {"$match": {"Churn": "Yes"}},
        {"$group": {"_id": "$internet.InternetService", "count": {"$sum": 1}}},
        {"$sort": {"count": -1}},
        {"$limit": 1}
    ]))
    churn_service = churn_stats[0]["_id"] if churn_stats else "Không xác định"
    churn_count = churn_stats[0]["count"] if churn_stats else 0

    return stats, popular_payment, popular_count, churn_service, churn_count

# Ví dụ sử dụng
stats, popular_payment, popular_count, churn_service, churn_count = statistics()

# In kết quả thống kê
print("\nThống kê theo PaymentMethod, InternetService, Churn:")
for stat in stats:
    print(f"PaymentMethod: {stat['_id']['PaymentMethod']}, "
          f"InternetService: {stat['_id']['InternetService']}, "
          f"Churn: {stat['_id']['Churn']}, Count: {stat['count']}")

print(f"\nPhương thức thanh toán phổ biến nhất: {popular_payment} ({popular_count} khách hàng)")
print(f"Loại dịch vụ Internet có tỷ lệ churn cao nhất: {churn_service} ({churn_count} khách hàng rời bỏ)")


Thống kê theo PaymentMethod, InternetService, Churn:
PaymentMethod: Electronic check, InternetService: Fiber optic, Churn: Yes, Count: 849
PaymentMethod: Electronic check, InternetService: Fiber optic, Churn: No, Count: 746
PaymentMethod: Mailed check, InternetService: No, Churn: No, Count: 670
PaymentMethod: Credit card (automatic), InternetService: DSL, Churn: No, Count: 522
PaymentMethod: Bank transfer (automatic), InternetService: DSL, Churn: No, Count: 513
PaymentMethod: Mailed check, InternetService: DSL, Churn: No, Count: 486
PaymentMethod: Bank transfer (automatic), InternetService: Fiber optic, Churn: No, Count: 459
PaymentMethod: Credit card (automatic), InternetService: Fiber optic, Churn: No, Count: 446
PaymentMethod: Electronic check, InternetService: DSL, Churn: No, Count: 441
PaymentMethod: Credit card (automatic), InternetService: No, Churn: No, Count: 322
PaymentMethod: Bank transfer (automatic), InternetService: No, Churn: No, Count: 314
PaymentMethod: Electronic che