# Improving Customer Churn Rate in Telecom: A Machine Learning Approach
by Alpha Team - Abe, Alfi, Hans

## Section 1. Business Understanding

### 1.1 Background
Perusahaan XYZ merupakan penyedia layanan telekomunikasi terkemuka yang dikenal karena pendekatannya yang inovatif dan berfokus pada pelanggan. Beroperasi di pasar yang sangat kompetitif, XYZ menawarkan beragam layanan seperti telepon seluler, internet broadband, dan layanan digital, yang ditujukan untuk pelanggan individu maupun bisnis. Meskipun memiliki posisi yang kuat di pasar, XYZ menghadapi tantangan besar terkait churn pelanggan, yaitu hilangnya pelanggan yang dapat berdampak langsung pada pendapatan dan pertumbuhan perusahaan. Dengan memanfaatkan analisis data dan wawasan pelanggan, XYZ berupaya mengurangi tingkat churn serta meningkatkan retensi pelanggan, guna menjaga keberlanjutan dan profitabilitas jangka panjang di industri telekomunikasi yang dinamis.

Churn pelanggan di industri telekomunikasi mengacu pada tingkat pelanggan yang berhenti menggunakan layanan dalam periode waktu tertentu. Fenomena ini sangat krusial karena berdampak langsung terhadap pendapatan dan laba perusahaan. Alasan pelanggan berhenti bisa bermacam-macam, mulai dari ketidakpuasan terhadap kualitas layanan, harga yang tidak kompetitif, layanan pelanggan yang buruk, hingga penawaran menarik dari pesaing. Memahami dan mengelola churn sangat penting agar perusahaan dapat menjaga basis pelanggan yang stabil serta kesehatan finansialnya (O'Brien & Downie, 2024; Britto, 2024; Luck, 2023; Investopedia Team, 2024).

### 1.2 Gap Analysis

<h3>Confusion Matrix - Rule-based Prediction</h3>
<table border="1" cellspacing="0" cellpadding="6">
  <tr>
    <th rowspan="2">Actual</th>
    <th colspan="2">Predicted</th>
  </tr>
  <tr>
    <th>No Churn</th>
    <th>Churn</th>
  </tr>
  <tr>
    <th>No Churn</th>
    <td>TN = 384</td>
    <td>FP = 339</td>
  </tr>
  <tr>
    <th>Churn</th>
    <td>FN = 45</td>
    <td>TP = 218</td>
  </tr>
</table>

<h3>Confusion Matrix - Model Prediction</h3>
<table border="1" cellspacing="0" cellpadding="6">
  <tr>
    <th rowspan="2">Actual</th>
    <th colspan="2">Predicted</th>
  </tr>
  <tr>
    <th>No Churn</th>
    <th>Churn</th>
  </tr>
  <tr>
    <th>No Churn</th>
    <td>TN = 421</td>
    <td>FP = 302</td>
  </tr>
  <tr>
    <th>Churn</th>
    <td>FN = 21</td>
    <td>TP = 242</td>
  </tr>
</table>

Proyek ini merupakan kelanjutan dari pengembangan yang dilakukan oleh Darmawan (2025). Pada proyek sebelumnya, peningkatan akurasi prediksi churn berhasil dicapai, terutama melalui peningkatan recall sekitar 9%, yang menghasilkan penghematan biaya tahunan sebesar $80.000 dibandingkan dengan sistem berbasis aturan (rule-based). Namun, fokus utama pada recall menyebabkan metrik lainnya kurang diperhatikan. Selain itu, churn rate yang dihasilkan oleh model berbasis machine learning tidak menunjukkan penurunan dibandingkan dengan sistem rule-based, yaitu tetap sebesar 26,67% (berdasarkan jumlah kasus True Positive dan False Negative). Di sisi lain, dataset yang digunakan dalam proyek ini telah mengalami pembaruan, sehingga diperlukan proses retraining dan pemeliharaan model secara menyeluruh.

### 1.3 Problem Statements
- Siapa saja pelanggan yang berisiko churn?
- Faktor apa saja yang paling memengaruhi churn pelanggan?
- Bagaimana cara perusahaan menurunkan churn dan meningkatkan retensi pelanggan?

### 1.4 Goals
- Mengembangkan model prediktif untuk mengklasifikasikan pelanggan apakah akan churn atau tidak.  
  + Dalam industri telekomunikasi, memprediksi pelanggan yang berpotensi churn melibatkan analisis data pelanggan untuk mengidentifikasi pola dan perilaku yang menunjukkan risiko tinggi berhenti berlangganan. Hal ini dapat dilakukan dengan model machine learning yang dilatih pada data historis. Model klasifikasi merupakan pendekatan umum untuk tujuan ini (Kumari et al., 2025; IQ Team, 2025). Dengan mengidentifikasi pelanggan yang berisiko, perusahaan dapat menerapkan strategi retensi yang lebih tepat sasaran.
- Mengidentifikasi fitur atau atribut utama yang memengaruhi churn.  
  + Memahami faktor utama yang menyebabkan pelanggan berhenti sangat penting untuk merancang strategi retensi yang efektif. Analisis feature importance dari model machine learning dapat mengungkap atribut mana yang paling berpengaruh terhadap kemungkinan churn. Misalnya, biaya bulanan yang tinggi atau pengalaman buruk dengan layanan pelanggan sering menjadi indikator kuat churn (Kumari et al., 2025; Bhatnagar & Srivastava, 2025). Dengan fokus pada faktor-faktor ini, perusahaan dapat mengoptimalkan layanannya dan meningkatkan kepuasan pelanggan.
- Memberikan rekomendasi yang dapat ditindaklanjuti untuk menurunkan churn.  
  + Untuk mengurangi churn dan meningkatkan retensi, perusahaan telekomunikasi dapat memanfaatkan wawasan dari model prediktif untuk menerapkan strategi yang ditargetkan, seperti menawarkan paket personalisasi, diskon khusus, atau peningkatan layanan pelanggan kepada mereka yang berisiko. Selain itu, menangani isu umum yang teridentifikasi sebagai penyebab churn—seperti biaya tinggi atau kualitas layanan yang buruk—dapat menurunkan churn secara keseluruhan. Dengan menggabungkan prediksi dan tindakan bisnis, perusahaan dapat memaksimalkan nilai pelanggan seumur hidup dan menurunkan biaya akuisisi, yang biasanya lebih tinggi dari biaya retensi (BlastChar, 2018; Bhatnagar & Srivastava, 2025).

### 1.5 Analytical Approach
Menurut Hermawan et al. (2024), perusahaan seperti TELCO umumnya menggunakan strategi berbasis aturan (*rule-based strategy*). Namun, pendekatan ini seringkali tidak mampu menangkap pola perilaku pelanggan yang lebih kompleks. Dengan kemajuan teknologi, algoritma machine learning menjadi semakin penting dalam menganalisis data dalam jumlah besar dan menemukan pola tersembunyi. Hal ini memungkinkan perusahaan untuk mengidentifikasi pelanggan yang berisiko churn dengan lebih akurat. Oleh karena itu, dalam kasus ini akan dibandingkan dua pendekatan, yaitu strategi berbasis aturan dan strategi berbasis machine learning. (TBA)

### 1.6 Metric Evaluation
- **Business Metric 1: Customer Acquisition Cost (CAC)**  
  + Biaya Akuisisi Pelanggan (CAC) adalah metrik penting yang mengukur total biaya yang dikeluarkan untuk mendapatkan pelanggan baru, termasuk biaya pemasaran dan penjualan. Metrik ini membantu perusahaan dalam mengevaluasi efisiensi dan profitabilitas, mengidentifikasi saluran yang paling efektif, serta membuat keputusan strategis untuk meningkatkan ROI pemasaran dan mempertahankan pelanggan (Corporate Finance Institute [CFI], t.t.). Menurut Yoga (2024), nilai CAC diasumsikan sebesar $200 per pelanggan.

- **Machine Learning Evaluation Metric 1: Recall**  
  + *Recall* merupakan metrik yang sangat penting dalam prediksi churn pelanggan karena mencerminkan seberapa baik model dapat menangkap pelanggan yang benar-benar akan churn. Metrik ini mendukung upaya retensi yang ditargetkan secara lebih akurat untuk melindungi pendapatan dan mendukung pertumbuhan bisnis.

- **Machine Learning Evaluation Metric 2: F2-Score**  
  + *F2-Score* memberikan bobot lebih besar pada *recall* dibandingkan *precision*, sehingga sangat cocok untuk kasus churn prediction. Dalam konteks ini, kehilangan pelanggan yang benar-benar akan churn (false negative) lebih berdampak dibandingkan salah menandai pelanggan setia sebagai akan churn (false positive). Oleh karena itu, *F2-Score* membantu menyeimbangkan performa model dengan fokus utama pada deteksi churn yang akurat demi mendukung strategi retensi.

### 1.7 Success Criteria
- Mencapai performa klasifikasi yang tinggi pada metrik recall atau F2-Score (>=80).
- Menghasilkan model yang dapat menurunkan Churn Rate, CAC dan CRC.
- Menyediakan wawasan yang dapat diinterpretasikan untuk mendukung pengambilan keputusan bisnis.
