# **Introduction**

Sebelum sebuah data dapat dianalisis atau digunakan untuk mengambil keputusan kebijakan tentu data tersebut perlu untuk diekstraksi terlebih dahulu. <b>Ekstraksi data</b> adalah sebuah proses pengumpulan atau pengambilan jenis data yang berbeda dari berbagai sumber, banyak di antaranya mungkin tidak terorganisir dengan baik atau tidak terstruktur sama sekali. Proses ini memungkinkan untuk mengkonsolidasikan, memproses, dan menyempurnakan data sehingga nantinya dapat disimpan di lokasi terpusat untuk diubah atau diproses lebih lanjut.

Python sebagai salah satu <i>tools</i> yang <i>powerful</i> untuk pengolahan data menyediakan berbagai <i>library</i> untuk mendukung proses ekstraksi data. Salah satu library paling banyak digunakan adalah <b>pandas</b>.

Pandas memungkinkan untuk membaca data dari berbagai jenis ekstensi seperti data yang bersumber dari database (sql), <i>excel</i> (<b>.xls</b> atau <b>.xlsx</b>), <i>separated value file</i> (<b>.csv</b>, <b>.tsv</b>, dsb) lalu merubahnya menjadi satu format struktur data yang sama yang disebut <b>DataFrame</b>. DataFrame inilah yang nantinya dapat kita lakukan proses <b>Data Manipulation</b><br><br>

<p align="center">
<img src="https://drive.google.com/uc?export=view&id=18NW3gMMTJjkwwpZX5TXi9DTteXxGAoxa" width="600" height="300">
<p align="center"><b>Gambar 1. Proses Ekstraksi Data dengan <i>pandas</i></b></p>

<br><br>
<p align="right"><sup>docs : <i><a href="https://shorturl.at/xyZ69">https://pandas.pydata.org/docs/user_guide/io.html</i></sup></a></p>


##**1. First Step : Pandas**

Untuk dapat menggunakan library pandas pada python, perlu untuk mengimpor library tersebut dengan cara mengetikan sintaks berikut

<p align="center"><code><b>import pandas as pd</b></code></p>

lalu jalankan (<i>run</i>) program.

<br><br>
<p align="left"><sup>docs : <i><a href="https://shorturl.at/kzG06">https://pandas.pydata.org/docs/getting_started/install.html</i></sup></a></p>

### üë®‚Äçüíª Task 1.1

Ketikan kode `import pandas as pd` pada prompt dibawah ini lalu jalankan

In [None]:
# Write your code below here & exec!


### üë®‚Äçüíª Task 1.2

Fungsi pd.set_option() di pandas digunakan untuk mengubah pengaturan tampilan (display options) dan perilaku global pandas saat bekerja di notebook, terminal, atau saat mencetak DataFrame. Sebagai contoh :   <br><br>   

* **Menampilkan seluruh isi DataFrame tanpa pemotongan**<br>`pd.set_option('display.max_rows', None)` -> Menampilkan seluruh baris tanpa pemotongan<br>`pd.set_option('display.max_columns', None)` -> Menampilkan seluruh kolom tanpa pemotongan<br><br>

* **Mengatur lebar kolom saat ditampilkan**<br>`pd.set_option('display.max_colwidth', None)` -> lebar maksimal tiap kolom (karakter)<br><br>

* **Mengatur angka dibelakang koma**<br>`pd.set_option('display.float_format', '{:.2f}'.format)` -> Tampilkan 2 angka di belakang koma<br><br>

Coba eksekusi sintaks tersebut dan lihat perbedaan tampilannya!

docs : _https://pandas.pydata.org/docs/reference/api/pandas.set_option.html_

In [None]:
# Eksekusi kedua sintaks berikut
pd.set_option('display.max_columns', None)
pd.set_option('display.max_colwidth', None)
pd.set_option('display.float_format', '{:.2f}'.format)

# **Struktur Data Pandas**

* Terdapat dua struktur data utama pada library pandas yang disebut dengan Series dan DataFrame.
<p align="center">
<img src="https://datagy.io/wp-content/uploads/2022/12/Understanding-Pandas-Series-and-DataFrames-1024x576.png" width="550" height="289">
<p align="center"><b>Gambar 2. Series VS DataFrame</b></p>
<br>

* Gabungan beberapa Series yang mempunyai banyak baris yang sama dapat membentuk sebuah DataFrame atau berlaku sebaliknya pada sebuah DataFrame dapat dipecah (di-<i>slicing</i> satu kolom) membentuk sebuah Series.<br><br>

<p align="right"><sup>docs : <i><a href="https://shorturl.at/dezQY">http://pandas.pydata.org/docs/getting_started/intro_tutorials/01_table_oriented.html</i></sup></a></p>

##**2. Series**

* <a href="">Series</a> merupakan kolom dari sebuah tabel yang bersifat homogen atau mempunyai elemen dengan tipe data yang sejenis.

* Untuk membuat Series gunakan sintaks berikut

<p align="center"><code><b>pd.Series(data)</b></code></p>

<ul>
  data dapat berupa <i>array-like</i>, <i>Iterable</i>, <i>dict</i>, atau <i>scalar</i>
</ul>

<p align="right"><sup>docs : <i><a href="https://pandas.pydata.org/docs/reference/api/pandas.Series.html">https://pandas.pydata.org/docs/reference/api/pandas.Series.html</i></sup></a></p>



## **3. DataFrame**

* <a href="https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.html#pandas.DataFrame">DataFrame</a> adalah struktur data 2 dimensi yang terdiri dari baris dan kolom (seperti tabel) dan dapat menyimpan data dari berbagai jenis (termasuk karakter, bilangan bulat, bilangan real, data kategorikal, dan lainnya).

<p align="center">
<img src="https://www.w3resource.com/w3r_images/pandas-data-frame.svg" width="600" height="300">
<p align="center"><b>Gambar 2. DataFrame Pandas</b></p>
<br>

* <a href="https://pandas.pydata.org/docs/reference/api/pandas.Series.html#pandas.Series">Series</a> merupakan kolom dari sebuah tabel yang bersifat homogen atau mempunyai elemen dengan tipe data yang sejenis.


<p align="center">
<img src="https://datagy.io/wp-content/uploads/2022/12/Understanding-Pandas-Series-and-DataFrames-1024x576.png" width="550" height="300">
<p align="center"><b>Gambar 3. Series VS DataFrame</b></p>
<br>

* Gabungan beberapa Series yang mempunyai banyak baris yang sama dapat membentuk sebuah DataFrame atau berlaku sebaliknya pada sebuah DataFrame dapat dipecah (di-<i>slicing</i> satu kolom) membentuk sebuah Series.<br><br>




# **Data Manipulation**

Data Manipulation adalah sebuah metode pengorganisasian data agar lebih mudah dibaca, terstruktur dan agar lebih mudah diolah untuk kebutuhan lain kedepannya. Beberapa hal yang biasa dilakukan saat data manipulation adalah sebagai berikut :


<ul>1Ô∏è‚É£ Column selections</ul>
<ul>2Ô∏è‚É£ Filter the data</ul>
<ul>3Ô∏è‚É£ Create a new column or change it</ul>
<ul>4Ô∏è‚É£ Drop a column</ul>
<ul>5Ô∏è‚É£ Apply custom functions</ul>
<ul>6Ô∏è‚É£ Join / Merge the data</ul>
<ul>7Ô∏è‚É£ etc</ul>


## **4. Data Extraction**

* Dalam konteks data extraction, Pandas dapat digunakan untuk membaca data dari berbagai sumber, seperti file CSV, Excel, SQL database, dan lainnya, dan mengubahnya menjadi DataFrames untuk analisis lebih lanjut.

* Beberapa fungsi dan metode Pandas yang umum digunakan untuk data extraction adalah sebagai berikut:

<ul>
<code><a href="https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html">pd.read_csv()</a></code>: Digunakan untuk membaca data dari file CSV dan mengonversinya menjadi DataFrame.

<code><a href="https://pandas.pydata.org/docs/reference/api/pandas.read_excel.html">pd.read_excel()</a></code>: Membaca data dari file Excel dan membuat DataFrame dari lembar kerja atau tabel tertentu.

<code><a href="https://pandas.pydata.org/docs/reference/api/pandas.read_sql.html">pd.read_sql()</a></code>: Mengambil data dari basis data SQL menggunakan SQL query dan menyimpannya dalam bentuk DataFrame.
</ul>
<br>

_docs : https://pandas.pydata.org/docs/reference/io.html_


### üë®‚Äçüíª Task 4.1

Untuk melakukan proses ekstraksi data, lakukan instruksi berikut :     

1.   Pada bagian kiri google colab, klik **Files** üóÇÔ∏è
2.   Lalu klik **Upload to session storage** ‚Üë
3.   Pilih file excel dengan judul **Data Telco Churn.xlsx** lalu upload
4.   Tunggu hingga file terunggah

### üë®‚Äçüíª Task 4.2

Setelah file berhasil terunggah, lakukan pembacaan data dengan pandas. Eksekusi perintah

<p align="center"><code><b>pd.read_excel('nama_file_excel')</b></code></p>

lalu assign ke DataFrame yang diberi nama **data_telco**
<br><br>

docs : _https://pandas.pydata.org/docs/reference/api/pandas.read_excel.html_

In [2]:
# Task 4.2 - Ekstraksi data excel dengan pandas
url = 'https://raw.githubusercontent.com/bachtiyarma/Material/main/Dataset/Telco-Churn/Data%20Telco%20Churned.xlsx'


Unnamed: 0,customer_id,open_date,gender,age,married,number_of_dependents,satisfaction_score,cltv,number_of_referrals,tenure_in_months,...,phone_service,internet_service,internet_type,contract,payment_method,monthly_charge,total_revenue,customer_status,churn_category,churn_reason
0,1989-PRJHP,05/08/2023,Male,75.0,Yes,0.0,1,2377,1.0,27.0,...,Yes,Yes,Fiber Optic,Month-to-Month,Bank Withdrawal,"$ 75,5","$ 2180,15",Churned,Competitor,Competitor had better devices
1,7216-EWTRS,07/04/2025,Female,78.0,Yes,0.0,1,3128,4.0,1.0,...,Yes,Yes,Fiber Optic,Month-to-Month,Bank Withdrawal,"$ 100,8","$ 118,15",Churned,Attitude,Attitude of service provider
2,3269-ATYWD,05/14/2022,Male,79.0,No,0.0,1,4892,0.0,39.0,...,Yes,Yes,Fiber Optic,Month-to-Month,Bank Withdrawal,"$ 95,65","$ 5544,32",Churned,Other,Don't know
3,8510-AWCXC,07/20/2024,,,,,1,3269,,,...,,,,,,,,Churned,Attitude,Attitude of support person
4,9907-SWKKF,07/12/2025,Female,69.0,No,0.0,1,4842,0.0,1.0,...,No,Yes,DSL,Month-to-Month,Credit Card,"$ 25,05","$ 25,05",Churned,Competitor,Competitor had better devices
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
7041,0856-NAOES,02/13/2025,Male,29.0,No,0.0,5,2191,0.0,6.0,...,Yes,Yes,DSL,Month-to-Month,Credit Card,"$ 60,9","$ 688,12",Stayed,,
7042,6549-BTYPG,08/14/2020,Female,19.0,Yes,0.0,5,5784,5.0,60.0,...,No,Yes,DSL,Two Year,Credit Card,"$ 60,8","$ 3603,45",Stayed,,
7043,5146-YYFRZ,01/12/2020,Male,32.0,No,0.0,5,6212,0.0,67.0,...,Yes,No,,Two Year,Bank Withdrawal,"$ 19,95","$ 2338,19",Stayed,,
7044,5351-QESIO,07/20/2025,Male,64.0,No,2.0,5,4276,0.0,1.0,...,No,Yes,Cable,Month-to-Month,Mailed Check,"$ 24,2","$ 24,2",Joined,,


### üë®‚Äçüíª Task 4.3

Tampilkan data hasil ekstraksi dengan mengeksekusi perintah

<p align="center"><code><b>display(nama_dataframe)</b></code></p>

Ketika dieksekusi maka akan muncul tampilan seperti berikut

<img src="https://raw.githubusercontent.com/bachtiyarma/Material/main/Image/Materi-Python/pandas_display_df.png" width="100%">

In [None]:
# Task 4.3 - Tampilkan DataFrame


Unnamed: 0,customer_id,open_date,gender,age,married,number_of_dependents,satisfaction_score,customer_status,cltv,number_of_referrals,...,offer,phone_service,internet_service,internet_type,contract,payment_method,monthly_charge,total_revenue,churn_category,churn_reason
0,1989-PRJHP,2023-05-08,Male,75.0,Yes,0.0,1,CHURNED,2377,1.0,...,,Yes,Yes,Fiber Optic,Month-to-Month,Bank Withdrawal,"$ 75,5",2180.15,Competitor,Competitor had better devices
1,7216-EWTRS,2025-07-04,Female,78.0,Yes,0.0,1,CHURNED,3128,4.0,...,,Yes,Yes,Fiber Optic,Month-to-Month,Bank Withdrawal,"$ 100,8",118.15,Attitude,Attitude of service provider
2,3269-ATYWD,2022-05-14,Male,79.0,No,0.0,1,CHURNED,4892,0.0,...,Offer C,Yes,Yes,Fiber Optic,Month-to-Month,Bank Withdrawal,"$ 95,65",5544.32,Other,Don't know
3,8510-AWCXC,2024-07-20,,,,,1,CHURNED,3269,,...,,,,,,,,,Attitude,Attitude of support person
4,9907-SWKKF,2025-07-12,Female,69.0,No,0.0,1,CHURNED,4842,0.0,...,Offer E,No,Yes,DSL,Month-to-Month,Credit Card,"$ 25,05",25.05,Competitor,Competitor had better devices
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
7041,0856-NAOES,2025-02-13,Male,29.0,No,0.0,5,STAYED,2191,0.0,...,Offer E,Yes,Yes,DSL,Month-to-Month,Credit Card,"$ 60,9",688.12,,
7042,6549-BTYPG,2020-08-14,Female,19.0,Yes,0.0,5,STAYED,5784,5.0,...,,No,Yes,DSL,Two Year,Credit Card,"$ 60,8",3603.45,,
7043,5146-YYFRZ,2020-01-12,Male,32.0,No,0.0,5,STAYED,6212,0.0,...,Offer A,Yes,No,,Two Year,Bank Withdrawal,"$ 19,95",2338.19,,
7044,5351-QESIO,2025-07-20,Male,64.0,No,2.0,5,JOINED,4276,0.0,...,Offer E,No,Yes,Cable,Month-to-Month,Mailed Check,"$ 24,2",24.20,,


## **5. Parts Of DataFrame**

Untuk lebih memahami objek DataFrame, perlu diketahui bahwa DataFrame terdiri dari tiga komponen sebagai atribut berikut :

<ul>1Ô∏è‚É£ DataFrame<b>.values</b> : Nilai - nilai yang tertera pada DataFrame</ul>
<ul>2Ô∏è‚É£ DataFrame<b>.columns</b> : Nama kolom yang ada pada DataFrame</ul>
<ul>3Ô∏è‚É£ DataFrame<b>.index</b>   : Nama atau nomor index pada DataFrame</ul>



### üë®‚Äçüíª Task 5.1

Pada DataFrame yang telah dibuat pada Task 4 (**data_telco**), coba tampilkan list nama kolomnya!

*Expected Output :*    

```
Index(['customer_id', 'open_date', 'gender', 'age', 'married',
       'number_of_dependents', 'satisfaction_score', 'customer_status', 'cltv',
       'number_of_referrals', 'tenure_in_months', 'offer', 'phone_service',
       'internet_service', 'internet_type', 'contract', 'payment_method',
       'monthly_charge', 'total_revenue', 'churn_category', 'churn_reason'],
      dtype='object')
```



In [None]:
# Task 5.1 - Tampilkan nama kolom


Index(['customer_id', 'open_date', 'gender', 'age', 'married',
       'number_of_dependents', 'satisfaction_score', 'customer_status', 'cltv',
       'number_of_referrals', 'tenure_in_months', 'offer', 'phone_service',
       'internet_service', 'internet_type', 'contract', 'payment_method',
       'monthly_charge', 'total_revenue', 'churn_category', 'churn_reason'],
      dtype='object')


### üë®‚Äçüíª Task 5.2

Pada DataFrame yang telah dibuat pada Task 4 (**data_telco**), tampilkan juga indexnya!

*Expected Output :*    

```
RangeIndex(start=0, stop=7046, step=1)
```

In [None]:
# Task 5.2 - Tampilkan index baris


RangeIndex(start=0, stop=7046, step=1)


## **6. Inspecting Data Information**

* Untuk dapat menginspeksi informasi umum pada data dapat menggunakan sintaks berikut

<p align="center"><code><b>DataFrame.info()</b></code></p>

<ul>Ketika dijalankan, sintaks tersebut akan menghasilkan output informasi umum pada data seperti banyak kolom, nama kolom beserta tipe data dan jumlah data tak kosong (<i>non-null value</i>)</ul><br>

docs : _https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.info.html_

### üë®‚Äçüíª Task 6.1

Pada DataFrame **data_telco**, inspeksi informasi umumnya! Setelah itu coba uraikan informasi apa yang bisa didapatkan setelah melakukan inspeksi informasi umum pada data tersebut!

*Expected Output :*  

```
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7046 entries, 0 to 7045
Data columns (total 21 columns):
 #   Column                Non-Null Count  Dtype         
---  ------                --------------  -----         
 0   customer_id           7046 non-null   object        
 1   open_date             7046 non-null   datetime64[ns]
 2   gender                7044 non-null   object        
 3   age                   7044 non-null   float64       
 4   married               7044 non-null   object        
 5   number_of_dependents  7044 non-null   float64       
 6   satisfaction_score    7046 non-null   int64         
 7   customer_status       7046 non-null   object        
 8   cltv                  7046 non-null   int64         
 9   number_of_referrals   7044 non-null   float64       
 10  tenure_in_months      7044 non-null   float64       
 11  offer                 3166 non-null   object        
 12  phone_service         7044 non-null   object        
 13  internet_service      7044 non-null   object        
 14  internet_type         5518 non-null   object        
 15  contract              7044 non-null   object        
 16  payment_method        7044 non-null   object        
 17  monthly_charge        7044 non-null   object        
 18  total_revenue         7044 non-null   object        
 19  churn_category        1870 non-null   object        
 20  churn_reason          1870 non-null   object        
dtypes: datetime64[ns](1), float64(4), int64(2), object(14)
memory usage: 1.1+ MB
```



In [None]:
# Task 6.1 - Tampilkan informasi umum pada data_telco


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7046 entries, 0 to 7045
Data columns (total 21 columns):
 #   Column                Non-Null Count  Dtype         
---  ------                --------------  -----         
 0   customer_id           7046 non-null   object        
 1   open_date             7046 non-null   datetime64[ns]
 2   gender                7044 non-null   object        
 3   age                   7044 non-null   float64       
 4   married               7044 non-null   object        
 5   number_of_dependents  7044 non-null   float64       
 6   satisfaction_score    7046 non-null   int64         
 7   customer_status       7046 non-null   object        
 8   cltv                  7046 non-null   int64         
 9   number_of_referrals   7044 non-null   float64       
 10  tenure_in_months      7044 non-null   float64       
 11  offer                 3166 non-null   object        
 12  phone_service         7044 non-null   object        
 13  internet_service  

## **7. Mengakses Series**

* Ketika ingin mengakses Series dari DataFrame dengan tujuan untuk mengambil, memproses, atau menganalisis data di satu kolom tertentu gunakan aturan berikut

<p align="center"><code><b>DataFrame[nama_kolom]</b></code></p>

### üë®‚Äçüíª Task 7.1

Pada DataFrame **data_telco**, tampilkan kolom customer_id saja

*Expected Output :*

<img src="https://raw.githubusercontent.com/bachtiyarma/Material/main/Image/Materi-Python/pandas_display_series.png" width="15%">

In [None]:
# Task 7.1 - Akses kolom customer_id pada data_telco


Unnamed: 0,customer_id
0,1989-PRJHP
1,7216-EWTRS
2,3269-ATYWD
3,8510-AWCXC
4,9907-SWKKF
...,...
7041,0856-NAOES
7042,6549-BTYPG
7043,5146-YYFRZ
7044,5351-QESIO


In [None]:
# Gunakan fungsi type untuk memeriksa tipe data
display(type(data_telco['customer_id']))

## **8. Mengakses Beberapa Kolom**

* Untuk mengakses beberapa kolom terpilih sekaligus, gunakan cara berikut

<p align="center"><code><b>DataFrame[list_nama_kolom]</b></code></p>

<ul><i>Note : Definisikan dulu kolom yang ingin diakses</i></ul>

### üë®‚Äçüíª Task 8.1

Pada DataFrame **data_telco**, tampilkan kolom *customer_id, gender, age* dan *married* saja untuk mendapatkan gambaran demografi pelanggan

*Expected Output :*

<img src="https://raw.githubusercontent.com/bachtiyarma/Material/main/Image/Materi-Python/pandas_display_selected_cols.png" width="30%">

In [None]:
# Task 8.1 - Tampilkan beberapa kolom yang disebutkan

# Definsikan kolom yang akan ditampilkan
selected_cols = ...

# Tampilkan hasilnya
...

Unnamed: 0,customer_id,gender,age,married
0,1989-PRJHP,Male,75.0,Yes
1,7216-EWTRS,Female,78.0,Yes
2,3269-ATYWD,Male,79.0,No
3,8510-AWCXC,,,
4,9907-SWKKF,Female,69.0,No
...,...,...,...,...
7041,0856-NAOES,Male,29.0,No
7042,6549-BTYPG,Female,19.0,Yes
7043,5146-YYFRZ,Male,32.0,No
7044,5351-QESIO,Male,64.0,No


## **9. Menambahkan Kolom Baru**

* Menambahkan kolom baru pada DataFrame berguna untuk menyimpan hasil perhitungan, transformasi, atau informasi tambahan yang berasal dari data yang sudah ada atau dari sumber lain. Untuk menambahkan kolom baru dengan operasi tertentu gunakan aturan

<p align="center"><code><b>DataFrame[nama_kolom_baru] = ...</b></code></p><br>

<ul><li>Operasi yang bisa dilakukan untuk tipe data <b>numerik</b><br></li>

<table>
<thead>
<tr>
<th>Operator / Fungsi</th>
<th>Deskripsi</th>
<th>Contoh</th>
</tr>
</thead>
<tbody>

<tr>
<td><code>+</code> atau <code>add()</code></td>
<td>Menjumlahkan nilai antar Series/DataFrame (atau dengan skalar)</td>
<td><code>s1 + s2</code> atau <code>s1.add(s2)</code></td>
</tr>

<tr>
<td><code>-</code> atau <code>sub()</code></td>
<td>Mengurangkan nilai antar Series/DataFrame (atau dengan skalar)</td>
<td><code>s1 - s2</code> atau <code>s1.sub(s2)</code></td>
</tr>

<tr>
<td><code>*</code> atau <code>mul()</code></td>
<td>Mengalikan nilai antar Series/DataFrame (atau dengan skalar)</td>
<td><code>s1 * s2</code> atau <code>s1.mul(s2)</code></td>
</tr>

<tr>
<td><code>/</code> atau <code>truediv()</code></td>
<td>Membagi nilai antar Series/DataFrame (hasil float)</td>
<td><code>s1 / s2</code> atau <code>s1.truediv(s2)</code></td>
</tr>

<tr>
<td><code>//</code> atau <code>floordiv()</code></td>
<td>Pembagian dengan pembulatan ke bawah (integer division)</td>
<td><code>s1 // s2</code> atau <code>s1.floordiv(s2)</code></td>
</tr>

<tr>
<td><code>%</code> atau <code>mod()</code></td>
<td>Mengambil sisa hasil bagi (modulus)</td>
<td><code>s1 % s2</code> atau <code>s1.mod(s2)</code></td>
</tr>

<tr>
<td><code>**</code> atau <code>pow()</code></td>
<td>Pangkat (eksponensial)</td>
<td><code>s1 ** 2</code> atau <code>s1.pow(2)</code></td>
</tr>

<tr>
<td><code>abs()</code></td>
<td>Mengambil nilai absolut</td>
<td><code>s.abs()</code></td>
</tr>

<tr>
<td><code>round(decimals=n)</code></td>
<td>Membulatkan angka ke jumlah desimal tertentu</td>
<td><code>s.round(2)</code></td>
</tr>

<tr>
<td><code>mean()</code></td>
<td>Menghitung rata-rata</td>
<td><code>s.mean()</code></td>
</tr>

<tr>
<td><code>sum()</code></td>
<td>Menjumlahkan semua nilai</td>
<td><code>s.sum()</code></td>
</tr>

<tr>
<td><code>prod()</code></td>
<td>Mengalikan semua nilai</td>
<td><code>s.prod()</code></td>
</tr>

<tr>
<td><code>min()</code> / <code>max()</code></td>
<td>Mengambil nilai minimum / maksimum</td>
<td><code>s.min()</code> / <code>s.max()</code></td>
</tr>

<tr>
<td><code>cumsum()</code></td>
<td>Menjumlahkan kumulatif</td>
<td><code>s.cumsum()</code></td>
</tr>

<tr>
<td><code>cumprod()</code></td>
<td>Perkalian kumulatif</td>
<td><code>s.cumprod()</code></td>
</tr>

<tr>
<td><code>diff(periods=n)</code></td>
<td>Selisih antar elemen (default 1 baris)</td>
<td><code>s.diff()</code></td>
</tr>

<tr>
<td><code>pct_change()</code></td>
<td>Menghitung persentase perubahan antar nilai</td>
<td><code>s.pct_change()</code></td>
</tr>

<tr>
<td><code>clip(lower, upper)</code></td>
<td>Memotong nilai di luar rentang tertentu</td>
<td><code>s.clip(0, 100)</code></td>
</tr>

<tr>
<td><code>add(other, fill_value=0)</code></td>
<td>Menjumlahkan sambil mengganti nilai NaN dengan default</td>
<td><code>s1.add(s2, fill_value=0)</code></td>
</tr>

</tbody>
</table>
</ul>
<br>
<ul><li>Operasi yang bisa dilakukan untuk tipe data <b>string</b><br></li>
<table>
<thead>
<tr>
<th>Fungsi</th>
<th>Deskripsi</th>
<th>Contoh</th>
</tr>
</thead>
<tbody>

<tr>
<td><code>str.lower()</code></td>
<td>Mengubah semua huruf menjadi huruf kecil</td>
<td><code>s.str.lower()</code> ‚Üí <code>'abc'</code></td>
</tr>

<tr>
<td><code>str.upper()</code></td>
<td>Mengubah semua huruf menjadi huruf besar</td>
<td><code>s.str.upper()</code> ‚Üí <code>'ABC'</code></td>
</tr>

<tr>
<td><code>str.title()</code></td>
<td>Mengubah huruf pertama tiap kata menjadi kapital</td>
<td><code>'hello world'</code> ‚Üí <code>'Hello World'</code></td>
</tr>

<tr>
<td><code>str.strip()</code></td>
<td>Menghapus spasi di awal dan akhir string</td>
<td><code>'  data '</code> ‚Üí <code>'data'</code></td>
</tr>

<tr>
<td><code>str.replace(pat, repl)</code></td>
<td>Mengganti teks dengan teks lain</td>
<td><code>s.str.replace('a', 'o')</code></td>
</tr>

<tr>
<td><code>str.contains(pat)</code></td>
<td>Memeriksa apakah string mengandung pola tertentu (regex)</td>
<td><code>s.str.contains('abc')</code></td>
</tr>

<tr>
<td><code>str.startswith(pat)</code></td>
<td>Memeriksa apakah string diawali pola tertentu</td>
<td><code>s.str.startswith('A')</code></td>
</tr>

<tr>
<td><code>str.endswith(pat)</code></td>
<td>Memeriksa apakah string diakhiri pola tertentu</td>
<td><code>s.str.endswith('.com')</code></td>
</tr>

<tr>
<td><code>str.len()</code></td>
<td>Menghitung panjang tiap string</td>
<td><code>s.str.len()</code> ‚Üí <code>[5, 3, 7]</code></td>
</tr>

<tr>
<td><code>str.split(pat)</code></td>
<td>Memisahkan string berdasarkan delimiter</td>
<td><code>'a,b,c'</code> ‚Üí <code>['a','b','c']</code></td>
</tr>

<tr>
<td><code>str.cat(sep=' ')</code></td>
<td>Menggabungkan string dengan pemisah tertentu</td>
<td><code>s.str.cat(sep=' ')</code></td>
</tr>

<tr>
<td><code>str.extract(pat)</code></td>
<td>Menangkap pola dengan regex dan hasilkan kolom baru</td>
<td><code>s.str.extract(r'(\d+)')</code></td>
</tr>

<tr>
<td><code>str.findall(pat)</code></td>
<td>Menemukan semua kecocokan pola (regex) di setiap elemen</td>
<td><code>s.str.findall(r'\d+')</code></td>
</tr>

<tr>
<td><code>str.zfill(width)</code></td>
<td>Menambahkan nol di depan hingga panjang tertentu</td>
<td><code>'42'</code> ‚Üí <code>'00042'</code></td>
</tr>

<tr>
<td><code>str.pad(width, fillchar=' ')</code></td>
<td>Menambahkan karakter tertentu di kiri/kanan</td>
<td><code>'A'</code> ‚Üí <code>'  A  '</code></td>
</tr>

<tr>
<td><code>str.get(i)</code></td>
<td>Mengambil elemen indeks ke-i dari list/string</td>
<td><code>s.str.get(0)</code></td>
</tr>

<tr>
<td><code>str.join(sep)</code></td>
<td>Menggabungkan elemen list menjadi string</td>
<td><code>s.str.join('-')</code> ‚Üí <code>'a-b-c'</code></td>
</tr>

<tr>
<td><code>str.replace(rgx, repl, regex=True)</code></td>
<td>Mengganti teks menggunakan ekspresi reguler</td>
<td><code>s.str.replace(r'\d+', '', regex=True)</code></td>
</tr>

<tr>
<td><code>str.wrap(width)</code></td>
<td>Membungkus teks menjadi beberapa baris</td>
<td><code>s.str.wrap(10)</code></td>
</tr>

<tr>
<td><code>str.normalize('NFKD')</code></td>
<td>Menormalkan karakter Unicode</td>
<td><code>s.str.normalize('NFKD')</code></td>
</tr>

</tbody>
</table>
</ul>


### üë®‚Äçüíª Task 9.1

Asumsikan bahwa rataan pendapatan bulanan yang diperoleh perusahaan telco dihitung berdasarkan rumus

$$
\text{avg_revenue_in_month} = \frac{\text{total_revenue}}{\text{tenure_in_month}}
$$

Tambahkan kolom tersebut ke dalam data_telco, lalu tampilkan kolom customer_id, tenure_in_months, total_revenue, avg_revenue_in_month pada data_telco!

*Expected Output :*

<img src="https://raw.githubusercontent.com/bachtiyarma/Material/main/Image/Materi-Python/pandas_display_add_newcol.png" width="50%">


In [None]:
# Task 9.1 - Tambahkan kolom avg_revenue_in_month

# Lakukan perhitungan


# Tampilkan hasilnya


Unnamed: 0,customer_id,open_date,gender,age,married,number_of_dependents,satisfaction_score,customer_status,cltv,number_of_referrals,tenure_in_months,offer,phone_service,internet_service,internet_type,contract,payment_method,monthly_charge,total_revenue,churn_category,churn_reason,avg_revenue_in_month
0,1989-PRJHP,2023-05-08,Male,75.00,Yes,0.00,1,CHURNED,2377,1.00,27.00,,Yes,Yes,Fiber Optic,Month-to-Month,Bank Withdrawal,"$ 75,5",2180.15,Competitor,Competitor had better devices,80.75
1,7216-EWTRS,2025-07-04,Female,78.00,Yes,0.00,1,CHURNED,3128,4.00,1.00,,Yes,Yes,Fiber Optic,Month-to-Month,Bank Withdrawal,"$ 100,8",118.15,Attitude,Attitude of service provider,118.15
2,3269-ATYWD,2022-05-14,Male,79.00,No,0.00,1,CHURNED,4892,0.00,39.00,Offer C,Yes,Yes,Fiber Optic,Month-to-Month,Bank Withdrawal,"$ 95,65",5544.32,Other,Don't know,142.16
3,8510-AWCXC,2024-07-20,,,,,1,CHURNED,3269,,,,,,,,,,,Attitude,Attitude of support person,
4,9907-SWKKF,2025-07-12,Female,69.00,No,0.00,1,CHURNED,4842,0.00,1.00,Offer E,No,Yes,DSL,Month-to-Month,Credit Card,"$ 25,05",25.05,Competitor,Competitor had better devices,25.05
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
7041,0856-NAOES,2025-02-13,Male,29.00,No,0.00,5,STAYED,2191,0.00,6.00,Offer E,Yes,Yes,DSL,Month-to-Month,Credit Card,"$ 60,9",688.12,,,114.69
7042,6549-BTYPG,2020-08-14,Female,19.00,Yes,0.00,5,STAYED,5784,5.00,60.00,,No,Yes,DSL,Two Year,Credit Card,"$ 60,8",3603.45,,,60.06
7043,5146-YYFRZ,2020-01-12,Male,32.00,No,0.00,5,STAYED,6212,0.00,67.00,Offer A,Yes,No,,Two Year,Bank Withdrawal,"$ 19,95",2338.19,,,34.90
7044,5351-QESIO,2025-07-20,Male,64.00,No,2.00,5,JOINED,4276,0.00,1.00,Offer E,No,Yes,Cable,Month-to-Month,Mailed Check,"$ 24,2",24.20,,,24.20


### üë®‚Äçüíª Task 9.2

**Apakah bisa mengubah nilai dari kolom yang sudah ada (_exsiting column_)?**

Pada kolom customer_status coba ubah penulisannya menjadi <a href="https://en.wikipedia.org/wiki/Letter_case"><i>uppercase</i></a>, lakukan *assignment* ke kolom yang sama dan tampilkan hasil perubahannya!

*Expected Output :*

<img src="https://raw.githubusercontent.com/bachtiyarma/Material/main/Image/Materi-Python/pandas_display_str_upper.png" width="15%">


In [None]:
# Task 9.2 - Uppercase pada kolom customer_status

# Ubah nilainya

# Tampilkan hasilnya


Unnamed: 0,customer_id,open_date,gender,age,married,number_of_dependents,satisfaction_score,customer_status,cltv,number_of_referrals,tenure_in_months,offer,phone_service,internet_service,internet_type,contract,payment_method,monthly_charge,total_revenue,avg_revenue_in_month,churn_category,churn_reason
0,1989-PRJHP,2023-05-08,Male,75.00,Yes,0.00,1,CHURNED,2377,1.00,27.00,,Yes,Yes,Fiber Optic,Month-to-Month,Bank Withdrawal,"$ 75,5",2180.15,80.75,Competitor,Competitor had better devices
1,7216-EWTRS,2025-07-04,Female,78.00,Yes,0.00,1,CHURNED,3128,4.00,1.00,,Yes,Yes,Fiber Optic,Month-to-Month,Bank Withdrawal,"$ 100,8",118.15,118.15,Attitude,Attitude of service provider
2,3269-ATYWD,2022-05-14,Male,79.00,No,0.00,1,CHURNED,4892,0.00,39.00,Offer C,Yes,Yes,Fiber Optic,Month-to-Month,Bank Withdrawal,"$ 95,65",5544.32,142.16,Other,Don't know
3,8510-AWCXC,2024-07-20,,,,,1,CHURNED,3269,,,,,,,,,,,,Attitude,Attitude of support person
4,9907-SWKKF,2025-07-12,Female,69.00,No,0.00,1,CHURNED,4842,0.00,1.00,Offer E,No,Yes,DSL,Month-to-Month,Credit Card,"$ 25,05",25.05,25.05,Competitor,Competitor had better devices
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
7041,0856-NAOES,2025-02-13,Male,29.00,No,0.00,5,STAYED,2191,0.00,6.00,Offer E,Yes,Yes,DSL,Month-to-Month,Credit Card,"$ 60,9",688.12,114.69,,
7042,6549-BTYPG,2020-08-14,Female,19.00,Yes,0.00,5,STAYED,5784,5.00,60.00,,No,Yes,DSL,Two Year,Credit Card,"$ 60,8",3603.45,60.06,,
7043,5146-YYFRZ,2020-01-12,Male,32.00,No,0.00,5,STAYED,6212,0.00,67.00,Offer A,Yes,No,,Two Year,Bank Withdrawal,"$ 19,95",2338.19,34.90,,
7044,5351-QESIO,2025-07-20,Male,64.00,No,2.00,5,JOINED,4276,0.00,1.00,Offer E,No,Yes,Cable,Month-to-Month,Mailed Check,"$ 24,2",24.20,24.20,,


## **10. Sorting Row**

Menemukan data yang menarik dalam sebuah DataFrame seringkali lebih mudah jika dilakukan pengurutan baris datanya. Pengurutan dibagi menjadi dua yakni pengurutan secara `Ascending` (pengurutan naik A ‚Üí Z) dan juga pengurutan secara `Descending` (pengurutan turun Z ‚Üí A). Eksekusi sintaks berikut :

<p align="center"><code><b>DataFrame.sort_values(by, ascending=True, ignore_index=False)</b></code></p>

Jika ingin mengurutkan DataFrame pandas dengan memperhatikan argumen

<ul>
<li><b><i>by</i></b> sebagai satu atau lebih kolom yang ingin dijadikan patokan pengurutan</li>

<li><b><i>ascending</i></b> dapat diisikan True jika ingin terurut naik atau False jika ingin terurut turun (default : True)</li>

<li><b><i>ignore_index</i></b> dapat diisikan True jika ingin index masih terurut atau False jika indexnya masih dipertahankan sesuai data awal (dafault : False)</li>

</ul><br>

docs : <i>https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.sort_values.html</i>


### üë®‚Äçüíª Task 10.1

Pada **data_telco** coba periksa apakah datanya sudah terurut berdasarkan kolom open_date? Jika belum urutkan datanya berdasarkan open_date paling awal hingga paling baru (latest date)

*Expected Output :*

<img src="https://raw.githubusercontent.com/bachtiyarma/Material/main/Image/Materi-Python/pandas_display_sortvalues.png" width="100%">

In [None]:
# Task 10.1 - Urutkan data berdasarkan open_date secara ascending

# Urutkan datanya

# Tampilkan hasilnya


Unnamed: 0,customer_id,open_date,gender,age,married,number_of_dependents,satisfaction_score,customer_status,cltv,number_of_referrals,tenure_in_months,offer,phone_service,internet_service,internet_type,contract,payment_method,monthly_charge,total_revenue,avg_revenue_in_month,churn_category,churn_reason
5453,8125-QPFJD,2019-08-01,Female,36.00,Yes,0.00,4,STAYED,4447,7.00,72.00,,Yes,Yes,DSL,Two Year,Bank Withdrawal,"$ 84,9",6161.78,85.58,,
1516,1452-UZOSF,2019-08-01,Male,31.00,Yes,1.00,3,STAYED,4890,9.00,72.00,Offer A,Yes,Yes,Fiber Optic,Two Year,Credit Card,"$ 106,1",8040.73,111.68,,
3557,7860-KSUGX,2019-08-01,Male,25.00,Yes,0.00,3,STAYED,6330,1.00,72.00,Offer A,Yes,Yes,Cable,Two Year,Credit Card,"$ 64,45",7072.24,98.23,,
6956,2091-GPPIQ,2019-08-01,Female,56.00,Yes,0.00,5,STAYED,5050,10.00,72.00,Offer A,Yes,Yes,Cable,Two Year,Bank Withdrawal,"$ 78,95",7605.03,105.63,,
4169,8823-RLPWL,2019-08-01,Female,24.00,Yes,0.00,4,STAYED,4259,5.00,72.00,Offer A,Yes,Yes,Fiber Optic,Two Year,Credit Card,"$ 110,65",11032.77,153.23,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
454,3716-BDVDB,2025-07-26,Male,62.00,No,0.00,1,CHURNED,5795,0.00,1.00,Offer E,Yes,Yes,Fiber Optic,Month-to-Month,Bank Withdrawal,"$ 69,1",107.76,107.76,Competitor,Competitor made better offer
6089,5133-POWUA,2025-07-26,Male,34.00,No,0.00,5,JOINED,2614,0.00,1.00,,Yes,Yes,Cable,Month-to-Month,Credit Card,"$ 45,8",59.42,59.42,,
125,7595-EUIVN,2025-07-26,Female,53.00,No,0.00,1,CHURNED,3940,0.00,1.00,,Yes,Yes,Fiber Optic,Month-to-Month,Bank Withdrawal,"$ 75,8",90.28,90.28,Competitor,Competitor had better devices
111,9894-EZEWG,2025-07-26,Female,31.00,No,0.00,1,CHURNED,5996,0.00,1.00,Offer E,Yes,Yes,Fiber Optic,Month-to-Month,Credit Card,"$ 74,3",113.96,113.96,Competitor,Competitor had better devices


### üë®‚Äçüíª Task 10.2

Sudah terurut berdasarkan kolom open_date? Menarik! Sekarang perhatikan index-nya apakah berantakan? Bisa bantu sesuaikan?

*Expected Output :*

<img src="https://raw.githubusercontent.com/bachtiyarma/Material/main/Image/Materi-Python/pandas_display_sortvalues_ignoreidx.png" width="100%">

In [None]:
# Task 10.2 - Urutkan data berdasarkan open_date secara ascending dan atur indexnya

# Urutkan data dan atur indexnya

# Tampilkan hasilnya


Unnamed: 0,customer_id,open_date,gender,age,married,number_of_dependents,satisfaction_score,customer_status,cltv,number_of_referrals,tenure_in_months,offer,phone_service,internet_service,internet_type,contract,payment_method,monthly_charge,total_revenue,avg_revenue_in_month,churn_category,churn_reason
0,8125-QPFJD,2019-08-01,Female,36.00,Yes,0.00,4,STAYED,4447,7.00,72.00,,Yes,Yes,DSL,Two Year,Bank Withdrawal,"$ 84,9",6161.78,85.58,,
1,3649-JPUGY,2019-08-01,Male,26.00,No,0.00,3,STAYED,5842,0.00,72.00,Offer A,Yes,Yes,DSL,Two Year,Bank Withdrawal,"$ 88,6",9403.07,130.60,,
2,5668-MEISB,2019-08-01,Female,57.00,Yes,1.00,4,STAYED,5146,1.00,72.00,,Yes,Yes,Fiber Optic,Two Year,Credit Card,"$ 106,1",8118.92,112.76,,
3,6181-AXXYF,2019-08-01,Male,54.00,Yes,2.00,4,STAYED,4185,3.00,72.00,Offer A,Yes,No,,Two Year,Credit Card,"$ 24,75",5292.78,73.51,,
4,2272-WUSPA,2019-08-01,Female,48.00,Yes,0.00,4,STAYED,4848,1.00,72.00,,Yes,Yes,Fiber Optic,Two Year,Bank Withdrawal,"$ 110,75",10612.98,147.40,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
7041,4291-HPAXL,2025-07-26,Male,63.00,No,2.00,3,JOINED,4840,0.00,1.00,,Yes,No,,Month-to-Month,Credit Card,"$ 19,85",48.95,48.95,,
7042,5542-TBBWB,2025-07-26,Male,46.00,No,0.00,4,JOINED,3358,0.00,1.00,,Yes,Yes,Fiber Optic,Month-to-Month,Bank Withdrawal,"$ 69,9",89.26,89.26,,
7043,5393-RXQSZ,2025-07-26,Male,40.00,No,0.00,3,CHURNED,2199,0.00,1.00,,Yes,Yes,Fiber Optic,Month-to-Month,Bank Withdrawal,"$ 79,6",98.92,98.92,Attitude,Attitude of support person
7044,6380-ARCEH,2025-07-26,Male,19.00,No,0.00,3,JOINED,2710,0.00,1.00,Offer E,Yes,No,,Month-to-Month,Credit Card,"$ 20,2",61.30,61.30,,


##**11. Conditions**

* Salah satu teknik paling sederhana untuk menemukan bagian mana dari kumpulan data yang menarik adalah menemukan subset baris yang cocok dengan beberapa kriteria untuk difilter atau dipilih. Untuk melakukan hal ini cukup mudah yakni dengan menuliskan kondisi seperti berikut

<p align="center"><code><b>DataFrame[conditions]</b></code></p>
<br>

* Conditions perlu menggunakan operator pembanding (_comparison operators_) atau operator keanggotaan (_membership operators_):

<ul><table>
<thead>
<tr>
<th>Operator</th>
<th>Nama / Fungsi</th>
<th>Contoh</th>
</tr>
</thead>
<tbody>

<tr>
<td><code>==</code></td>
<td>Equal to ‚Äî membandingkan kesetaraan nilai</td>
<td><code>5 == 5</code></td>
</tr>

<tr>
<td><code>!=</code></td>
<td>Not equal to ‚Äî membandingkan ketidaksamaan nilai</td>
<td><code>5 != 3</code></td>
</tr>

<tr>
<td><code>&gt;</code></td>
<td>Greater than ‚Äî lebih besar dari</td>
<td><code>10 &gt; 5</code></td>
</tr>

<tr>
<td><code>&lt;</code></td>
<td>Less than ‚Äî lebih kecil dari</td>
<td><code>2 &lt; 8</code></td>
</tr>

<tr>
<td><code>&gt;=</code></td>
<td>Greater than or equal to ‚Äî lebih besar atau sama dengan</td>
<td><code>7 &gt;= 7</code></td>
</tr>

<tr>
<td><code>&lt;=</code></td>
<td>Less than or equal to ‚Äî lebih kecil atau sama dengan</td>
<td><code>3 &lt;= 4</code></td>
</tr>

<tr>
<td><code>is</code></td>
<td>Identitas ‚Äî membandingkan apakah dua objek adalah objek yang sama (bukan hanya nilainya)</td>
<td><code>a is b</code></td>
</tr>

<tr>
<td><code>is not</code></td>
<td>Kebalikan dari <code>is</code> ‚Äî True jika dua objek berbeda</td>
<td><code>a is not b</code></td>
</tr>

<tr>
<td><code>in</code></td>
<td>Membership ‚Äî memeriksa apakah elemen ada di dalam koleksi (list, tuple, string, dll)</td>
<td><code>'a' in 'data'</code></td>
</tr>

<tr>
<td><code>not in</code></td>
<td>Kebalikan dari <code>in</code> ‚Äî memeriksa apakah elemen tidak ada di dalam koleksi</td>
<td><code>'x' not in 'data'</code></td>
</tr>

</tbody>
</table>
</ul>
<br>

* Conditions dapat dibentuk dari 1 atau lebih kriteria boolean dan dihubungkan dengan operator logika
<br>

<ul><table>
<thead>
<tr>
<th>Operator</th>
<th>Nama / Fungsi</th>
<th>Nilai Kebenaran</th>
</tr>
</thead>
<tbody>

<tr>
<td><code>&amp;</code></td>
<td>Bitwise AND ‚Äî operasi logika berbasis bit antar nilai biner</td>
<td>Bernilai benar jika semua kondisi terpenuhi</td>
</tr>

<tr>
<td><code>|</code></td>
<td>Bitwise OR ‚Äî operasi logika OR berbasis bit</td>
<td>Bernilai benar jika salah satu kondisi terpenuhi</td>
</tr>

<tr>
<td><code>~</code></td>
<td>Bitwise NOT ‚Äî membalikkan bit (komplemen biner)</td>
<td>Negasi / kebalikan</td>
</tr>

</tbody>
</table>
</ul>

### üë®‚Äçüíª Task 11.1

Pada **data_telco**, tampilkan data customer yang CHURNED saja

*Expected Output :*

<img src="https://raw.githubusercontent.com/bachtiyarma/Material/main/Image/Materi-Python/pandas_display_condition1.png" width="100%">

In [None]:
# Task 11.1 - Filter data customer_status = CHURNED

# Buat kondisi
condition1 = ...

# Filter dan Tampilkan hasilnya saja
...

### üë®‚Äçüíª Task 11.2

Pada **data_telco**, tampilkan data customer yang CHURNED namun nilai Customer Life-Time Value nya lebih dari 5000!

*Expected Output :*

<img src="https://raw.githubusercontent.com/bachtiyarma/Material/main/Image/Materi-Python/pandas_display_condition2.png" width="100%">

In [None]:
# Task 11.2 - Filter data customer_status = CHURNED dan customer life time value > 5000

# Buat kondisi
condition1 = ...
condition2 = ...

# Filter dan Tampilkan hasilnya saja
...

##**12. Aggregation**

Agregasi data merupakan serangkaian proses yang dilakukan untuk melakukan pengumpulan data dan dinyatakan dalam bentuk ringkasan sebagai contoh menghitung total yang dikelompokkan berdasarkan kategori tertentu, dsb.

Untuk melakukan agregasi gunakan sintaks berikut

<p align="center"><code><b>DataFrame.group_by(by, as_index).agg(kolom_hasil_aggregasi = (kolom_dihitung, jenis_agregasi))</b></code></p>

Jenis agregasi :
* sum = Menghitung total data
* mean = Menghitung rataan data
* max = Menghitung nilai maksimum data
* min = Menghitung nilai minimum data
* nunique = Menghitung jumlah data unik data
* count = Menghitung banyak data

### üë®‚Äçüíª Task 12.1

Pada **data_telco**, hitung jumlah data tiap statusnya!


### üë®‚Äçüíª Task 12.2

Pada **data_telco**, hitung proporsi tiap statusnya!


Data Source : <i>https://www.ibm.com/docs/en/cognos-analytics/12.0.x?topic=samples-telco-customer-churn</i> (dengan modifikasi)


---

<br>
<a href="https://www.linkedin.com/in/bachtiyarma/"><img src="https://img.shields.io/badge/-¬© 2025 Bachtiyar M. Arief-0072b1?style=for-the-badge&logoColor=white"/></a>

<a href="https://dqlab.id/"><img src="https://dqlab.id/files/dqlab/cache/87e30118ebba5ec7d96f6ea8c9dcc10b_x_118_X_55.png" align="left" /></a>