# 31 - Mengenal Tipe Data Ordinal pada Pandas Data Frame

Dalam statistika, terdapat dua `tipe data kategori` yaitu `tipe data nominal` yang bersifat murni sebagai label dan `tipe data ordinal`yang memiliki tingkatan (misalnya sangat buruk, buruk, cukup, baik, sangat baik). 

## Import Modules
### Module yang digunakan :
1. pandas

In [1]:
import pandas as pd

- Mengecheck versi dari module yang digunakan yaitu pandas

In [2]:
print(pd.__version__)

1.0.5


## Membuat Data Frame

Data frame sample yang akan kita gunakan adalah data frame yang terdiri dari dua buah kolom, yaitu `pelangaan` dan `kepuasan`. 
- Kolom pelanggan berisikan `tipe data nominal` yaitu 11, 12, 13, dan 14 sebagai urutan pelanggan yang memberikan penilaian.
- Kolom kepuasaan berisikan `tipe data ordinal` yaitu *baik*, *cukup*, *buruk*, dan *cukup* sebagai hasil penilaian dari pelanggan.

In [3]:
d = {'pelanggan':[11, 12, 13, 14], 
     'kepuasan':['baik', 'cukup', 'buruk', 'cukup']}

df = pd.DataFrame(d)
df

Unnamed: 0,pelanggan,kepuasan
0,11,baik
1,12,cukup
2,13,buruk
3,14,cukup


## Tipe Data ordinal pada Pandas Data Frame

- Pemanggilan `CategoricalDtype()` digunakan untuk menspesifikasikan urutan pada tipe data ordinal, yang disertai oleh beberapa parameter yaitu:
    - Parameter pertama yaitu `['buruk', 'cukup', 'baik', 'sangat baik']` merupakan urutan ordinal dari paling kecil.
    - Parameter kedua yaitu `ordered=True` .
- Pemanggilan `astype()`untuk menspesifikasikan tipe data ordinal baru pada data frame yaitu `tingkat_kepuasan` yang merupakan tipe data ordinal yang sudah didefinisikan sebelumnya.

In [4]:
from pandas.api.types import CategoricalDtype

tingkat_kepuasan = CategoricalDtype(['buruk', 'cukup', 'baik', 'sangat baik'], 
                                    ordered=True)

df['kepuasan'] = df['kepuasan'].astype(tingkat_kepuasan)
df

Unnamed: 0,pelanggan,kepuasan
0,11,baik
1,12,cukup
2,13,buruk
3,14,cukup


- Pemanggilan `df.sort_values('kepuasan', ascending=True)` untuk mengurutkan nilai pada data frame yang disertai berdasarkan `kepuasan` dan disusun secara `ascending`.

In [5]:
df = df.sort_values('kepuasan', ascending=True)
df

Unnamed: 0,pelanggan,kepuasan
2,13,buruk
1,12,cukup
3,14,cukup
0,11,baik


### Melakukan seleksi baris

- Pemanggilan `df['kepuasan'] >= 'cukup'` untuk menampilkan baris pada data frame yang nilai *kepuasannya* lebih besar dari/sama dengan *cukup*

In [6]:
df[df['kepuasan'] >= 'cukup']

Unnamed: 0,pelanggan,kepuasan
1,12,cukup
3,14,cukup
0,11,baik
