<a href="https://colab.research.google.com/github/Deri-Nugroho/Intensive-Camp-Machine-Learning/blob/main/Pengantar_Pemrograman_Python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 🐍 Pengantar Pemrograman Python
🔹 Apa Itu Python?
Python adalah bahasa pemrograman tingkat tinggi yang:

*   Memiliki sintaksis sederhana dan mudah dibaca.

*   Digunakan luas dalam berbagai bidang: pengembangan web, automasi, data science, machine learning, AI, dll.

*   Bersifat open-source dan memiliki komunitas global yang besar.

🔹 Mengapa Memilih Python untuk Machine Learning?
Mudah Dipelajari: Sintaks Python hampir seperti bahasa manusia.

*   Kaya Library: Tersedia banyak library seperti NumPy, Pandas, Scikit-learn, TensorFlow, dan PyTorch.

*   Kompatibel dengan AI/ML: Banyak tools dan platform mendukung Python sebagai bahasa utama.

*   Komunitas Besar: Banyak dokumentasi, tutorial, dan bantuan online.



# 🔹 Struktur Dasar Bahasa Python

1. Komentar

In [None]:
# Ini adalah komentar satu baris

"""
Ini komentar multi-baris,
biasanya dipakai untuk dokumentasi
"""


'\nIni komentar multi-baris,\nbiasanya dipakai untuk dokumentasi\n'

2. Variabel & Tipe Data

In [None]:
# Tipe data dasar
angka = 10               # Integer
pi = 3.14                # Float
nama = "Dian"            # String
aktif = True             # Boolean

3. Operasi Matematika

In [None]:
x = 10
y = 3

print(x + y)   # Penjumlahan
print(x - y)   # Pengurangan
print(x * y)   # Perkalian
print(x / y)   # Pembagian
print(x % y)   # Modulus (sisa bagi)

13
7
30
3.3333333333333335
1


4. Tipe Data Struktur (List, Tuple, Dictionary)

In [None]:
# List (bisa diubah)
buah = ["apel", "jeruk", "mangga"]
print(buah[1])  # Output: jeruk

# Tuple (tidak bisa diubah)
angka = (1, 2, 3)

# Dictionary (pasangan key:value)
mahasiswa = {
    "nama": "Dian",
    "umur": 22}
print(mahasiswa["nama"])  # Output: Dian

jeruk
Dian


5. Percabangan (if-else)

In [None]:
umur = 70
if umur == 18:
    print("Dewasa")
elif umur > 50:
    print("Tua")
else:
    print("Anak-anak")

Tua


6. Perulangan (looping)

In [None]:
# For loop
for i in range(5):  # 0 sampai 4
    print(i)

# While loop
count = 0
while count < 5:
    print(count)
    count += 1

0
1
2
3
4
0
1
2
3
4


# 🔹 Fungsi di Python

In [None]:
# Fungsi sederhana
def salam(nama):
    print("Halo, " + nama)

salam("Dian")  # Output: Halo, Dian

Halo, Dian


# 🔹 Penanganan Error (Exception Handling)

In [None]:
try:
    angka = int(10)  # Error karena bukan angka
except ValueError:
    print("Input tidak valid!")

# 📘 Contoh Latihan Sederhana

In [None]:
# Menentukan bilangan ganjil/genap
bilangan = int(input("Masukkan bilangan: "))

if bilangan % 2 == 0:
    print("Bilangan genap")
else:
    print("Bilangan ganjil")

Masukkan bilangan: 6
Bilangan genap


# ✅ Ringkasan Konsep

| Konsep      | Penjelasan Singkat                          |
| ----------- | ------------------------------------------- |
| Variabel    | Tempat menyimpan data                       |
| Tipe Data   | Integer, float, string, boolean             |
| List/Dict   | Struktur data untuk menyimpan banyak item   |
| Percabangan | Menentukan alur program berdasarkan kondisi |
| Perulangan  | Mengulang proses sesuai kondisi             |
| Fungsi      | Blok kode yang dapat digunakan ulang        |
| Exception   | Menangani error agar program tidak crash    |


# 📚 Preprocessing Data untuk Machine Learning

Preprocessing data adalah proses membersihkan dan mempersiapkan data mentah agar siap digunakan untuk pelatihan model machine learning.

1. Import Library yang Dibutuhkan

In [None]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder, StandardScaler
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix

2. Contoh Dataset dengan Missing Value (NaN)

In [None]:
import pandas as pd
import numpy as np

data = {
    'Nama': [
        'Ari','Budi','Citra','Dina','Eka','Fajar','Gita','Hani','Indra','Joko',
        'Kiki','Lina','Made','Nina','Oka','Putri','Qori','Rama','Sinta','Tono',
        'Umar','Vina','Wati','Xander','Yuni','Zaki','Alya','Bayu','Cahya','Dewi',
        'Edo','Farah','Galih','Hana','Iqbal','Jihan','Kamal','Laras','Miko','Nadia',
        'Oscar','Putra','Quin','Rizki','Sari','Tegar','Utami','Vino','Wulan','Yoga'
    ],
    'Jenis Kelamin': [
        'Pria','Pria','Wanita','Wanita','Wanita','Pria','Wanita','Wanita','Pria','Pria',
        'Pria','Wanita','Pria','Wanita','Pria','Wanita','Wanita','Pria','Wanita','Pria',
        'Pria','Wanita','Wanita','Pria','Wanita','Pria','Wanita','Pria','Wanita','Wanita',
        'Pria','Wanita','Pria','Wanita','Pria','Wanita','Pria','Wanita','Pria','Wanita',
        'Pria','Pria','Wanita','Pria','Wanita','Pria','Wanita','Pria','Wanita','Pria'
    ],
    'Usia': [
        25,40,30,45,28,35,32,29,50,38,    # Layak
        42,33,31,36,29,41,39,34,48,26,    # Layak
        44,37,30,52,43,32,39,27,35,31,    # Tidak
        20,19,56,60,18,58,17,70,22,65,    # Tidak
        28,45,29,53,24,np.nan,38,21,33,46 # Campuran dgn NaN
    ],
    'Pendapatan': [
        15,18,20,14,12,19,22,16,25,13,    # Layak
        17,21,14,19,16,23,18,20,15,22,    # Layak
        8,9,11,10,7,6,5,8,9,10,           # Tidak
        30,28,35,40,25,50,60,55,70,80,    # Tidak (pinjaman besar / usia tidak sesuai)
        12,14,16,13,np.nan,18,22,15,19,20 # Campuran dgn NaN
    ],  # juta per bulan
    'Pekerjaan': [
        'Swasta','PNS','Swasta','PNS','Wirausaha','Swasta','Swasta','PNS','PNS','Wirausaha',
        'Swasta','PNS','Wirausaha','Swasta','PNS','Wirausaha','Swasta','PNS','Swasta','Wirausaha',
        'Swasta','PNS','Swasta','PNS','Wirausaha','Swasta','Swasta','PNS','Wirausaha',np.nan,
        'Swasta','PNS','Wirausaha','Swasta','PNS','Wirausaha','Swasta','PNS','Swasta','Wirausaha',
        'Swasta','PNS','Wirausaha','Swasta','PNS','Wirausaha','Swasta','PNS','Swasta','Wirausaha'
    ],
    'Jumlah Pinjaman': [
        300,400,250,350,200,280,320,450,300,400,   # Layak
        250,300,280,400,350,200,450,300,320,400,   # Layak
        600,700,550,800,650,900,750,600,700,800,   # Tidak
        900,850,1000,1200,950,1100,1300,1250,900,1000, # Tidak
        200,300,400,250,600,700,550,800,650,500    # Campuran
    ],  # juta
    'Durasi Pinjaman': [
        10,12,8,15,7,10,9,14,10,12,    # Layak
        8,10,9,11,12,10,14,9,10,13,    # Layak
        20,18,25,22,19,21,23,24,20,19, # Tidak
        30,28,27,35,25,33,32,np.nan,30,28, # Tidak
        7,9,10,8,20,22,18,25,19,15     # Campuran
    ],  # tahun
    'Kelayakan Kredit': [
        'Layak','Layak','Layak','Layak','Layak','Layak','Layak','Layak','Layak','Layak',
        'Layak','Layak','Layak','Layak','Layak','Layak','Layak','Layak','Layak','Layak',
        'Tidak','Tidak','Tidak','Tidak','Tidak','Tidak','Tidak','Tidak','Tidak','Tidak',
        'Tidak','Tidak','Tidak','Tidak','Tidak','Tidak','Tidak','Tidak','Tidak','Tidak',
        'Layak','Layak','Layak','Layak','Tidak','Tidak','Tidak','Tidak','Tidak','Layak'
    ]
}

df = pd.DataFrame(data)

print("=== Data Awal (50 baris, dengan NaN) ===")
print(df.head(5))
print("\nJumlah Kelayakan Kredit:\n", df['Kelayakan Kredit'].value_counts())


=== Data Awal (50 baris, dengan NaN) ===
    Nama Jenis Kelamin  Usia  Pendapatan  Pekerjaan  Jumlah Pinjaman  \
0    Ari          Pria  25.0        15.0     Swasta              300   
1   Budi          Pria  40.0        18.0        PNS              400   
2  Citra        Wanita  30.0        20.0     Swasta              250   
3   Dina        Wanita  45.0        14.0        PNS              350   
4    Eka        Wanita  28.0        12.0  Wirausaha              200   

   Durasi Pinjaman Kelayakan Kredit  
0             10.0            Layak  
1             12.0            Layak  
2              8.0            Layak  
3             15.0            Layak  
4              7.0            Layak  

Jumlah Kelayakan Kredit:
 Kelayakan Kredit
Layak    25
Tidak    25
Name: count, dtype: int64


3. Menangani Missing Value (NaN)

In [None]:
# Isi nilai NaN untuk kolom numerik dengan mean (rata-rata)
for col in ['Usia', 'Pendapatan', 'Jumlah Pinjaman', 'Durasi Pinjaman']:
    df[col].fillna(df[col].mean(), inplace=True)

# Isi nilai NaN untuk kolom kategorikal dengan modus (nilai terbanyak)
df['Pekerjaan'].fillna(df['Pekerjaan'].mode()[0], inplace=True)

print("\nData Setelah Missing Value Ditangani:\n", df)


Data Setelah Missing Value Ditangani:
       Nama Jenis Kelamin       Usia  Pendapatan  Pekerjaan  Jumlah Pinjaman  \
0      Ari          Pria  25.000000   15.000000     Swasta              300   
1     Budi          Pria  40.000000   18.000000        PNS              400   
2    Citra        Wanita  30.000000   20.000000     Swasta              250   
3     Dina        Wanita  45.000000   14.000000        PNS              350   
4      Eka        Wanita  28.000000   12.000000  Wirausaha              200   
5    Fajar          Pria  35.000000   19.000000     Swasta              280   
6     Gita        Wanita  32.000000   22.000000     Swasta              320   
7     Hani        Wanita  29.000000   16.000000        PNS              450   
8    Indra          Pria  50.000000   25.000000        PNS              300   
9     Joko          Pria  38.000000   13.000000  Wirausaha              400   
10    Kiki          Pria  42.000000   17.000000     Swasta              250   
11    Lina  

The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df[col].fillna(df[col].mean(), inplace=True)
The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df['Pekerjaan'].fillna(df['Pekerjaan'].mode()[0], inplace=True)


4. Encoding Kolom Kategorikal

In [None]:
# Buat objek LabelEncoder
le_gender = LabelEncoder()   # Untuk kolom Jenis Kelamin
le_job = LabelEncoder()      # Untuk kolom Pekerjaan
le_target = LabelEncoder()   # Untuk kolom target Kelayakan Kredit

# Ubah kolom kategorikal menjadi angka
df['Jenis Kelamin'] = le_gender.fit_transform(df['Jenis Kelamin'])      # Pria/Wanita -> 0/1
df['Pekerjaan'] = le_job.fit_transform(df['Pekerjaan'])                # Swasta/PNS/Wirausaha -> angka
df['Kelayakan Kredit'] = le_target.fit_transform(df['Kelayakan Kredit']) # Layak/Tidak -> 1/0

print("\nData Setelah Encoding:\n", df)


Data Setelah Encoding:
       Nama  Jenis Kelamin       Usia  Pendapatan  Pekerjaan  Jumlah Pinjaman  \
0      Ari              0  25.000000   15.000000          1              300   
1     Budi              0  40.000000   18.000000          0              400   
2    Citra              1  30.000000   20.000000          1              250   
3     Dina              1  45.000000   14.000000          0              350   
4      Eka              1  28.000000   12.000000          2              200   
5    Fajar              0  35.000000   19.000000          1              280   
6     Gita              1  32.000000   22.000000          1              320   
7     Hani              1  29.000000   16.000000          0              450   
8    Indra              0  50.000000   25.000000          0              300   
9     Joko              0  38.000000   13.000000          2              400   
10    Kiki              0  42.000000   17.000000          1              250   
11    Lina     

5. Standarisasi Kolom Numerik

In [None]:
# Buat objek scaler
scaler = StandardScaler()

# Standarisasi kolom numerik agar memiliki skala yang sama
df[['Usia', 'Pendapatan', 'Jumlah Pinjaman', 'Durasi Pinjaman']] = scaler.fit_transform(
    df[['Usia', 'Pendapatan', 'Jumlah Pinjaman', 'Durasi Pinjaman']]
)

print("\nData Setelah Standarisasi:\n", df)


Data Setelah Standarisasi:
       Nama  Jenis Kelamin          Usia  Pendapatan  Pekerjaan  \
0      Ari              0 -9.735762e-01   -0.425946          1   
1     Budi              0  2.644489e-01   -0.235629          0   
2    Citra              1 -5.609012e-01   -0.108752          1   
3     Dina              1  6.771239e-01   -0.489384          0   
4      Eka              1 -7.259712e-01   -0.616262          2   
5    Fajar              0 -1.482261e-01   -0.172191          1   
6     Gita              1 -3.958311e-01    0.018125          1   
7     Hani              1 -6.434362e-01   -0.362507          0   
8    Indra              0  1.089799e+00    0.208441          0   
9     Joko              0  9.937888e-02   -0.552823          2   
10    Kiki              0  4.295189e-01   -0.299068          1   
11    Lina              1 -3.132961e-01   -0.045313          0   
12    Made              0 -4.783661e-01   -0.489384          2   
13    Nina              1 -6.569113e-02   -0.17

6. Pisahkan Fitur (X) dan Target (y)

In [None]:
X = df.drop(columns=['Kelayakan Kredit', 'Nama'])  # Semua kolom kecuali target dan Nama
y = df['Kelayakan Kredit']                         # Kolom target

# Bagi dataset menjadi data latih (70%) dan data uji (30%)
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=42
)

print("\nData Latih:\n", X_train)
print("\nData Uji:\n", X_test)


Data Latih:
     Jenis Kelamin      Usia  Pendapatan  Pekerjaan  Jumlah Pinjaman  \
6               1 -0.395831    0.018125          1        -0.863616   
41              0  0.677124   -0.489384          0        -0.930305   
46              1  0.099379    0.018125          1        -0.096698   
47              0 -1.303716   -0.425946          0         0.736908   
15              1  0.346984    0.081564          2        -1.263748   
9               0  0.099379   -0.552823          2        -0.596862   
16              1  0.181914   -0.235629          1        -0.430141   
24              1  0.512054   -0.933455          2         0.236744   
34              0 -1.551321    0.208441          0         1.237072   
31              1 -1.468786    0.398758          0         0.903630   
0               0 -0.973576   -0.425946          1        -0.930305   
44              1 -1.056111    0.000000          0         0.070023   
27              0 -0.808506   -0.870016          0         0.07

7. Buat dan Latih Model Random Forest

In [None]:
rf_model = RandomForestClassifier(n_estimators=100, random_state=42)  # Buat model
rf_model.fit(X_train, y_train)  # Latih model dengan data latih

8. Prediksi pada Data Uji

In [None]:
y_pred = rf_model.predict(X_test)  # Prediksi pada data uji

9. Evaluasi Model

In [None]:
print("\nHasil Prediksi:", y_pred.tolist())
print("Nilai Aktual  :", y_test.tolist())
print("Akurasi:", accuracy_score(y_test, y_pred))  # Hitung akurasi model
print("\nClassification Report:\n", classification_report(y_test, y_pred))  # Laporan klasifikasi
print("Confusion Matrix:\n", confusion_matrix(y_test, y_pred))              # Matriks kebingungan


Hasil Prediksi: [0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 0, 1, 0, 0]
Nilai Aktual  : [0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 0, 1, 0, 0]
Akurasi: 1.0

Classification Report:
               precision    recall  f1-score   support

           0       1.00      1.00      1.00         7
           1       1.00      1.00      1.00         8

    accuracy                           1.00        15
   macro avg       1.00      1.00      1.00        15
weighted avg       1.00      1.00      1.00        15

Confusion Matrix:
 [[7 0]
 [0 8]]


9. Prediksi Data Baru (contoh statis)

In [None]:
print("Mapping target:", dict(zip(le_target.classes_, le_target.transform(le_target.classes_))))


Mapping target: {'Layak': np.int64(0), 'Tidak': np.int64(1)}


In [None]:
# ======================================
# 10. Prediksi Berdasarkan Input Pengguna (Interaktif)
# ======================================
print("\n=== Prediksi Berdasarkan Input Pengguna ===")

# Input dari user
gender_input = input("Masukkan Jenis Kelamin (Pria/Wanita): ")
usia_input = float(input("Masukkan Usia (tahun): "))
pendapatan_input = float(input("Masukkan Pendapatan (juta per bulan): "))
pekerjaan_input = input("Masukkan Pekerjaan (Swasta/PNS/Wirausaha): ")
pinjaman_input = float(input("Masukkan Jumlah Pinjaman (juta): "))
durasi_input = float(input("Masukkan Durasi Pinjaman (tahun): "))

# Standarisasi input numerik
scaled_input = scaler.transform([[usia_input, pendapatan_input, pinjaman_input, durasi_input]])

# Buat DataFrame sesuai format fitur
user_input = pd.DataFrame({
    'Jenis Kelamin': [le_gender.transform([gender_input])[0]],   # Encode Jenis Kelamin
    'Usia': [scaled_input[0][0]],                                # Usia yang distandarisasi
    'Pendapatan': [scaled_input[0][1]],                          # Pendapatan distandarisasi
    'Jumlah Pinjaman': [scaled_input[0][2]],                     # Pinjaman distandarisasi
    'Durasi Pinjaman': [scaled_input[0][3]],                     # Durasi distandarisasi
    'Pekerjaan': [le_job.transform([pekerjaan_input])[0]]        # Encode Pekerjaan
}, index=[0])

# Samakan urutan kolom dengan X (data training)
user_input = user_input.reindex(columns=X.columns)

# Prediksi hasil input user
pred_user = rf_model.predict(user_input)

# Tampilkan hasil
print("\n=== Hasil Prediksi ===")
print(f"Input: {gender_input}, Usia {usia_input}, Pendapatan {pendapatan_input}jt, "
      f"Pekerjaan {pekerjaan_input}, Pinjaman {pinjaman_input}jt, Durasi {durasi_input}thn")

# Gunakan inverse_transform agar sesuai mapping asli
print("Prediksi Kelayakan Kredit:", le_target.inverse_transform(pred_user)[0])



=== Prediksi Berdasarkan Input Pengguna ===
Masukkan Jenis Kelamin (Pria/Wanita): Pria
Masukkan Usia (tahun): 15
Masukkan Pendapatan (juta per bulan): 2
Masukkan Pekerjaan (Swasta/PNS/Wirausaha): PNS
Masukkan Jumlah Pinjaman (juta): 900
Masukkan Durasi Pinjaman (tahun): 10

=== Hasil Prediksi ===
Input: Pria, Usia 15.0, Pendapatan 2.0jt, Pekerjaan PNS, Pinjaman 900.0jt, Durasi 10.0thn
Prediksi Kelayakan Kredit: Tidak


