<center><a href="https://www.nvidia.com/dli"> <img src="Pelatihan-DLI.jpeg" alt="Header" style="width: 1000px;"/> </a></center>

# Pengenalan Library Python untuk Data Science dan AI
## Scikit-learn (Machine Learning)
### Pelatihan Dasar Machine Learning untuk TNI

Notebook ini memperkenalkan **Scikit-learn (sklearn)**, library utama Python untuk *Machine Learning* klasik seperti regresi, klasifikasi, dan klasterisasi.

Kita akan belajar menggunakan Scikit-learn untuk membuat model yang dapat **menganalisis data, memprediksi hasil, dan mengelompokkan informasi operasional TNI.**

---
## 🎯 Tujuan Pembelajaran
- Memahami konsep dasar Machine Learning.
- Mengenal struktur kerja Scikit-learn.
- Membangun model ML sederhana (Regresi, Klasifikasi, Klasterisasi).
- Mengaplikasikan ML dalam konteks operasional/logistik TNI.

## 🟩 1️⃣ Pengenalan Machine Learning dan Scikit-learn

### Apa itu Machine Learning?
- *Machine Learning (ML)* adalah kemampuan komputer untuk **belajar dari data** dan membuat prediksi tanpa diprogram secara eksplisit.

### Apa itu Scikit-learn?
- Scikit-learn adalah library Python untuk **analisis data dan machine learning klasik**.
- Mudah digunakan, cepat, dan berbasis pada **NumPy**, **Pandas**, dan **Matplotlib**.

In [None]:
# Import library dasar
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Import modul Scikit-learn
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.cluster import KMeans

print("Scikit-learn siap digunakan untuk analisis data TNI!")

## 🟩 2️⃣ Workflow Machine Learning di Scikit-learn

Langkah umum dalam proyek Machine Learning menggunakan Scikit-learn:
1. **Persiapkan data (dataset)**
2. **Pisahkan data** menjadi fitur (X) dan target (y)
3. **Split data** menjadi train/test
4. **Pilih model** yang sesuai (regresi, klasifikasi, klasterisasi)
5. **Latih model (fit)** menggunakan data training
6. **Prediksi (predict)** dengan data baru
7. **Evaluasi hasil**

## 🟩 3️⃣ REGRESI — Prediksi Jumlah Logistik Berdasarkan Prajurit

Kita akan membuat model **Linear Regression** untuk memprediksi jumlah logistik yang dibutuhkan berdasarkan jumlah prajurit.

In [None]:
from sklearn.linear_model import LinearRegression

# Data simulasi
prajurit = np.array([50, 80, 100, 150, 200]).reshape(-1, 1)
logistik = np.array([100, 160, 190, 300, 380])

# Membuat dan melatih model
model = LinearRegression()
model.fit(prajurit, logistik)

# Prediksi untuk 120 prajurit
prediksi = model.predict([[120]])
print("Prediksi logistik untuk 120 prajurit:", round(prediksi[0], 2))

### 📈 Visualisasi Regresi Linear

In [None]:
plt.scatter(prajurit, logistik, color='olive', label='Data Aktual')
plt.plot(prajurit, model.predict(prajurit), color='red', label='Model Prediksi')
plt.xlabel('Jumlah Prajurit')
plt.ylabel('Jumlah Logistik')
plt.title('Prediksi Kebutuhan Logistik Berdasarkan Jumlah Prajurit')
plt.legend()
plt.show()

## 🟩 4️⃣ KLASIFIKASI — Menentukan Status Siaga

Kita akan menggunakan **Decision Tree Classifier** untuk menentukan status siaga berdasarkan tingkat ancaman dan ketersediaan logistik.

In [None]:
from sklearn.tree import DecisionTreeClassifier

# Dataset sederhana: [tingkat ancaman, logistik]
X = [[5, 30], [2, 80], [4, 50], [1, 100]]
y = ["SIAGA 1", "NORMAL", "SIAGA 2", "NORMAL"]

clf = DecisionTreeClassifier()
clf.fit(X, y)

# Prediksi kondisi baru
prediksi = clf.predict([[3, 60]])
print("Prediksi status siaga:", prediksi[0])

### Visualisasi Pohon Keputusan

In [None]:
from sklearn import tree

plt.figure(figsize=(6,4))
tree.plot_tree(clf, filled=True, feature_names=["Ancaman", "Logistik"])
plt.show()

## 🟩 5️⃣ KLASTERISASI — Pengelompokan Pos Operasi (K-Means)

Gunakan **K-Means Clustering** untuk mengelompokkan pos berdasarkan jumlah prajurit dan logistik.

In [None]:
from sklearn.cluster import KMeans

data = np.array([
    [120, 50], [80, 70], [100, 65], [60, 40], [130, 75]
])

kmeans = KMeans(n_clusters=2, random_state=0)
kmeans.fit(data)

print("Label cluster tiap pos:", kmeans.labels_)
print("Pusat cluster:\n", kmeans.cluster_centers_)

### Visualisasi Klasterisasi

In [None]:
plt.scatter(data[:,0], data[:,1], c=kmeans.labels_, cmap='Dark2')
plt.scatter(kmeans.cluster_centers_[:,0], kmeans.cluster_centers_[:,1],
            marker='X', color='red', s=200, label='Pusat Cluster')
plt.xlabel('Jumlah Prajurit')
plt.ylabel('Jumlah Logistik')
plt.title('Klasterisasi Pos Berdasarkan Jumlah Prajurit & Logistik')
plt.legend()
plt.show()

## 🟩 6️⃣ Exercise — Prediksi Kesiapan Unit Operasi

**Tugas:**
1. Gunakan `DecisionTreeClassifier` untuk menentukan apakah unit **SIAP** atau **TIDAK SIAP** berdasarkan:
   - `jumlah_prajurit`
   - `logistik`
   - `tingkat_ancaman`
2. Buat minimal 6 data pelatihan.
3. Uji dengan 2 data baru.
4. Visualisasikan hasil pohon keputusan.

In [None]:
# 🧩 TODO: Lengkapi latihan prediksi kesiapan unit operasi
# Gunakan DecisionTreeClassifier dengan 3 fitur

