In [None]:
# ==============================================================================
# KUIS REGRESI LINEAR - SOLUSI DENGAN PYTHON
# ==============================================================================
# Library yang dibutuhkan:
# - numpy: untuk komputasi numerik dan mengelola array
# - pandas: untuk mengelola data dalam bentuk tabel (DataFrame), sangat berguna untuk regresi berganda
# - scikit-learn: untuk model machine learning, termasuk LinearRegression

import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression

print("==================== Kasus No. 1: Pelanggan vs. Pendapatan ====================")

# --- 1. Menyiapkan Data ---
# X adalah variabel independen (Jumlah Pelanggan)
# y adalah variabel dependen (Pendapatan dalam ribu rupiah)
# .reshape(-1, 1) mengubah array 1D menjadi array 2D kolom, sesuai format scikit-learn
X1 = np.array([10, 20, 30, 40, 50]).reshape(-1, 1)
y1 = np.array([200, 400, 600, 800, 1000])

# --- 2. Membuat dan Melatih Model ---
# Membuat instance dari model LinearRegression
model1 = LinearRegression()
# Melatih model dengan data (X1, y1). Proses ini mencari nilai a dan b terbaik.
model1.fit(X1, y1)

# --- 3. Menampilkan Hasil Model ---
a1 = model1.intercept_  # Koefisien a (intercept)
b1 = model1.coef_[0]    # Koefisien b (slope)
print(f"Model Regresi: Y = {a1:.2f} + {b1:.2f}X")

# --- 4. Membuat Prediksi ---
# Menyiapkan data baru yang ingin diprediksi (35 pelanggan) dalam format 2D
pelanggan_baru = np.array([[35]])
# Menggunakan model yang sudah dilatih untuk memprediksi
prediksi_pendapatan = model1.predict(pelanggan_baru)
print(f"Prediksi pendapatan untuk 35 pelanggan: {prediksi_pendapatan[0]:.0f} ribu rupiah")


print("\n==================== Kasus No. 2: Waktu Belajar vs. Nilai Ujian ===================")

# --- 1. Menyiapkan Data ---
X2 = np.array([1, 2, 3, 4]).reshape(-1, 1)
y2 = np.array([60, 65, 70, 75])

# --- 2. Membuat dan Melatih Model ---
model2 = LinearRegression()
model2.fit(X2, y2)

# --- 3. Menemukan Rata-rata Peningkatan ---
# Pertanyaan ini mencari nilai slope (b), yang merepresentasikan
# perubahan rata-rata Y untuk setiap kenaikan 1 unit X.
rata_rata_peningkatan = model2.coef_[0]
print(f"Rata-rata peningkatan nilai untuk setiap jam belajar adalah: {rata_rata_peningkatan:.0f} poin")


print("\n================= Kasus No. 3: Usia Kendaraan vs. Harga Jual ===================")

# --- 1. Menyiapkan Data ---
X3 = np.array([1, 3, 5, 7, 9]).reshape(-1, 1)
y3 = np.array([150, 120, 90, 60, 30])

# --- 2. Membuat dan Melatih Model ---
model3 = LinearRegression()
model3.fit(X3, y3)

# --- 3. Menampilkan Persamaan dan Prediksi ---
a3 = model3.intercept_
b3 = model3.coef_[0]
print(f"1. Persamaan Regresi: Y = {a3:.2f} - {-b3:.2f}X") # Dibuat format Y = a - bX agar lebih mudah dibaca

# Prediksi untuk usia kendaraan 4 tahun
usia_baru = np.array([[4]])
prediksi_harga = model3.predict(usia_baru)
print(f"2. Prediksi harga jual untuk usia 4 tahun: {prediksi_harga[0]:.0f} juta rupiah")


print("\n=================== Kasus No. 4: Jam Internet vs. Biaya Pulsa ====================")

# --- 1. Menyiapkan Data ---
X4 = np.array([5, 10, 15, 20]).reshape(-1, 1)
y4 = np.array([25000, 50000, 75000, 100000])

# --- 2. Membuat dan Melatih Model ---
model4 = LinearRegression()
model4.fit(X4, y4)

# --- 3. Membuat Prediksi ---
# Prediksi untuk 18 jam penggunaan internet
jam_baru = np.array([[18]])
prediksi_biaya = model4.predict(jam_baru)
print(f"Model regresi adalah: Y = {model4.coef_[0]:.0f}X")
print(f"Prediksi biaya pulsa untuk 18 jam internet: Rp {prediksi_biaya[0]:.0f},-")


print("\n================== Kasus No. 5: Regresi Linear Berganda (Kafe) ==================")

# --- 1. Menyiapkan Data menggunakan Pandas DataFrame ---
# Pandas memudahkan pengelolaan data dengan banyak variabel (kolom)
data5 = {
    'Pengunjung (X1)': [50, 60, 70, 80, 90],
    'Menu_Baru (X2)': [2, 3, 4, 5, 6],
    'Penjualan (Y)': [400, 480, 560, 640, 720]
}
df5 = pd.DataFrame(data5)

# Memisahkan variabel independen (fitur) dan dependen (target)
X5 = df5[['Pengunjung (X1)', 'Menu_Baru (X2)']] # X sekarang memiliki 2 kolom
y5 = df5['Penjualan (Y)']

# --- 2. Membuat dan Melatih Model Berganda ---
model5 = LinearRegression()
model5.fit(X5, y5)

# --- 3. Menampilkan Hasil Model Berganda ---
a5 = model5.intercept_
b5_1 = model5.coef_[0] # Koefisien untuk X1
b5_2 = model5.coef_[1] # Koefisien untuk X2
print(f"1. Model Regresi Berganda: Y = {a5:.2f} + ({b5_1:.2f})*X1 + ({b5_2:.2f})*X2")

# --- 4. Membuat Prediksi Berganda ---
# Menyiapkan data baru dalam format DataFrame yang sama
data_baru5 = pd.DataFrame({'Pengunjung (X1)': [75], 'Menu_Baru (X2)': [4]})
prediksi_penjualan5 = model5.predict(data_baru5)
print(f"2. Prediksi penjualan untuk 75 pengunjung dan 4 menu baru: {prediksi_penjualan5[0]:.0f} ribu rupiah")

Model Regresi: Y = 0.00 + 20.00X
Prediksi pendapatan untuk 35 pelanggan: 700 ribu rupiah

Rata-rata peningkatan nilai untuk setiap jam belajar adalah: 5 poin

1. Persamaan Regresi: Y = 165.00 - 15.00X
2. Prediksi harga jual untuk usia 4 tahun: 105 juta rupiah

Model regresi adalah: Y = 5000X
Prediksi biaya pulsa untuk 18 jam internet: Rp 90000,-

1. Model Regresi Berganda: Y = 2.38 + (7.92)*X1 + (0.79)*X2
2. Prediksi penjualan untuk 75 pengunjung dan 4 menu baru: 600 ribu rupiah
