In [None]:
!pip install pandas numpy scikit-learn matplotlib seaborn openpyxl



In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# Fungsi untuk memuat data dan preprocessing
def muat_dan_preprocessing(nama_file):
    try:
        # Menggunakan read_excel untuk file Excel
        data = pd.read_excel(nama_file)
        print("Data berhasil dimuat!")

        # Mengisi nilai kosong untuk kolom numerik dengan mean
        for kolom in data.select_dtypes(include=['number']).columns:
            data[kolom] = data[kolom].fillna(data[kolom].mean())

        # Mengisi nilai kosong untuk kolom non-numerik dengan mode
        for kolom in data.select_dtypes(exclude=['number']).columns:
            data[kolom] = data[kolom].fillna(data[kolom].mode()[0])

        print("Nilai kosong telah diganti dengan mean atau mode.")

        # Asumsikan kolom terakhir adalah target, sisanya fitur
        X = data.iloc[:, :-1]
        y = data.iloc[:, -1]

        # Jika target numerik, ubah menjadi kategori diskret dengan binning
        if y.dtype in ['float64', 'int64']:
            y = pd.cut(y, bins=3, labels=[0, 1, 2])  # Contoh: 3 kategori

        # Validasi data tidak kosong
        if X.empty or y.empty:
            raise ValueError("Data atau target kosong setelah preprocessing.")

        return X, y
    except Exception as e:
        print(f"Terjadi kesalahan saat memuat data: {e}")
        return None, None

# Fungsi untuk menjalankan algoritma yang dipilih pengguna
def jalankan_algoritma(X, y, algoritma):
    try:
        # Bagi data menjadi data latih dan uji
        X_latih, X_uji, y_latih, y_uji = train_test_split(X, y, test_size=0.2, random_state=42)

        if algoritma == '2':
            model = RandomForestClassifier()
        elif algoritma == '3':
            model = LogisticRegression()
        else:
            print("Pilihan algoritma tidak valid.")
            return

        # Latih model
        model.fit(X_latih, y_latih)

        # Prediksi dan hitung akurasi
        y_pred = model.predict(X_uji)
        akurasi = accuracy_score(y_uji, y_pred)
        print(f"Akurasi: {akurasi:.2f}")
    except Exception as e:
        print(f"Terjadi kesalahan saat menjalankan algoritma: {e}")

# Loop utama untuk terminal
while True:
    print("\n=== Analisis Kualitas Udara ===")
    print("1. Muat dan preprocessing data")
    print("2. Jalankan Random Forest Classifier")
    print("3. Jalankan Logistic Regression")
    print("4. Keluar")

    pilihan = input("Masukkan pilihan Anda: ")

    if pilihan == '1':
        nama_file = input("Masukkan nama file Excel: ")
        X, y = muat_dan_preprocessing(nama_file)
        if X is not None and y is not None:
            print("Data siap untuk dianalisis.")
    elif pilihan in ['2', '3']:
        if 'X' in locals() and 'y' in locals():
            jalankan_algoritma(X, y, pilihan)
        else:
            print("Silakan muat data terlebih dahulu.")
    elif pilihan == '4':
        print("Keluar dari program. Sampai jumpa!")
        break
    else:
        print("Pilihan tidak valid. Silakan coba lagi.")



=== Analisis Kualitas Udara ===
1. Muat dan preprocessing data
2. Jalankan Random Forest Classifier
3. Jalankan Logistic Regression
4. Keluar
