In [26]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import mean_squared_error, accuracy_score
from sklearn.preprocessing import LabelEncoder, MinMaxScaler


In [27]:
# Load the dataset
df = pd.read_excel('air_quality.xlsx')

# Data preprocessing
# Fill missing numerical values with the mean
df.fillna(df.mean(numeric_only=True), inplace=True)

In [28]:
# Handle categorical target column
if 'Air Quality' in df.columns:
    le = LabelEncoder()
    df['Air Quality'] = le.fit_transform(df['Air Quality'].astype(str))

In [29]:
# Feature selection (X) and target (y)
X = df.drop(columns=['Air Quality'])
y = df['Air Quality']

# Normalize features
scaler = MinMaxScaler()
X_scaled = scaler.fit_transform(X)

# Train-test split
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

In [30]:
# Linear Regression Model
lr_model = LinearRegression()
lr_model.fit(X_train, y_train)

# Predictions and evaluation for Linear Regression
lr_predictions = lr_model.predict(X_test)
lr_mse = mean_squared_error(y_test, lr_predictions)
print(f"Linear Regression MSE: {lr_mse}")

Linear Regression MSE: 1.4995030981884738


In [31]:
# Naive Bayes Model
nb_model = GaussianNB()
nb_model.fit(X_train, y_train)

# Predictions and evaluation for Naive Bayes
nb_predictions = nb_model.predict(X_test)
nb_accuracy = accuracy_score(y_test, nb_predictions)
print(f"Naive Bayes Accuracy: {nb_accuracy}")

Naive Bayes Accuracy: 0.85


In [32]:
# Predictions and evaluation
rnn_predictions = rnn_model.predict(X_test_rnn)
rnn_mse = mean_squared_error(y_test, rnn_predictions)
print(f"RNN MSE: {rnn_mse}")

[1m4/4[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step 
RNN MSE: 1.5879236529567446


In [None]:
while True:
    user_input = input("Masukkan data baru (nilai dipisahkan dengan koma: 1, 2, 3, 4, 5, 6, 7, 8, 9 atau dengan koma) atau 'keluar' untuk keluar: ")
    if user_input.lower() == 'keluar':
        break
    try:
        # Memilih metode prediksi
        metode = input("Pilih metode ('lr' untuk Linear Regression, 'nb' untuk Naive Bayes): ").strip().lower()
        if metode not in ['lr', 'nb']:
            print("Metode tidak valid. Silakan pilih 'lr' atau 'nb'.")
            continue

        # Memproses input pengguna
        input_data = np.array([float(i.strip()) for i in user_input.split(",")]).reshape(1, -1)
        if input_data.shape[1] != X.shape[1]:
            raise ValueError(f"Dibutuhkan {X.shape[1]} fitur, tetapi hanya menerima {input_data.shape[1]}")

        # Normalisasi data input
        input_scaled = scaler.transform(input_data)

        # Prediksi berdasarkan metode yang dipilih
        if metode == 'lr':
            lr_result = lr_model.predict(input_scaled)
            print(f"Prediksi Linear Regression: {lr_result[0]:.2f}")
        elif metode == 'nb':
            nb_result = nb_model.predict(input_scaled)
            print(f"Prediksi Naive Bayes: {nb_result[0]}")
    except ValueError as ve:
        print(f"Input tidak valid: {ve}. Masukkan {X.shape[1]} nilai numerik yang dipisahkan dengan koma.")
    except Exception as e:
        print(f"Terjadi kesalahan: {e}. Silakan coba lagi.")

Masukkan data baru (nilai dipisahkan dengan koma) atau 'keluar' untuk keluar: 1, 2, 3, 4 , 5, 6, 7, 8, 9
Pilih metode ('lr' untuk Linear Regression, 'nb' untuk Naive Bayes): lr




Prediksi Linear Regression: 4.89
Masukkan data baru (nilai dipisahkan dengan koma) atau 'keluar' untuk keluar: 2, 3, 4, 5, 6, 7, 8, 9, 10
Pilih metode ('lr' untuk Linear Regression, 'nb' untuk Naive Bayes): nb




Prediksi Naive Bayes: 1
Masukkan data baru (nilai dipisahkan dengan koma) atau 'keluar' untuk keluar: 29.8,75.6,5.2,17.9, 28.3,74.5,6.3,18.1, 17.9
Pilih metode ('lr' untuk Linear Regression, 'nb' untuk Naive Bayes): lr




Prediksi Linear Regression: 0.79
Masukkan data baru (nilai dipisahkan dengan koma) atau 'keluar' untuk keluar: exit
