In [5]:
import pandas as pd
import numpy as np
import streamlit as st
import joblib
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import StandardScaler, LabelEncoder
import seaborn as sns
import matplotlib.pyplot as plt

Mengimpor berbagai library yang diperlukan untuk data processing, machine learning, visualisasi, dan pembuatan aplikasi web

In [None]:
st.title("Aplikasi Prediksi Harga Laptop")

Menambahkan judul aplikasi web

In [None]:
menu = st.sidebar.selectbox("Menu", ["Overview", Data Visualization", "Prediction"])

Menambahkan sidebar dengan opsi menu untuk memilih antara Overview, Data Visualization, atau Prediction

In [None]:
@st.cache_data
def load_data():
    df = pd.read_csv("LaptopPrice.csv")
    return df

df = load_data()

Fungsi load_data digunakan untuk memuat dataset dari file CSV dan menyimpannya di cache untuk meningkatkan kinerja

In [None]:
if menu == "Overview":
    st.subheader("Gambaran Dataset")
    st.write(f"Total baris dalam dataset: {df.shape[0]}")
    st.dataframe(df)
    st.write("Shape dari dataset:", df.shape)
    st.write("Informasi Kolom:")
    st.write(df.info())
    st.write("Nilai yang hilang dalam dataset:")
    st.write(df.isnull().sum())

Menampilkan gambaran umum dataset, termasuk jumlah baris, kolom, informasi kolom, dan jumlah nilai yang hilang

In [None]:
elif menu == "Data Visualization":
    st.subheader("Visualisasi Data")
    x_col = st.selectbox("Pilih kolom X-axis", df.columns)
    y_col = st.selectbox("Pilih kolom Y-axis", df.columns)
    plot_type = st.selectbox("Pilih jenis plot", ["Barplot", "Lineplot", "Boxplot", "Scatterplot", "Histogram"])
    fig, ax = plt.subplots()
    if plot_type == "Barplot":
        sns.barplot(data=df, x=x_col, y=y_col, ax=ax)
        explanation = ...
    elif plot_type == "Lineplot":
        sns.lineplot(data=df, x=x_col, y=y_col, ax=ax)
        explanation = ...
    elif plot_type == "Boxplot":
        sns.boxplot(data=df, x=x_col, y=y_col, ax=ax)
        explanation = ...
    elif plot_type == "Scatterplot":
        sns.scatterplot(data=df, x=x_col, y=y_col, ax=ax)
        explanation = ...
    elif plot_type == "Histogram":
        sns.histplot(data=df, x=x_col, ax=ax)
        explanation = ...
    st.pyplot(fig)
    st.write(explanation)
    st.write(further_analysis)

Menampilkan berbagai opsi visualisasi data berdasarkan pilihan pengguna, termasuk Barplot, Lineplot, Boxplot, Scatterplot, dan Histogram. Penjelasan lebih lanjut mengenai analisis grafik juga ditampilkan

In [None]:
elif menu == "Prediction":
    st.subheader("Prediksi Harga Laptop")
    numeric_cols = ['Processor_Speed', 'RAM_Size', 'Storage_Capacity', 'Screen_Size', 'Weight']
    target_col = 'Price'
    for column in df.columns:
        if df[column].dtype == 'object':
            le = LabelEncoder()
            df[column] = le.fit_transform(df[column])
    X = df[numeric_cols]
    y = df[target_col]
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
    scaler = StandardScaler()
    X_train_scaled = scaler.fit_transform(X_train)
    X_test_scaled = scaler.transform(X_test)
    model = LinearRegression()
    model.fit(X_train_scaled, y_train)
    if 'laptop_price_model.sav' not in st.session_state:
        joblib.dump(model, "laptop_price_model.sav")
        joblib.dump(scaler, "scaler.sav")
        st.session_state['laptop_price_model.sav'] = True
        st.session_state['scaler.sav'] = True
        st.write("Model dan scaler disimpan!")
    st.write("Masukkan spesifikasi laptop:")
    processor_speed = st.number_input("Kecepatan Prosesor (GHz)", min_value=1.0, max_value=5.0, value=2.5, step=0.1)
    ram_size = st.number_input("Ukuran RAM (GB)", min_value=2, max_value=64, value=8, step=2)
    storage_capacity = st.number_input("Kapasitas Penyimpanan (GB)", min_value=128, max_value=2048, value=512, step=128)
    screen_size = st.number_input("Ukuran Layar (inci)", min_value=10.0, max_value=20.0, value=15.6, step=0.1)
    weight = st.number_input("Berat (kg)", min_value=0.5, max_value=5.0, value=2.0, step=0.1)
    model = joblib.load("laptop_price_model.sav")
    scaler = joblib.load("scaler.sav")
    if st.button("Prediksi Harga"):
        user_input = scaler.transform([[processor_speed, ram_size, storage_capacity, screen_size, weight]])
        predicted_price = model.predict(user_input)
        st.write(f"Prediksi Harga Laptop: ${predicted_price[0]:,.2f}")
    r_squared = model.score(X_test_scaled, y_test)
    st.write(f"R-squared Model: {r_squared:.2f}")

Prediksi Harga Laptop : Menampilkan fitur untuk prediksi harga laptop berdasarkan input pengguna.

Pengkodean Kolom Kategorikal : Menggunakan LabelEncoder untuk mengkodekan kolom kategorikal menjadi angka.

Pemrosesan Data : Membagi data menjadi data latih dan data uji, serta melakukan skala fitur.

Pelatihan Model : Melatih model regresi linear menggunakan data latih yang telah diskalakan.

Simpan Model dan Scaler : Menyimpan model dan scaler ke file jika belum ada.

Input Pengguna : Meminta input spesifikasi laptop dari pengguna dan melakukan prediksi harga berdasarkan input tersebut.

Menampilkan R-squared : Menampilkan nilai R-squared model.

Aplikasi ini memungkinkan pengguna untuk melihat gambaran umum data, melakukan visualisasi data, dan memprediksi harga laptop berdasarkan spesifikasi yang diberikan.