
# LapPick: Sistem Rekomendasi Laptop Menggunakan NLP
### Capstone Project Laskar AI

**Tanggal Pembuatan:** 20 May 2025

**Tim:** LAI25-SM035  
**Anggota:**  
- A533YBM071 – ARLIYANDI – STIKOM EL RAHMA  
- A006YBF160 – FATHUR RAHMAN AL FARIZY – Universitas Brawijaya  
- A245YBF227 – IRFAN FAJAR MUTTAQIN – Universitas Kristen Satya Wacana Salatiga  
- A011XBF457 – SHOFURA TSABITAH RAHMAH – Universitas Padjadjaran  

---

## Deskripsi Proyek
LapPick adalah sistem rekomendasi laptop berbasis Natural Language Processing (NLP) untuk membantu calon pembeli memilih laptop berdasarkan kebutuhan (gaming, desain grafis, perkantoran, dll.) dan anggaran.


In [None]:
# Data Processing and Numerical Operations
import pandas as pd
import numpy as np

# Natural Language Processing (NLP)
from Sastrawi.Stemmer.StemmerFactory import StemmerFactory
from sklearn.feature_extraction.text import TfidfVectorizer
import nltk
nltk.download('punkt')

# Machine Learning and Model Evaluation
from sklearn.metrics.pairwise import cosine_similarity
from sklearn.metrics import classification_report
from sklearn.model_selection import train_test_split

# Web Scraping (Jika Diperlukan)
import requests
from bs4 import BeautifulSoup
from selenium import webdriver

# Visualization (Jika Diperlukan)
import matplotlib.pyplot as plt
import seaborn as sns

# Optional: TensorFlow (Jika ingin model rekomendasi kompleks)
import tensorflow as tf

# General Settings
import warnings
warnings.filterwarnings('ignore')


## 1. Pengumpulan Data

### Tujuan
Mengumpulkan data spesifikasi laptop dari berbagai sumber (e-commerce, dataset publik).

### Langkah
1. Melakukan web scraping dari situs e-commerce.
2. Mengambil dataset dari Kaggle (jika ada).

### Implementasi


In [None]:

# Contoh penggunaan BeautifulSoup untuk scraping data laptop dari e-commerce
url = 'https://www.example.com/laptops'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

# Ambil judul laptop
titles = [item.get_text() for item in soup.select('h2.title')]
print(titles[:5])



## 2. Pembersihan dan Praproses Data

### Tujuan
Membersihkan data agar konsisten dan siap diproses oleh model.

### Langkah
1. Menghilangkan duplikasi.
2. Mengatasi nilai kosong.
3. Normalisasi teks (misalnya, huruf kecil).

### Implementasi


In [None]:

# Contoh membersihkan data

df = pd.read_csv('laptop_data.csv')

# Menghilangkan duplikat
df = df.drop_duplicates()

# Mengisi nilai kosong dengan rata-rata (contoh pada kolom harga)
df['harga'] = df['harga'].fillna(df['harga'].mean())

# Normalisasi nama produk
df['nama'] = df['nama'].str.lower()
print(df.head())



## 3. Pemahaman Kebutuhan Pengguna (NLP)

### Tujuan
Menginterpretasikan input teks dari pengguna untuk memahami kebutuhan.

### Langkah
1. Tokenisasi dan Stemming.
2. Perhitungan TF-IDF.
3. Pembuatan vektor kebutuhan.

### Implementasi


In [None]:

# Contoh NLP dengan TF-IDF

# Buat stemmer
factory = StemmerFactory()
stemmer = factory.create_stemmer()

# Tokenisasi dan stemming
texts = ['Laptop gaming terbaik', 'Laptop desain grafis murah']
processed_texts = [stemmer.stem(text) for text in texts]

# TF-IDF Vectorizer
vectorizer = TfidfVectorizer()
tfidf_matrix = vectorizer.fit_transform(processed_texts)

print('TF-IDF Matrix:')
print(tfidf_matrix.toarray())



## 4. Sistem Rekomendasi

### Tujuan
Merekomendasikan laptop berdasarkan kesesuaian dengan input pengguna.

### Langkah
1. Menghitung kemiripan vektor (cosine similarity).
2. Menampilkan laptop dengan skor tertinggi.

### Implementasi


In [None]:

# Contoh menghitung kemiripan
similarity = cosine_similarity(tfidf_matrix)
print('Cosine Similarity:')
print(similarity)



## 5. Evaluasi Model

### Tujuan
Mengukur akurasi dan efektivitas model rekomendasi.

### Metode
- Precision, Recall, F1-Score
- Cosine Similarity

### Implementasi


In [None]:

# Contoh evaluasi model
true_labels = [1, 0]
predictions = [1, 1]
print(classification_report(true_labels, predictions))
