<a href="https://colab.research.google.com/github/Daalleee/Natural-Language-Processing-NLP-/blob/main/ChatBot.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
import re
import random

# 1. Kamus intent: kumpulan pattern (kata kunci) dan respon
intents = {
    "greeting": {
        "patterns": ["hai", "hi", "halo", "hello", "pagi", "siang", "sore", "malam"],
        "responses": [
            "Halo! Ada yang bisa saya bantu?",
            "Hai, senang bertemu denganmu. Apa kabar?",
            "Halo, silakan tanyakan apa saja 😀"
        ]
    },
    "ask_name": {
        "patterns": ["siapa namamu", "nama kamu siapa", "kamu siapa"],
        "responses": [
            "Saya adalah chatbot sederhana yang dibuat dengan Python.",
            "Saya bot sederhana. Kamu bisa memanggil saya PyBot."
        ]
    },
    "ask_condition": {
        "patterns": ["apa kabar", "gimana kabarnya", "bagaimana kabarmu"],
        "responses": [
            "Saya baik-baik saja, terima kasih! Kamu bagaimana?",
            "Saya selalu siap membantu. Kamu sendiri bagaimana?"
        ]
    },
    "ask_help": {
        "patterns": ["bantu", "tolong", "help", "bisa apa"],
        "responses": [
            "Saya bisa menjawab pertanyaan sederhana dan mengobrol singkat.",
            "Saya masih sederhana, tapi saya bisa mencoba menjawab pertanyaanmu."
        ]
    },
    "farewell": {
        "patterns": ["dadah", "bye", "sampai jumpa", "terima kasih", "makasih"],
        "responses": [
            "Sama-sama! Sampai jumpa lagi ya 👋",
            "Terima kasih juga, senang bisa membantu!",
            "Bye, semoga harimu menyenangkan!"
        ]
    },
    "fallback": {
        "patterns": [],
        "responses": [
            "Maaf, saya belum mengerti maksudmu. Bisa dijelaskan dengan cara lain?",
            "Hmm, saya belum punya jawaban untuk itu.",
            "Menarik, tapi saya masih terlalu sederhana untuk memahami pertanyaan itu."
        ]
    }
}


In [4]:
# 2. Fungsi preprocessing: merapikan teks input
def preprocess(text: str) -> str:
    """
    Mengubah teks menjadi huruf kecil dan menghapus karakter
    non-alfanumerik.
    Contoh: 'Halo!!! Apa Kabar?' -> 'halo apa kabar'
    """
    text = text.lower()
    # ganti karakter selain huruf, angka, dan spasi dengan spasi
    text = re.sub(r"[^a-z0-9\s]", " ", text)
    # rapikan spasi yang berlebihan
    text = re.sub(r"\s+", " ", text).strip()
    return text


In [5]:
# 3. Fungsi untuk menentukan intent berdasarkan kata kunci
def get_intent(user_text: str) -> str:
    """
    Menghitung skor kecocokan tiap intent berdasarkan kemunculan
    kata kunci.
    Intent dengan skor tertinggi yang akan dipilih.
    Jika semua skor 0, gunakan intent 'fallback'.
    """
    cleaned = preprocess(user_text)
    best_intent = "fallback"
    best_score = 0

    for intent_name, data in intents.items():
        # lewati fallback saat perhitungan
        if intent_name == "fallback":
            continue

        score = 0
        for pattern in data["patterns"]:
            # jika pattern (kata/frasa) muncul di kalimat, tambahkan skor
            if pattern in cleaned:
                score += 1

        # update intent terbaik jika skor sekarang lebih tinggi
        if score > best_score:
            best_score = score
            best_intent = intent_name

    # jika tidak ada pattern yang cocok (best_score == 0), pakai fallback
    if best_score == 0:
        return "fallback"

    return best_intent


In [6]:
# 4. Fungsi untuk menghasilkan respon akhir
def generate_response(user_text: str) -> str:
    intent_name = get_intent(user_text)
    responses = intents[intent_name]["responses"]
    # pilih salah satu respon secara acak agar percakapan terasa lebih natural
    return random.choice(responses)


In [9]:
# 5. Loop percakapan utama
def chat():
    print("Chatbot: Halo, saya Chatbot Sederhana berbasis Python.")
    print("Chatbot: Ketik 'keluar', 'exit', atau 'quit' untuk mengakhiri.\n")

    while True:
        user_input = input("Anda : ")
        if user_input.lower() in ["keluar", "exit", "quit"]:
            print("Chatbot: Terima kasih sudah mengobrol. Sampai jumpa! 👋")
            break

        bot_reply = generate_response(user_input)
        print("Chatbot:", bot_reply)


# Jalankan chatbot jika file dieksekusi langsung
if __name__ == "__main__":
    chat()


Chatbot: Halo, saya Chatbot Sederhana berbasis Python.
Chatbot: Ketik 'keluar', 'exit', atau 'quit' untuk mengakhiri.

Anda : halo
Chatbot: Halo, silakan tanyakan apa saja 😀
Anda : keluat
Chatbot: Hmm, saya belum punya jawaban untuk itu.
Anda : keluar
Chatbot: Terima kasih sudah mengobrol. Sampai jumpa! 👋


**wisata**

In [10]:
import re
import random

intents = {
    "greeting": {
        "patterns": ["hai", "hi", "halo", "hello", "pagi", "siang", "sore"],
        "responses": [
            "Halo! Saya adalah chatbot wisata Indonesia. Mau liburan ke mana?",
            "Hai! Butuh rekomendasi tempat wisata?"
        ]
    },

    "tanya_tujuan_populer": {
        "patterns": [
            "wisata di bali", "bali kemana", "wisata di jogja",
            "tempat wisata populer", "rekomendasi wisata"
        ],
        "responses": [
            "Beberapa destinasi populer di Bali: Kuta, Ubud, Tanah Lot, Nusa Dua, dan Uluwatu.",
            "Kalau di Jogja, kamu bisa ke Malioboro, Candi Prambanan, Candi Borobudur (Magelang), dan Kaliurang."
        ]
    },

    "tanya_kuliner": {
        "patterns": ["kuliner khas", "makanan khas", "makan apa", "kuliner di"],
        "responses": [
            "Kalau di Jogja, coba gudeg, bakpia, dan sate klathak.",
            "Di Bandung, banyak kuliner enak: batagor, siomay, dan aneka café instagramable."
        ]
    },

    "tanya_transport": {
        "patterns": ["transport", "ke sana naik apa", "cara ke sana", "naik apa ke"],
        "responses": [
            "Untuk antar kota, kamu bisa gunakan kereta, bus AKAP, atau pesawat. Di dalam kota, biasanya ada ojek online dan angkot.",
            "Kalau dari bandara, opsi umum: taksi, shuttle bus, atau ojek online."
        ]
    },

    "tanya_budget": {
        "patterns": ["budget", "biaya", "habis berapa", "murah gak"],
        "responses": [
            "Untuk liburan hemat 3 hari di Jogja, siapkan sekitar 1–2 juta (transport belum termasuk).",
            "Untuk Bali, tergantung gaya liburanmu. Budget backpacker 3 hari bisa mulai dari 2–3 juta."
        ]
    },

    "farewell": {
        "patterns": ["terima kasih", "makasih", "thank you", "bye", "dadah"],
        "responses": [
            "Sama-sama! Semoga liburannya menyenangkan 😄",
            "Terima kasih juga, semoga perjalananmu lancar!"
        ]
    },

    "fallback": {
        "patterns": [],
        "responses": [
            "Maaf, saya belum mengerti. Coba jelaskan lagi rencana wisatamu?",
            "Menarik! Bisa dijelaskan lebih spesifik (tujuan kota, lama perjalanan, atau budget)?"
        ]
    }
}

def preprocess(text: str) -> str:
    text = text.lower()
    text = re.sub(r"[^a-z0-9\s]", " ", text)
    text = re.sub(r"\s+", " ", text).strip()
    return text

def get_intent(user_text: str) -> str:
    cleaned = preprocess(user_text)
    best_intent = "fallback"
    best_score = 0

    for intent_name, data in intents.items():
        if intent_name == "fallback":
            continue

        score = 0
        for pattern in data["patterns"]:
            if pattern in cleaned:
                score += 1

        if score > best_score:
            best_score = score
            best_intent = intent_name

    if best_score == 0:
        return "fallback"

    return best_intent

def generate_response(user_text: str) -> str:
    intent_name = get_intent(user_text)
    return random.choice(intents[intent_name]["responses"])

def chat():
    print("Chatbot Wisata: Halo! Saya chatbot wisata Indonesia.")
    print("Ketik 'keluar' untuk mengakhiri.\n")

    while True:
        user_input = input("Anda : ")
        if user_input.lower() in ["keluar", "exit", "quit"]:
            print("Chatbot Wisata: Sampai jumpa, selamat berlibur! 👋")
            break

        print("Chatbot Wisata:", generate_response(user_input))

if __name__ == "__main__":
    chat()


Chatbot Wisata: Halo! Saya chatbot wisata Indonesia.
Ketik 'keluar' untuk mengakhiri.

Anda : wisata di bali
Chatbot Wisata: Beberapa destinasi populer di Bali: Kuta, Ubud, Tanah Lot, Nusa Dua, dan Uluwatu.
Anda : exit
Chatbot Wisata: Sampai jumpa, selamat berlibur! 👋


In [1]:
from sentence_transformers import SentenceTransformer
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np

# 1. Load pretrained model (multilingual, bisa bahasa Indonesia)
# Anda bisa ganti ke model lain jika mau, misalnya:
# "paraphrase-multilingual-MiniLM-L12-v2"
model = SentenceTransformer("paraphrase-multilingual-MiniLM-L12-v2")

# 2. Knowledge base: daftar FAQ dan jawaban tentang wisata
faq_questions = [
    "Apa saja tempat wisata populer di Bali?",
    "Apa rekomendasi wisata di Yogyakarta?",
    "Apa kuliner khas Yogyakarta?",
    "Bagaimana cara ke Bali dari Jakarta?",
    "Berapa budget yang dibutuhkan untuk liburan 3 hari di Bali?",
    "Apa saja wisata alam yang cocok untuk keluarga?",
    "Kapan waktu terbaik untuk berkunjung ke Bali?"
]

faq_answers = [
    "Tempat wisata populer di Bali antara lain: Kuta, Seminyak, Ubud, Tanah Lot, dan Uluwatu.",
    "Di Yogyakarta, kamu bisa mengunjungi Malioboro, Keraton, Taman Sari, dan Candi Prambanan.",
    "Kuliner khas Yogyakarta antara lain: gudeg, bakpia, sate klathak, dan kopi jos.",
    "Dari Jakarta ke Bali kamu bisa naik pesawat (sekitar 1,5 jam), atau naik kereta ke Banyuwangi lalu menyeberang ke Gilimanuk.",
    "Untuk liburan hemat 3 hari di Bali, siapkan sekitar 2–3 juta rupiah di luar tiket pesawat.",
    "Wisata alam untuk keluarga misalnya: pantai-pantai yang landai, kebun binatang, dan taman nasional yang ramah pengunjung.",
    "Waktu terbaik ke Bali biasanya saat musim kemarau (sekitar April–Oktober) karena cuaca cenderung cerah."
]

# 3. Hitung embedding untuk semua pertanyaan FAQ (sekali saja)
faq_embeddings = model.encode(faq_questions)

def get_best_answer(user_question, threshold=0.4):
    """
    Mengambil jawaban paling mirip berdasarkan cosine similarity.
    Jika similarity tertinggi < threshold, kembalikan pesan fallback.
    """
    # Encode pertanyaan user
    user_emb = model.encode([user_question])

    # Hitung cosine similarity
    similarities = cosine_similarity(user_emb, faq_embeddings)[0]

    # Cari index dengan similarity tertinggi
    best_idx = int(np.argmax(similarities))
    best_sim = similarities[best_idx]

    if best_sim < threshold:
        return (
            f"Maaf, saya belum punya jawaban pasti untuk itu "
            f"(similarity={best_sim:.2f}). Bisa tanyakan dengan cara lain?"
        )
    else:
        return faq_answers[best_idx]

def chat_wisata_semantic():
    print("Chatbot Wisata (Semantic Search)")
    print("Ketik 'keluar' untuk mengakhiri.\n")

    while True:
        user_input = input("Anda : ")

        if user_input.lower() in ["keluar", "exit", "quit"]:
            print("Chatbot: Sampai jumpa! Selamat merencanakan liburan 😊")
            break

        answer = get_best_answer(user_input)
        print("Chatbot:", answer)


if __name__ == "__main__":
    chat_wisata_semantic()


Error while fetching `HF_TOKEN` secret value from your vault: 'Requesting secret HF_TOKEN timed out. Secrets can only be fetched when running from the Colab UI.'.
You are not authenticated with the Hugging Face Hub in this notebook.
If the error persists, please let us know by opening an issue on GitHub (https://github.com/huggingface/huggingface_hub/issues/new).


modules.json:   0%|          | 0.00/229 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/122 [00:00<?, ?B/s]

README.md: 0.00B [00:00, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/645 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/471M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/480 [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/9.08M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/239 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

Chatbot Wisata (Semantic Search)
Ketik 'keluar' untuk mengakhiri.

Anda : halo
Chatbot: Maaf, saya belum punya jawaban pasti untuk itu (similarity=0.30). Bisa tanyakan dengan cara lain?
Anda : balo
Chatbot: Maaf, saya belum punya jawaban pasti untuk itu (similarity=0.39). Bisa tanyakan dengan cara lain?
Anda : bali
Chatbot: Dari Jakarta ke Bali kamu bisa naik pesawat (sekitar 1,5 jam), atau naik kereta ke Banyuwangi lalu menyeberang ke Gilimanuk.
Anda : jogja
Chatbot: Maaf, saya belum punya jawaban pasti untuk itu (similarity=0.39). Bisa tanyakan dengan cara lain?
Anda : yogyakarta
Chatbot: Kuliner khas Yogyakarta antara lain: gudeg, bakpia, sate klathak, dan kopi jos.
Anda : gudeg
Chatbot: Maaf, saya belum punya jawaban pasti untuk itu (similarity=0.27). Bisa tanyakan dengan cara lain?
Anda : khas
Chatbot: Maaf, saya belum punya jawaban pasti untuk itu (similarity=0.32). Bisa tanyakan dengan cara lain?
Anda : apa saja
Chatbot: Maaf, saya belum punya jawaban pasti untuk itu (similarity