# AI Chatbot in Python
> Chatbot sederhana ini menggunakan konsep sederhana penerapan Cosine Similarity

> Disini program Chatbot dibuat dengan sesuai kebutuhan pengguna, jadi kita bisa memilih apakah harus membuat program ini bisa bekerja pada topik tertentu, misalnya untuk Chatbot berbasis Covid-19, atau yang lainnya yang sedang relevan.

In [None]:
#sumber materi : https://towardsdatascience.com/making-a-simple-and-fast-chatbot-in-10-minutes-2d84a4ba35e
#https://youtu.be/9KZwRBg4-P0

# Tools scraping Artikel

Pada program kali ini kita akan mengambil teks dari internet menggunakan tools newspaper3k, dimana tools ini memiliki beberapa kelebihan yaitu:
1. Kerangka kerja dalam mengunduh artikel yang multi-thread
2. Dapat mengidentifikasi URL baru
3. Mampu mengekstraksi teks dari HTML
4. Terbaik dalam hal ekstraksi gambar dari HTML
5. Mampu mengekstraksi semua gambar dari HTML
6. Dapat mengekstraksi kata kunci dari teks
7. Dapat mengekstrak ringkasan teks
8. Dapat mengekstraksi nama penulis suatu artikel
9. Dapat mengekstraksi istilah yang sedang trend di mesin pencarian Google
10. Dapat bekerja lebih dari 10 bahasa (termasuk Inggris, Jerman, Arab, China, dll)

In [None]:
!pip install newspaper3k



In [None]:
# Import library
from newspaper import Article
import random
import nltk
import string
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np
import warnings
warnings.filterwarnings('ignore')

In [None]:
nltk.download('punkt', quiet=True)

True

# Proses 1 (Membuat korpus dengan mendownload artikel dari sebuah link)

Link dapat diganti dengan link teks berbhasa Indonesia, tetapi kali ini kita mencoba menggunakan teks berbahasa Inggris terlebih dahulu. 

In [None]:
article = Article('https://www.mayoclinic.org/diseases-conditions/chronic-kidney-disease/symptoms-causes/syc-20354521')
article.download()
article.parse()
article.nlp()
corpus = article.text
print(corpus)

Overview

Chronic kidney disease, also called chronic kidney failure, involves a gradual loss of kidney function. Your kidneys filter wastes and excess fluids from your blood, which are then removed in your urine. Advanced chronic kidney disease can cause dangerous levels of fluid, electrolytes and wastes to build up in your body.

In the early stages of chronic kidney disease, you might have few signs or symptoms. You might not realize that you have kidney disease until the condition is advanced.

Treatment for chronic kidney disease focuses on slowing the progression of kidney damage, usually by controlling the cause. But, even controlling the cause might not keep kidney damage from progressing. Chronic kidney disease can progress to end-stage kidney failure, which is fatal without artificial filtering (dialysis) or a kidney transplant.

How kidneys work Show transcript for video How kidneys work One of the important jobs of the kidneys is to clean the blood. As blood moves through t

# Proses 2 (Memabagi corpus menjadi perkalimat)

Pada proses ini kita membagi article yg kita simpan di dalam corpus menjadi perkalimat-kalimat.

In [None]:
# Tokenization
text = corpus
sentence_list = nltk.sent_tokenize(text) #A list of senetences

# Print the list of sentences
print(sentence_list)


['Overview\n\nChronic kidney disease, also called chronic kidney failure, involves a gradual loss of kidney function.', 'Your kidneys filter wastes and excess fluids from your blood, which are then removed in your urine.', 'Advanced chronic kidney disease can cause dangerous levels of fluid, electrolytes and wastes to build up in your body.', 'In the early stages of chronic kidney disease, you might have few signs or symptoms.', 'You might not realize that you have kidney disease until the condition is advanced.', 'Treatment for chronic kidney disease focuses on slowing the progression of kidney damage, usually by controlling the cause.', 'But, even controlling the cause might not keep kidney damage from progressing.', 'Chronic kidney disease can progress to end-stage kidney failure, which is fatal without artificial filtering (dialysis) or a kidney transplant.', 'How kidneys work Show transcript for video How kidneys work One of the important jobs of the kidneys is to clean the blood.

# Proses 3 (Bot Response)

Bot respon digunakan untuk membuat sebuah percakapan awal antara pengguna dengan bot, jadi disini user dapat menyapa bot, nah untuk kata-kata dapat diganti sesuai dengan kebutuhan, misalnya bahasa indonesia. 

Pada percakapan awal tidak menggunakan ML atau metode lainnya, program hanya menjawab dengan kata yang di cocokkan sebagai input.

In [None]:
#a function to return a random greeting response to a users greeting
def greeting_response(text):
    text = text.lower()
    
    #Bots greeting respone
    bot_greetings = ['howdy','hi','hello','hola']
    
    #Users greeting
    user_greetings = ['hi','hey','hello','greetings','wassup']
    
    for word in text.split():
        if word in user_greetings:
            return random.choice(bot_greetings)
        
    #Random response to greeting
    def gratitude_response(text):
        text=text.lower()
   


1. Pada list kode bot_greetings itu bentuk kata sapaan bot terhadap sapaan yang kita berikan, dan dapat diganti dengan bahasa Indonesia atau lainnya.
2. Sedangkan, pada list user_greetings itu kata sapaan input dari user dan dapat diganti dengan bahasa lainnya.

# Sorting List

In [None]:
 def index_sort(list_var):
    length = len(list_var)
    list_index = list(range(0, length))
    
    x = list_var        
    for i in range(length):
        for j in range(length):
            if x[list_index[i]] > x[list_index[j]]:
                #swap
                temp = list_index[i]
                list_index[i] = list_index[j]
                list_index[j] = temp
                
    return list_index

Fungsi index_sort berfungsi untuk mengurutkan index pada list hasil similarity scores. Index akan diurutkan menurut element yg mempunyai similarity scores paling besar

# Chatbot Respon Menggunakan Cosine Similarity

Pada respon bot menggunakan teknis Cosine Similarity untuk menghitung kata yang cocok dengan yang di input user terhadap respon dari Bot

In [None]:
# Creat Bots Response
def bot_response(user_input):
    user_input=user_input.lower() #Merubah input dari user menjadi huruf kecil
    sentence_list.append(user_input) #Memasukkan input user kedalam corpus yg kita punya (corpus disimpan dalam variabel sentence_list)
    bot_response= '' #Inisialisasi variabel bot response

    cm=CountVectorizer().fit_transform(sentence_list) #Melakukan ekstraksi fitur pada corpus yg kita punya menggunakan CountVectorizer (Bag of Word)

    similarity_scores=cosine_similarity(cm[-1],cm) #Menghitung cosine similarity antara hasil fitur ekstraksi input user (cm[-1]) dengan semua data dalam corpus
    similarity_scores_list=similarity_scores.flatten() #Merubah hasil perhitungan cosine similarity menjadi list 1D
    index=index_sort(similarity_scores_list) #Melakukan sorting untuk index pada similarity score berdasarkan element yg terbesar, kemudian hasilnya disimpan pada list yg bernama index
    index=index[1:] 

    response_flag=0 
    for i in range(len(index)):
        if similarity_scores_list[index[i]]>0.0:
            bot_response=bot_response+' '+sentence_list[index[i]]
            response_flag=1

        if response_flag==0:
            bot_response=bot_response+" "+"I apologize, I dont understand" #Jika respon_flag = 0 (tidak ada kata yg cocok) maka akan memberikan response  apologize, I dont understand.

        sentence_list.remove(user_input) #Meremove user_input yg sudah dimasukkan kedalam sentence_list (Corpus yg kita punya).

        return bot_response

Pada listing kode >bot_response=bot_response+" "+"I apologize, I dont understand" pada list kode ini kata I apologize tujuannya untuk memberikan respon karena sistem tidak mengenali kata yang kita input, jadi sebagai bentuk respon bot kepada user. Kata tersebut bisa diganti dengan bahasa Indonesia, misalnya "Maaf saya tidak mengetahui arti atau tidak mengenali kata-kata yang di input".

# Proses 4 (End Process, Making chat box)

In [None]:
#Start Chat
print("Doc Bot: I am DOc bot and I will answer your queries about chronic kidney disease, if you want to exit type, bye  ?")

exit_list=['exit','bye','see you later','quit']

while(True):
    user_input=input() #mengambil input pada user
    if user_input.lower() in exit_list: #kalau input dari user ada didalam exit_list maka program akan berhenti
        print('Doc Bot: Bye Bye See you later')
        break
    else:
        if greeting_response(user_input)!= None: #Mengecek apakah input dari user masuk kedalam greeting atau bukan
            print('Doc Bot: '+ greeting_response(user_input)) #Jika masuk kedalam greeting maka bot akan melakukan response terhadap greeting tersebut
        else:
            print('Doc Bot: '+ bot_response(user_input)) #Jika bukan, maka bot akan memanggil fungsi bot_response untuk menentukan respon apa yg akan ia keluarkan sesuai dengan input dari user

Doc Bot: I am DOc bot and I will answer your queries about chronic kidney disease, if you want to exit type, bye  ?
what is chronic kidney disease
Doc Bot:  Overview

Chronic kidney disease, also called chronic kidney failure, involves a gradual loss of kidney function.
Pregnancy complications
Doc Bot:  Potential complications include:

Fluid retention, which could lead to swelling in your arms and legs, high blood pressure, or fluid in your lungs (pulmonary edema)

A sudden rise in potassium levels in your blood (hyperkalemia), which could impair your heart's function and can be life-threatening

Anemia

Heart disease

Weak bones and an increased risk of bone fractures

Decreased sex drive, erectile dysfunction or reduced fertility

Damage to your central nervous system, which can cause difficulty concentrating, personality changes or seizures

Decreased immune response, which makes you more vulnerable to infection

Pericarditis, an inflammation of the saclike membrane that envelops y

Doc Bot ganti dengan ini atau sesuai dengan topik yang lagi di bahas, print("Doc Bot: Mau nanya apa kamu tentang kabel laut?")

In [None]:
#buat pertanyaan pada kolom diatas seperti : what is chronic kidney disease?, dll.

---
# AI Chatbot Versi Bahasa **Indonesia**
# Proses 1 (Making Corpus with Download an Article)

In [None]:
article = Article('https://warstek.com/kabel-laut/')
article.download()
article.parse()
article.nlp()
corpus = article.text
print(corpus)

Telkomsel, Indihome, dan Kabel Laut JaSuKa

Pada hari Minggu lalu (19 September 2021), terjadi gangguan jaringan internet pada Telkomsel dan Indihome. Gangguan tersebut menyebabkan penurunan kualitas layanan TelkomGroup baik fixed maupun mobile broadband di beberapa wilayah Indonesia. Di masa pandemi yang menuntut orang untuk berada di rumah seperti ini, gangguan internet tentu menjadi masalah besar. Berbagai kegiatan penting seperti Seleksi Kompetensi Dasar (SKD) CPNS mengalami penundaan. Netizen pun banyak berkomentar negatif terkait hal ini. Saat artikel ini dirilis, gangguan tersebut mungkin belum benar-benar terselesaikan.

Gangguan tersebut disebabkan oleh masalah pada sistem komunikasi kabel laut JaSuKa (Jawa, Sumatera dan Kalimantan) ruas Batam-Pontianak. Telkom memperkirakan proses perbaikan kabel laut yang terganggu akan berlangsung sekitar sebulan. Meski begitu, Telkom mencoba berbagai alternatif agar jaringan internet tetap dapat berjalan sebaik mungkin, meski tentu tidak s

# Proses 2 (Tokenization)

In [None]:
# Tokenization
text = corpus
sentence_list = nltk.sent_tokenize(text) #A list of senetences

# Print the list of sentences
print(sentence_list)

['Telkomsel, Indihome, dan Kabel Laut JaSuKa\n\nPada hari Minggu lalu (19 September 2021), terjadi gangguan jaringan internet pada Telkomsel dan Indihome.', 'Gangguan tersebut menyebabkan penurunan kualitas layanan TelkomGroup baik fixed maupun mobile broadband di beberapa wilayah Indonesia.', 'Di masa pandemi yang menuntut orang untuk berada di rumah seperti ini, gangguan internet tentu menjadi masalah besar.', 'Berbagai kegiatan penting seperti Seleksi Kompetensi Dasar (SKD) CPNS mengalami penundaan.', 'Netizen pun banyak berkomentar negatif terkait hal ini.', 'Saat artikel ini dirilis, gangguan tersebut mungkin belum benar-benar terselesaikan.', 'Gangguan tersebut disebabkan oleh masalah pada sistem komunikasi kabel laut JaSuKa (Jawa, Sumatera dan Kalimantan) ruas Batam-Pontianak.', 'Telkom memperkirakan proses perbaikan kabel laut yang terganggu akan berlangsung sekitar sebulan.', 'Meski begitu, Telkom mencoba berbagai alternatif agar jaringan internet tetap dapat berjalan sebaik m

In [None]:
#a function to return a random greeting response to a users greeting
def greeting_response(text):
    text = text.lower()
    
    #Bots greeting respone
    bot_greetings = ['halo','hai','yuhuu','*eyebrows up*']
    
    #Users greeting
    user_greetings = ['Haloo','Eh iyaa Haii','Hai','greetings','wassup']
    
    for word in text.split():
        if word in user_greetings:
            return random.choice(bot_greetings)
        
    #Random response to greeting
    def gratitude_response(text):
        text=text.lower()
   


In [None]:
 def index_sort(list_var):
    length = len(list_var)
    list_index = list(range(0, length))
    
    x = list_var        
    for i in range(length):
        for j in range(length):
            if x[list_index[i]] > x[list_index[j]]:
                #swap
                temp = list_index[i]
                list_index[i] = list_index[j]
                list_index[j] = temp
                
    return list_index

In [None]:
# Creat Bots Response
def bot_response(user_input):
    user_input=user_input.lower() #Merubah input dari user menjadi huruf kecil
    sentence_list.append(user_input) #Memasukkan input user kedalam corpus yg kita punya (corpus disimpan dalam variabel sentence_list)
    bot_response= '' #Inisialisasi variabel bot response

    cm=CountVectorizer().fit_transform(sentence_list) #Melakukan ekstraksi fitur pada corpus yg kita punya menggunakan CountVectorizer (Bag of Word)

    similarity_scores=cosine_similarity(cm[-1],cm) #Menghitung cosine similarity antara hasil fitur ekstraksi input user (cm[-1]) dengan semua data dalam corpus
    similarity_scores_list=similarity_scores.flatten() #Merubah hasil perhitungan cosine similarity menjadi list 1D
    index=index_sort(similarity_scores_list) #Melakukan sorting untuk index pada similarity score berdasarkan element yg terbesar, kemudian hasilnya disimpan pada list yg bernama index
    index=index[1:] 

    response_flag=0 
    for i in range(len(index)):
        if similarity_scores_list[index[i]]>0.0:
            bot_response=bot_response+' '+sentence_list[index[i]]
            response_flag=1
            
        if response_flag==0:
            bot_response=bot_response+" "+"Maaf aku tidak mengerti" #Jika respon_flag = 0 (tidak ada kata yg cocok) maka akan memberikan response  apologize, I dont understand.

        sentence_list.remove(user_input) #Meremove user_input yg sudah dimasukkan kedalam sentence_list (Corpus yg kita punya).

        return bot_response

# Proses 4 (End Process, Making chat box)

In [None]:
#Start Chat
print("Doc Bot: Mau nanya apa kamu tentang kabel laut")

exit_list=['exit','bye','keluar','quit', 'sampai jumpa']

while(True):
    user_input=input() #mengambil input pada user
    if user_input.lower() in exit_list: #kalau input dari user ada didalam exit_list maka program akan berhenti
        print('Doc Bot: Bye Bye Sampai Jumpa Lagi')
        break
    else:
        if greeting_response(user_input)!= None: #Mengecek apakah input dari user masuk kedalam greeting atau bukan
            print('Doc Bot: '+ greeting_response(user_input)) #Jika masuk kedalam greeting maka bot akan melakukan response terhadap greeting tersebut
        else:
            print('Doc Bot: '+ bot_response(user_input)) #Jika bukan, maka bot akan memanggil fungsi bot_response untuk menentukan respon apa yg akan ia keluarkan sesuai dengan input dari user

Doc Bot: Mau nanya apa kamu tentang kabel laut
apa itu kabel laut
Doc Bot:  Sebagai mahasiswa Teknik Elektro yang pernah sedikit mendalami internet, yang bisa penulis katakan terkait internet adalah “It’s never been simple”

Mengenal Kabel Laut

Ketika mendengar bahwa 99% internet itu melewati kabel laut, apa bayangan kita terkait bentuk fisik dari kabel laut itu?
kabel laut murah
Doc Bot:  Jaringan Kabel Laut di Indonesia – www.submarinecablemap.com

Kabel laut memang jauh lebih murah daripada satelit, namun tetap saja tidak mudah dan tidak sederhana.
keluar
Doc Bot: Bye Bye Sampai Jumpa Lagi


In [None]:
# kabel laut adalah
# kabel laut untuk komunikasi internasional adalah

## Activity (3-5 kelompok dalam 30-60 menit)
- Buatlah bot sederhana dengan topik tertentu. Data (knowledge base) boleh berasal dari mana saja, disesuaikan dengna topik yang ingin diambil. 
- Wajib menggunakan versi Bahasa Inggris dan Bahasa Indonesia.
- Gunakan beberapa artikel agar bot memiliki pengetahuan yang lebih luas.
- Buat simulasi pertanyaan dan tampilkan hasilnya (contoh output).
- Jawaban tidak ada yang benar atau yang salah, yang terpenting bot mampu memberi respon yang baik sesuai dengan topik yang dibahas.

In [None]:
!pip install newspaper3k



In [None]:
# Import library
from newspaper import Article
import random
import nltk
import string
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.metrics.pairwise import cosine_similarity
import numpy as np
import warnings
warnings.filterwarnings('ignore')

In [None]:
nltk.download('punkt', quiet=True)

True

## Make corpus

In [None]:
article = Article('https://www.hsph.harvard.edu/nutritionsource/healthy-eating-plate/')
article.download()
article.parse()
article.nlp()
corpus = article.text
print(corpus)

Use the Healthy Eating Plate as a guide for creating healthy, balanced meals—whether served at the table or packed in a lunch box. Click on each section of the interactive image below to learn more.



Looking for a printable copy? Download one here, and hang it on your refrigerator to serve as a daily reminder when planning and preparing your meals! Translations of the Healthy Eating Plate are also available in over 25 languages.

Building a Healthy and Balanced Diet

Make most of your meal vegetables and fruits – ½ of your plate.

Aim for color and variety, and remember that potatoes don’t count as vegetables on the Healthy Eating Plate because of their negative impact on blood sugar.

Go for whole grains – ¼ of your plate.

Whole and intact grains—whole wheat, barley, wheat berries, quinoa, oats, brown rice, and foods made with them, such as whole wheat pasta—have a milder effect on blood sugar and insulin than white bread, white rice, and other refined grains.

Protein power – ¼ of

## Tokenizing

In [None]:
# Tokenization
text = corpus
sentence_list = nltk.sent_tokenize(text) #A list of senetences

# Print the list of sentences
print(sentence_list)

['Use the Healthy Eating Plate as a guide for creating healthy, balanced meals—whether served at the table or packed in a lunch box.', 'Click on each section of the interactive image below to learn more.', 'Looking for a printable copy?', 'Download one here, and hang it on your refrigerator to serve as a daily reminder when planning and preparing your meals!', 'Translations of the Healthy Eating Plate are also available in over 25 languages.', 'Building a Healthy and Balanced Diet\n\nMake most of your meal vegetables and fruits – ½ of your plate.', 'Aim for color and variety, and remember that potatoes don’t count as vegetables on the Healthy Eating Plate because of their negative impact on blood sugar.', 'Go for whole grains – ¼ of your plate.', 'Whole and intact grains—whole wheat, barley, wheat berries, quinoa, oats, brown rice, and foods made with them, such as whole wheat pasta—have a milder effect on blood sugar and insulin than white bread, white rice, and other refined grains.'

## Bot respons

In [None]:
#a function to return a random greeting response to a users greeting
def greeting_response(text):
    text = text.lower()
    
    #Bots greeting respone
    bot_greetings = ['hey','hi','hello','hola',"welcome"]
    
    #Users greeting
    user_greetings = ['hi','hey','hello','greetings','wassup']
    
    for word in text.split():
        if word in user_greetings:
            return random.choice(bot_greetings)
        
    #Random response to greeting
    def gratitude_response(text):
        text=text.lower()
   

## sorting

In [None]:
 def index_sort(list_var):
    length = len(list_var)
    list_index = list(range(0, length))
    
    x = list_var        
    for i in range(length):
        for j in range(length):
            if x[list_index[i]] > x[list_index[j]]:
                #swap
                temp = list_index[i]
                list_index[i] = list_index[j]
                list_index[j] = temp
                
    return list_index

In [None]:
# Creat Bots Response
def bot_response(user_input):
    user_input=user_input.lower() #Merubah input dari user menjadi huruf kecil
    sentence_list.append(user_input) #Memasukkan input user kedalam corpus yg kita punya (corpus disimpan dalam variabel sentence_list)
    bot_response= '' #Inisialisasi variabel bot response

    cm=CountVectorizer().fit_transform(sentence_list) #Melakukan ekstraksi fitur pada corpus yg kita punya menggunakan CountVectorizer (Bag of Word)

    similarity_scores=cosine_similarity(cm[-1],cm) #Menghitung cosine similarity antara hasil fitur ekstraksi input user (cm[-1]) dengan semua data dalam corpus
    similarity_scores_list=similarity_scores.flatten() #Merubah hasil perhitungan cosine similarity menjadi list 1D
    index=index_sort(similarity_scores_list) #Melakukan sorting untuk index pada similarity score berdasarkan element yg terbesar, kemudian hasilnya disimpan pada list yg bernama index
    index=index[1:] 

    response_flag=0 
    for i in range(len(index)):
        if similarity_scores_list[index[i]]>0.0:
            bot_response=bot_response+' '+sentence_list[index[i]]
            response_flag=1

        if response_flag==0:
            bot_response=bot_response+" "+" Sorry , I dont understand" #Jika respon_flag = 0 (tidak ada kata yg cocok) maka akan memberikan response  apologize, I dont understand.

        sentence_list.remove(user_input) #Meremove user_input yg sudah dimasukkan kedalam sentence_list (Corpus yg kita punya).

        return bot_response

In [None]:
#Start Chat
print("hello plate: holla I am Hello plate and I will answer your queries about Healthy Eating, if you want to exit type, bye  ?")

exit_list=['exit','bye','by','see you later','quit','ok']

while(True):
    user_input=input() #mengambil input pada user
    if user_input.lower() in exit_list: #kalau input dari user ada didalam exit_list maka program akan berhenti
        print('hello plate : Bye Bye See you later, thanks')
        break
    else:
        if greeting_response(user_input)!= None: #Mengecek apakah input dari user masuk kedalam greeting atau bukan
            print('hello plate : '+ greeting_response(user_input)) #Jika masuk kedalam greeting maka bot akan melakukan response terhadap greeting tersebut
        else:
            print('hello plate : '+ bot_response(user_input)) #Jika bukan, maka bot akan memanggil fungsi bot_response untuk menentukan respon apa yg akan ia keluarkan sesuai dengan input dari user

hello plate: holla I am Hello plate and I will answer your queries about Healthy Eating, if you want to exit type, bye  ?


KeyboardInterrupt: ignored

### B indo


In [None]:
'https://www.kompas.com/stori/read/2021/05/20/110016179/kerajaan-pajajaran-berdirinya-raja-raja-keruntuhan-dan-peninggalan?page=all'and'https://sejarahlengkap.com/indonesia/kerajaan/sejarah-kerajaan-pajajaran')

In [None]:
article = Article('https://www.cnnindonesia.com/nasional/20210607163129-31-651351/kerajaan-pajajaran-masa-kejayaan-dan-jejak-peninggalan')
article.download()
article.parse()
article.nlp()
corpus = article.text
print(corpus)

Jakarta, CNN Indonesia --

Kerajaan Pajajaran adalah kerajaan di Nusantara yang terletak di Jawa Barat. Kerajaan Pajajaran memiliki sejarah panjang saat berdiri dan pada masa kejayaanya hingga meninggalkan jejak peninggalan yang bisa dilihat hingga saat ini.

Kerajaan Pajajaran dikenal juga dengan naman lain Kerajaan Sunda atau Negeri Sunda atau disebut Pasundan. Letak kerajaan ini di masa lampau bukanlah terletak di Bandung yang kini menjadi Ibu Kota Jawa Barat, melainkan di Pakuan atau saat ini Bogor.

Awal Mula Kerajaan Pajajaran

Kerajaan Pajajaran berdiri pada tahun 923 M dan berakhir pada 1597 M. Menurut naskah kuno Carita Parahiyangan yang ditulis pada abad ke-16 M, Kerajaan Pajajaran merupakan gabungan dua kerajaan yakni Kerajaan Sunda dan Kerajaan Galuh.

Kerajaan Pajajaran adalah kerajaan Hindu yang terbentuk dari bersatunya Kerajaan Sunda dan Kerajaan Galuh. (Foto: Gunawan Kartapranata via Wikimedia Commons (CC-BY-SA-3.0) Kerajaan Pajajaran adalah kerajaan Hindu yang terbent

In [None]:
article = Article('https://www.cnnindonesia.com/nasional/20210607163129-31-651351/kerajaan-pajajaran-masa-kejayaan-dan-jejak-peninggalan')
article2 = Article('https://phinemo.com/sejarah-kerajaan-pajajaran-dan-asal-usul-urang-sunda-di-jawa-barat/')
article.download()
article.parse()
article.nlp()
corpus = article.text
print(corpus)

Jakarta, CNN Indonesia --

Kerajaan Pajajaran adalah kerajaan di Nusantara yang terletak di Jawa Barat. Kerajaan Pajajaran memiliki sejarah panjang saat berdiri dan pada masa kejayaanya hingga meninggalkan jejak peninggalan yang bisa dilihat hingga saat ini.

Kerajaan Pajajaran dikenal juga dengan naman lain Kerajaan Sunda atau Negeri Sunda atau disebut Pasundan. Letak kerajaan ini di masa lampau bukanlah terletak di Bandung yang kini menjadi Ibu Kota Jawa Barat, melainkan di Pakuan atau saat ini Bogor.

Awal Mula Kerajaan Pajajaran

Kerajaan Pajajaran berdiri pada tahun 923 M dan berakhir pada 1597 M. Menurut naskah kuno Carita Parahiyangan yang ditulis pada abad ke-16 M, Kerajaan Pajajaran merupakan gabungan dua kerajaan yakni Kerajaan Sunda dan Kerajaan Galuh.

Kerajaan Pajajaran adalah kerajaan Hindu yang terbentuk dari bersatunya Kerajaan Sunda dan Kerajaan Galuh. (Foto: Gunawan Kartapranata via Wikimedia Commons (CC-BY-SA-3.0) Kerajaan Pajajaran adalah kerajaan Hindu yang terbent

In [None]:
article2.download()
article2.parse()
article2.nlp()
corpus2 = article2.text
print(corpus2)

Sejarah Kerajaan Pajajaran atau Kerajaan Sunda dimulai pada tahun 1130 M dan berakhir di tahun 1579 M. Pajajaran adalah kerajaan Hindu terkahir di Jawa.

SHARE :

Ditulis Oleh: Taufiqur Rohman

Sejarah Kerajaan Pajajaran atau juga dikenal sebagai Kerajaan Sunda dimulai pada tahun 1130 M dan berakhir di tahun 1579 M. Pajajaran adalah kerajaan Hindu di Tatar Pasundan yang didirikan oleh orang-orang dari etnis Sunda. Kerajaan ini bukanlah kerajaan kecil dan lemah, dalam riwayatnya diceritakan bahwa Kerajaan Singasari dan Majapahit yang menguasai hampir seluruh wilayah Asia Tenggara bahkan tidak mampu untuk menaklukannya.

Luas Kerajaan Pajajaran hanya sepertiga atau seperdelapan Pulau Jawa, berbagai wilayah kekuasaan dengan Kerajaan Majapahit kala itu. Pajajaran menguasai wilayah seluas 300 league atau sekitar 1176 km, mencakup Pelabuhan Sunda Kelapa, Pelabuhan Cimanuk, dan Sungai Cimanuk. Dari catatan sejarah, diketahui pusat pemerintahan atau ibukota terakhir Pajajaran sebelum hancur ol

In [None]:
# Tokenization
text = corpus
sentence_list = nltk.sent_tokenize(text) #A list of senetences

for i nltk.sent_tokenize(corpus2):
  sentence_list.append(i)

# Print the list of sentences
print(sentence_list)

SyntaxError: ignored

In [None]:
#a function to return a random greeting response to a users greeting
def greeting_response(text):
    text = text.lower()
    
    #Bots greeting respone
    bot_greetings = ['halo','hai','yuhuu','*eyebrows up*','sampurasun']
    
    #Users greeting
    user_greetings = ['Haloo','Eh iyaa Haii','Hai','greetings','wassup','rampes']
    
    for word in text.split():
        if word in user_greetings:
            return random.choice(bot_greetings)
        
    #Random response to greeting
    def gratitude_response(text):
        text=text.lower()

In [None]:
 def index_sort(list_var):
    length = len(list_var)
    list_index = list(range(0, length))
    
    x = list_var        
    for i in range(length):
        for j in range(length):
            if x[list_index[i]] > x[list_index[j]]:
                #swap
                temp = list_index[i]
                list_index[i] = list_index[j]
                list_index[j] = temp
                
    return list_index

In [None]:
# Creat Bots Response
def bot_response(user_input):
    user_input=user_input.lower() #Merubah input dari user menjadi huruf kecil
    sentence_list.append(user_input) #Memasukkan input user kedalam corpus yg kita punya (corpus disimpan dalam variabel sentence_list)
    bot_response= '' #Inisialisasi variabel bot response

    cm=CountVectorizer().fit_transform(sentence_list) #Melakukan ekstraksi fitur pada corpus yg kita punya menggunakan CountVectorizer (Bag of Word)

    similarity_scores=cosine_similarity(cm[-1],cm) #Menghitung cosine similarity antara hasil fitur ekstraksi input user (cm[-1]) dengan semua data dalam corpus
    similarity_scores_list=similarity_scores.flatten() #Merubah hasil perhitungan cosine similarity menjadi list 1D
    index=index_sort(similarity_scores_list) #Melakukan sorting untuk index pada similarity score berdasarkan element yg terbesar, kemudian hasilnya disimpan pada list yg bernama index
    index=index[1:] 

    response_flag=0 
    for i in range(len(index)):
        if similarity_scores_list[index[i]]>0.0:
            bot_response=bot_response+' '+sentence_list[index[i]]
            response_flag=1
            
        if response_flag==0:
            bot_response=bot_response+" "+"Punten saya gak ngerti" #Jika respon_flag = 0 (tidak ada kata yg cocok) maka akan memberikan response  apologize, I dont understand.

        sentence_list.remove(user_input) #Meremove user_input yg sudah dimasukkan kedalam sentence_list (Corpus yg kita punya).

        return bot_response

In [None]:
#Start Chat
print("Sejarahku: Mau nanya apa kamu tentang Sejarah kerajaan pasundan?, kalo mau berhenti bisa ketik exit ")

exit_list=['exit','bye','keluar','quit', 'sampai jumpa','cukup','makasih','nuhun']

while(True):
    user_input=input() #mengambil input pada user
    if user_input.lower() in exit_list: #kalau input dari user ada didalam exit_list maka program akan berhenti
        print('Sejarahku: Bye Bye Sampai Jumpa Lagi, hatur nuhun')
        break
    else:
        if greeting_response(user_input)!= None: #Mengecek apakah input dari user masuk kedalam greeting atau bukan
            print('Sejarahku: '+ greeting_response(user_input)) #Jika masuk kedalam greeting maka bot akan melakukan response terhadap greeting tersebut
        else:
            print('Sejarahku: '+ bot_response(user_input)) #Jika bukan, maka bot akan memanggil fungsi bot_response untuk menentukan respon apa yg akan ia keluarkan sesuai dengan input dari user

Sejarahku: Mau nanya apa kamu tentang Sejarah kerajaan pasundan?, kalo mau berhenti bisa ketik exit 
raja
Sejarahku:  Raja-Raja Kerajaan Pajajaran

Semasa berdiri, Kerajaan Pajajaran hanya diperintah oleh enam raja sebelum akhirnya hancur.
surawisesa
Sejarahku:  Keenam raja tersebut adalah sebagai berikut:

Sri Baduga Maharaja atau Prabu Siliwangi(1482 - 1521 M) Surawisesa (1521 - 1535 M) Ratu Dewata (1535 - 1543 M) Ratu Sakti (1531 - 1551 M) Ratu Nilakendra (1551 - 1567 M) Raga Mulya (1567 - 1579 M)

Peninggalan Kerajaan Pajajaran

Sebagai salah satu kerajaan besar yang pernah ada di Indonesia, Kerajaan Pajajaran meninggalkan sejumlah jejak peninggalan.
