In [1]:
#Import Library yang akan Digunakan
import nltk
from nltk import Tree
import re
from collections import Counter
from nltk.grammar import CFG, Nonterminal
from nltk.parse.chart import BottomUpChartParser
from nltk.parse.generate import generate, demo_grammar

In [2]:
#Membuat CFG (Context-Free Grammar) Bahasa Indonesia
cfg_grammar = """
  S -> Sub P | Sub P O | Sub P K | Sub P O K
  Sub -> KB | KG | KB KG | KB KTun
  P -> KK
  O -> KB | KG | KB KG
  K -> KD KW | KD KT

  KB -> 'anjing' | 'kucing' | 'pohon'  | 'bola' | 'susu' | 'emas' | 'cincin'
  KG -> 'aku' | 'kamu' | 'dia' | 'ayah' | 'ibu' | 'adik' | 'kakak' | 'paman' | 'bibi' | 'kakek' | 'nenek'
  KTun -> 'itu' | 'ini'
  KK -> 'berenang' | 'menangis' | 'bermain' | 'memanjat' | 'meminum' | 'menjaga'
  KD -> 'di' | 'dari' | 'ke' | 'pada'
  KW -> KWS H
  KWS -> 'siang' | 'pagi' | 'sore'
  H -> 'hari'
  KT -> 'warung' | 'kolam' | 'lapangan' | 'kantor' | 'kampus'
"""
grammar = CFG.fromstring(cfg_grammar)
print(grammar)

Grammar with 54 productions (start state = S)
    S -> Sub P
    S -> Sub P O
    S -> Sub P K
    S -> Sub P O K
    Sub -> KB
    Sub -> KG
    Sub -> KB KG
    Sub -> KB KTun
    P -> KK
    O -> KB
    O -> KG
    O -> KB KG
    K -> KD KW
    K -> KD KT
    KB -> 'anjing'
    KB -> 'kucing'
    KB -> 'pohon'
    KB -> 'bola'
    KB -> 'susu'
    KB -> 'emas'
    KB -> 'cincin'
    KG -> 'aku'
    KG -> 'kamu'
    KG -> 'dia'
    KG -> 'ayah'
    KG -> 'ibu'
    KG -> 'adik'
    KG -> 'kakak'
    KG -> 'paman'
    KG -> 'bibi'
    KG -> 'kakek'
    KG -> 'nenek'
    KTun -> 'itu'
    KTun -> 'ini'
    KK -> 'berenang'
    KK -> 'menangis'
    KK -> 'bermain'
    KK -> 'memanjat'
    KK -> 'meminum'
    KK -> 'menjaga'
    KD -> 'di'
    KD -> 'dari'
    KD -> 'ke'
    KD -> 'pada'
    KW -> KWS H
    KWS -> 'siang'
    KWS -> 'pagi'
    KWS -> 'sore'
    H -> 'hari'
    KT -> 'warung'
    KT -> 'kolam'
    KT -> 'lapangan'
    KT -> 'kantor'
    KT -> 'kampus'


In [3]:
#Melakukan Generate Kalimat Sebanyak 50 Kalimat
N = 50
print("Generate %d kalimat dari grammar:" % (N,))
for n, sent in enumerate(generate(grammar, n=N), 1):
    print("%3d. %s" % (n, " ".join(sent)))

Generate 50 kalimat dari grammar:
  1. anjing berenang
  2. anjing menangis
  3. anjing bermain
  4. anjing memanjat
  5. anjing meminum
  6. anjing menjaga
  7. kucing berenang
  8. kucing menangis
  9. kucing bermain
 10. kucing memanjat
 11. kucing meminum
 12. kucing menjaga
 13. pohon berenang
 14. pohon menangis
 15. pohon bermain
 16. pohon memanjat
 17. pohon meminum
 18. pohon menjaga
 19. bola berenang
 20. bola menangis
 21. bola bermain
 22. bola memanjat
 23. bola meminum
 24. bola menjaga
 25. susu berenang
 26. susu menangis
 27. susu bermain
 28. susu memanjat
 29. susu meminum
 30. susu menjaga
 31. emas berenang
 32. emas menangis
 33. emas bermain
 34. emas memanjat
 35. emas meminum
 36. emas menjaga
 37. cincin berenang
 38. cincin menangis
 39. cincin bermain
 40. cincin memanjat
 41. cincin meminum
 42. cincin menjaga
 43. aku berenang
 44. aku menangis
 45. aku bermain
 46. aku memanjat
 47. aku meminum
 48. aku menjaga
 49. kamu berenang
 50. kamu menangis


In [11]:
#Menampilkan Derivation dari Dua Contoh Kalimat
#Kalimat 1 = “anjing itu berenang di kolam”
#Kalimat 2 = “kakak bermain bola pada pagi hari”

kalimat = "anjing itu berenang di kolam"
parser = BottomUpChartParser(grammar)
kalimat_split = kalimat.split()
kalimat_parsed = list(parser.parse(kalimat_split))
print(kalimat_parsed[0].pretty_print())

kalimat = "kakak bermain bola pada pagi hari"
parser = BottomUpChartParser(grammar)
kalimat_split = kalimat.split()
kalimat_parsed = list(parser.parse(kalimat_split))
print(kalimat_parsed[0].pretty_print())

                   S                  
         __________|__________         
       Sub         P          K       
   _____|___       |       ___|____    
  KB       KTun    KK     KD       KT 
  |         |      |      |        |   
anjing     itu  berenang  di     kolam

None
               S                     
   ____________|_________             
  |      |     |         K           
  |      |     |     ____|____        
 Sub     P     O    |         KW     
  |      |     |    |     ____|___    
  KG     KK    KB   KD  KWS       H  
  |      |     |    |    |        |   
kakak bermain bola pada pagi     hari

None


In [28]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [29]:
import os
os.chdir("/content/drive/")

N = 10000000
output = open('/content/drive/My Drive/Upload/Akademik/Tugas 3 PBA/output.txt','w')
for n, sent in enumerate(generate(grammar, n=N), 1):
    output.write("%3d. %s\n" % (n, " ".join(sent)))
output.close()