In [None]:
!pip install pyidaungsu

Collecting pyidaungsu
  Downloading pyidaungsu-0.1.4-py3-none-any.whl (5.5 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m5.5/5.5 MB[0m [31m5.0 MB/s[0m eta [36m0:00:00[0m
Collecting python-crfsuite (from pyidaungsu)
  Downloading python_crfsuite-0.9.9-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (993 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m993.5/993.5 kB[0m [31m65.6 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting emoji (from pyidaungsu)
  Downloading emoji-2.8.0-py2.py3-none-any.whl (358 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m358.9/358.9 kB[0m [31m39.3 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting pybind11 (from pyidaungsu)
  Downloading pybind11-2.11.1-py3-none-any.whl (227 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m227.7/227.7 kB[0m [31m26.4 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting fasttext (from pyidaungsu)
  Downloading fasttext-0.9.2.tar.gz (68 kB)


In [None]:
from nltk.cluster.util import cosine_distance
import re
import numpy as np
import pyidaungsu as pds

SENTENCE_SEPARATOR = [".", "?", "!", "။", "…", "\n"]

def sentence_tokenize(text):
  sentences = re.split("(?<=[" + "".join(SENTENCE_SEPARATOR) + "])\s*", text)
  if sentences[-1]:
    return sentences
  return sentences[:-1]


def read_text(text):
  sentences = sentence_tokenize(text)
  return sentences

def sentence_similarity(sent1, sent2):

  sent1 = [w.lower() for w in pds.tokenize(sent1, form='word')]
  sent2 = [w.lower() for w in pds.tokenize(sent2, form='word')]

  all_words = list(set(sent1 + sent2))

  vector1 = [0] * len(all_words)
  vector2 = [0] * len(all_words)

  for w in sent1:
    vector1[all_words.index(w)] += 1

  for w in sent2:
    vector2[all_words.index(w)] += 1

  if np.isnan(1 - cosine_distance(vector1, vector2)):
    return 0
  return 1 - cosine_distance(vector1, vector2)


def build_similarity_matrix(sentences):

  similarity_matrix = np.zeros((len(sentences),len(sentences)))

  for idx1 in range(len(sentences)):
    for idx2 in range(len(sentences)):
      if idx1!=idx2:
        similarity_matrix[idx1][idx2] = sentence_similarity(sentences[idx1],sentences[idx2])
    return similarity_matrix

In [None]:
#@title Generate Text Summary
import networkx as nx

def generate_summary(text,top_n):

  summarize_text = []

  sentences = read_text(text)
  sentence_similarity_matrix = build_similarity_matrix(sentences)
  sentence_similarity_graph = nx.from_numpy_array(sentence_similarity_matrix)
  scores = nx.pagerank(sentence_similarity_graph)
  ranked_sentences = sorted(((scores[i],s) for i,s in enumerate(sentences)),reverse=True)

  for i in range(top_n):
    summarize_text.append(ranked_sentences[i][1].replace("\n", ""))

  return " ".join(summarize_text),len(sentences)

In [None]:
text = """အပူလှိုင်းရိုက်ခတ်မှုကိုပြင်သစ်ဘော်ဒိုးဒေသရှိဝိုင်လုပ်ငန်းရှင်များကြိုဆို
ဥရောပတစ်ဝန်း၌မကြာသေးမီရက်ပိုင်းအတွင်းအပူလှိုင်းရိုက်ခတ်မှုကြောင့်ဝိုင်ကောင်းကောင်းထွက်နိုင်ခြေများနေသဖြင့်ယင်းကိုပြင်သစ်နိုင်ငံဘော်ဒိုးဒေသရှိဝိုင်လုပ်ငန်းရှင်များကကြိုဆိုခဲ့ကြသည်. ဘော်ဒိုး၌သုံးရက်ခန့်အပူလှိုင်းရိုက်ခတ်မှုသည်ဝိုင်ကောင်းကောင်းထွက်ရှိရေးအတွက်မှော်ပညာဖြင့်လုပ်ပေးလိုက်သလိုရှိနေကြောင်းဘော်ဒိုးဝိုင်ကောင်စီအကြီးအကဲဖိလစ်ပဲဘာဒေကပြောဆိုခဲ့သည်. ယခုအပတ်အတွင်းဘော်ဒိုးဒေသ၌အပူချိန်သည်၄၀ဒီဂရီဆဲစီးယပ်စ်ကိုကျော်လွန်ဖွယ်ရှိနေရာယင်းအပူချိန်ကြောင့်စပျစ်ပင်များတွင်ကပ်နေသည့်မှိုများအရည်ပျော်ကျကာဝိုင်ကောင်းကောင်းထွက်နိုင်ခြေများလာကြောင်းဘာဒေကပြောဆိုခဲ့သည်. ဘော်ဒိုးဒေသရှိအပင်များသည်မြေထဲပင်လယ်အပင်များဖြစ်သောကြောင့်အပူကိုနှစ်သက်ကြကြောင်းဘော်ဒိုးဝိုင်လုပ်ငန်းရှင်များအဖွဲ့၏ဥက္ကဋ္ဌဘားနတ်ဖာဂက်စ်ကပြောဆိုခဲ့သည်. အပူချိန်မကြုံစဖူးမြင့်တက်မှုကြောင့်အလုပ်သမားများသည်နွေရာသီလွန်ခူးဆွတ်မှုများကိုစတင်ရန်ပြင်ဆင်နေကြပြီဖြစ်သည်"""

summary, txt_len = generate_summary(text, 3)
print("Summary: ", summary)

Summary:  အပူလှိုင်းရိုက်ခတ်မှုကိုပြင်သစ်ဘော်ဒိုးဒေသရှိဝိုင်လုပ်ငန်းရှင်များကြိုဆို ဥရောပတစ်ဝန်း၌မကြာသေးမီရက်ပိုင်းအတွင်းအပူလှိုင်းရိုက်ခတ်မှုကြောင့်ဝိုင်ကောင်းကောင်းထွက်နိုင်ခြေများနေသဖြင့်ယင်းကိုပြင်သစ်နိုင်ငံဘော်ဒိုးဒေသရှိဝိုင်လုပ်ငန်းရှင်များကကြိုဆိုခဲ့ကြသည်. ဘော်ဒိုးဒေသရှိအပင်များသည်မြေထဲပင်လယ်အပင်များဖြစ်သောကြောင့်အပူကိုနှစ်သက်ကြကြောင်းဘော်ဒိုးဝိုင်လုပ်ငန်းရှင်များအဖွဲ့၏ဥက္ကဋ္ဌဘားနတ်ဖာဂက်စ်ကပြောဆိုခဲ့သည်.
