In [90]:
# -*- coding: utf-8 -*-
import math

from nltk.probability import FreqDist
from nltk.corpus import stopwords
from hazm import sent_tokenize, word_tokenize
from hazm import Normalizer
import pandas as pd

class Summarizer(object):

    def __init__(self):
        self.normalizer = Normalizer()

    def summarize(self, input):
        self.input = self.normalizer.normalize(input)
        self.base_words = word_tokenize(self.input)
        self.working_sentences = sent_tokenize(self.input)
        self.sentences_number = len(self.working_sentences)
        return self._get_summarize(num_sentences=3)

    def _find_num_sentences(self):
        return (int(math.log(self.sentences_number) ** 2 + 1) + 1) if self.sentences_number >= 6 else self.sentences_number
        # return int(self.sentences_number - 0.2 * self.sentences_number)

    def _get_summarize(self, num_sentences):
        # if str(word not in stopwords.words()]
        swfa = pd.read_csv('../dataset/stopwords.csv' , header=None)
        words = [word for word in self.base_words if word not in list(swfa[0]) ]
        word_frequencies = FreqDist(words)

        most_frequent_words = [pair[0] for pair in list(word_frequencies.items())[:100]]

        actual_sentences = sent_tokenize(self.input)
        output_sentences = []

        for word in most_frequent_words:
            for i in range(0, len(self.working_sentences)):
                if (word in self.working_sentences[i]
                        and actual_sentences[i] not in output_sentences):
                    output_sentences.append(actual_sentences[i])
                    break
                if len(output_sentences) >= num_sentences:
                    break

            if len(output_sentences) >= num_sentences:
                break

        return self._reorder_sentences(output_sentences)

    def _reorder_sentences(self, output_sentences):
        output_sentences.sort(key=lambda s1: self.input.find(s1))
        return output_sentences

In [93]:
inputs='''
یک دستگاه تریلی حامل مهمات (گلوله های توپ) در جاده قزوین آتش گرفت و مهمات آن نیز منفجر شدند.

به گزارش عصرایران، این تریلی بر اثر پارگی لاستیک در اتوبان قزوین - زنجان نزدیک به شهر تاکستان دچار حادثه شده بود.  این اتفاق تلفاتی نداشت. انفجارها با صدای بسیار بلندی همراه شدند و تا مسافت زیادی شنیدی شد. نخستین خبرها با عنوان انفجار در اتوبان قزوین منتشر شده بودند.
 
سخنگوی سپاه هم گفت: سانحه امروز اتوبان زنجان- قزوین مربوط به انفجار تریلی حامل گلوله‌های توپ یکی از یگان‌های سپاه بود که این سانحه تلفات جانی نداشت.

 سردار رمضان شریف مسئول روابط عمومی کل سپاه در گفت‌وگو با خبرنگار فارس در خصوص جزئیات سانحه امروز انفجار یک دستگاه تریلی در اتوبان زنجان- قزوین اظهار داشت: این سانحه مربوط یکی از تریلی‌هایی بود که مقادیری از گلوله‌های توپ متعلق به یکی از یگان‌های سپاه را حمل می‌کرد که این تریلی در  اثر ترکیدگی لاستیک و برخورد با گاردریل کنار جاده در هوای بسیار گرم شده و دچار آتش‌سوزی و انفجار می‌شود.

وی گفت: با تدابیر ایمنی پیش‌بینی شده برای جلوگیری از آسیب به خودروهای در حال حرکت بلافاصله مسیر توسط تیم اسکورت مسدود و با همکاری مردم عزیز هیچ آسیبی به کسی نمی‌رسد و تنها یکی از مأمورین فداکار نیروی انتظامی دچار مصدومیت جزیی شده است.

سردار شریف خاطرنشان کرد: اقدامات ایمنی جهت حمل و نقل مهمات نظامی طبق دستورالعمل جاری بر فرآیند چینش مهمات در تریلی به طور کامل اعمال شده بود و تدابیر دیگر نظیر نبودن چاشنی نیز از دیگر اقداماتی بود که مسئولان امر صورت داده بودند.
'''

In [94]:
obj = Summarizer()
s = obj.summarize(inputs)
for i in s:
    print(i)

به گزارش عصرایران، این تریلی بر اثر پارگی لاستیک در اتوبان قزوین - زنجان نزدیک به شهر تاکستان دچار حادثه شده بود.
نخستین خبرها با عنوان انفجار در اتوبان قزوین منتشر شده بودند.
سردار رمضان شریف مسئول روابط عمومی کل سپاه در گفت‌وگو با خبرنگار فارس در خصوص جزئیات سانحه امروز انفجار یک دستگاه تریلی در اتوبان زنجان- قزوین اظهار داشت: این سانحه مربوط یکی از تریلی‌هایی بود که مقادیری از گلوله‌های توپ متعلق به یکی از یگان‌های سپاه را حمل می‌کرد که این تریلی در اثر ترکیدگی لاستیک و برخورد با گاردریل کنار جاده در هوای بسیار گرم شده و دچار آتش‌سوزی و انفجار می‌شود.
