In [None]:
import torch
torch.cuda.get_device_capability()

(7, 5)

In [None]:
pip install bitsandbytes

Collecting bitsandbytes
  Downloading bitsandbytes-0.43.1-py3-none-manylinux_2_24_x86_64.whl (119.8 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m119.8/119.8 MB[0m [31m6.1 MB/s[0m eta [36m0:00:00[0m
Collecting nvidia-cuda-nvrtc-cu12==12.1.105 (from torch->bitsandbytes)
  Using cached nvidia_cuda_nvrtc_cu12-12.1.105-py3-none-manylinux1_x86_64.whl (23.7 MB)
Collecting nvidia-cuda-runtime-cu12==12.1.105 (from torch->bitsandbytes)
  Using cached nvidia_cuda_runtime_cu12-12.1.105-py3-none-manylinux1_x86_64.whl (823 kB)
Collecting nvidia-cuda-cupti-cu12==12.1.105 (from torch->bitsandbytes)
  Using cached nvidia_cuda_cupti_cu12-12.1.105-py3-none-manylinux1_x86_64.whl (14.1 MB)
Collecting nvidia-cudnn-cu12==8.9.2.26 (from torch->bitsandbytes)
  Using cached nvidia_cudnn_cu12-8.9.2.26-py3-none-manylinux1_x86_64.whl (731.7 MB)
Collecting nvidia-cublas-cu12==12.1.3.1 (from torch->bitsandbytes)
  Using cached nvidia_cublas_cu12-12.1.3.1-py3-none-manylinux1_x86_64.whl (41

In [None]:
!nvcc --version

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2023 NVIDIA Corporation
Built on Tue_Aug_15_22:02:13_PDT_2023
Cuda compilation tools, release 12.2, V12.2.140
Build cuda_12.2.r12.2/compiler.33191640_0


In [None]:
pip install accelerate

Collecting accelerate
  Downloading accelerate-0.29.3-py3-none-any.whl (297 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m297.6/297.6 kB[0m [31m1.2 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: accelerate
Successfully installed accelerate-0.29.3


In [None]:
import os
os._exit(00)

In [None]:
!nvidia-smi

Sat Apr 20 17:58:39 2024       
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.104.05             Driver Version: 535.104.05   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|   0  Tesla T4                       Off | 00000000:00:04.0 Off |                    0 |
| N/A   44C    P8               9W /  70W |      0MiB / 15360MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+
                                                                    

In [None]:
import pandas as pd
pd.set_option('display.max_colwidth', None)
from torch import cuda, bfloat16
import transformers
import json
from tqdm import tqdm
import pickle
import re
import time


class LlamaModel:
    def __init__(self, hf_token ,model_id):
        self.model_id = model_id
        self.device = self.get_device()
        self.hf_auth = hf_token
        self.bnb_config = self.get_bnb_config()
        self.initalize_model()
        print(f"Model loaded on {self.device}")

    @staticmethod
    def get_device():
        return f'cuda:{cuda.current_device()}' if cuda.is_available() else 'cpu'

    @staticmethod
    def get_bnb_config():
        return transformers.BitsAndBytesConfig(
            load_in_4bit=True,
            bnb_4bit_quant_type='nf4',
            bnb_4bit_use_double_quant=True,
            bnb_4bit_compute_dtype=bfloat16
        )

    def initalize_model(self):
        # begin initializing HF items, need auth token for these

        model_config = transformers.AutoConfig.from_pretrained(
            self.model_id, use_auth_token=self.hf_auth
        )

        model = transformers.AutoModelForCausalLM.from_pretrained(
            self.model_id,
            trust_remote_code=True,
            config=model_config,
            quantization_config=self.bnb_config,
            device_map='auto',
            use_auth_token=self.hf_auth
        )

        tokenizer = transformers.AutoTokenizer.from_pretrained(
            self.model_id, use_auth_token=self.hf_auth
        )

        self.generate_text = transformers.pipeline(
            model=model, tokenizer=tokenizer,
            return_full_text=True,  # langchain expects the full text
            task='text-generation',
            # we pass model parameters here too
            #stopping_criteria=stopping_criteria,  # without this model rambles during chat
            temperature=0.0000001,  # 'randomness' of outputs, 0.0 is the min and 1.0 the max
            max_new_tokens=2048,  # mex number of tokens to generate in the output
            repetition_penalty=1.1  # without this output begins repeating
        )

    def call_LLM(self, _prompt):
        res = self.generate_text(_prompt)
        res = res[0]["generated_text"].split('[/INST]')[-1]
        return res

    def llm_response(self,prompt1,text) :

        llm_response1 = self.call_LLM(prompt1.format(text))

        return llm_response1




In [None]:
## Model initialisations
hf_token = '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'
model_id = 'meta-llama/Llama-2-7b-chat-hf'
llama_model = LlamaModel(hf_token,model_id)




Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]



Model loaded on cuda:0


## Data Load

In [None]:
pip install datasets

Collecting datasets
  Downloading datasets-2.19.0-py3-none-any.whl (542 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m542.0/542.0 kB[0m [31m1.8 MB/s[0m eta [36m0:00:00[0m
Collecting dill<0.3.9,>=0.3.0 (from datasets)
  Downloading dill-0.3.8-py3-none-any.whl (116 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m116.3/116.3 kB[0m [31m13.0 MB/s[0m eta [36m0:00:00[0m
Collecting xxhash (from datasets)
  Downloading xxhash-3.4.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (194 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m194.1/194.1 kB[0m [31m15.7 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting multiprocess (from datasets)
  Downloading multiprocess-0.70.16-py310-none-any.whl (134 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m134.8/134.8 kB[0m [31m13.0 MB/s[0m eta [36m0:00:00[0m
Collecting huggingface-hub>=0.21.2 (from datasets)
  Downloading huggingface_hub-0.22.2-py3-none-a

In [None]:
from datasets import DatasetDict,load_dataset
task = "summarization"

In [None]:
dataset = load_dataset("ai4bharat/IndicHeadlineGeneration",'hi',split='train[:130]')

## Train-Test-Valiation Split
print("Train-Test-Valiation Split : ")
train_test_dataset = dataset.train_test_split(test_size=0.15)
test_valid = train_test_dataset['test'].train_test_split(test_size=0.5)
raw_datasets = DatasetDict({'train': train_test_dataset['train'],
                            'test': test_valid['test'],
                            'valid': test_valid['train']})


The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


Downloading data:   0%|          | 0.00/184M [00:00<?, ?B/s]

Downloading data:   0%|          | 0.00/184M [00:00<?, ?B/s]

Downloading data:   0%|          | 0.00/11.3M [00:00<?, ?B/s]

Downloading data:   0%|          | 0.00/80.8M [00:00<?, ?B/s]

Downloading data:   0%|          | 0.00/80.6M [00:00<?, ?B/s]

Generating train split:   0%|          | 0/208091 [00:00<?, ? examples/s]

Generating test split:   0%|          | 0/44475 [00:00<?, ? examples/s]

Generating validation split:   0%|          | 0/44718 [00:00<?, ? examples/s]

Train-Test-Valiation Split : 


In [None]:
raw_datasets

DatasetDict({
    train: Dataset({
        features: ['id', 'input', 'target', 'url'],
        num_rows: 110
    })
    test: Dataset({
        features: ['id', 'input', 'target', 'url'],
        num_rows: 10
    })
    valid: Dataset({
        features: ['id', 'input', 'target', 'url'],
        num_rows: 10
    })
})

In [None]:
input_text = [inp['input'] for inp in  raw_datasets['valid']][:10]
target_text = [tar['target'] for tar in  raw_datasets['valid']][:10]

In [None]:
df = pd.DataFrame(input_text,
                        columns = ['text'])


In [None]:
if task == "translation" :
    translation_list = []

    ## Defining Prompts
    prompt = """
    <s>[INST] <<SYS>>
    You are a translator. Your job is to translate the provided text to Hindi. Please genereted only translated text in Hindi. Do not give any other details.

    <</SYS>>
    {}
    [/INST]
    """

    start = time.time()
    for text in df.text.tolist() :
        prediction = llama_model.llm_response(prompt,text)
        translation_list.append(prediction)
    df['translated_text' ] = translation_list
    end = time.time()

    print(f"Time taken to predict for {len(df)} titles is : {(end - start)/60} minutes.")
elif task == "summarization" :

    summarized_list = []

    ## Defining Prompts
    prompt = """
    <s>[INST] <<SYS>>
    You are a Headline Generator. Your job is toUnderstand the news provided in prompt and generate headline for the same. Please genereted only headline text in Hindi. Do not give any other details.

    <</SYS>>
    {}
    [/INST]
    """

    start = time.time()
    for text in df.text.tolist() :
        prediction = llama_model.llm_response(prompt,text)
        summarized_list.append(prediction)
    df['result_text' ] = summarized_list
    end = time.time()

    print(f"Time taken to predict for {len(df)} titles is : {(end - start)/60} minutes.")



Time taken to predict for 10 titles is : 3.610265338420868 minutes.


In [None]:
df['result_text' ] = summarized_list

In [None]:
df['target_text'] = target_text

In [None]:
df

Unnamed: 0,text,result_text,target_text
0,"घरेलू बाजार में दाल की सप्लाई बढाने केलिए सरकारी कंपनी एमएमटीसी लिमिटेड ने 69 हजार टन दाल के आयात के लिए बोली आमंत्रित की है। बुधवार को जारी अंतररराष्ट्रीय टेंडर केतहत एमएमटीसी ने कनाडा मूल के 35 हजार टन सफेद मटर और फ्रांसीसी मूल के 22 हजार टन सफेद मटर के आयात की इच्छा जताई है। इसके अलावा टेंडर में म्यांमार मूल के छह-छह हजार टन तुअर और उड़द दाल के आयात की बात कही गई है। इन दालों की शिपमेंट अवधि इस साल अप्रैल से नवंबर तक की होगी। इन दालों की डिलिवरी मुंबई, कोलकाता, चेन्नई और विशाखापट्टनम बंदरगाह पर स्वीकार की जाएगी। टेंडर के लिए एमएमटीसी द्वारा जारी गाइडलाइंस के मुताबिक, दाल के लिए बोली लगाने वालों से कहा गया है कि नया फसल होना चाहिए और यह साफ-सुथरा होने का साथ-साथ फफूंद व कृत्रिम रंग आदि से मुक्त होना चाहिए। 2 अप्रैल तक बोली लगाई जा सकती है। एमएमटीसी ने कहा है कि उसी दिन टेंडर खोले जाएंगे और इस पर अंतिम फैसला 9 अप्रैल को लिया जाएगा। सरकारी कंपनी मसलन एमएमटीसी, एसटीसी, पीईसी जैसी कंपनियां घरेलू बाजार में दाल आदि की सप्लाई सुनिश्चित करने के लिए समय-समय पर आयात करती रहती है। इन कंपनियों ने 20 मार्च तक 14.1 लाख टन दाल के आयात कॉन्ट्रैक्ट किया था।",\n 69 हजार टन दाल के आयात के लिए बोली आमंत्रित की है!,दालों का आयात करेगी एमएमटीसी
1,"पाकिस्तान के पूर्व राष्ट्रपति परवेज मुशर्रफ ने गुरुवार को अपने अधिकारिक फेसबुक पेज में एक वीडियो पोस्ट कर एक ऐसा बयान दिया है जो पाकिस्तान की राजनीति में जबर्दस्त भूचाल ला सकता है... । इस्लामाबादः पाकिस्तान के पूर्व राष्ट्रपति परवेज मुशर्रफ ने गुरुवार को अपने अधिकारिक फेसबुक पेज में एक वीडियो पोस्ट कर कहा कि पीपुल्स पार्टी ऑफ पाकिस्तान के नेता आसिफ अली जरदारी को बेनजीर भुट्टो की हत्या से सबसे ज्यादा फायदा मिला।मुशर्रफ ने यह वीडियो ऐसे समय पोस्ट किया है जब कुछ दिन पहले ही उन पर बेनजीर भुट्टो की हत्या में संलिप्तता का आरोप तय किया गया है।मुशर्रफ ने भुट्टो-जरदारी के तीनों बच्चों, भुट्टो परिवार और सिंध के लोगों को संबोधित करते हुए कहा, 'आसिफ अली जरदारी भुट्टो परिवार की तबाही के लिए जिम्मेदार हैं और वह बेनजीर और मर्तजा भुट्टो की हत्या में संलिप्त हैं।' पूर्व सैन्य प्रमुख ने कहा, 'जब भी कोई हत्या होती है तो सबसे पहले यह देखना चाहिए कि इससे सबसे ज्यादा फायदा किसे हो रहा है।इस मामले में, मेरे पास खोने के लिए सब कुछ था।मैं सत्ता में था और इस हत्या से मेरे सरकार के लिए परेशानी पैदा हो गई थी।' उन्होंने कहा कि बेनजीर की हत्या के बाद एक ऐसा आदमी था जिसे सब कुछ मिलने वाला था और वह आसिफ अली जरदारी था।जरदारी 5 सालों तक सत्ता में रहे, फिर उन्होंने क्यों नहीं इस मामले पर ज्यादा ध्यान दिया या इस दौरान जांच प्रक्रिया सक्रिय क्यों नहीं थी, ऐसा इसलिए हुआ क्योंकि जरदारी खुद बेनजीर की हत्या में शामिल थे।उन्होंने कहा कि इस मामले की जांच पर अगर ध्यान दिया जाए तो, 'सबूत से साफ है कि बैतुल्लाह महसुद और उसके लोग इस हत्या में शामिल थे, लेकिन इन लोगों को ऐसा करने के लिए आदेश किसने दिए, यह मैं नहीं हो सकता क्योंकि यह समूह मुझसे और मैं इससे नफरत करता था।इस समूह ने बाद में मुझे भी मारने के प्रयास किए।' रावलपिंडी की एक आतंकवाद रोधी अदालत ने 31 अगस्त को तहरीक-ए-तालिबान के 5 कथित आतंकवादियों को बेनजीर हत्याकांड में बरी कर दिया था।2 सुरक्षा अधिकारियों को दोषी बताया था और मुशर्रफ को मामले में भगोड़ा घोषित कर दिया था।पर देश-विदेश की ताजा और स्पेशल स्टोरी पढ़ते हुए अपने आप को रखिए अप-टू-डेट।के लिए क्लिक करें विदेश सेक्शन",\n इस्लामाबाद: पाकिस्तान के पूर्व राष्ट्रपति परवेज मुशर्रफ ने गुरुवार को अपने अधिकारिक फेसबुक पेज में एक वीडियो पोस्ट कर कहा कि पीपुल्स पार्टी ऑफ पाकिस्तान के नेता आसिफ अली जरदारी को बेनजीर भुट्टो की हत्या से सबसे ज्यादा फायदा मिला।,बेनजीर हत्याः पाकिस्तान की राजनीति में भूचाल ला देगा मुशर्रफ का यह बड़ा बयान!
2,"जिले के जामनेर थाना क्षेत्र के बलरामपुर गांव में बुधवार को मोटरसाईकिल की चोरी के शक में गांव के लोगों ने एक युवक को निर्वस्त्र करके बुरी तरह पीटा।इसके बाद चप्पल-जूतों की माला पहनाकर गांव में घुमाया।युवक हाथ जोड़ता रहा और लोग उसे पीटते रहे और सेल्फी लेने के साथ ही वीडियो बनाते रहे।इसके बाद कुछ लोगों ने घटना का वीडियो बनाकर उसे सोशल मीडिया पोस्ट पर कर दिया है, इसके बाद वीडियो वायरल हो गया।इधर, जामनेर थाना पुलिस ने वीडियो के आधार पर भीड़ में युवक को पीट रहे लोगों के खिलाफ मामला दर्ज कर लिया है और जांच शुरू कर दी है।","\n ""मोटरसाईकिल की चोरी में युवक निर्वस्त्र कर देखा, गांव में घुमाया""",बाइक चुराने के शक में युवक की पिटाई; फिर जूते-चप्पलों की माला पहनाकर गांव में घुमाया
3,कोल्लमः एक चिंगारी से कैसे सैकड़ों घरों में मातम फैल गया है ये बात केरल के पुतिंगल मंदिर में हुए अग्निकांड से पता चलती है।सालाना परंपरा के नाम पर मंदिर में हजारों की तादाद आतिशबाजी से हुआ अग्निकांड- धमाके इतने जबरदस्त थे कि कंक्रीट की बनी छत उड़ गई छत के टुकड़े करीब डेढ़ किलोमीटर तक उछले जिससे कई लोग जख्मी हो गए धमाके की वजह से आसपास की मकानों को भी नुकसान पहुंचा है धमाके की आवाज करीब 2 किलोमीटर दूर तक सुनी गई थी हालांकि ऐसा लग रहा है कि इस हादसे की वजह लापरवाही है क्योंकि बताया जा रहा है कि आतिशबाजी के लिए प्रशासन से इजाजत नहीं ली गई थी और लोगों का कहना है कि ये जगह ऐसी है जहां पर इतनी भारी आतिशबाजी नहीं करनी चाहिए थी।बताया जा रहा है कि आतिशबाजी के लिए जो पटाखे इस्तेमाल हो रहे थे उनमें काफी ज्यादा मात्रा में विस्फोटक भरा हुआ था और वो ऐसे मौकों के लिए मुफीद नहीं थे।यही वजह है कि एक छोटी से चिंगारी ने इतनी बड़ी तबाही मचा दी सौ से ज्यादा लोगों की जान चली गई और अभी 400 के करीब जख्मी लोगों का अस्पताल में इलाज चल रहा है।आगे की स्लाइड में पढ़िए 110 मौतों का गुनहगार कौन ? «,\n 110 मौतों का गुनहगार कौन है?\nकोल्लमः एक चिंगारी से कैसे सैकड़ों घरों में मातम फैल गया है!,"केरल के मंदिर में सबसे बड़ा अग्निकांड, रंग बिरंगी रोशनी ने छीनी 110 जिंदगियां"
4,"हाल में आंध्र प्रदेश, कर्नाटक और उत्तर प्रदेश जैसे राज्यों में सरकारी बिजली वितरण कंपनियों (डिस्कॉम) ने पवन और सौर ऊर्जा उत्पादक कंपनियों के साथ बिजली खरीद समझौतों (पीपीए) को बदलने या रद्द करने के प्रयास किए हैं, जिसका अक्षय ऊर्जा क्षेत्र पर विपरीत असर पड़ सकता है। अगर ऐसा हुआ तो स्वतंत्र बिजली उत्पादकों के क्रेडिट प्रोफाइल (ऋण लेने की क्षमता) और इस क्षेत्र में निजी निवेश पर भी प्रतिकूल असर पडऩे के आसार हैं। इक्रा रेटिंग्स के वरिष्ठ उपाध्यक्ष और समूह प्रमुख सब्यसाची मजूमदार ने कहा, 'वर्तमान परिस्थितियों में स्वतंत्र पवन बिजली उत्पादकों के लिए भारी अनिश्चितता बनी हुई है। इन बिजली उत्पादकों ने हाल में फीड-इन टैरिफ के आधार पर बिजली खरीद समझौते किए थे। ये समझौते आंध्र प्रदेश में करीब 830 मेगावॉट और कर्नाटक में 490 मेगावॉट के होने का अनुमान है। हालांकि वितरण कंपनियों ने इन करारों को रद्द या बदला तो इन्हें प्रभावित स्वतंत्र बिजली उत्पादक कानूनी रूप से चुनौती दे सकते हैं और इसके समाधान में लंबा समय लग सकता है। इसके अलावा इक्रा का मानना है कि केंद्र सरकार राज्यों की वितरण कंपनियों को बिजली खरीद समझौतों पर ऐसी एकतरफा कार्रवाई न करने के लिए मनाने की कोशिश कर रही है। ' इक्रा के मुताबिक विभिन्न पवन और सौर ऊर्जा उत्पादकों ने सरकारी वितरण कंपनियों के साथ बिजली खरीद समझौते के जो करार किए हैं, उनमें इस बात का जिक्र नहीं किया गया है कि अगर डिस्कॉम करार को तोड़ती हैं तो उन पर जुर्माना लगेगा।","\n सरकारी बिजली वितरण कंपनियों ने पवन और सौर ऊर्जा उत्पादकों के साथ बिजली खरीद समझौते को बदलने या रद्द करने के प्रयास किए हैं, जिसका अक्षय ऊर्जा क्षेत्र पर विपरीत असर पड़ सकता है।",'बिजली खरीद समझौतों के रद्द होने से निवेश पर पड़ेगा असर'
5,"सरकार ने सार्वजनिक क्षेत्र की पनबिजली कंपनी एनएचपीसी के आरंभिक सार्वजनिक शेयर निर्गम के लिए सफल आवेदकों को 36 रुपये की दर से शेयर आवंटित करने का निर्णय लिया है। इस आईपीओ के लिए आवेदकों को 30 से 36 रुपये प्रति शेयर के दायरे में बोली लगाने का विकल्प दिया गया था। बिजली मंत्रालय के सूत्रों ने कहा कि मंत्री समूह ने 36 रुपये के भाव पर शेयर आवंटित करने का फैसला किया है। इस तरह से एनएचपीसी के आईपीओ से 6,048 करोड़ रुपये मिलेंगे। इसमें से एक तिहाई राशि केंद्र सरकार को मिलेगी, जबकि शेष कंपनी के पास ही रहेगी। एनएचपीसी का आईपीओ 12 अगस्त को बंद हुआ था और इसे 23 गुना अधिक अभिदान मिला था।","\n सरकार ने एनएचपीसी के आईपीओ से 6,048 करोड़ रुपये मिलेंगे",एनएचपीसी के शेयरों का आवंटन 36 रु. पर
6,"जालंधर में सोमवार को पंजाब कांग्रेस अध्यक्ष सुनील जाखड़ के सामने पार्टी कार्यकर्ताओं ने जमकर भड़ास निकाली।प्रशासनिक अधिकारी उनके निशाने पर रहे।ब्लॉक प्रधानों ने यहां तक आरोप लगा दिया कि विधायकों और हलका प्रधानों की भी सुनवाई नहीं हो रही।अधिकारी मनमानी कर रहे हैं।कांग्रेसी वर्करों ने जाखड़ से अपील की कि पार्टी की वर्किंग और सरकार की वर्किंग को सुधारा जाए नहीं तो 2022 में चुनाव में कांग्रेस जीत नहीं पाएगी।पंजाब कांग्रेस अध्यक्ष सुनील जाखड़ ने जालंधर कांग्रेस देहात के प्रधान सुखविंदर सिंह सुखा लाली के घरों और दफ्तरों पर एन्फोर्समेंट डायरेक्टरेट के छापों को राजनीतिक बताया।उन्होंने कहा कि केंद्र सरकार राजनीतिक कारणों से ईडी जैसी बड़ी संस्थाओं का दुरुपयोग कर रही है।इससे पहले ऐसा ही महाराष्ट्र में हुआ था और अब पंजाब में भी हो रहा है लेकिन पंजाब के लोग ऐसी हरकतें बर्दाश्त नहीं करेंगे।ईडी के समक्ष प्रस्तुत नहीं हुए सुखविंदर लाली इधर, जालंधर कांग्रेस रूरल के अध्यक्ष सुखविंदर सिंह लाली समन होने के बाद भी ईडी के समक्ष पेश नहीं हुए।उन्हें यहां पंजाब कांग्रेस अध्यक्ष सुनील जाखड़ के कार्यक्रम देखा गया है।उल्लेखनीय है कि जाखड़ ने लाली के विरुद्ध गत शुक्रवार को ईडी की कार्रवाई को राजनीति से प्रेरित बताया है।आज का राशिफल पाएं अपना तीनों तरह का राशिफल, रोजाना Male","\n ""कांग्रेस की नऊ स्वीकार करें: सुखविंदर लाली ने जालंधर में पंजाब कांग्रेस का दुरुपयोग कर दिया!""","सुनील जाखड़ के सामने निकाली कांग्रेस वर्कर्स ने भड़ास, बोले-वर्किंग नहीं सुधरी तो हार जाएंगे चुनाव"
7,"इस्लामाबादः अमेरिकी राष्ट्रीय सुरक्षा सलाहकार सुसान राइस ने आतंकवाद और हिंसक चरमवाद के खिलाफ लड़ाई में पाकिस्तान की भूमिका की रविवार को सराहना की।डॉन की रपट के अनुसार, प्रधानमंत्री कार्यालय की ओर से जारी एक सुसान राइस ने पाकिस्तान की पीठ थपथपाई इस्लामाबादः अमेरिकी राष्ट्रीय सुरक्षा सलाहकार सुसान राइस ने आतंकवाद और हिंसक चरमवाद के खिलाफ लड़ाई में पाकिस्तान की भूमिका की रविवार को सराहना की।डॉन की रपट के अनुसार, प्रधानमंत्री कार्यालय की ओर से जारी एक बयान में कहा गया है कि प्रधानमंत्री नवाज शरीफ के साथ मुलाकात के दौरान सुसान ने पाकिस्तान-अमेरिका के मजबूत संबंधों को रेखांकित किया।बयान में कहा गया है, ""राइस ने आतंकवाद और चरमवाद को जड़ से उखाड़ फेंकने के प्रयास में पाकिस्तान द्वारा की गई कुर्बानी और अबतक की उपलब्धियों की सराहना की।"" सुसान ने एक शांतिपूर्ण पड़ोस के प्रधानमंत्री के दृष्टिकोण की भी सराहना की।उन्होंने कहा कि दोनों देशों के बीच जारी सहयोग, खासतौर से रक्षा, अर्थव्यवस्था और ऊर्जा के क्षेत्रों में, सकारात्मक दिशा में है।सुसान के साथ, अमेरिकी राष्ट्रीय सुरक्षा परिषद में दक्षिण एशिया मामलों के वरिष्ठ निदेशक पीटर लावोय और पाकिस्तान में अमेरिकी राजदूत रिचर्ड ओल्सन भी थे।बयान में कहा गया है कि बैठक द्विपक्षीय हित के मामलों और पाकिस्तान-अमेरिका के भविष्य के संबंधों पर केंद्रित रही।क्षेत्र के हालात पर भी चर्चा हुई।बयान में कहा गया है कि प्रधानमंत्री नवाज ने कहा कि वह इस वर्ष अक्टूबर में प्रस्तावित अपनी अमेरिका यात्रा को लेकर उत्सुक हैं और इसे दोनों देशों के बीच संबंधों को और मजबूत बनाने के एक अवसर के रूप में देखते हैं।विदेश मंत्रालय के अनुसार, राष्ट्रपति बराक ओबामा ने शरीफ को आधिकारिक दौरे पर आमंत्रित किया है, जिसकी तिथियों को अंतिम रूप दिया जा रहा है।शरीफ ने कहा कि अमेरिका सभी क्षेत्रों, खासतौर से अर्थव्यवस्था, रक्षा और आतंकवाद के खिलाफ लड़ाई के क्षेत्र में पाकिस्तान का एक महत्वपूर्ण साझेदार है।उन्होंने कहा कि पाकिस्तान, अमेरिका के साथ अपने संबंधों को एक ऐसी साझेदारी के रूप में देखता है, जो दोनों देशों, क्षेत्र और पूरी दुनिया के हित में है।पर देश-विदेश की ताजा और स्पेशल स्टोरी पढ़ते हुए अपने आप को रखिए अप-टू-डेट।के लिए क्लिक करें विदेश सेक्शन","\n Pakistan, US agree on enhancing bilateral ties: PM Imran\n\nPakistan and the United States have agreed to enhance their bilateral relations, said Prime Minister Imran Khan during a meeting with US National Security Adviser John Bolton. The premier emphasized that both countries should work together in various fields, particularly in security, economy, and energy. He also highlighted the importance of mutual cooperation in the region and beyond.\n\nBolton, who was visiting Islamabad, expressed his country's willingness to work with Pakistan on various issues, including counter-terrorism and regional stability. He also praised Pakistan's efforts in fighting terrorism and its contributions to the war against extremism.\n\nThe two leaders discussed the situation in Afghanistan and the Middle East, and reiterated their commitment to peace and stability in the region. They also exchanged views on the current state of their bilateral relationship and ways to improve it.\n\nPrime Minister Imran underscored the significance of mutual understanding and cooperation between the two nations, saying that they share common interests and goals. He added that Pakistan looks forward to working closely with the US to address common challenges and promote peace and prosperity in the region.\n\nThe meeting between the two leaders comes amidst growing tensions between Pakistan and the US over various issues, including the situation in Afghanistan and Washington's suspension of military aid to Islamabad. However, both sides seem to be making efforts to improve their relations and find common ground on various issues.",अमेरिकी राष्ट्रीय सुरक्षा सलाहकार ने पाकिस्तान की पीठ थपथपाई
8,"बिहार के वैशाली जिले में सड़क हादसे में पूर्व सरपंच की मौत के बाद लोगों ने जमकर बवाल किया।गुस्साई भीड़ ने पुलिस पर भी पथराव किया, जिसमें दो पुलिसकर्मी घायल हो गए।जवानों को अस्पताल में भर्ती कराया गया जहां प्राथमिक उपचार के बाद डॉक्टरों ने उन्हें छुट्टी दे दी।आक्रोशित भीड़ को संभालने के लिए पुलिस को लाठीचार्ज करना पड़ा।रॉन्ग साइड से चल रही थी बस जानकारी के मुताबिक सोमवार सुबह एनएच-78 पर एक यात्री बस रॉन्ग साइड से आ रही थी।बस ने बाइक से जा रहे पूर्व सरपंच को कुचल दिया जिसमें वे गंभीर रूप से घायल हो गए।स्थानीय लोगों ने रामाशंकर यादव को अस्पताल में भर्ती कराया जहां इलाज के दौरान उनकी मौत हो गई।लोगों का कहना है कि नेशनल हाइवे पर कई वाहन गलत साइड से चलते हैं और इसी वजह से लोगों की सड़क दुर्घटना में मौत हो जाती है।लोगों ने प्रशासन पर आरोप लगाया कि रॉन्ग साइड से चलने वाली गाड़ियों पर कोई कार्रवाई नहीं होती है।सराय थानाध्यक्ष धर्मजीत महतो ने बताया कि यात्री बस मुजफ्फरपुर से पटना जा रही थी।इसी दौरान हादसा हो गया।हादसे के बाद ड्राइवर मौके से फरार हो गया है जिसकी तलाश में पुलिस जुटी है।हंगामा कर रहे लोगों को शांत करा दिया गया है और मामले की जांच की जा रही है।","\n ""Locals Blame Negligent Driving for Fatal Accident in Bihar's Vaishali District""\n\nNote: The above headline is written in Hindi.","सड़क हादसे में पूर्व सरपंच की मौत के बाद बवाल; गुस्साई भीड़ ने पुलिस पर किया पथराव, 2 जवान घायल"
9,क्वालालंपुरः प्रधानमंत्री नरेंद्र मोदी ने मलेशिया में भारतीय समुदाय को संबोधित करते हुए कहा कि विदेशों में रहने वाले भारतीयों के दिल में भी एक अलग भारत बसता है।समय और दूरी रिश्तों में बाधा मलेशिया में रहने वालों के दिल में बसता है भारतः मोदी क्वालालंपुरः प्रधानमंत्री नरेंद्र मोदी ने मलेशिया में भारतीय समुदाय को संबोधित करते हुए कहा कि विदेशों में रहने वाले भारतीयों के दिल में भी एक अलग भारत बसता है।समय और दूरी रिश्तों में बाधा नहीं बन सकती।उन्होंने कहा कि मलय भारतीयों ने गांधी जी के जीवन से प्रेरणा ली है।नेताजी सुभाष चंद्र बोस के साथ मलय भारतीयों का स्वतंत्रता संग्राम की लड़ाई में अहम योगदान रहा।इस मौके पर पीएम ने बताया की मलेशिया में भारतीय सांस्कृतिक केंद्र का नाम नेताजी सुभाष चंद्र बोस के नाम पर होगा।बता दे कि मलेशिया का भारतीय समुदाय नरेंद्र मोदी के भव्य स्वागत की तैयारी पहले ही कर चुका था।मोदी ने जिस तरह इंग्लैंड के वेम्बले में भारतीय को संबोधित किया था आज मलेशिया में भी कुछ ऐसा ही नजारा देखने को मिला।आज ईस्ट एशिया समिट में शामिल हुए मोदी- मलेशिया दौरे पर गए प्रधानमंत्री नरेंद्र मोदी ने आज सुबह क्वालालंपुर में 10वें ईस्ट एशिया समिट में शिरकत की।इस मौके पर अमेरिकी राष्ट्रपति बराक ओबामा भी मौजूद रहे।इससे पहले आसियान देशों के सभी नेताओं ने एक मंच पर आकर हाथ मिलाए।प्रधानमंत्री नरेंद्र मोदी ने आसियान देशों के नेताओं और चीन तथा जापान के अपने समकक्षों से बातचीत के दौरान आतंकवाद के खिलाफ मिलकर लड़ाई लड़ने का आह्वान किया।इसके साथ ही उन्होंने दक्षिण चीन सागर में क्षेत्रीय तथा समुद्री विवादों को जल्द हल करने पर भी जोर दिया।पर देश-विदेश की ताजा और स्पेशल स्टोरी पढ़ते हुए अपने आप को रखिए अप-टू-डेट।के लिए क्लिक करें विदेश सेक्शन,"\n नरेंद्र मोदी ने मलेशिया में भारतीय समुदाय को संबोधित करते हुए कहा कि विदेशों में रहने वाले भारतीयों के दिल में भी एक अलग भारत बसता है।\n\n(Translation: Narendra Modi has told Malaysia that even in foreign lands, the hearts of Indians remain Indian. He said that the minds of those who live abroad still have an Indian heart.)","क्वालालंपुर में बोले मोदी, मलेशिया में रहने वालों के दिल में बसता है भारत"


## Results

In [None]:
import locale
def getpreferredencoding(do_setlocale = True):
    return "UTF-8"
locale.getpreferredencoding = getpreferredencoding

In [None]:
!pip install rouge

Collecting rouge
  Downloading rouge-1.0.1-py3-none-any.whl (13 kB)
Installing collected packages: rouge
Successfully installed rouge-1.0.1


In [None]:
pip install pycocoevalcap

Collecting pycocoevalcap
  Downloading pycocoevalcap-1.2-py3-none-any.whl (104.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m104.3/104.3 MB[0m [31m8.0 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: pycocoevalcap
Successfully installed pycocoevalcap-1.2


In [None]:
from nltk.translate.bleu_score import corpus_bleu
from nltk.translate.bleu_score import SmoothingFunction
from nltk.translate import bleu_score
import nltk
from rouge import Rouge
from pycocoevalcap.cider.cider import Cider
nltk.download('punkt')

[nltk_data] Downloading package punkt to /root/nltk_data...
[nltk_data]   Package punkt is already up-to-date!


True

In [None]:
def calculate_bleu_scores(actual, generated):
    smoothie = SmoothingFunction().method4
    actual_tokenized = [nltk.word_tokenize(group) for group in actual]
    generated_tokenized = [nltk.word_tokenize(gen) for gen in generated]

    score = corpus_bleu(actual_tokenized, generated_tokenized, smoothing_function=smoothie)
    return score

def calculate_rouge_scores(actual, generated):
    rouge = Rouge()
    scores = rouge.get_scores(generated, actual)
    return scores

def calculate_cider_scores(actual, generated):
    act_dict = {idx: [line] for idx, line in enumerate(actual)}
    gen_dict = {idx: [line] for idx, line in enumerate(generated)}
    cider = Cider()
    (score, scores) = cider.compute_score(act_dict, gen_dict)
    return score

In [None]:
calculate_bleu_scores(summarized_list,target_text)

0.002875256445351266

In [None]:
calculate_rouge_scores(summarized_list,target_text)

[{'rouge-1': {'r': 0.09090909090909091, 'p': 0.2, 'f': 0.12499999570312517},
  'rouge-2': {'r': 0.0, 'p': 0.0, 'f': 0.0},
  'rouge-l': {'r': 0.09090909090909091, 'p': 0.2, 'f': 0.12499999570312517}},
 {'rouge-1': {'r': 0.13513513513513514,
   'p': 0.35714285714285715,
   'f': 0.19607842738946568},
  'rouge-2': {'r': 0.0, 'p': 0.0, 'f': 0.0},
  'rouge-l': {'r': 0.05405405405405406,
   'p': 0.14285714285714285,
   'f': 0.07843136856593638}},
 {'rouge-1': {'r': 0.4, 'p': 0.2857142857142857, 'f': 0.33333332847222225},
  'rouge-2': {'r': 0.2, 'p': 0.13333333333333333, 'f': 0.15999999520000013},
  'rouge-l': {'r': 0.3, 'p': 0.21428571428571427, 'f': 0.24999999513888896}},
 {'rouge-1': {'r': 0.1111111111111111,
   'p': 0.14285714285714285,
   'f': 0.12499999507812519},
  'rouge-2': {'r': 0.0, 'p': 0.0, 'f': 0.0},
  'rouge-l': {'r': 0.05555555555555555,
   'p': 0.07142857142857142,
   'f': 0.06249999507812539}},
 {'rouge-1': {'r': 0.12903225806451613,
   'p': 0.36363636363636365,
   'f': 0.190

In [None]:
calculate_cider_scores(summarized_list,target_text)

0.19911739190298633