In [1]:
!pip install pandas torch transformers datasets scikit-learn rouge-score bert-score

Collecting rouge-score
  Downloading rouge_score-0.1.2.tar.gz (17 kB)
  Preparing metadata (setup.py) ... [?25ldone
[?25hCollecting bert-score
  Downloading bert_score-0.3.13-py3-none-any.whl.metadata (15 kB)
Downloading bert_score-0.3.13-py3-none-any.whl (61 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m61.1/61.1 kB[0m [31m2.9 MB/s[0m eta [36m0:00:00[0m
[?25hBuilding wheels for collected packages: rouge-score
  Building wheel for rouge-score (setup.py) ... [?25ldone
[?25h  Created wheel for rouge-score: filename=rouge_score-0.1.2-py3-none-any.whl size=24934 sha256=282027ef3f6c7bb2dd4a2dc01d75a7b0b3325b5dd9f373a17cba23b88580309a
  Stored in directory: /root/.cache/pip/wheels/5f/dd/89/461065a73be61a532ff8599a28e9beef17985c9e9c31e541b4
Successfully built rouge-score
Installing collected packages: rouge-score, bert-score
Successfully installed bert-score-0.3.13 rouge-score-0.1.2


In [2]:
import os
import pandas as pd
import torch
from transformers import MT5Tokenizer, MT5ForConditionalGeneration, Seq2SeqTrainer, Seq2SeqTrainingArguments, DataCollatorForSeq2Seq
from datasets import Dataset, DatasetDict
from sklearn.model_selection import train_test_split
from rouge_score import rouge_scorer
from bert_score import score as bert_score

In [3]:
# Veri seti yolunun kontrolü
input_path = '/kaggle/input/eco-news-toplu/eco_news_cleaned3.csv'
if not os.path.exists(input_path):
    raise FileNotFoundError(f"File not found: {input_path}")

# Veri setini okuma ve temizleme
df = pd.read_csv(input_path)
df = df.dropna(subset=['icerik', 'ozet'])  # 'icerik' ve 'ozet' sütunlarındaki NaN değerleri çıkar

# Haberleri ve özetleri ayırma
articles = df['icerik'].tolist()
summaries = df['ozet'].tolist()

# Veriyi train-test olarak ayırma
train_articles, test_articles, train_summaries, test_summaries = train_test_split(
    articles, summaries, test_size=0.2, random_state=42
)

# Train-validation ayırma
train_articles, val_articles, train_summaries, val_summaries = train_test_split(
    train_articles, train_summaries, test_size=0.1, random_state=42
)

print(f"Train set size: {len(train_articles)}")
print(f"Validation set size: {len(val_articles)}")
print(f"Test set size: {len(test_articles)}")

Train set size: 5576
Validation set size: 620
Test set size: 1550


In [4]:
# Dataset formatına dönüştürme
train_data = {'article': train_articles, 'summary': train_summaries}
val_data = {'article': val_articles, 'summary': val_summaries}
test_data = {'article': test_articles, 'summary': test_summaries}

train_dataset = Dataset.from_dict(train_data)
val_dataset = Dataset.from_dict(val_data)
test_dataset = Dataset.from_dict(test_data)

dataset = DatasetDict({
    'train': train_dataset,
    'validation': val_dataset,
    'test': test_dataset
})

In [5]:
# Model ve tokenizer yükleme
model_name = 'google/mt5-base'
model = MT5ForConditionalGeneration.from_pretrained(model_name)
tokenizer = MT5Tokenizer.from_pretrained(model_name)

config.json:   0%|          | 0.00/702 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/2.33G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/147 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/376 [00:00<?, ?B/s]

spiece.model:   0%|          | 0.00/4.31M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/65.0 [00:00<?, ?B/s]

You are using the default legacy behaviour of the <class 'transformers.models.t5.tokenization_t5.T5Tokenizer'>. This is expected, and simply means that the `legacy` (previous) behavior will be used so nothing changes for you. If you want to use the new behaviour, set `legacy=False`. This should only be set if you understand what it means, and thoroughly read the reason why this was added as explained in https://github.com/huggingface/transformers/pull/24565


In [6]:
# Dinamik `max_length` hesaplama fonksiyonu
def calculate_max_summary_length(article_length, min_length=50, max_length=150, ratio=0.2):
    calculated_length = int(article_length * ratio)
    return max(min_length, min(max_length, calculated_length))

In [7]:
# Dinamik `max_length` ve preprocessing fonksiyonu
def preprocess_data_with_dynamic_length(examples):
    inputs = [f"Özetle: {article}" for article in examples["article"]]
    targets = examples["summary"]

    input_lengths = [len(tokenizer.tokenize(article)) for article in inputs]
    max_summary_lengths = [calculate_max_summary_length(length) for length in input_lengths]

    model_inputs = tokenizer(inputs, max_length=512, truncation=True, padding="max_length")
    
    labels = []
    for target, max_length in zip(targets, max_summary_lengths):
        label = tokenizer(target, max_length=max_length, truncation=True, padding="max_length")
        labels.append(label["input_ids"])
    
    model_inputs["labels"] = labels
    return model_inputs

In [8]:
# Preprocessing uygulama
tokenized_dataset = dataset.map(preprocess_data_with_dynamic_length, batched=True)

Map:   0%|          | 0/5576 [00:00<?, ? examples/s]

Map:   0%|          | 0/620 [00:00<?, ? examples/s]

Map:   0%|          | 0/1550 [00:00<?, ? examples/s]

In [9]:
# Dinamik padding için data collator
data_collator = DataCollatorForSeq2Seq(
    tokenizer=tokenizer, 
    model=model, 
    padding=True
)

In [10]:
training_args = Seq2SeqTrainingArguments(
    output_dir='./results',
    eval_strategy="epoch",
    save_strategy="no",
    learning_rate=2e-5,
    per_device_train_batch_size=4,
    per_device_eval_batch_size=4,
    num_train_epochs=20,
    weight_decay=0.01,
    predict_with_generate=True,
    logging_dir='./logs',
    report_to="none",
)

In [11]:
# Seq2SeqTrainer ile model eğitimi
trainer = Seq2SeqTrainer(
    model=model,
    args=training_args,
    train_dataset=tokenized_dataset["train"],
    eval_dataset=tokenized_dataset["validation"],
    tokenizer=tokenizer,
    data_collator=data_collator  # Dinamik padding burada aktif
)

# Start training
trainer.train()

Epoch,Training Loss,Validation Loss
1,3.2055,0.579072
2,0.6545,0.464366
3,0.5581,0.423599
4,0.5033,0.406274
5,0.4763,0.397948
6,0.4609,0.386195
7,0.4335,0.379903
8,0.41,0.371167
9,0.4002,0.373508
10,0.3807,0.365852


TrainOutput(global_step=27880, training_loss=0.8273323756892507, metrics={'train_runtime': 16705.4646, 'train_samples_per_second': 6.676, 'train_steps_per_second': 1.669, 'total_flos': 1.3371762460852224e+17, 'train_loss': 0.8273323756892507, 'epoch': 20.0})

In [12]:
!pip install sacrebleu

  pid, fd = os.forkpty()


Collecting sacrebleu
  Downloading sacrebleu-2.4.3-py3-none-any.whl.metadata (51 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m51.8/51.8 kB[0m [31m2.5 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting portalocker (from sacrebleu)
  Downloading portalocker-3.0.0-py3-none-any.whl.metadata (8.5 kB)
Downloading sacrebleu-2.4.3-py3-none-any.whl (103 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m104.0/104.0 kB[0m [31m5.1 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading portalocker-3.0.0-py3-none-any.whl (19 kB)
Installing collected packages: portalocker, sacrebleu
Successfully installed portalocker-3.0.0 sacrebleu-2.4.3


In [14]:
import sacrebleu

# Test veri kümesindeki orijinal metinler ve özetler
original_texts = dataset['test']['article']
reference_summaries = dataset['test']['summary']

# Modelin tahmin ettiği özetler
def generate_summaries(model, tokenizer, texts, max_length=150, device='cuda'):
    model.to(device)  # Modeli cihaza taşı
    summaries = []
    for text in texts:
        # Girişleri cihaza taşı
        inputs = tokenizer(f"Özetle: {text}", return_tensors="pt", truncation=True, max_length=512).to(device)
        
        # Özet oluşturma
        outputs = model.generate(
            input_ids=inputs["input_ids"], 
            attention_mask=inputs["attention_mask"], 
            max_length=max_length, 
            num_beams=4, 
            early_stopping=True
        )
        
        # Özetleri çöz ve listeye ekle
        summary = tokenizer.decode(outputs[0], skip_special_tokens=True)
        summaries.append(summary)
    return summaries

# Tahmin edilen özetler
predicted_summaries = generate_summaries(model, tokenizer, original_texts)

# ROUGE hesaplama
def calculate_rouge(reference_summaries, predicted_summaries):
    scorer = rouge_scorer.RougeScorer(['rouge1', 'rouge2', 'rougeL'], use_stemmer=True)
    rouge_scores = {'rouge1': [], 'rouge2': [], 'rougeL': []}
    for ref, pred in zip(reference_summaries, predicted_summaries):
        scores = scorer.score(ref, pred)
        rouge_scores['rouge1'].append(scores['rouge1'].fmeasure)
        rouge_scores['rouge2'].append(scores['rouge2'].fmeasure)
        rouge_scores['rougeL'].append(scores['rougeL'].fmeasure)
    # Ortalama ROUGE skorlarını döndür
    return {key: sum(values)/len(values) for key, values in rouge_scores.items()}

# BLEU hesaplama
def calculate_bleu(reference_summaries, predicted_summaries):
    bleu = sacrebleu.corpus_bleu(predicted_summaries, [reference_summaries])
    return bleu.score

# BERTScore hesaplama
def calculate_bertscore(reference_summaries, predicted_summaries, lang='tr'):
    P, R, F1 = bert_score(predicted_summaries, reference_summaries, lang=lang)
    return {'Precision': P.mean().item(), 'Recall': R.mean().item(), 'F1': F1.mean().item()}

In [16]:
rouge_results = calculate_rouge(reference_summaries, predicted_summaries)
print("ROUGE Scores:", rouge_results)

ROUGE Scores: {'rouge1': 0.6444456485569592, 'rouge2': 0.5519392289045285, 'rougeL': 0.6200820095123559}


In [17]:
bleu_score = calculate_bleu(reference_summaries, predicted_summaries)
print("BLEU Score:", bleu_score)

BLEU Score: 41.84931326448394


In [18]:
bertscore_results = calculate_bertscore(reference_summaries, predicted_summaries)
print("BERTScore:", bertscore_results)

tokenizer_config.json:   0%|          | 0.00/60.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/385 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/251k [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/445M [00:00<?, ?B/s]

BERTScore: {'Precision': 0.8236191272735596, 'Recall': 0.8144460320472717, 'F1': 0.817284107208252}


In [43]:
import torch

# Cihaz kontrolü (cuda varsa GPU'yu, yoksa CPU'yu seç)
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# Model ve tokenizer'ı cihaza taşı
model.to(device)

# Haber metninin uzunluğuna göre özet uzunluğunu hesaplayan fonksiyon
def calculate_summary_length(article_length, min_length=30, max_length=150, ratio=0.2):
    dynamic_length = int(article_length * ratio)  # Haber uzunluğunun belirli bir oranı kadar özet oluştur
    return max(min_length, min(max_length, dynamic_length))  # Sınırları kontrol et

# Example data
news_text = """Özetle: Türkiye Cumhuriyet Merkez Bankası (TCMB) bugün gerçekleştirilen Para Politikası Kurulu (PPK) toplantısında, politika faiz 
oranını 200 baz puan artırarak yüzde 20 seviyesine yükseltti. Banka, bu kararı, enflasyonist baskılarla mücadele kapsamında aldığını belirtti. 
Kararın ardından, döviz kurlarında ani yükselişler görülürken, borsa ise dalgalı bir seyir izledi. Ekonomistler, bu adımın enflasyonla mücadelede
önemli bir sinyal olduğunu ve piyasaların orta vadede dengeye geleceğini öngörüyor. Öte yandan, iş dünyası temsilcileri ve yatırımcılar,
faiz artışının kredi maliyetlerini yükselteceğini ifade ederek kararı temkinli karşıladı. TCMB Başkanı, faiz artışlarının, enflasyonu dizginlemek
amacıyla kontrollü bir şekilde devam edebileceğini söyledi. Kararın etkisi önümüzdeki günlerde piyasalarda yakından izlenecek."""

# Haber metnini tokenizer ile işleyerek token haline getir (cihaza taşı)
input_ids = tokenizer.encode(
    news_text, 
    return_tensors="pt",  # Tensor formatında döndür
    max_length=512,       # Maksimum uzunluk sınırı
    truncation=True       # Uzun metinleri kes
).to(device)

# Haber metninin token uzunluğunu hesapla
article_length = input_ids.shape[1]  # Tensor'un ikinci boyutu (token sayısı)

# Dinamik özet uzunluğunu hesapla
dynamic_max_length = calculate_summary_length(article_length, ratio=0.25)
dynamic_min_length = max(10, int(dynamic_max_length * 0.2))  # Minimum uzunluk, max_length'in %20'si kadar olsun

# Özet oluşturma
summary_ids = model.generate(
    input_ids, 
    max_length=dynamic_max_length,       # Dinamik maksimum uzunluk
    min_length=dynamic_min_length,       # Dinamik minimum uzunluk
    length_penalty=2.0,                  # Uzun özetleri tercih etmek için ceza oranı
    num_beams=7,                         # Beam Search ile daha iyi özet oluşturma
    early_stopping=True                  # İlk uygun özet bulunduğunda durdur
)

# Tokenize edilmiş özet metnini çözüp metin haline getir
summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)

# Özet çıktısını yazdır
print("Dynamic Max Length:", dynamic_max_length)
print("Dynamic Min Length:", dynamic_min_length)
print("Summary:", summary)


Dynamic Max Length: 57
Dynamic Min Length: 11
Summary: Türkiye Cumhuriyet Merkez Bankası, politika faiz oranını 200 baz puan artırarak yüzde 20 seviyesine yükseltti.


In [48]:
import random
import torch

# Cihaz kontrolü
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# Model ve tokenizer'ı cihaza taşı
model.to(device)

# Rastgele bir test örneği seçmek
def get_random_test_sample(dataset):
    idx = random.randint(0, len(dataset['test']) - 1)  # Test setinden rastgele bir indeks seç
    return dataset['test'][idx]

# Modelin özet oluşturma fonksiyonu
def generate_summary_for_text(model, tokenizer, text, device, max_length=150, min_length=30):
    # Haberi tokenize edip cihaza taşı
    input_ids = tokenizer.encode(
        f"Özetle: {text}",
        return_tensors="pt",
        max_length=512,
        truncation=True
    ).to(device)

    # Özet oluşturma
    summary_ids = model.generate(
        input_ids,
        max_length=max_length,
        min_length=min_length,
        length_penalty=2.0,
        num_beams=7,
        early_stopping=True
    )

    # Özet metnini çöz
    summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
    return summary

# Rastgele bir test haberi al
sample = get_random_test_sample(dataset)
article = sample['article']
true_summary = sample['summary']

# Modelin ürettiği özeti oluştur
generated_summary = generate_summary_for_text(model, tokenizer, article, device)

# Karşılaştırmayı yazdırma
print("\n=== Rastgele Bir Test Haberi ===")
print(f"Haber Metni:\n{article}")
print("\n--- Gerçek Özet ---")
print(f"{true_summary}")
print("\n--- Modelin Ürettiği Özet ---")
print(f"{generated_summary}")



=== Rastgele Bir Test Haberi ===
Haber Metni:
**Borsa İstanbul'da BIST 100 endeksi,** önceki kapanışa göre 16,92 puan azalırken, toplam işlem hacmi 32,1 milyar lira seviyesinde gerçekleşti.  Bankacılık endeksi yüzde 0,59 değer kaybederken, holding endeksi yüzde 0,58 değer kazandı. Sektör endeksleri arasında en fazla kazandıran yüzde 1,82 ile spor, en çok gerileyen ise yüzde 6,48 ile elektrik oldu.  Cumhurbaşkanı Recep Tayyip Erdoğan'ın "müjde" açıklamasıyla üç gündür dünya borsalarından pozitif ayrışan BIST 100 endeksi, bugün enerji hisselerinde yoğunlaşan alımlarla 1.141,32 puana kadar yükseldi. Kapanışa yakın kar satışları ile kazançlarını geri veren borsa günü yüzde 1,50 azalışla 1.109,88 puandan tamamladı.  Türkiye, tarihinin en büyük doğal gaz keşfini Karadeniz'de gerçekleştirirken, Erdoğan, "Fatih Sondaj Gemimiz 20 Temmuz 2020'de başladığı Tuna 1 Kuyusu sondajında 320 milyar metroküp doğal gaz rezervi keşfetmiş durumda. Hedefimiz, 2023 yılında Karadeniz gazını milletimizin kulla

In [None]:
import random

# Validation veri setinin tamamında tahminler
predictions = trainer.predict(tokenized_dataset["validation"])

# Tahmin edilen ve gerçek özetleri çözümleme
predicted_summaries = [tokenizer.decode(ids, skip_special_tokens=True) for ids in predictions.predictions]
reference_summaries = tokenized_dataset["validation"]["summary"]
original_articles = tokenized_dataset["validation"]["article"]

# ROUGE Skorlarını Hesaplama
rouge = rouge_scorer.RougeScorer(['rouge1', 'rouge2', 'rougeL'], use_stemmer=True)
rouge_scores = [rouge.score(pred, ref) for pred, ref in zip(predicted_summaries, reference_summaries)]

# Ortalama ROUGE Skorlarını Hesaplama
rouge1 = sum([score['rouge1'].fmeasure for score in rouge_scores]) / len(rouge_scores)
rouge2 = sum([score['rouge2'].fmeasure for score in rouge_scores]) / len(rouge_scores)
rougeL = sum([score['rougeL'].fmeasure for score in rouge_scores]) / len(rouge_scores)

print(f"ROUGE-1 F1 Score: {rouge1:.4f}")
print(f"ROUGE-2 F1 Score: {rouge2:.4f}")
print(f"ROUGE-L F1 Score: {rougeL:.4f}")

# BERTScore Hesaplama (tüm doğrulama seti üzerinden)
P, R, F1 = bert_score(predicted_summaries, reference_summaries, lang="tr")  # 'tr' yerine uygun dili seçin
bert_f1 = F1.mean().item()

print("-"*50)
print(f"BERTScore F1 Score: {bert_f1:.4f}")

# Rastgele bir örnek seçme
random_index = random.randint(0, len(original_articles) - 1)
article = original_articles[random_index]
predicted_summary = predicted_summaries[random_index]
reference_summary = reference_summaries[random_index]

# Seçilen rastgele örneği yazdırma
print(f"\n------ Rastgele Seçilen Haber {random_index + 1} ------")
print(f"--- Orijinal Metin ---\n{article}")
print(f"--- Modelin Oluşturduğu Özet ---\n{predicted_summary}")
print(f"--- Gerçek Özet ---\n{reference_summary}\n")


In [None]:
# Load the fine-tuned model and tokenizer
model_name = "nebiberke/haber-ozet-mt5-base-ustune"
TOKEN = "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"
model = MT5ForConditionalGeneration.from_pretrained(model_name, token=TOKEN)
tokenizer = MT5Tokenizer.from_pretrained(model_name, token=TOKEN)

In [None]:


# Sample news text to summarize
news_text = """Yedi ülkede, 10 santral operasyonu ve dört farklı ülkede eş zamanlı devam eden yatırımlarıyla bugün itibarıyla toplam 
2,627 MW kurulu güce sahip olan Aksa Enerji, 2023 yılı konsolide finansal sonuçlarını açıkladı. Şirket, bir önceki yıla göre FAVÖK marjını 
7 puanlık artışla yüzde 22 seviyesine yükseltti, net kâr marjı ise 10 puan artışla yüzde 16’ya ulaştı. Aksa Enerji Yönetim Kurulu Başkanı ve 
CEO’su Cemil Kazancı, yıl sonu değerlendirmesinde, sürdürülebilir yüksek büyüme hedefi kapsamında devam eden yurt içi ve yurt dışı yatırımlara 
ve etkin bilanço yönetimine dikkat çekti. Kazancı, “2023 yılında, coğrafi çeşitliliği artırmaya yönelik güçlü adımlar attık. Öte yandan hali 
hazırda faaliyet gösterdiğimiz ülkelerde sözleşmelerimizi yenileyerek kapasite artırımı gerçekleştirdik. Stratejik yatırımlarımızın kârlılığa 
olumlu etkisi ve etkin bilanço yönetimiyle birlikte yatırımlarımızın devam ettiği dönemde net finansal borcumuzun FAVÖK'e oranı 1,6 çarpan 
seviyesinde gerçekleşti. 2030 Stratejisi doğrultusunda, kurumsal dönüşüm hedeflerine paralel olarak fonksiyonel, mükemmeliyet merkezi yaklaşımına
sahip, yalın, çevik ve güçlü bir organizasyon yapısı oluşturmak üzere çalışmalara devam edildiğini ileten Sn. Kazancı, üretim portföyünü yurt 
içinde de gerek kaynak gerekse coğrafi anlamda çeşitlendirmeye devam ettiklerini sözlerine ekledi. Sn. Kazancı, “Bu kapsamda 2023 yılı içerisinde 
İç Anadolu ve Ege Bölgeleri’nde, 8 şehirde toplam 831,41 MW kurulu güce sahip olacak RES ve GES depolamalı yenilenebilir enerji santrali ön 
lisansını almaya hak kazandık. Bu yatırımların önümüzdeki 5 yıllık süre zarfında faaliyete geçmesini planlıyoruz” dedi. Aksa Enerji’nin sağlam 
2023 yılı performansında karlılık odaklı portföy yönetimi etkili oldu. Şirket, 2023 yılı içerisinde Orta Asya ve Afrika gibi stratejik pazarlarda 
önemli yatırımlarda bulundu. Mart 2022’den beri 740MW’lık kurulu güç ile Özbekistan’da faaliyet gösteren Aksa Enerji, Kasım 2023 tarihinde 
Talimercan şehrinde 430 MW kurulu güçte bir doğal gaz kombine çevrim santrali kurulması ve işletilmesini içeren yeni bir anlaşma imzaladı. 
Santralin faaliyete geçmesiyle birlikte şirketin ülkedeki kurulu gücü 1,170 MW seviyesine çıkacak. Öte yandan Aksa Enerji, bu dönemde yeni bir 
anlaşma ile Orta Asya’daki yatırımlarına Kazakistan’ı da ekledi. Kazakistan’ın Kızılorda şehrindeki santral yatırımının hayata geçmesiyle birlikte 
Aksa Enerji bölgeye ilk defa hem ısı hem de elektrik tedariği gerçekleştirecek. Kazakistan’daki büyüme hedefinin ilk ve önemli adımı olan 
bu santralin, 2025 yılında faaliyete geçmesi planlanıyor. Afrika kıtasında ise şirket, 2023 Nisan ayında Electricity Company of Ghana ile 350 MW 
kurulu gücünde Kumasi kombine çevrim doğal gaz santrali kurulumu, elektrik üretimi ve üretilen elektriğin garantili satışı konusunda anlaşma
imzaladı. Anlaşmaya göre şirket, ABD doları bazlı 20 yıl süreli bir enerji satış anlaşması ile Gana’da doğal gaz dönüşümü ile sürdürülebilir
enerjiye geçiş konusundaki adımlarını güçlendirdi. Bu yatırım atağı ile hedeflerinin Türkiye’nin küresel enerji piyasalarındaki konumunu 
güçlendirirken aynı zamanda ülkelerin enerji arz güvenliğine hizmet etmek olduğunu belirten Sn. Cemil Kazancı, “Ülkemize duyduğumuz güven ve 
adanmışlıkla küresel piyasalardaki atılımlarımıza hız kattığımız bir dönemdeyiz. 2023 yılında gerçekleştirdiğimiz yeni anlaşmalarla Orta Asya’dan 
Güney Afrika’ya geniş bir coğrafyada enerji yatırımlarını hayata geçiriyoruz. Bu kapsamda Özbekistan Santrali Projesi’nin Aksa Enerji’nin varlık
portföyündeki döviz bazlı gelirleri çeşitlendirerek ‘Sürdürülebilir Yüksek Büyüme’ stratejisini destekleyeceğine inanıyoruz. Talimercan ve 
Kızılorda yatırımlarımız da yine bu stratejik yaklaşımın ürünleri. Önümüzdeki yıllarda faaliyete geçmesi planlanan Gana-Kumasi ve Senagal-St Louis 
santral atılımımızla da ülkelerin enerji arz güvenliğine yatırım yapmaya devam ediyoruz. 2030 Stratejimizi kapsayan tüm bu çalışmalarımız, finansal
başarımızı ve performansımızı güçlendirirken 5 kıtada faaliyet hedefimize de bizi adım adım yaklaştırıyor"""

# Preprocess the text (tokenize and encode)
input_ids = tokenizer.encode(news_text, return_tensors="pt", max_length=512, truncation=True).to('cuda')

# Generate the summary
summary_ids = model.generate(input_ids, max_length=150, min_length=30, length_penalty=2.0, num_beams=7, early_stopping=True)
summary = tokenizer.decode(summary_ids[0], skip_special_tokens=True)

# Print the generated summary
print("Summary:", summary)


In [None]:
# Function to generate a summary
def generate_summary(text):
    input_ids = tokenizer.encode(text, return_tensors="pt", max_length=512, truncation=True)
    summary_ids = model.generate(input_ids, max_length=150, min_length=30, length_penalty=2.0, num_beams=7, early_stopping=True)
    return tokenizer.decode(summary_ids[0], skip_special_tokens=True)

# Example data
news_text = """Özetle: Türkiye Cumhuriyet Merkez Bankası (TCMB) bugün gerçekleştirilen Para Politikası Kurulu (PPK) toplantısında, politika faiz 
oranını 200 baz puan artırarak yüzde 20 seviyesine yükseltti. Banka, bu kararı, enflasyonist baskılarla mücadele kapsamında aldığını belirtti. 
Kararın ardından, döviz kurlarında ani yükselişler görülürken, borsa ise dalgalı bir seyir izledi. Ekonomistler, bu adımın enflasyonla mücadelede
önemli bir sinyal olduğunu ve piyasaların orta vadede dengeye geleceğini öngörüyor. Öte yandan, iş dünyası temsilcileri ve yatırımcılar,
faiz artışının kredi maliyetlerini yükselteceğini ifade ederek kararı temkinli karşıladı. TCMB Başkanı, faiz artışlarının, enflasyonu dizginlemek
amacıyla kontrollü bir şekilde devam edebileceğini söyledi. Kararın etkisi önümüzdeki günlerde piyasalarda yakından izlenecek."""
reference_summary = "Merkez Bankası, enflasyonla mücadele için faiz oranını yüzde 20'ye yükseltti. Faiz artışı dövizde yükselişe, borsada dalgalanmaya yol açtı."

# Generate a summary for the news text
generated_summary = generate_summary(news_text)
print("Generated Summary:", generated_summary)

# Calculate ROUGE scores
rouge_scorer_tool = rouge_scorer.RougeScorer(['rouge1', 'rouge2', 'rougeL'], use_stemmer=True)
rouge_scores = rouge_scorer_tool.score(reference_summary, generated_summary)

# Display ROUGE scores
print("ROUGE Scores:")
for key, value in rouge_scores.items():
    print(f"{key}: Precision: {value.precision:.4f}, Recall: {value.recall:.4f}, F1-score: {value.fmeasure:.4f}")

# Calculate BERTScore
P, R, F1 = bert_score([generated_summary], [reference_summary], lang="en", verbose=True)

# Display BERTScore
print("\nBERTScore:")
print(f"Precision: {P.mean().item():.4f}, Recall: {R.mean().item():.4f}, F1-score: {F1.mean().item():.4f}")

In [49]:
# Save the fine-tuned model
model.save_pretrained("fine_tuned_mt5_base_dynamic_length")
tokenizer.save_pretrained("fine_tuned_mt5_base_dynamic_length")

print("Fine-tuning complete. Model and tokenizer saved.")

Fine-tuning complete. Model and tokenizer saved.
