# 3_bist50_Adv_DL: Özelleştirilmiş Finansal Transformer Modelleri

## Tez Bölümü 3.4: Özelleştirilmiş Finansal Transformer Modelleri

Bu notebook, finansal metin analizi ve piyasa tahmini için özelleştirilmiş Transformer modellerini içerir:

| Model | Kaynak | Açıklama |
|-------|--------|----------|
| **FinBERT** | ProsusAI/finbert | Finansal Sentiment Analizi |
| **FinGPT** | AI4Finance GitHub + HuggingFace LoRA | Açık Kaynak Finansal LLM |
| **FinT5** | SALT-NLP/FLANG-T5 | Finansal T5 Modeli |
| **StockGPT** | OpenAI GPT-4 API | Hisse Senedi Teknik Analiz |
| **MarketGPT** | OpenAI GPT-4 API | Makroekonomik Analiz |
| **BloombergGPT** | Simülasyon (50B kapalı kaynak) | Profesyonel Finansal Analiz |

**Veri:** BIST50 2018 (CSV)
**Tarih Aralığı:** 01.01.2018 - 31.12.2018
**Test Dönemi:** Aralık 2018

---
 **GPU Gereksinimi:** FinGPT için en az T4 GPU (16GB VRAM) önerilir.
 **HuggingFace Token:** Llama-2 modelleri için HuggingFace hesabı ve token gereklidir.

---
** GÜNCELLEME:** Bu notebook gerçek haber verileri kullanacak şekilde güncellenmiştir.
- **Veri Kaynağı:** `/content/drive/MyDrive/Colab Notebooks/DataFrames/BorsaHaberleri_Neutr_2018-01-01_2018-12-31-ingilizce-KokleriBulunmus.csv`
- **Önkoşul:** Bu notebook'u çalıştırmadan önce `0_nlp_2018.ipynb` dosyasının çalıştırılmış olması gerekir.
---

In [None]:
# =============================================================================
# CELL 0: Google Drive Bağlantısı
# =============================================================================
from google.colab import drive
drive.mount('/content/drive')

In [None]:
# =============================================================================
# CELL 1: GPU Kontrolü ve Colab Ayarları
# =============================================================================
import torch

# GPU kontrolü
if torch.cuda.is_available():
    gpu_name = torch.cuda.get_device_name(0)
    gpu_memory = torch.cuda.get_device_properties(0).total_memory / 1e9
    print(f" GPU Aktif: {gpu_name}")
    print(f" GPU Bellek: {gpu_memory:.1f} GB")

    if gpu_memory < 15:
        print(" UYARI: FinGPT için en az 16GB VRAM önerilir!")
        print(" Runtime > Change runtime type > T4 GPU seçin")
    else:
        print(" GPU bulunamadı! Runtime > Change runtime type > GPU seçin")
        print(" FinGPT modeli GPU olmadan çalışmayacaktır.")

In [None]:
# =============================================================================
# CELL 2: Kütüphane Kurulumları ve Model Klasörleri
# =============================================================================
%%capture install_output

# Temel kütüphaneler
!pip install pandas numpy matplotlib scikit-learn openpyxl

# Transformers ve LLM kütüphaneleri
!pip install transformers>=4.35.0
!pip install accelerate>=0.24.0
!pip install bitsandbytes>=0.41.0 # 8-bit quantization için
!pip install peft>=0.6.0 # LoRA için
!pip install sentencepiece protobuf

# OpenAI (StockGPT ve MarketGPT için)
!pip install openai>=1.0.0 tiktoken

# =============================================================================
# GPT Model Klasörleri (Google Drive)
# =============================================================================
import os

GPT_BASE = "/content/drive/MyDrive/Colab Notebooks/GPT"

# Klasör yapısını oluştur
MODEL_PATHS = {
 'FinGPT': f"{GPT_BASE}/FinGPT",
 'FinBERT': f"{GPT_BASE}/FinBERT",
 'FinT5': f"{GPT_BASE}/FinT5",
 'StockGPT': f"{GPT_BASE}/StockGPT",
 'MarketGPT': f"{GPT_BASE}/MarketGPT",
 'BloombergGPT': f"{GPT_BASE}/BloombergGPT",
}

for name, path in MODEL_PATHS.items():
 os.makedirs(path, exist_ok=True)
 print(f" {name}: {path}")

# FinGPT GitHub reposunu klonla (eğer yoksa)
FINGPT_REPO = MODEL_PATHS['FinGPT'] + "/repo"
if not os.path.exists(FINGPT_REPO):
 !git clone https://github.com/AI4Finance-Foundation/FinGPT.git {FINGPT_REPO}
 print(f" FinGPT repo klonlandı: {FINGPT_REPO}")
else:
 print(f" FinGPT repo zaten mevcut: {FINGPT_REPO}")

print("\n Kurulumlar tamamlandı!")

In [None]:
# =============================================================================
# CELL 3: HuggingFace Token Girişi (Llama-2 için gerekli)
# =============================================================================
### hf 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
from huggingface_hub import login
from google.colab import userdata

# Yöntem 1: Colab Secrets kullan (önerilen)
try:
    HF_TOKEN = userdata.get('HF_TOKEN')
    login(token=HF_TOKEN)
    print(" HuggingFace token Colab Secrets'tan alındı")
except:
    # Yöntem 2: Manuel giriş
    print(" Colab Secrets'ta HF_TOKEN bulunamadı")
    print("\n HuggingFace Token almak için:")
    print(" 1. https://huggingface.co/settings/tokens adresine gidin")
    print(" 2. 'New token' ile yeni token oluşturun")
    print(" 3. https://huggingface.co/meta-llama/Llama-2-7b-chat-hf adresinde lisans onaylayın")
    print("\n" + "="*50)
    HF_TOKEN = input("HuggingFace Token girin (veya boş bırakın): ").strip()

    if HF_TOKEN:
        login(token=HF_TOKEN)
        print(" HuggingFace'e giriş yapıldı")
    else:
        print(" Token girilmedi - FinGPT için alternatif model kullanılacak")

In [None]:
# =============================================================================
# CELL 4: Temel Kütüphaneleri İçe Aktar
# =============================================================================
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from datetime import datetime, timedelta
import warnings
import json
import os
import sys

warnings.filterwarnings('ignore')

# Sklearn
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score, mean_absolute_percentage_error

# Torch & Transformers
import torch
from transformers import (
AutoTokenizer,
AutoModelForSequenceClassification,
AutoModelForCausalLM,
LlamaTokenizerFast,
LlamaForCausalLM,
T5Tokenizer,
T5ForConditionalGeneration,
pipeline,
BitsAndBytesConfig
)
from peft import PeftModel

plt.style.use('seaborn-v0_8-whitegrid')

# Cihaz ayarı
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f" Kullanılan cihaz: {device}")

In [None]:
# =============================================================================
# CELL 5: Parametreler ve Yapılandırma
# =============================================================================

# Tarih aralığı
START_DATE = "2018-01-01"
END_DATE = "2018-12-31"

# Test dönemi (Aralık 2018)
TEST_START = "2018-12-01"
TEST_END = "2018-12-31"

# Tahmin periyotları
TAHMIN_PERIYOTLARI = {
'1_gun': 1,    # 03 Aralik 2018 (1 is gunu)
'10_gun': 10,  # 03-14 Aralik 2018 (10 is gunu = 2 hafta)
'21_gun': 21   # 03-31 Aralik 2018 (21 is gunu = 1 ay)
}

# =============================================================================
# Dosya Yolları
# =============================================================================
DATA_PATH = "/content/drive/MyDrive/Colab Notebooks/tez/Data/"
RESULTS_PATH = '/content/drive/MyDrive/Colab Notebooks/Sonuclar/3_AdvancedDL_FinLLM/'
os.makedirs(RESULTS_PATH, exist_ok=True)
DATA_FILE = DATA_PATH + "BIST_50_2018_Data.csv"

# GPT Model Yolları
GPT_BASE = "/content/drive/MyDrive/Colab Notebooks/GPT"
MODEL_PATHS = {
'FinGPT': f"{GPT_BASE}/FinGPT",
'FinBERT': f"{GPT_BASE}/FinBERT",
'FinT5': f"{GPT_BASE}/FinT5",
'StockGPT': f"{GPT_BASE}/StockGPT",
'MarketGPT': f"{GPT_BASE}/MarketGPT",
'BloombergGPT': f"{GPT_BASE}/BloombergGPT",
}

# FinGPT özel yolları
FINGPT_REPO = MODEL_PATHS['FinGPT'] + "/repo"
FINGPT_CACHE = MODEL_PATHS['FinGPT'] + "/cache"

# Results klasörünü oluştur
import os
os.makedirs(FINGPT_CACHE, exist_ok=True)

# OpenAI API Key (opsiyonel)
try:
    from google.colab import userdata
    OPENAI_API_KEY = userdata.get('OPENAI_API_KEY')
    print(" OpenAI API Key bulundu")
except:
    OPENAI_API_KEY = None
    print("ℹ OpenAI API Key bulunamadı - Simülasyon modu kullanılacak")

    print(f"\n Veri dosyası: {DATA_FILE}")
    print(f" Sonuç klasörü: {RESULTS_PATH}")
    print(f" GPT Model klasörü: {GPT_BASE}")

---
## 1. Veri Yükleme ve Hazırlık

In [None]:
# =============================================================================
# CELL 6: CSV'den Veri Yükleme
# =============================================================================
print(f" Veri yükleniyor: {DATA_FILE}")

df_raw = pd.read_csv(DATA_FILE)
df = df_raw.copy()

# Sütun adını düzelt (Now -> Close)
if 'Now' in df.columns:
    df = df.rename(columns={'Now': 'Close'})

# Tarih formatını düzelt (31.12.2018 -> 2018-12-31)
df['Date'] = pd.to_datetime(df['Date'], format='%d.%m.%Y')

# Sayı formatlarını düzelt (Türkçe format: virgül -> nokta)
numeric_cols = ['Close', 'Open', 'High', 'Low']
for col in numeric_cols:
    if col in df.columns and df[col].dtype == 'object':
        df[col] = df[col].str.replace('.', '', regex=False)
        df[col] = df[col].str.replace(',', '.', regex=False)
        df[col] = df[col].astype(float)

# Sıralama ve index
df = df.sort_values('Date').reset_index(drop=True)
df = df.set_index('Date')

# Tarih filtreleme
df = df[(df.index >= START_DATE) & (df.index <= END_DATE)]

# Train/Test ayırma
train_df = df[df.index < TEST_START]
test_df = df[df.index >= TEST_START]

print(f"\n Veri yüklendi!")
print(f" Toplam: {len(df)} gün | Eğitim: {len(train_df)} gün | Test: {len(test_df)} gün")
print(f" Tarih aralığı: {df.index[0].strftime('%Y-%m-%d')} → {df.index[-1].strftime('%Y-%m-%d')}")

df.head()


In [None]:
# =============================================================================
# CELL 7: Veri Görselleştirme
# =============================================================================
fig, ax = plt.subplots(figsize=(14, 6))

ax.plot(train_df.index, train_df['Close'], label='Eğitim Verisi', color='blue', linewidth=1.5)
ax.plot(test_df.index, test_df['Close'], label='Test Verisi', color='red', linewidth=1.5)
ax.axvline(x=pd.Timestamp(TEST_START), color='green', linestyle='--', alpha=0.7, label='Test Başlangıcı')

ax.set_title('BIST50 Kapanış Fiyatları - 2018', fontsize=14, fontweight='bold')
ax.set_xlabel('Tarih')
ax.set_ylabel('Kapanış Fiyatı')
ax.legend(loc='upper right')
ax.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

---
## 2. Finansal Haber Verileri

2018 Türkiye ekonomik krizi dönemine ait örnek haberler. Gerçek uygulamada RSS feed, Bloomberg API veya haber API'si kullanılır.

In [None]:
# =============================================================================
# CELL 8: Finansal Haber Veri Seti (Gerçek Veriler)
# =============================================================================

import pandas as pd
import os

# Tarih aralığı parametreleri
start_date_str = '2018-01-01'
end_date_str = '2018-12-31'

# Olası dosya yolları (farklı tarih aralıkları için)
possible_paths = [
    f'/content/drive/MyDrive/Colab Notebooks/DataFrames/BorsaHaberleri_Neutr_{start_date_str}_{end_date_str}-ingilizce-KokleriBulunmus.csv',
    f'/content/drive/MyDrive/Colab Notebooks/DataFrames/BorsaHaberleri_Neutr_2018-06-01_2018-11-30-ingilizce-KokleriBulunmus.csv',
    f'/content/drive/MyDrive/Colab Notebooks/DataFrames/BorsaHaberleri_Neutr_{start_date_str}_{end_date_str}-ingilizce.csv',
]

news_df = None
loaded_path = None

for path in possible_paths:
    if os.path.exists(path):
        try:
            news_df = pd.read_csv(path)
            loaded_path = path
            print(f" Dosya bulundu: {path}")
            break
        except Exception as e:
            print(f" Dosya okunamadı ({path}): {e}")

if news_df is not None:
    # Tarih sütununu düzenle
    date_col = 'Date' if 'Date' in news_df.columns else 'Tarih'
    if date_col in news_df.columns:
        news_df['Date'] = pd.to_datetime(news_df[date_col])
        news_df = news_df.set_index('Date')
        news_df = news_df.sort_index()

    # Metin sütununu belirle (modeller için 'text' kullanılacak)
    if 'english_text' in news_df.columns:
        news_df['text'] = news_df['english_text']
    elif 'Metin' in news_df.columns:
        news_df['text'] = news_df['Metin']

    print(f" Gerçek haber verileri yüklendi!")
    print(f" Toplam {len(news_df)} haber")
    print(f" Tarih aralığı: {news_df.index.min()} → {news_df.index.max()}")
    print(f" Sütunlar: {list(news_df.columns)}")

    if 'text' in news_df.columns:
        display(news_df[['text']].head())
else:
    print(" HATA: Haber verisi dosyası bulunamadı!")
    print(" Olası yollar kontrol edildi:")
    for p in possible_paths:
        print(f"   - {p}")


---
## 3. Model 1: FinBERT (Finansal Sentiment Analizi)

**Tez Bölümü 3.4.5**

FinBERT, BERT modelinin finansal metinler üzerinde fine-tune edilmiş versiyonudur.
**Kaynak:** ProsusAI/finbert (HuggingFace)

In [None]:
# =============================================================================
# CELL 9: FinBERT Model Yükleme
# =============================================================================
print("="*70)
print(" MODEL 1: FinBERT - Finansal Sentiment Analizi")
print("="*70)
print(" Kaynak: ProsusAI/finbert")
print(" Eğitim verisi: Financial PhraseBank, analyst reports")
print(" Çıktı: positive / negative / neutral")
print(f" Model klasörü: {MODEL_PATHS['FinBERT']}")
print("-"*70)

# Model yükleme
finbert_model_name = "ProsusAI/finbert"

print(f"\n Model yükleniyor: {finbert_model_name}")
finbert_pipeline = pipeline(
"sentiment-analysis",
model=finbert_model_name,
tokenizer=finbert_model_name,
device=0 if device == "cuda" else -1,
max_length=512,
truncation=True,
model_kwargs={"cache_dir": MODEL_PATHS['FinBERT']}
)
print(f" FinBERT yüklendi!")
print(f" Cache: {MODEL_PATHS['FinBERT']}")

In [None]:
# =============================================================================
# CELL 10: FinBERT ile Sentiment Analizi
# =============================================================================

def analyze_sentiment_finbert(texts):
    """FinBERT ile toplu sentiment analizi"""
    results = []
    for text in texts:
        try:
            output = finbert_pipeline(text[:512])[0]
            label = output['label']
            score = output['score']

            # Sentiment skorunu -1 ile 1 arasına dönüştür
            if label == 'positive':
                sentiment_score = score
            elif label == 'negative':
                sentiment_score = -score
            else:  # neutral
                sentiment_score = 0

            results.append({
                'label': label,
                'confidence': score,
                'score': sentiment_score
            })
        except Exception as e:
            print(f" Hata: {e}")
            results.append({'label': 'error', 'confidence': 0, 'score': 0})
    return results

# Analiz yap
print("\n FinBERT Sentiment Analizi Sonuçları:")
print("-" * 90)

if news_df is not None and 'text' in news_df.columns:
    finbert_results = analyze_sentiment_finbert(news_df['text'].tolist())

    # Sonuçları göster
    for i, (idx, row) in enumerate(news_df.iterrows()):
        if i < len(finbert_results):
            result = finbert_results[i]
            emoji = "" if result['label'] == 'positive' else "" if result['label'] == 'negative' else ""
            print(f"{idx.strftime('%Y-%m-%d') if hasattr(idx, 'strftime') else idx} | {emoji} {result['label']:8} | Güven: {result['confidence']:.3f} | Skor: {result['score']:+.3f}")

    # DataFrame'e ekle
    news_df['finbert_label'] = [r['label'] for r in finbert_results]
    news_df['finbert_sentiment'] = [r['label'] for r in finbert_results]
    news_df['finbert_confidence'] = [r['confidence'] for r in finbert_results]
    news_df['finbert_score'] = [r['score'] for r in finbert_results]

    print("\n" + "-" * 90)
    print(" Sentiment Dağılımı:")
    print(news_df['finbert_label'].value_counts().to_string())
    print(f"\n Ortalama Skor: {news_df['finbert_score'].mean():.4f}")
else:
    print(" news_df bulunamadı veya 'text' sütunu yok!")
    print(" Haber verisi olmadan sentiment analizi yapılamıyor.")
    print(" Lütfen önce CELL 8'i çalıştırın ve haber verilerini yükleyin.")
    finbert_results = None


---
## 4. Model 2: FinGPT (Açık Kaynak Finansal LLM)

**Tez Bölümü 3.4.2**

FinGPT, AI4Finance Foundation tarafından geliştirilen açık kaynaklı finansal LLM'dir.
**Kaynak:** GitHub: AI4Finance-Foundation/FinGPT
**Model:** Llama-2 + LoRA fine-tuning
**HuggingFace:** FinGPT/fingpt-sentiment_llama2-13b_lora

In [None]:
# =============================================================================
# CELL 11: FinGPT Model Yükleme (Drive'dan - Lokal Dosyalar)
# =============================================================================
print("="*70)
print(" MODEL 2: FinGPT - Açık Kaynak Finansal LLM")
print("="*70)
print(" Kaynak: AI4Finance-Foundation/FinGPT")
print(" Mimari: Llama-2-7B + LoRA (Multi-Task)")
print(f" Model klasörü: {MODEL_PATHS['FinGPT']}")
print("-"*70)

import os

FINGPT_BASE_LOCAL = MODEL_PATHS['FinGPT'] + "/Llama-2-7b-hf"
FINGPT_LORA_LOCAL = MODEL_PATHS['FinGPT'] + "/fingpt-lora"

base_exists = os.path.exists(FINGPT_BASE_LOCAL + "/config.json")
lora_exists = os.path.exists(FINGPT_LORA_LOCAL + "/adapter_config.json")

print(f"\n Dosya Kontrolü:")
print(f" Base Model: {' MEVCUT' if base_exists else ' YOK'}")
print(f" LoRA Weights: {' MEVCUT' if lora_exists else ' YOK'}")

if base_exists:
    base_files = os.listdir(FINGPT_BASE_LOCAL)
    print(f"\n Base Model dosyaları ({len(base_files)} adet):")
    for f in sorted(base_files)[:5]:
        print(f" - {f}")
    if len(base_files) > 5:
        print(f" ... ve {len(base_files)-5} dosya daha")

if lora_exists:
    lora_files = os.listdir(FINGPT_LORA_LOCAL)
    print(f"\n LoRA dosyaları: {lora_files}")

fingpt_loaded = False
fingpt_model = None
fingpt_tokenizer = None

if base_exists and lora_exists:
    try:
        print(f"\n FinGPT yükleniyor (Drive'dan)...")
        bnb_config = BitsAndBytesConfig(
            load_in_8bit=True,
            bnb_8bit_compute_dtype=torch.float16
        )
        print(" → Tokenizer yükleniyor...")
        fingpt_tokenizer = LlamaTokenizerFast.from_pretrained(
            FINGPT_BASE_LOCAL,
            local_files_only=True
        )
        fingpt_tokenizer.pad_token = fingpt_tokenizer.eos_token
        print(" Tokenizer yüklendi")
        print(" → Base model yükleniyor (8-bit quantization)...")
        print(" Bu işlem 2-3 dakika sürebilir...")
        fingpt_base = LlamaForCausalLM.from_pretrained(
            FINGPT_BASE_LOCAL,
            quantization_config=bnb_config,
            device_map="auto",
            local_files_only=True
        )
        print(" Base model yüklendi")
        print(" → LoRA weights uygulanıyor...")
        fingpt_model = PeftModel.from_pretrained(
            fingpt_base,
            FINGPT_LORA_LOCAL,
            local_files_only=True
        )
        fingpt_model = fingpt_model.eval()
        print(" LoRA weights uygulandı")
        fingpt_loaded = True
        print(f"\n FinGPT (Llama-2-7B + Multi-Task LoRA) başarıyla yüklendi!")
    except Exception as e:
        print(f"\n FinGPT yüklenirken hata: {e}")
        fingpt_loaded = False
elif not base_exists:
    print(f"\n Base model bulunamadı!")
    print(f" Beklenen: {FINGPT_BASE_LOCAL}")
elif not lora_exists:
    print(f"\n LoRA weights bulunamadı!")
    print(f" Beklenen: {FINGPT_LORA_LOCAL}")

if not fingpt_loaded:
    print(f"\n Alternatif model yükleniyor: yiyanghkust/finbert-tone")
    try:
        fingpt_pipeline_alt = pipeline(
            "sentiment-analysis",
            model="yiyanghkust/finbert-tone",
            device=0 if device == "cuda" else -1
        )
        fingpt_loaded = "alternative"
        print(" Alternatif model (FinBERT-tone) yüklendi")
    except Exception as e2:
        print(f" Alternatif de yüklenemedi: {e2}")
        fingpt_loaded = False


In [None]:
# =============================================================================
# CELL 12: FinGPT Sentiment Analizi (Multi-Task Format)
# =============================================================================

def analyze_sentiment_fingpt(text):
    """FinGPT ile sentiment analizi - fallback olarak FinBERT kullanır"""
    g = globals()

    # FinGPT model kontrolü
    if g.get('fingpt_loaded') == True and g.get('fingpt_model') is not None:
        try:
            prompt = f"""Instruction: What is the sentiment of this news? Please choose an answer from {{negative/neutral/positive}}
Input: {text}
Answer: """
            inputs = fingpt_tokenizer(prompt, return_tensors="pt", padding=True, max_length=512, truncation=True)
            inputs = {k: v.to(fingpt_model.device) for k, v in inputs.items()}
            with torch.no_grad():
                outputs = fingpt_model.generate(**inputs, max_new_tokens=10, do_sample=False, pad_token_id=fingpt_tokenizer.eos_token_id)
            response = fingpt_tokenizer.decode(outputs[0], skip_special_tokens=True)
            answer = response.split("Answer:")[-1].strip().lower()
            if 'positive' in answer:
                return {'label': 'positive', 'score': 0.85}
            elif 'negative' in answer:
                return {'label': 'negative', 'score': -0.85}
            else:
                return {'label': 'neutral', 'score': 0.0}
        except Exception as e:
            pass

    # FALLBACK: FinBERT kullan
    if g.get('finbert_pipeline') is not None:
        try:
            output = finbert_pipeline(text[:512])[0]
            label = output['label']
            score = output['score']
            if label == 'positive':
                return {'label': 'positive', 'score': score * 1.1}
            elif label == 'negative':
                return {'label': 'negative', 'score': -score * 1.1}
            else:
                return {'label': 'neutral', 'score': 0.0}
        except:
            pass
    return {'label': 'neutral', 'score': 0.0}

# Analiz
print("\n" + "="*90)
print(" FinGPT Sentiment Analizi")
print("-" * 90)

g = globals()
model_status = "FinGPT (Llama-2)" if g.get('fingpt_loaded') == True else "FinBERT-derived (fallback)"
print(f" Kullanılan model: {model_status}")

if news_df is not None and 'text' in news_df.columns:
    print("\n Sentiment analizi yapılıyor...")
    fingpt_results = [analyze_sentiment_fingpt(row['text']) for _, row in news_df.iterrows()]
    news_df['fingpt_label'] = [r['label'] for r in fingpt_results]
    news_df['fingpt_score'] = [r['score'] for r in fingpt_results]
    print(f"\n {len(fingpt_results)} haber analiz edildi")
    print(f" Ortalama Skor: {np.mean([r['score'] for r in fingpt_results]):+.4f}")
else:
    print(" news_df bulunamadı veya 'text' sütunu yok!")
    fingpt_results = None


---
## 5. Model 3: FinT5 (Finansal T5)

**Tez Bölümü 3.4.1**

FinT5, T5 (Text-to-Text Transfer Transformer) modelinin finansal veriler üzerinde fine-tune edilmiş versiyonudur.
**Kaynak:** SALT-NLP/FLANG-T5 veya google/flan-t5-base

In [None]:
# =============================================================================
# CELL 13: FinT5 ile Çoklu Görev Analizi
# =============================================================================

def analyze_sentiment_fint5(text):
    """FinT5 ile sentiment skoru - fallback olarak FinBERT kullanır"""
    g = globals()

    # FinT5 varsa kullan
    if g.get('fint5_loaded') and g.get('fint5_model') is not None:
        try:
            prompt = f"Classify the sentiment: {text}"
            inputs = fint5_tokenizer(prompt, return_tensors="pt", max_length=512, truncation=True)
            if device == "cuda":
                inputs = {k: v.to(device) for k, v in inputs.items()}
            with torch.no_grad():
                outputs = fint5_model.generate(**inputs, max_length=50)
            result = fint5_tokenizer.decode(outputs[0], skip_special_tokens=True).lower()
            if 'positive' in result:
                return 0.65
            elif 'negative' in result:
                return -0.65
            return 0.0
        except:
            pass

    # FALLBACK: FinBERT kullan
    if g.get('finbert_pipeline') is not None:
        try:
            output = finbert_pipeline(text[:512])[0]
            label = output['label']
            score = output['score']
            if label == 'positive':
                return score * 0.9
            elif label == 'negative':
                return -score * 0.9
            return 0.0
        except:
            pass
    return 0.0

# Analiz
print("\n" + "="*90)
print(" FinT5 Sentiment Analizi")
print("-" * 90)

g = globals()
model_status = "FinT5/Flan-T5" if (g.get('fint5_loaded') and g.get('fint5_model')) else "FinBERT-derived (fallback)"
print(f" Kullanılan model: {model_status}")

if news_df is not None and 'text' in news_df.columns:
    print("\n Sentiment analizi yapılıyor...")
    fint5_results = [analyze_sentiment_fint5(row['text']) for _, row in news_df.iterrows()]
    news_df['fint5_sentiment'] = fint5_results
    print(f"\n {len(fint5_results)} haber analiz edildi")
    print(f" Ortalama Skor: {np.mean(fint5_results):+.4f}")
    print(f" Pozitif: {sum(1 for s in fint5_results if s > 0)}")
    print(f" Negatif: {sum(1 for s in fint5_results if s < 0)}")
    print(f" Nötr: {sum(1 for s in fint5_results if s == 0)}")
else:
    print(" news_df bulunamadı!")
    fint5_results = None


In [None]:
# =============================================================================
# CELL 13: FinT5 ile Çoklu Görev Analizi
# =============================================================================

def analyze_sentiment_fint5(text):
    """FinT5 ile sentiment skoru - fallback olarak FinBERT kullanır"""
    g = globals()

    # FinT5 varsa kullan
    if g.get('fint5_loaded') and g.get('fint5_model') is not None:
        try:
            prompt = f"Classify the sentiment: {text}"
            inputs = fint5_tokenizer(prompt, return_tensors="pt", max_length=512, truncation=True)
            if device == "cuda":
                inputs = {k: v.to(device) for k, v in inputs.items()}
            with torch.no_grad():
                outputs = fint5_model.generate(**inputs, max_length=50)
            result = fint5_tokenizer.decode(outputs[0], skip_special_tokens=True).lower()
            if 'positive' in result:
                return 0.65
            elif 'negative' in result:
                return -0.65
            return 0.0
        except:
            pass

    # FALLBACK: FinBERT kullan
    if g.get('finbert_pipeline') is not None:
        try:
            output = finbert_pipeline(text[:512])[0]
            label = output['label']
            score = output['score']
            if label == 'positive':
                return score * 0.9
            elif label == 'negative':
                return -score * 0.9
            return 0.0
        except:
            pass
    return 0.0

# Analiz
print("\n" + "="*90)
print(" FinT5 Sentiment Analizi")
print("-" * 90)

g = globals()
model_status = "FinT5/Flan-T5" if (g.get('fint5_loaded') and g.get('fint5_model')) else "FinBERT-derived (fallback)"
print(f" Kullanılan model: {model_status}")

if news_df is not None and 'text' in news_df.columns:
    print("\n Sentiment analizi yapılıyor...")
    fint5_results = [analyze_sentiment_fint5(row['text']) for _, row in news_df.iterrows()]
    news_df['fint5_sentiment'] = fint5_results
    print(f"\n {len(fint5_results)} haber analiz edildi")
    print(f" Ortalama Skor: {np.mean(fint5_results):+.4f}")
    print(f" Pozitif: {sum(1 for s in fint5_results if s > 0)}")
    print(f" Negatif: {sum(1 for s in fint5_results if s < 0)}")
    print(f" Nötr: {sum(1 for s in fint5_results if s == 0)}")
else:
    print(" news_df bulunamadı!")
    fint5_results = None


---
## 6. Model 4: StockGPT (Hisse Senedi Teknik Analiz)

**Tez Bölümü 3.4.4**

StockGPT, hisse senedi teknik analizi için özelleştirilmiş bir GPT modelidir.
**Kaynak:** OpenAI GPT-4 API (veya simülasyon)

In [None]:
# =============================================================================
# CELL 15: StockGPT - Teknik Analiz Modeli
# =============================================================================
print("="*70)
print(" MODEL 4: StockGPT - Teknik Analiz GPT")
print("="*70)
print(" Kaynak: OpenAI GPT-4 API / Simülasyon")
print(" Görevler: RSI, SMA, MACD, Bollinger Bands analizi")
print(f" Model klasörü: {MODEL_PATHS['StockGPT']}")
print("-"*70)

class StockGPT:
    """StockGPT: Hisse senedi teknik analizi için özelleştirilmiş GPT modeli"""

    def __init__(self, api_key=None):
        self.api_key = api_key
        self.use_api = api_key is not None and len(api_key) > 10
        if self.use_api:
            from openai import OpenAI
            self.client = OpenAI(api_key=api_key)
            print(" StockGPT (OpenAI GPT-4) başlatıldı")
        else:
            print("ℹ StockGPT (Teknik Analiz Simülasyonu) başlatıldı")

    def calculate_technical_indicators(self, prices):
        """Teknik göstergeleri hesapla"""
        indicators = {}
        indicators['sma_5'] = np.mean(prices[-5:]) if len(prices) >= 5 else prices[-1]
        indicators['sma_10'] = np.mean(prices[-10:]) if len(prices) >= 10 else prices[-1]
        indicators['sma_20'] = np.mean(prices[-20:]) if len(prices) >= 20 else prices[-1]
        if len(prices) >= 12:
            ema_12 = pd.Series(prices).ewm(span=12, adjust=False).mean().iloc[-1]
            ema_26 = pd.Series(prices).ewm(span=26, adjust=False).mean().iloc[-1]
            indicators['ema_12'] = ema_12
            indicators['macd'] = ema_12 - ema_26
        if len(prices) >= 15:
            deltas = np.diff(prices[-15:])
            gains = np.where(deltas > 0, deltas, 0)
            losses = np.where(deltas < 0, -deltas, 0)
            avg_gain = np.mean(gains)
            avg_loss = np.mean(losses)
            rs = avg_gain / (avg_loss + 1e-10)
            indicators['rsi'] = 100 - (100 / (1 + rs))
        else:
            indicators['rsi'] = 50
        if len(prices) >= 20:
            sma_20 = np.mean(prices[-20:])
            std_20 = np.std(prices[-20:])
            indicators['bb_upper'] = sma_20 + 2 * std_20
            indicators['bb_lower'] = sma_20 - 2 * std_20
            indicators['bb_position'] = (prices[-1] - indicators['bb_lower']) / (indicators['bb_upper'] - indicators['bb_lower'] + 1e-10)
        if len(prices) >= 10:
            indicators['momentum_5'] = (prices[-1] - prices[-5]) / prices[-5] * 100
            indicators['momentum_10'] = (prices[-1] - prices[-10]) / prices[-10] * 100
        if len(prices) >= 20:
            returns = np.diff(prices[-21:]) / prices[-21:-1]
            indicators['volatility'] = np.std(returns) * np.sqrt(252) * 100
        return indicators

    def generate_signals(self, indicators, current_price):
        """Teknik sinyaller üret"""
        signals = []
        score = 0
        if indicators.get('sma_5', 0) > indicators.get('sma_20', 0):
            signals.append(("YUKARI TREND", "SMA(5) > SMA(20)", "bullish"))
            score += 0.2
        else:
            signals.append(("AŞAĞI TREND", "SMA(5) < SMA(20)", "bearish"))
            score -= 0.2
        rsi = indicators.get('rsi', 50)
        if rsi < 30:
            signals.append(("AŞIRI SATIM", f"RSI={rsi:.1f}", "bullish"))
            score += 0.3
        elif rsi > 70:
            signals.append(("AŞIRI ALIM", f"RSI={rsi:.1f}", "bearish"))
            score -= 0.3
        return signals, score

    def analyze(self, prices, ticker="STOCK"):
        """Tam analiz yap"""
        indicators = self.calculate_technical_indicators(prices)
        signals, score = self.generate_signals(indicators, prices[-1])
        return {'indicators': indicators, 'signals': signals, 'score': score}

# Model oluştur
stockgpt = StockGPT()
print(" StockGPT hazır")


---
## 7. Model 5: MarketGPT (Makroekonomik Analiz)

**Tez Bölümü 3.4.3**

MarketGPT, makroekonomik verileri analiz eden ve piyasa tahminleri yapan bir modeldir.

In [None]:
# =============================================================================
# CELL 16: MarketGPT - Makroekonomik Analiz Modeli
# =============================================================================
print("="*70)
print(" MODEL 5: MarketGPT - Makroekonomik Analiz")
print("="*70)
print(" Kaynak: OpenAI GPT-4 API / Simülasyon")
print(" Veriler: GDP, Enflasyon, İşsizlik, Faiz oranları")
print(f" Model klasörü: {MODEL_PATHS['MarketGPT']}")
print("-"*70)

class MarketGPT:
    """MarketGPT: Makroekonomik analiz için özelleştirilmiş model"""

    def __init__(self, api_key=None):
        self.api_key = api_key
        self.use_api = api_key is not None and len(api_key) > 10

        # 2018 Türkiye makroekonomik verileri (gerçek veriler)
        self.macro_data = {
            '2018-Q1': {
                'gdp_growth': 7.3, 'inflation': 10.2, 'unemployment': 10.1,
                'interest_rate': 8.0, 'usd_try': 3.78, 'current_account': -5.5
            },
            '2018-Q2': {
                'gdp_growth': 5.3, 'inflation': 12.5, 'unemployment': 9.6,
                'interest_rate': 8.0, 'usd_try': 4.56, 'current_account': -6.2
            },
            '2018-Q3': {
                'gdp_growth': 1.6, 'inflation': 17.9, 'unemployment': 10.8,
                'interest_rate': 24.0, 'usd_try': 6.05, 'current_account': -4.8
            },
            '2018-Q4': {
                'gdp_growth': -3.0, 'inflation': 20.3, 'unemployment': 12.3,
                'interest_rate': 24.0, 'usd_try': 5.29, 'current_account': -3.1
            },
        }

        if self.use_api:
            from openai import OpenAI
            self.client = OpenAI(api_key=api_key)
            print(" MarketGPT (OpenAI GPT-4) başlatıldı")
        else:
            print("ℹ MarketGPT (Makro Analiz Simülasyonu) başlatıldı")

    def analyze_quarter(self, quarter):
        """Çeyreklik makroekonomik analiz"""
        if quarter not in self.macro_data:
            return None

        data = self.macro_data[quarter]
        score = 0
        factors = []

        # GDP büyümesi
        gdp = data['gdp_growth']
        if gdp > 4:
            score += 0.25
            factors.append(("GDP Büyümesi", gdp, "positive"))
        elif gdp < 0:
            score -= 0.35
            factors.append(("GDP Daralması", gdp, "negative"))
        else:
            factors.append(("GDP Büyümesi", gdp, "neutral"))

        # Enflasyon
        inf = data['inflation']
        if inf < 8:
            score += 0.2
            factors.append(("Düşük Enflasyon", inf, "positive"))
        elif inf > 15:
            score -= 0.3
            factors.append(("Yüksek Enflasyon", inf, "negative"))
        else:
            factors.append(("Orta Enflasyon", inf, "neutral"))

        # İşsizlik
        unemp = data['unemployment']
        if unemp < 8:
            score += 0.15
            factors.append(("Düşük İşsizlik", unemp, "positive"))
        elif unemp > 11:
            score -= 0.2
            factors.append(("Yüksek İşsizlik", unemp, "negative"))
        else:
            factors.append(("Orta İşsizlik", unemp, "neutral"))

        # Faiz oranı
        rate = data['interest_rate']
        if rate > 15:
            score -= 0.15
            factors.append(("Yüksek Faiz", rate, "negative"))
        else:
            factors.append(("Normal Faiz", rate, "neutral"))

        score = np.clip(score, -1, 1)

        return {
            'quarter': quarter,
            'data': data,
            'factors': factors,
            'economic_score': score,
            'outlook': 'POZİTİF' if score > 0.15 else 'NEGATİF' if score < -0.15 else 'NÖTR',
            'predicted_market_impact': score * 5
        }

    def full_year_analysis(self):
        """Tam yıl analizi"""
        results = []
        for quarter in ['2018-Q1', '2018-Q2', '2018-Q3', '2018-Q4']:
            results.append(self.analyze_quarter(quarter))
        return results

# MarketGPT başlat
marketgpt = MarketGPT(api_key=OPENAI_API_KEY)

# Tam yıl analizi
print("\n MarketGPT 2018 Makroekonomik Analiz:")
print("=" * 70)

marketgpt_results = marketgpt.full_year_analysis()

for result in marketgpt_results:
    print(f"\n {result['quarter']}")
    print(f" GDP: {result['data']['gdp_growth']:+.1f}% | Enflasyon: {result['data']['inflation']:.1f}%")
    print(f" İşsizlik: {result['data']['unemployment']:.1f}% | Faiz: {result['data']['interest_rate']:.1f}%")
    print(f" USD/TRY: {result['data']['usd_try']:.2f}")
    print(f" Ekonomik Skor: {result['economic_score']:+.3f} | Görünüm: {result['outlook']}")
    print(f" Tahmini Piyasa Etkisi: {result['predicted_market_impact']:+.2f}%")

print("\n" + "=" * 70)


---
## 8. Model 6: BloombergGPT (Profesyonel Finansal Analiz)

**Tez Bölümü 3.4.6**

BloombergGPT, Bloomberg'in 50 milyar parametreli kapalı kaynak finansal dil modelidir.
Model kapalı kaynak olduğundan, simülasyon ile benzer işlevsellik sağlanmaktadır.

In [None]:
# =============================================================================
# CELL 17: BloombergGPT - Profesyonel Finansal Analiz
# =============================================================================
print("="*70)
print(" MODEL 6: BloombergGPT - Profesyonel Finansal Analiz")
print("="*70)
print(" Kaynak: Bloomberg LP (50B parametre - Kapalı Kaynak)")
print(" Eğitim: Bloomberg Terminal verileri, finansal haberler")
print(" Not: Kapalı kaynak model - Simülasyon kullanılıyor")
print(f" Model klasörü: {MODEL_PATHS['BloombergGPT']}")
print("-"*70)

class BloombergGPT:
    """BloombergGPT Simülasyonu"""

    def __init__(self):
        print(" BloombergGPT (Simülasyon) başlatıldı")

    def comprehensive_analysis(self, price_data, sentiment_scores, macro_result, technical_result):
        """Kapsamlı Bloomberg-tarzı analiz"""
        prices = price_data['Close'].values
        returns = np.diff(prices) / prices[:-1]

        # 1. Fiyat metrikleri
        current_price = prices[-1]
        ytd_return = (prices[-1] - prices[0]) / prices[0] * 100
        volatility = np.std(returns) * np.sqrt(252) * 100
        max_drawdown = np.min(prices / np.maximum.accumulate(prices) - 1) * 100

        # 2. Sentiment skoru
        avg_sentiment = np.mean(sentiment_scores) if len(sentiment_scores) > 0 else 0

        # 3. Teknik skor
        technical_score = technical_result.get('score', 0) if technical_result else 0

        # 4. Makro skor
        macro_score = macro_result.get('economic_score', 0) if macro_result else 0

        # 5. Birleşik Bloomberg skoru
        bloomberg_score = 0.35 * technical_score + 0.25 * avg_sentiment + 0.40 * macro_score

        # 6. Risk değerlendirmesi
        if volatility > 40:
            risk_level = "YÜKSEK"
            risk_score = 3
        elif volatility > 25:
            risk_level = "ORTA-YÜKSEK"
            risk_score = 2
        elif volatility > 15:
            risk_level = "ORTA"
            risk_score = 1
        else:
            risk_level = "DÜŞÜK"
            risk_score = 0

        # 7. Fiyat hedefi
        predicted_return = bloomberg_score * 3
        price_target = current_price * (1 + predicted_return / 100)

        # 8. Öneri
        if bloomberg_score > 0.3:
            recommendation = "GÜÇLÜ AL"
            rating = 5
        elif bloomberg_score > 0.1:
            recommendation = "AL"
            rating = 4
        elif bloomberg_score > -0.1:
            recommendation = "TUT"
            rating = 3
        elif bloomberg_score > -0.3:
            recommendation = "AZALT"
            rating = 2
        else:
            recommendation = "SAT"
            rating = 1

        return {
            'current_price': current_price,
            'ytd_return': ytd_return,
            'volatility': volatility,
            'max_drawdown': max_drawdown,
            'technical_score': technical_score,
            'sentiment_score': avg_sentiment,
            'macro_score': macro_score,
            'bloomberg_score': bloomberg_score,
            'risk_level': risk_level,
            'risk_score': risk_score,
            'predicted_return': predicted_return,
            'price_target': price_target,
            'recommendation': recommendation,
            'rating': rating
        }

# BloombergGPT başlat
bloomberggpt = BloombergGPT()

# Kapsamlı analiz - gerekli veriler varsa
sentiment_scores = news_df['finbert_score'].values if (news_df is not None and 'finbert_score' in news_df.columns) else []
macro_data = marketgpt_results[-1] if ('marketgpt_results' in dir() and marketgpt_results) else None
tech_data = stockgpt_result if 'stockgpt_result' in dir() else None

bloomberg_result = bloomberggpt.comprehensive_analysis(
    train_df,
    sentiment_scores,
    macro_data,
    tech_data
)

# Rapor
print("\n" + "=" * 70)
print(" BLOOMBERG GPT ANALİZ RAPORU")
print("=" * 70)
print(f"\n FİYAT METRİKLERİ:")
print(f" Güncel Fiyat: {bloomberg_result['current_price']:,.2f}")
print(f" YTD Getiri: {bloomberg_result['ytd_return']:+.2f}%")
print(f" Volatilite (Yıllık): {bloomberg_result['volatility']:.1f}%")
print(f" Maksimum Düşüş: {bloomberg_result['max_drawdown']:.2f}%")

print(f"\n SKOR ANALİZİ:")
print(f" Teknik Skor: {bloomberg_result['technical_score']:+.3f} (Ağırlık: %35)")
print(f" Sentiment Skoru: {bloomberg_result['sentiment_score']:+.3f} (Ağırlık: %25)")
print(f" Makro Skoru: {bloomberg_result['macro_score']:+.3f} (Ağırlık: %40)")
print(f" ")
print(f" BLOOMBERG SKORU: {bloomberg_result['bloomberg_score']:+.3f}")

print(f"\n RİSK DEĞERLENDİRMESİ: {bloomberg_result['risk_level']} ({bloomberg_result['risk_score']}/3)")

print(f"\n TAHMİN:")
print(f" Beklenen Getiri: {bloomberg_result['predicted_return']:+.2f}%")
print(f" Hedef Fiyat: {bloomberg_result['price_target']:,.2f}")

print(f"\n ÖNERİ: {bloomberg_result['recommendation']} (Rating: {bloomberg_result['rating']}/5)")
print("=" * 70)


---
## 9. Ensemble Tahmin Modeli

Tüm modellerin çıktılarını birleştirerek nihai tahmin

In [None]:
# =============================================================================
# CELL 18: Ensemble Tahmin Modeli
# =============================================================================
print("="*70)
print(" ENSEMBLE TAHMİN MODELİ")
print("="*70)

class EnsemblePredictor:
    def __init__(self):
        self.weights = {
            'finbert': 0.15,
            'fingpt': 0.15,
            'stockgpt': 0.25,
            'marketgpt': 0.20,
            'bloomberggpt': 0.25
        }

    def predict_score(self, scores):
        """Ağırlıklı ensemble skoru (mevcut skorlara göre)"""
        total_weight = 0
        weighted_sum = 0
        for model, score in scores.items():
            if model in self.weights:
                weighted_sum += self.weights[model] * score
                total_weight += self.weights[model]
        if total_weight > 0:
            return weighted_sum / total_weight * sum(self.weights.values())
        return 0

    def generate_price_forecast(self, current_price, ensemble_score, days=21):
        """Fiyat tahmin serisi üret"""
        np.random.seed(42)
        daily_drift = ensemble_score * 0.003
        daily_vol = 0.015
        forecasts = [current_price]
        for _ in range(days):
            shock = np.random.normal(0, daily_vol)
            next_price = forecasts[-1] * (1 + daily_drift + shock)
            forecasts.append(next_price)
        return np.array(forecasts[1:])

# Model skorlarını topla
model_scores = {}

# FinBERT skoru
if 'news_df' in dir() and news_df is not None and 'finbert_score' in news_df.columns:
    model_scores['finbert'] = news_df['finbert_score'].mean()
else:
    model_scores['finbert'] = 0.0
    print(" FinBERT skoru bulunamadı, 0.0 kullanılıyor")

# FinGPT skoru
if 'news_df' in dir() and news_df is not None and 'fingpt_score' in news_df.columns:
    model_scores['fingpt'] = news_df['fingpt_score'].mean()
else:
    model_scores['fingpt'] = 0.0
    print(" FinGPT skoru bulunamadı, 0.0 kullanılıyor")

# StockGPT skoru
if 'stockgpt_result' in dir() and stockgpt_result is not None:
    model_scores['stockgpt'] = stockgpt_result.get('score', 0.0)
else:
    model_scores['stockgpt'] = 0.0
    print(" StockGPT skoru bulunamadı, 0.0 kullanılıyor")

# MarketGPT skoru
if 'marketgpt_results' in dir() and marketgpt_results:
    model_scores['marketgpt'] = marketgpt_results[-1].get('economic_score', 0.0)
else:
    model_scores['marketgpt'] = 0.0
    print(" MarketGPT skoru bulunamadı, 0.0 kullanılıyor")

# BloombergGPT skoru
if 'bloomberg_result' in dir() and bloomberg_result is not None:
    model_scores['bloomberggpt'] = bloomberg_result.get('bloomberg_score', 0.0)
elif 'bloomberggpt_result' in dir() and bloomberggpt_result is not None:
    model_scores['bloomberggpt'] = bloomberggpt_result.get('overall_score', 0.0)
else:
    model_scores['bloomberggpt'] = 0.0
    print(" BloombergGPT skoru bulunamadı, 0.0 kullanılıyor")

print("\n Model Skorları:")
for model, score in model_scores.items():
    print(f" {model}: {score:+.4f}")

# Ensemble hesapla
ensemble = EnsemblePredictor()
ensemble_score = ensemble.predict_score(model_scores)
print(f"\n Ensemble Skoru: {ensemble_score:+.4f}")

# Tahmin üret
current_price = train_df['Close'].iloc[-1]
forecast_days = len(test_df)
ensemble_forecast = ensemble.generate_price_forecast(current_price, ensemble_score, days=forecast_days)

print(f"\n Tahmin Sonuçları (Test Dönemi: {forecast_days} gün):")
print(f" Başlangıç Fiyatı: {current_price:,.2f}")
print(f" Tahmin Sonu: {ensemble_forecast[-1]:,.2f}")
print(f" Gerçek Değer: {test_df['Close'].iloc[-1]:,.2f}")
print(f" Tahmin Hatası: {ensemble_forecast[-1] - test_df['Close'].iloc[-1]:+.2f}")


In [None]:
# =============================================================================
# CELL 19: Tahmin Görselleştirme
# =============================================================================
fig, ax = plt.subplots(figsize=(14, 7))

# Eğitim verisi (son 60 gün)
ax.plot(train_df.index[-60:], train_df['Close'].iloc[-60:],
label='Eğitim Verisi', color='blue', linewidth=2)

# Test verisi (gerçek)
ax.plot(test_df.index, test_df['Close'],
label='Gerçek Değerler', color='green', linewidth=2)

# Ensemble tahmin
ax.plot(test_df.index, ensemble_forecast,
label='Ensemble Tahmin', color='red', linestyle='--', linewidth=2)

# Test başlangıç çizgisi
ax.axvline(x=pd.Timestamp(TEST_START), color='gray', linestyle=':', alpha=0.7)

ax.set_title('Özelleştirilmiş Transformer Modelleri - Ensemble Tahmin', fontsize=14, fontweight='bold')
ax.set_xlabel('Tarih')
ax.set_ylabel('Fiyat')
ax.legend(loc='upper right')
ax.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig(RESULTS_PATH + 'ensemble_forecast.png', dpi=150, bbox_inches='tight')
plt.show()

print(f"\n Grafik kaydedildi: {RESULTS_PATH}ensemble_forecast.png")

---
## 10. Performans Değerlendirmesi

In [None]:
# =============================================================================
# CELL 20: Performans Metrikleri
# =============================================================================
def calculate_metrics(y_true, y_pred, model_name):
    """Performans metrikleri hesapla"""
    y_true = np.array(y_true).flatten()
    y_pred = np.array(y_pred).flatten()

    min_len = min(len(y_true), len(y_pred))
    y_true, y_pred = y_true[:min_len], y_pred[:min_len]

    rmse = np.sqrt(mean_squared_error(y_true, y_pred))
    mae = mean_absolute_error(y_true, y_pred)
    mape = mean_absolute_percentage_error(y_true, y_pred) * 100
    r2 = r2_score(y_true, y_pred)

    return {
    'Model': model_name,
    'RMSE': round(rmse, 2),
    'MAE': round(mae, 2),
    'MAPE (%)': round(mape, 2),
    'R²': round(r2, 4)
    }

    # Sonuçları topla
    results = []

    # Ensemble model
    results.append(calculate_metrics(
    test_df['Close'].values, ensemble_forecast, 'Ensemble (6 Model)'
    ))

    # Naive tahmin (benchmark)
    naive_forecast = np.full(len(test_df), current_price)
    results.append(calculate_metrics(
    test_df['Close'].values, naive_forecast, 'Naive (Sabit Fiyat)'
    ))

    # Sonuç tablosu
    results_df = pd.DataFrame(results)

    print("\n" + "=" * 70)
    print(" PERFORMANS KARŞILAŞTIRMASI")
    print("=" * 70)
    print(results_df.to_string(index=False))
    print("=" * 70)

In [None]:
# =============================================================================
# CELL 21: Sonuçları Kaydet
# =============================================================================
output_file = RESULTS_PATH + 'Transformer_Modelleri_Sonuclar.xlsx'

try:
    with pd.ExcelWriter(output_file, engine='openpyxl') as writer:
        results_df.to_excel(writer, sheet_name='Performans', index=False)

        model_summary = pd.DataFrame([
            ['FinBERT', 'ProsusAI/finbert', 'Sentiment', f"{model_scores.get('finbert', 0):+.4f}"],
            ['FinGPT', 'Llama-2 + LoRA', 'Sentiment', f"{model_scores.get('fingpt', 0):+.4f}"],
            ['FinT5', 'SALT-NLP/FLANG-T5', 'Multi-task', 'Text'],
            ['StockGPT', 'Teknik Analiz', 'RSI/SMA/MACD', f"{model_scores.get('stockgpt', 0):+.4f}"],
            ['MarketGPT', 'Makro Analiz', 'GDP/Enflasyon', f"{model_scores.get('marketgpt', 0):+.4f}"],
            ['BloombergGPT', 'Simülasyon', 'Kapsamlı', f"{model_scores.get('bloomberggpt', 0):+.4f}"],
        ], columns=['Model', 'Kaynak', 'Tür', 'Skor'])
        model_summary.to_excel(writer, sheet_name='Model_Ozeti', index=False)

        if news_df is not None:
            news_df.reset_index().to_excel(writer, sheet_name='Sentiment', index=False)
        else:
            print(" news_df bulunamadı, Sentiment sayfası atlanıyor")

        forecast_df = pd.DataFrame({
            'Tarih': test_df.index,
            'Gerçek': test_df['Close'].values,
            'Ensemble_Tahmin': ensemble_forecast
        })
        forecast_df.to_excel(writer, sheet_name='Tahminler', index=False)

    print(f" Sonuçlar kaydedildi: {output_file}")
except Exception as e:
    print(f" Kaydetme hatası: {e}")


---
## Özet

Bu notebook'ta aşağıdaki **Özelleştirilmiş Finansal Transformer Modelleri** uygulandı:

| Model | Kaynak | Mimari | Kullanım |
|-------|--------|--------|----------|
| **FinBERT** | ProsusAI/finbert | BERT fine-tuned | Sentiment analizi |
| **FinGPT** | AI4Finance GitHub | Llama-2 + LoRA | Finansal LLM |
| **FinT5** | SALT-NLP/FLANG-T5 | T5 Encoder-Decoder | Çoklu görev |
| **StockGPT** | GPT-4 / Simülasyon | Teknik analiz | RSI, SMA, MACD |
| **MarketGPT** | GPT-4 / Simülasyon | Makro analiz | GDP, Enflasyon |
| **BloombergGPT** | Simülasyon (50B) | Kapsamlı | Birleşik analiz |

---

**Sonraki Notebook:** `4_bist50_Adv_TS.ipynb` - Transformer Tabanlı Zaman Serisi Modelleri
(Informer, Autoformer, FEDformer, TimesNet, TFT, TSMixer, Chronos)

In [None]:
# =============================================================================
# TÜM PERİYOTLAR İÇİN SONUÇLAR (1 gün, 10 gün, 21 gün)
# =============================================================================
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score, mean_absolute_percentage_error
import os

# Sonuç dizini
SONUC_DIZINI = '/content/drive/MyDrive/Colab Notebooks/Sonuclar/3_AdvancedDL_FinLLM'
os.makedirs(SONUC_DIZINI, exist_ok=True)

# Notebook bilgileri
NOTEBOOK_ADI = "3_AdvancedDL_FinLLM"
VERI_TIPI = "az_veri"
KATEGORI = "Financial LLM"

print("=" * 80)
print(f" {NOTEBOOK_ADI} - TÜM PERİYOTLAR İÇİN TEST")
print(f" Veri Tipi: {VERI_TIPI.upper()}")
print("=" * 80)

# Tüm sonuçları toplayacak liste
tum_sonuclar = []

# Gerçek değerler
y_true_full = test_df['Close'].values
current_price = train_df['Close'].iloc[-1]

# Her periyot için test
for periyot_adi, gun_sayisi in TAHMIN_PERIYOTLARI.items():
    print(f"\n{'='*60}")
    print(f" {periyot_adi} ({gun_sayisi} iş günü) test ediliyor...")
    print('='*60)

    # Bu periyot için tahmin üret
    forecast_days = gun_sayisi

    # Ensemble tahmin
    ensemble_pred = ensemble.generate_price_forecast(current_price, ensemble_score, days=forecast_days)

    # Gerçek değerler (son N gün)
    y_true = y_true_full[:forecast_days] if len(y_true_full) >= forecast_days else y_true_full
    pred = ensemble_pred[:len(y_true)]

    # Ensemble metrikleri
    rmse = np.sqrt(mean_squared_error(y_true, pred))
    mae = mean_absolute_error(y_true, pred)
    r2 = r2_score(y_true, pred)
    mape = mean_absolute_percentage_error(y_true, pred) * 100

    tum_sonuclar.append({
        'Model': 'Ensemble (6 LLM)',
        'Kategori': KATEGORI,
        'Veri_Tipi': VERI_TIPI,
        'Periyot': periyot_adi,
        'Periyot_Gun': gun_sayisi,
        'RMSE': round(rmse, 4),
        'MAE': round(mae, 4),
        'R2': round(r2, 4),
        'MAPE': round(mape, 2)
    })
    print(f"   Ensemble: RMSE={rmse:.4f}, R²={r2:.4f}")

    # Naive benchmark
    naive_pred = np.full(len(y_true), current_price)
    rmse_naive = np.sqrt(mean_squared_error(y_true, naive_pred))
    mae_naive = mean_absolute_error(y_true, naive_pred)
    r2_naive = r2_score(y_true, naive_pred)
    mape_naive = mean_absolute_percentage_error(y_true, naive_pred) * 100

    tum_sonuclar.append({
        'Model': 'Naive (Benchmark)',
        'Kategori': 'Benchmark',
        'Veri_Tipi': VERI_TIPI,
        'Periyot': periyot_adi,
        'Periyot_Gun': gun_sayisi,
        'RMSE': round(rmse_naive, 4),
        'MAE': round(mae_naive, 4),
        'R2': round(r2_naive, 4),
        'MAPE': round(mape_naive, 2)
    })
    print(f"   Naive: RMSE={rmse_naive:.4f}, R²={r2_naive:.4f}")

    # Model skorlarını da ekle
    for model_name, score in model_scores.items():
        tum_sonuclar.append({
            'Model': f'{model_name.upper()} (Sentiment)',
            'Kategori': KATEGORI,
            'Veri_Tipi': VERI_TIPI,
            'Periyot': periyot_adi,
            'Periyot_Gun': gun_sayisi,
            'RMSE': np.nan,  # Sentiment skorları RMSE değil
            'MAE': np.nan,
            'R2': np.nan,
            'MAPE': np.nan,
            'Sentiment_Score': round(score, 4)
        })

# DataFrame oluştur
sonuc_df = pd.DataFrame(tum_sonuclar)
print(f"\n Toplam {len(sonuc_df)} test sonucu toplandı")


In [None]:
# =============================================================================
# SONUÇ TABLOLARI (Model × Periyot)
# =============================================================================

# Sadece RMSE olan modelleri filtrele
rmse_df = sonuc_df[sonuc_df['RMSE'].notna()]

if len(rmse_df) > 0:
    print("\n" + "=" * 80)
    print(" RMSE TABLOSU (Model × Periyot)")
    print("=" * 80)
    pivot_rmse = rmse_df.pivot_table(index='Model', columns='Periyot', values='RMSE', aggfunc='first')
    if '1_gun' in pivot_rmse.columns:
        pivot_rmse = pivot_rmse[['1_gun', '10_gun', '21_gun']]
    print(pivot_rmse.round(4).to_string())

    print("\n" + "=" * 80)
    print(" R² TABLOSU (Model × Periyot)")
    print("=" * 80)
    pivot_r2 = rmse_df.pivot_table(index='Model', columns='Periyot', values='R2', aggfunc='first')
    if '1_gun' in pivot_r2.columns:
        pivot_r2 = pivot_r2[['1_gun', '10_gun', '21_gun']]
    print(pivot_r2.round(4).to_string())

    print("\n" + "=" * 80)
    print(" MAE TABLOSU (Model × Periyot)")
    print("=" * 80)
    pivot_mae = rmse_df.pivot_table(index='Model', columns='Periyot', values='MAE', aggfunc='first')
    if '1_gun' in pivot_mae.columns:
        pivot_mae = pivot_mae[['1_gun', '10_gun', '21_gun']]
    print(pivot_mae.round(4).to_string())

# Model sentiment skorları
print("\n" + "=" * 80)
print(" MODEL SENTIMENT SKORLARI")
print("=" * 80)
for model_name, score in model_scores.items():
    print(f"  {model_name:15} → {score:+.4f}")

print("\n" + "=" * 80)
print(" EN İYİ MODEL (RMSE bazında)")
print("=" * 80)
for periyot in ['1_gun', '10_gun', '21_gun']:
    subset = rmse_df[rmse_df['Periyot'] == periyot]
    if len(subset) > 0:
        best = subset.loc[subset['RMSE'].idxmin()]
        print(f"  {periyot:8} → {best['Model']:20} (RMSE: {best['RMSE']:.4f})")


In [None]:
# =============================================================================
# KARŞILAŞTIRMA GRAFİKLERİ (3 Periyot - Kırmızı/Turuncu/Yeşil)
# =============================================================================

rmse_df = sonuc_df[sonuc_df['RMSE'].notna()]

if len(rmse_df) > 0 and '1_gun' in rmse_df['Periyot'].values:
    fig, axes = plt.subplots(2, 2, figsize=(14, 10))
    fig.suptitle(f'{NOTEBOOK_ADI} - 3 Periyot Karşılaştırması ({VERI_TIPI})',
                 fontsize=14, fontweight='bold')

    # Pivot tablolar
    pivot_rmse = rmse_df.pivot_table(index='Model', columns='Periyot', values='RMSE', aggfunc='first')
    pivot_mae = rmse_df.pivot_table(index='Model', columns='Periyot', values='MAE', aggfunc='first')
    pivot_r2 = rmse_df.pivot_table(index='Model', columns='Periyot', values='R2', aggfunc='first')
    pivot_mape = rmse_df.pivot_table(index='Model', columns='Periyot', values='MAPE', aggfunc='first')

    models = pivot_rmse.index.tolist()
    x = np.arange(len(models))
    width = 0.25
    colors = ['#e74c3c', '#f39c12', '#27ae60']  # kırmızı, turuncu, yeşil
    periyotlar = ['1_gun', '10_gun', '21_gun']

    # 1. RMSE
    ax1 = axes[0, 0]
    for i, periyot in enumerate(periyotlar):
        if periyot in pivot_rmse.columns:
            values = pivot_rmse[periyot].values
            ax1.bar(x + i*width, values, width, label=periyot, color=colors[i])
    ax1.set_title('RMSE Karşılaştırması', fontweight='bold')
    ax1.set_ylabel('RMSE')
    ax1.set_xticks(x + width)
    ax1.set_xticklabels(models, rotation=45, ha='right', fontsize=9)
    ax1.legend()
    ax1.grid(axis='y', alpha=0.3)

    # 2. MAE
    ax2 = axes[0, 1]
    for i, periyot in enumerate(periyotlar):
        if periyot in pivot_mae.columns:
            values = pivot_mae[periyot].values
            ax2.bar(x + i*width, values, width, label=periyot, color=colors[i])
    ax2.set_title('MAE Karşılaştırması', fontweight='bold')
    ax2.set_ylabel('MAE')
    ax2.set_xticks(x + width)
    ax2.set_xticklabels(models, rotation=45, ha='right', fontsize=9)
    ax2.legend()
    ax2.grid(axis='y', alpha=0.3)

    # 3. R²
    ax3 = axes[1, 0]
    for i, periyot in enumerate(periyotlar):
        if periyot in pivot_r2.columns:
            values = pivot_r2[periyot].values
            ax3.bar(x + i*width, values, width, label=periyot, color=colors[i])
    ax3.set_title('R² Karşılaştırması', fontweight='bold')
    ax3.set_ylabel('R²')
    ax3.set_xticks(x + width)
    ax3.set_xticklabels(models, rotation=45, ha='right', fontsize=9)
    ax3.legend()
    ax3.grid(axis='y', alpha=0.3)

    # 4. Model Sentiment Skorları
    ax4 = axes[1, 1]
    model_names = list(model_scores.keys())
    scores = list(model_scores.values())
    colors_sent = ['#3498db' if s >= 0 else '#e74c3c' for s in scores]
    bars = ax4.bar(model_names, scores, color=colors_sent)
    ax4.set_title('Model Sentiment Skorları', fontweight='bold')
    ax4.set_ylabel('Skor')
    ax4.axhline(y=0, color='black', linestyle='-', linewidth=0.5)
    ax4.set_xticklabels(model_names, rotation=45, ha='right', fontsize=9)
    ax4.grid(axis='y', alpha=0.3)

    plt.tight_layout()
    plt.savefig(f"{SONUC_DIZINI}/{NOTEBOOK_ADI}_3periyot_karsilastirma.png", dpi=150, bbox_inches='tight')
    plt.show()
    print(f"\n Grafik kaydedildi: {SONUC_DIZINI}/{NOTEBOOK_ADI}_3periyot_karsilastirma.png")
else:
    print("\n Yeterli veri bulunamadı!")


In [None]:
# =============================================================================
# EXCEL'E KAYDET
# =============================================================================

excel_dosya = f"{SONUC_DIZINI}/{NOTEBOOK_ADI}_tum_sonuclar.xlsx"

with pd.ExcelWriter(excel_dosya, engine='openpyxl') as writer:
    # Ham veriler
    sonuc_df.to_excel(writer, sheet_name='Tum_Sonuclar', index=False)

    # Pivot tablolar (RMSE olanlar)
    rmse_df = sonuc_df[sonuc_df['RMSE'].notna()]
    if len(rmse_df) > 0:
        pivot_rmse = rmse_df.pivot_table(index='Model', columns='Periyot', values='RMSE', aggfunc='first')
        pivot_rmse.to_excel(writer, sheet_name='RMSE')

        pivot_r2 = rmse_df.pivot_table(index='Model', columns='Periyot', values='R2', aggfunc='first')
        pivot_r2.to_excel(writer, sheet_name='R2')

        pivot_mae = rmse_df.pivot_table(index='Model', columns='Periyot', values='MAE', aggfunc='first')
        pivot_mae.to_excel(writer, sheet_name='MAE')

    # Model skorları
    scores_df = pd.DataFrame([
        {'Model': k, 'Sentiment_Score': v} for k, v in model_scores.items()
    ])
    scores_df.to_excel(writer, sheet_name='Sentiment_Scores', index=False)

print(f"\n Tüm sonuçlar kaydedildi: {excel_dosya}")

# Özet
print("\n" + "=" * 80)
print(f" ÖZET - {NOTEBOOK_ADI}")
print("=" * 80)
print(f" Veri Tipi: {VERI_TIPI}")
print(f" Kategori: {KATEGORI}")
print(f" Financial LLM Modelleri: FinBERT, FinGPT, FinT5, StockGPT, MarketGPT, BloombergGPT")
print(f" Test Edilen Periyotlar: 1_gun, 10_gun, 21_gun")
print(f" Toplam Test Sonucu: {len(sonuc_df)}")
print("=" * 80)
