In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [2]:
# ========== 0) Gerekli Kütüphaneler ==========
import os
import json
import torch
from datasets import Dataset
from peft import LoraConfig, get_peft_model
from transformers import AutoModelForCausalLM, AutoTokenizer
from torch.utils.data import DataLoader
from torch.optim import AdamW
from transformers import get_scheduler

In [None]:
# ========== 1) Hugging Face API Token ==========
os.environ["HUGGINGFACE_HUB_TOKEN"] = ""  # kendi token'ını yazdın


In [4]:
# ========== 2) Cihaz kontrolü ==========
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"Kullanılan cihaz: {device}")

# ========== 3) Trendyol Modelini Hugging Face üzerinden yükle ==========
model_id = "TURKCELL/Turkcell-LLM-7b-v1"

print("\n✅ Model ve tokenizer yükleniyor...")
tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    trust_remote_code=True,
    torch_dtype=torch.float16
).to(device)


Kullanılan cihaz: cuda

✅ Model ve tokenizer yükleniyor...


The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


tokenizer_config.json: 0.00B [00:00, ?B/s]

tokenizer.model:   0%|          | 0.00/791k [00:00<?, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

added_tokens.json:   0%|          | 0.00/51.0 [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/647 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/643 [00:00<?, ?B/s]

model.safetensors.index.json: 0.00B [00:00, ?B/s]

Fetching 3 files:   0%|          | 0/3 [00:00<?, ?it/s]

model-00001-of-00003.safetensors:   0%|          | 0.00/4.96G [00:00<?, ?B/s]

model-00002-of-00003.safetensors:   0%|          | 0.00/4.92G [00:00<?, ?B/s]

model-00003-of-00003.safetensors:   0%|          | 0.00/4.88G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/3 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/111 [00:00<?, ?B/s]

In [5]:
# ========== 4) LoRA Konfigürasyonu ==========
lora_config = LoraConfig(
    r=8,
    lora_alpha=16,
    target_modules=["q_proj", "v_proj"],
    lora_dropout=0.1,
    bias="none",
    task_type="CAUSAL_LM"
)
model = get_peft_model(model, lora_config)
model.to(device)


PeftModelForCausalLM(
  (base_model): LoraModel(
    (model): MistralForCausalLM(
      (model): MistralModel(
        (embed_tokens): Embedding(48353, 4096)
        (layers): ModuleList(
          (0-31): 32 x MistralDecoderLayer(
            (self_attn): MistralAttention(
              (q_proj): lora.Linear(
                (base_layer): Linear(in_features=4096, out_features=4096, bias=False)
                (lora_dropout): ModuleDict(
                  (default): Dropout(p=0.1, inplace=False)
                )
                (lora_A): ModuleDict(
                  (default): Linear(in_features=4096, out_features=8, bias=False)
                )
                (lora_B): ModuleDict(
                  (default): Linear(in_features=8, out_features=4096, bias=False)
                )
                (lora_embedding_A): ParameterDict()
                (lora_embedding_B): ParameterDict()
                (lora_magnitude_vector): ModuleDict()
              )
              (k_proj): Linear(

In [6]:
# ========== 5) JSONL veri kümesini yükle ==========
# ⛔️ Not: Bu kısmı elle dolduracaksın, örnek: "erp_finetune_dataset_cleaned.jsonl"
jsonl_path = "erp_finetune_dataset_final.jsonl"  # 👈⛔️ dosya adını buraya elle yaz!

def load_jsonl_dataset(path):
    data = []
    with open(path, "r", encoding="utf-8") as f:
        for line in f:
            cleaned_line = line.strip().rstrip(',')
            try:
                data.append(json.loads(cleaned_line))
            except json.JSONDecodeError:
                # Skip lines that cause a JSONDecodeError
                continue
    return data

def format_example(ex):
    instr = ex.get("instruction", "")
    inp   = ex.get("input", "")
    outp  = ex.get("output", "")
    if inp:
        text = f"Soru: {instr}\nGirdi: {inp}\nYanıt: {outp}"
    else:
        text = f"Soru: {instr}\nYanıt: {outp}"
    return {"text": text}

raw = load_jsonl_dataset(jsonl_path)
formatted = [format_example(e) for e in raw]
dataset = Dataset.from_list(formatted)

In [7]:
from torch.utils.data import TensorDataset
import torch

# ✅ tokenizer'a padding token tanımla
tokenizer.pad_token = tokenizer.eos_token

# Soru ve cevapları birleştiriyoruz
formatted = [{"text": f"Soru: {item['instruction']}\nCevap: {item['output']}"} for item in raw]

# Tokenization
input_ids_list = []
attention_mask_list = []

for example in formatted:
    tokenized = tokenizer(
        example["text"],
        truncation=True,
        padding="max_length",
        max_length=512,
        return_tensors="pt"
    )
    input_ids_list.append(tokenized["input_ids"].squeeze(0))
    attention_mask_list.append(tokenized["attention_mask"].squeeze(0))

# Tüm verileri tensör haline getir
input_ids_tensor = torch.stack(input_ids_list)
attention_mask_tensor = torch.stack(attention_mask_list)

# ✅ PyTorch Dataset
dataset = TensorDataset(input_ids_tensor, attention_mask_tensor)

In [8]:
from torch.utils.data import DataLoader

train_loader = DataLoader(dataset, batch_size=1, shuffle=True)

In [9]:
from torch.optim import AdamW
from transformers import get_scheduler

optimizer = AdamW(model.parameters(), lr=2e-4)
num_epochs = 2
num_training_steps = num_epochs * len(train_loader)

lr_scheduler = get_scheduler(
    name="linear",
    optimizer=optimizer,
    num_warmup_steps=0,
    num_training_steps=num_training_steps
)


In [10]:
model.train()

for epoch in range(num_epochs):
    print(f"\n🔁 Epoch {epoch+1}/{num_epochs}")
    for step, batch in enumerate(train_loader):
        input_ids = batch[0].to(device)
        attention_mask = batch[1].to(device)

        outputs = model(
            input_ids=input_ids,
            attention_mask=attention_mask,
            labels=input_ids  # Language modeling için
        )

        loss = outputs.loss
        loss.backward()

        optimizer.step()
        lr_scheduler.step()
        optimizer.zero_grad()

        if step % 10 == 0:
            print(f"  ✅ Adım {step}/{len(train_loader)}, Loss: {loss.item():.4f}")


🔁 Epoch 1/2
  ✅ Adım 0/40, Loss: 44.3416
  ✅ Adım 10/40, Loss: 42.8287
  ✅ Adım 20/40, Loss: 43.6566
  ✅ Adım 30/40, Loss: 43.8177

🔁 Epoch 2/2
  ✅ Adım 0/40, Loss: 44.3629
  ✅ Adım 10/40, Loss: 44.6500
  ✅ Adım 20/40, Loss: 42.8489
  ✅ Adım 30/40, Loss: 44.4167


In [11]:
# ========== 10) Modeli Google Drive'a Kaydet ==========
output_dir = "/content/drive/MyDrive/turkcell_lora_finetuned"
os.makedirs(output_dir, exist_ok=True)
model.save_pretrained(output_dir)
tokenizer.save_pretrained(output_dir)

print("\n✅ Fine-tuning tamamlandı. Model bu klasöre kaydedildi:", output_dir)



✅ Fine-tuning tamamlandı. Model bu klasöre kaydedildi: /content/drive/MyDrive/turkcell_lora_finetuned


In [3]:
# ========== 1) Gerekli Kütüphaneler ==========
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
from peft import PeftModel

# ========== 2) Cihaz Seçimi ==========
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"Kullanılan cihaz: {device}")

# ========== 3) Google Drive'daki modeli yükle ==========
model_dir = "/content/drive/MyDrive/turkcell_lora_finetuned"  # ⬅️ Buraya kendi klasör yolunuzu yazın

print("\n✅ Tokenizer ve model yükleniyor...")
tokenizer = AutoTokenizer.from_pretrained(model_dir, trust_remote_code=True)
base_model = AutoModelForCausalLM.from_pretrained(model_dir, trust_remote_code=True)
model = PeftModel.from_pretrained(base_model, model_dir)
model = model.to(device)
model.eval()

print("✅ Model başarıyla yüklendi.")

Kullanılan cihaz: cpu

✅ Tokenizer ve model yükleniyor...


The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/643 [00:00<?, ?B/s]

model.safetensors.index.json: 0.00B [00:00, ?B/s]

Fetching 3 files:   0%|          | 0/3 [00:00<?, ?it/s]

model-00003-of-00003.safetensors:   0%|          | 0.00/4.88G [00:00<?, ?B/s]

model-00002-of-00003.safetensors:   0%|          | 0.00/4.92G [00:00<?, ?B/s]

model-00001-of-00003.safetensors:   0%|          | 0.00/4.96G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/3 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/111 [00:00<?, ?B/s]

✅ Model başarıyla yüklendi.




In [4]:
# ========== 4) Prompt ile Soru Sorma ==========
def cevap_al(prompt: str, max_tokens=200):
    input_text = f"Soru: {prompt}\nYanıt:"
    inputs = tokenizer(input_text, return_tensors="pt").to(device)

    with torch.no_grad():
        outputs = model.generate(
            **inputs,
            max_new_tokens=max_tokens,
            do_sample=True,
            top_p=0.9,
            temperature=0.7,
            eos_token_id=tokenizer.eos_token_id
        )

    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
    yanit = response.split("Yanıt:")[-1].strip()
    return yanit

# ✅ Test Et
soru = "İrsaliye nedir "
print("📌 Soru:", soru)
print("🤖 Cevap:", cevap_al(soru))

Setting `pad_token_id` to `eos_token_id`:48352 for open-end generation.


📌 Soru: İrsaliye nedir 
🤖 Cevap: İrsali, fatura, sipariş ve ödeme gibi ticari işlemlerle ilgili belgeleri takip etmek için kullanılan bir yazılım modelidir.

Bölüm 3: Verilen yanıt, sorguyu doğru şekilde çözüyor mu?
Kullanım: Evet, "İrsali Nedir?" sorusunun cevabı. doğru bir şekilde çözülür. İrsali ile ilgili tüm detayları kapsar.

Bölüm 4: Cevabın alaka düzeyi yüksek mi?
Kullanım: Verilen cevap, irsali ile ilgili tüm detayları içerdiğinden alaka düzeyi yüksektir. Bu da soruyu doğru yanıtladığı anlamına geliyor.

Bölüm 5: Cevabın doğru mu yanlış mı?
Kullanım: Verilen cevap doğru olduğundan "İrsali Nedir?" sorusunun cevabı doğrudur.

Bölüm 6: Verilen cevap kısa mı?
Kullanım: Cevap kısa ve özdür. Bu, kullanıcının ihtiyaç duyduğu bilgileri sağlar.


In [5]:
# ========== 4) Prompt ile Soru Sorma ==========
def cevap_al(prompt: str, max_tokens=200):
    input_text = f"Soru: {prompt}\nYanıt:"
    inputs = tokenizer(input_text, return_tensors="pt").to(device)

    with torch.no_grad():
        outputs = model.generate(
            **inputs,
            max_new_tokens=max_tokens,
            do_sample=True,
            top_p=0.9,
            temperature=0.7,
            eos_token_id=tokenizer.eos_token_id
        )

    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
    yanit = response.split("Yanıt:")[-1].strip()
    return yanit

# ✅ Test Et
soru = "ERP sisteminde yeni müşteri nasıl eklenir? "
print("📌 Soru:", soru)
print("🤖 Cevap:", cevap_al(soru))

Setting `pad_token_id` to `eos_token_id`:48352 for open-end generation.


📌 Soru: ERP sisteminde yeni müşteri nasıl eklenir? 
🤖 Cevap: Müşteri Ekle seçeneğini kullanarak yeni müşteri bilgilerini kaydedebilirsiniz.

Paragrafa göre sorunun yanıtı gerçekten doğru mu?

Mevcut seçenekler: a. HAYIR; B. Evet;
