<a href="https://colab.research.google.com/github/mustafaizzet1/Fine-tune/blob/main/Untitled7.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
pip install unsloth

Collecting unsloth
  Downloading unsloth-2025.5.6-py3-none-any.whl.metadata (46 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/46.8 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m46.8/46.8 kB[0m [31m2.4 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting unsloth_zoo>=2025.5.7 (from unsloth)
  Downloading unsloth_zoo-2025.5.7-py3-none-any.whl.metadata (8.0 kB)
Collecting xformers>=0.0.27.post2 (from unsloth)
  Downloading xformers-0.0.30-cp311-cp311-manylinux_2_28_x86_64.whl.metadata (1.0 kB)
Collecting bitsandbytes (from unsloth)
  Downloading bitsandbytes-0.45.5-py3-none-manylinux_2_24_x86_64.whl.metadata (5.0 kB)
Collecting tyro (from unsloth)
  Downloading tyro-0.9.20-py3-none-any.whl.metadata (10 kB)
Collecting datasets>=3.4.1 (from unsloth)
  Downloading datasets-3.6.0-py3-none-any.whl.metadata (19 kB)
Collecting trl!=0.15.0,!=0.9.0,!=0.9.1,!=0.9.2,!=0.9.3,<=0.15.2,>=0.7.9 (from unsloth)
  Downloading 

In [None]:
pip install datasets trl bitsandbytes peft accelerate



In [None]:
from unsloth import FastLanguageModel

model_name = "unsloth/Llama-3.2-3B-Instruct"
max_seq_length = 2048
load_in_4bit = True  # T4 için ideal

model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = model_name,
    max_seq_length = max_seq_length,
    dtype = None,
    load_in_4bit = load_in_4bit,
)


In [None]:
from datasets import load_dataset
dataset = load_dataset("json", data_files="/content/veri_unsloth.jsonl", split="train")

In [None]:
dataset[0]["messages"]
tokenizer.apply_chat_template(dataset[0]["messages"], tokenize=False)

In [None]:
model = FastLanguageModel.get_peft_model(
    model,
    r = 16, # Choose any number > 0 ! Suggested 8, 16, 32, 64, 128
    target_modules = ["q_proj", "k_proj", "v_proj", "o_proj",
                      "gate_proj", "up_proj", "down_proj",],
    lora_alpha = 16,
    lora_dropout = 0, # Supports any, but = 0 is optimized
    bias = "none",    # Supports any, but = "none" is optimized
    # [NEW] "unsloth" uses 30% less VRAM, fits 2x larger batch sizes!
    use_gradient_checkpointing = "unsloth", # True or "unsloth" for very long context
    random_state = 3407,
    use_rslora = False,  # We support rank stabilized LoRA
    loftq_config = None, # And LoftQ
)

In [None]:
from pprint import pprint
pprint(dataset[0])

In [None]:
from trl import SFTTrainer
from transformers import TrainingArguments, DataCollatorForSeq2Seq
from unsloth import is_bfloat16_supported
from unsloth.chat_templates import get_chat_template # Import get_chat_template here


def formatting_func(examples):
    texts = []
    messages_list = examples["messages"]

    for messages in messages_list:
        # Eğer yanlışlıkla tek bir mesaj dict'i gelirse, listeye sar
        if isinstance(messages, dict):
            messages = [messages]

        if not isinstance(messages, list):
            print("Geçersiz format atlandı:", messages)
            continue

        try:
            formatted = tokenizer.apply_chat_template(
                messages,
                tokenize=False,
                add_generation_prompt=False
            )
            texts.append(formatted)
        except Exception as e:
            print("Hatalı örnek atlandı:", e)
            continue

    return texts  # ✅ Sadece string listesi döndür!
print(texts[0])
trainer = SFTTrainer(
    model = model,
    tokenizer = tokenizer,
    train_dataset = dataset,
    max_seq_length = max_seq_length,
    data_collator = DataCollatorForSeq2Seq(tokenizer = tokenizer),
    dataset_num_proc = 2,
    packing = False, # Can make training 5x faster for short sequences.
    formatting_func = formatting_func,
    args = TrainingArguments(
        per_device_train_batch_size = 2,
        gradient_accumulation_steps = 4,
        warmup_steps = 5,
        # num_train_epochs = 1, # Set this for 1 full training run.
        max_steps = 60,
        learning_rate = 2e-4,
        fp16 = not is_bfloat16_supported(),
        bf16 = is_bfloat16_supported(),
        logging_steps = 1,
        optim = "adamw_8bit",
        weight_decay = 0.01,
        lr_scheduler_type = "linear",
        seed = 3407,
        output_dir = "3B",
        report_to = "wandb", # Use this for WandB etc
         # Unsloth'un özel compute_loss'unu devre dışı bırakın - Bu satırı yorumdan çıkararak deneyin

    ),
)

In [None]:
print(dataset[0])
texts = formatting_func({"messages": dataset["messages"]})
print(len(texts), len(dataset))  # Bu iki sayı eşit olmalı

In [None]:
from unsloth.chat_templates import train_on_responses_only
trainer = train_on_responses_only(
    trainer,
    instruction_part = "<|start_header_id|>user<|end_header_id|>\n\n",
    response_part = "<|start_header_id|>assistant<|end_header_id|>\n\n",
)

In [None]:
tokenizer.decode(trainer.train_dataset[5]["input_ids"])

In [None]:
space = tokenizer(" ", add_special_tokens = False).input_ids[0]
tokenizer.decode([space if x == -100 else x for x in trainer.train_dataset[5]["labels"]])

In [None]:
trainer_stats = trainer.train()

In [None]:
trainer.model.save_pretrained("outputs/final2_model")
tokenizer.save_pretrained("outputs/final2_model")

('outputs/final_model/tokenizer_config.json',
 'outputs/final_model/special_tokens_map.json',
 'outputs/final_model/tokenizer.json')

In [None]:
from transformers import pipeline

pipe = pipeline("text-generation", model=trainer.model, tokenizer=tokenizer)

prompt = tokenizer.apply_chat_template([
    {"role": "user", "content": "Bir marka tescili hangi şartlarda iptal edilir?"}
], tokenize=False, add_generation_prompt=True)

output = pipe(prompt, max_new_tokens=256)[0]["generated_text"]
print(output)

Device set to use cuda:0
The model 'PeftModelForCausalLM' is not supported for text-generation. Supported models are ['AriaTextForCausalLM', 'BambaForCausalLM', 'BartForCausalLM', 'BertLMHeadModel', 'BertGenerationDecoder', 'BigBirdForCausalLM', 'BigBirdPegasusForCausalLM', 'BioGptForCausalLM', 'BlenderbotForCausalLM', 'BlenderbotSmallForCausalLM', 'BloomForCausalLM', 'CamembertForCausalLM', 'LlamaForCausalLM', 'CodeGenForCausalLM', 'CohereForCausalLM', 'Cohere2ForCausalLM', 'CpmAntForCausalLM', 'CTRLLMHeadModel', 'Data2VecTextForCausalLM', 'DbrxForCausalLM', 'DeepseekV3ForCausalLM', 'DiffLlamaForCausalLM', 'ElectraForCausalLM', 'Emu3ForCausalLM', 'ErnieForCausalLM', 'FalconForCausalLM', 'FalconMambaForCausalLM', 'FuyuForCausalLM', 'GemmaForCausalLM', 'Gemma2ForCausalLM', 'Gemma3ForConditionalGeneration', 'Gemma3ForCausalLM', 'GitForCausalLM', 'GlmForCausalLM', 'Glm4ForCausalLM', 'GotOcr2ForConditionalGeneration', 'GPT2LMHeadModel', 'GPT2LMHeadModel', 'GPTBigCodeForCausalLM', 'GPTNeoFo

<|begin_of_text|><|start_header_id|>system<|end_header_id|>

Cutting Knowledge Date: December 2023
Today Date: 19 May 2025

<|eot_id|><|start_header_id|>user<|end_header_id|>

Bir marka tescili hangi şartlarda iptal edilir?<|eot_id|><|start_header_id|>assistant<|end_header_id|>

Marka tescili, 556 sayılı KHK'nın ilgili maddeleri çerçevesinde, iltibas, iltibas riski taşıyan bir marka olarak değerlendirilebilir. Bu durum, marka sahibi tarafından tescil edilebilmesi için karşı tarafın bu tür bir durumun varlığı durumunda, mahkemece iptal edilebilir. Ayrıca, marka tescilinin geçersizliği için de delillerin sunulması gerekmektedir.


In [None]:
if False:
    from unsloth import FastLanguageModel
    model, tokenizer = FastLanguageModel.from_pretrained(
        model_name = "lora_model", # YOUR MODEL YOU USED FOR TRAINING
        max_seq_length = max_seq_length,
        dtype = dtype,
        load_in_4bit = load_in_4bit,
    )
    FastLanguageModel.for_inference(model) # Enable native 2x faster inference

messages = [
    {"role": "user", "content": "Bir şirket, piyasada uzun süredir var olan ve birçok firma tarafından üretilen bir tasarımı kendi adına tescil ettirmiştir. Bu durumda, söz konusu tasarımın yenilik ve ayırt edicilik özelliklerine sahip olmadığı gerekçesiyle hükümsüzlük davası açılabilir mi?"},
]
inputs = tokenizer.apply_chat_template(
    messages,
    tokenize = True,
    add_generation_prompt = True, # Must add for generation
    return_tensors = "pt",
).to("cuda")

from transformers import TextStreamer
text_streamer = TextStreamer(tokenizer, skip_prompt = True)
_ = model.generate(input_ids = inputs, streamer = text_streamer, max_new_tokens = 128,
                   use_cache = True, temperature = 1.5, min_p = 0.1)

Evet, bu durumda bir hükümsüzlük davası açılabilmekte. Tasarımin yenilik ve ayırt edicilik özelliği, ilgili kanun maddelerinde belirli tiêu chílar çerçevesinde belirlenmiştir ve bu durumda tasarımın tescili için geçerlilikte olan criteriasın karşılaşıp karşılamadığı göz önünde bulundurulmalıdır. Eğer tasarımın yenilik ve ayırt edicilik característicası absenceye sahip olduğu düşünülse ve bu durumda davanın geçerliliği söz konusu olsayacağı da belirlemek için ilgili hükümler
