-
Notifications
You must be signed in to change notification settings - Fork 0
Dataset Format
ChiefVenzox edited this page Jun 18, 2026
·
1 revision
Eğitim verisi JSONL (her satır bir JSON nesnesi). backend/datasets/*.jsonl.
- instruction (zorunlu): ne istediğin (doğal dil).
- input (opsiyonel): stil/kısıt detayları.
- output (tercih edilen): modelin üretmesini istediğin yapısal çıktı.
output yerine ayrı alanlar verebilirsin; sistem @@-bloğunu otomatik kurar:
{ "instruction": "...", "input": "...",
"html": "<!DOCTYPE html>...", "css": ".btn{...}", "notes": "Kısa açıklama" }@@HTML
<!DOCTYPE html> ... (tam belge, stil hariç)
@@CSS
... css ...
@@NOTES
... kısa açıklama ...
@@END
-
@@HTML / @@CSS / @@NOTES / @@ENDHTML/CSS içeriğinde asla geçmez → ayrıştırma kesin ve kesilmeye (truncation) dayanıklı. -
Kapanış
@@yoktur.@@HTML@@gibi kapanışlı olsaydı tokenizer'da@@ | HTML | @@oluşur; paylaşılan@@hem açılış hem kapanış olunca model@@sonrası en sık geleni (\n) seçip bölüm adını atlardı. Kapanışı kaldırınca@@daima bir bölüm adıyla devam eder.
<|user|>
Instruction: {instruction}
Style: {input}
<|assistant|>
@@HTML
...
@@CSS
...
@@NOTES
...
@@END
<|end|>
(<|user|>, <|assistant|>, <|end|>, <|endoftext|> özel token; @@...
işaretçileri düz metin — model bunları öğrenir.)
- Prompt → HTML/CSS
- Prompt → Bootstrap layout
- Bozuk CSS → düzeltilmiş CSS
- UI tarifi → bileşen kodu (button, card, navbar, form, alert, badge)
- Renk paleti → CSS değişkenleri
- Masaüstü layout → responsive layout
- Basit bileşen üretimi
- Tek-dosya tam HTML sayfası
backend/datasets/build_seed.py bu kategorilerde dengeli ve çeşitli ifadeli
örnekler üretir (her bileşen için birden çok prompt cümlesi). Çıktı:
backend/datasets/seed.jsonl.
Birkaç yüz örnek boru hattını test eder ama tutarlı, özgün çıktı için binlerce iyi örnek + uzun eğitim gerekir. Veriyi büyütmek en yüksek etkili adımdır.
{ "instruction": "Create a modern SaaS landing page hero section.", "input": "Style: premium, dark, orange accent #c45a26, responsive.", "output": "@@HTML\n<!DOCTYPE html>...\n@@CSS\n.btn{...}\n@@NOTES\nKısa açıklama\n@@END" }