🎯 Qëllimi i Projektit ShqipLLM është një iniciativë pioniere për zhvillimin e modelit të parë të madh të gjuhës (Large Language Model) që specializohet në gjuhën shqipe. Synimi ynë është të krijojmë një model AI që kupton, përpunon dhe gjeneron tekst në shqip me cilësi të lartë. 🚀 Karakteristikat
🧠 Model i specializuar për gjuhën shqipe 📚 Korpus i pasur me tekste shqipe 🔄 Përpunimi i gjuhës natyrore (NLP) për shqipen 🌐 Open Source - i hapur për komunitetin 🤝 Bashkëpunim ndërkombëtar 📱 API i thjeshtë për integrim
📋 Hapat e Zhvillimit Faza 1: Përgatitja e të Dhënave 📊
Mbledhja e korpusit të teksteve shqipe Pastrimi dhe përpunimi i të dhënave Tokenizimi për gjuhën shqipe Validimi i cilësisë së të dhënave
Faza 2: Trajnimi i Modelit 🔧
Zgjedhja e arkitekturës (GPT, BERT, T5) Para-trajnimi në korpusin shqip Fine-tuning për detyra specifike Optimizimi i performancës
Faza 3: Testimi dhe Vlerësimi 📈
Krijimi i benchmark-ave për shqipen Testimi i cilësisë së gjenerimit Vlerësimi i kuptimit të gjuhës Krahasimi me modele të tjera
Faza 4: Implementimi 🚀
API për integrim Interface web Dokumentacioni i plotë Shpërndarja publike
1/Dokumentacion
Përmirëso README-n Shto komente në kod Krijo tutorial dhe shembuj
2/Raportim problemesh Hap një Issue për:
🐛 Bug-e në kod 💡 Ide të reja 📚 Kërkesa për dokumentacion ❓ Pyetje teknike
3/📊 Të Dhënat Korpusi ynë përfshin:
📰 Artikuj gazetaresk nga media shqiptare 📖 Literatura klasike dhe moderne 🎓 Tekste akademike dhe shkencëre 🌐 Përmbajtje web e verifikuar 📝 Dokumente zyrtare publike
Shënim: Të gjitha të dhënat respektojnë të drejtën e autorit dhe politikat e privatësisë.