Skip to content

anilkus/TurkceniKoru-PreservingtheTurkishLanguage

Repository files navigation

image

TürkçeniKoru-Preserving the Turkish Language

Teknofest 2024 Doğal Dil İşleme Yarışması - ToRos Dil İşleme Takımı

Günlük hayatta sosyal/görsel medyada, haberlerde veya günlük konuşmalarda, türkçe cümlelerin içerisinde yabancı(türkçe olmayan) kelime veya yapıların sık sık kullanıldığına şahit oluyoruz. Bu çalışma bu tarz cümlelerdeki türkçe olmayan kelime/yapıları tespit edip değiştirerek, yeniden cümleler kuran bir uygulama geliştirmeyi amaçlamıştır. Bu sayede Türkçe dilinin korunması noktasında bir farkındalık oluşturmak hedeflenmiştir.

Üretilen yeni cümleler, dilbilgisi olarak doğru olan cümleler ile benzerlik algoritmaları kullanılarak kıyaslanmıştır. LSC, Cosinüs benzerliği ve JaccardAlgoritması ile değerlendirilen LLM üretimli cümleler %96 doğruluk orarına ulaşmıştır.


Teknofest 2024 NLP Branch - ToRos Dil İşleme Team

In everyday life, whether on social/visual media, in the news, or in daily conversations, we frequently witness the use of foreign (non-Turkish) words or structures within Turkish sentences. This study aims to develop an application that detects and replaces these non-Turkish words/structures in such sentences, thereby reconstructing them. The goal is to raise awareness about preserving the Turkish language.

The newly generated sentences were compared to grammatically correct sentences using similarity algorithms. The sentences produced by the LLM were evaluated using LSC, Cosine Similarity, and the Jaccard Algorithm, achieving an accuracy rate of 96%.