# Stemming
* Kelimenin Kökünü bulur (Morfolojik Analiz yapmaz)
* Daha hızlı ama daha az doğru
* Örnek: "gelecekler" -> "gelecek"


# Lemmatization (Sözlüksel Kök Bulma)
* Kelimenin **sözlükteki temel formunu** bulur
* Daha yavaş ama daha doğru
* Örnek: "gittim" -> "git"

In [1]:
# Test için Türkçe kelimeler - farklı morfolojik yapılar
test_words = [
    # İsimler
    "kitaplarında",
    "evlerimizden", 
    "çocuklarımız",
    "arabaların",
    "kedilerin",
    
    # Fiiller
    "gidiyorum",
    "gelecekler",
    "yapmışlar",
    "koşuyordu",
    "okuyacağım",
    
    # Sıfatlar
    "güzeller",
    "büyüklerin",
    "küçücük",
    
    # Karmaşık kelimeler
    "anlamlandıramadıklarımızdan",
    "çalışabileceklerinden",
    "düşünebiliyormuş"
]

print("Test Kelimeleri:")
for i, word in enumerate(test_words, 1):
    print(f"{i:2d}. {word}")

print(f"\nToplam {len(test_words)} kelime test edilecek.")

Test Kelimeleri:
 1. kitaplarında
 2. evlerimizden
 3. çocuklarımız
 4. arabaların
 5. kedilerin
 6. gidiyorum
 7. gelecekler
 8. yapmışlar
 9. koşuyordu
10. okuyacağım
11. güzeller
12. büyüklerin
13. küçücük
14. anlamlandıramadıklarımızdan
15. çalışabileceklerinden
16. düşünebiliyormuş

Toplam 16 kelime test edilecek.


### Python

In [2]:
import re

def simple_turkish_stemmer(word):
    """Basit Türkçe stemmer - sadece yaygın ekleri kaldırır"""
    # Yaygın Türkçe ekleri (basitleştirilmiş)
    suffixes = [
        # İsim ekleri
        'larında', 'lerinde', 'larından', 'lerinden',
        'larımız', 'lerimiz', 'larınız', 'leriniz',
        'ların', 'lerin', 'larda', 'lerde',
        'lar', 'ler', 'dan', 'den', 'tan', 'ten',
        'nın', 'nin', 'nun', 'nün', 'ın', 'in', 'un', 'ün',
        'da', 'de', 'ta', 'te', 'ya', 'ye', 'na', 'ne',
        'ı', 'i', 'u', 'ü', 'a', 'e',
        
        # Fiil ekleri
        'iyorum', 'uyorum', 'üyorum', 'ıyorum',
        'ecekler', 'acaklar', 'ecekler', 'acaklar',
        'mışlar', 'muşlar', 'müşler', 'mişler',
        'yordu', 'uyordu', 'üyordu', 'ıyordu',
        'acağım', 'eceğim', 'acağım', 'eceğim',
        'iyor', 'uyor', 'üyor', 'ıyor',
        'mış', 'muş', 'müş', 'miş',
        'dı', 'di', 'du', 'dü', 'tı', 'ti', 'tu', 'tü',
        'ar', 'er', 'ır', 'ir', 'ur', 'ür',
        'im', 'um', 'üm', 'ım',
        
        # Sıfat ekleri
        'ler', 'lar', 'cük', 'cik', 'cuk', 'cük'
    ]
    
    # En uzun eşleşen eki bul ve kaldır
    word_lower = word.lower()
    for suffix in sorted(suffixes, key=len, reverse=True):
        if word_lower.endswith(suffix) and len(word_lower) > len(suffix):
            return word_lower[:-len(suffix)]
    
    return word_lower

def python_stemming_lemmatization(words):
    """Python ile basit stemming (lemmatization yok)"""
    results = []
    for word in words:
        stem = simple_turkish_stemmer(word)
        results.append({
            'word': word,
            'stem': stem,
            'lemma': 'N/A (Python standart kütüphanelerde yok)'
        })
    return results

# Test et
python_results = python_stemming_lemmatization(test_words)

print("PYTHON (Basit Stemming) SONUÇLARI:")
print("="*60)
print(f"{'Kelime':<25} {'Stem':<15} {'Lemma':<15}")
print("-"*60)
for result in python_results:
    print(f"{result['word']:<25} {result['stem']:<15} {result['lemma']:<15}")

PYTHON (Basit Stemming) SONUÇLARI:
Kelime                    Stem            Lemma          
------------------------------------------------------------
kitaplarında              kitap           N/A (Python standart kütüphanelerde yok)
evlerimizden              evlerimiz       N/A (Python standart kütüphanelerde yok)
çocuklarımız              çocuk           N/A (Python standart kütüphanelerde yok)
arabaların                araba           N/A (Python standart kütüphanelerde yok)
kedilerin                 kedi            N/A (Python standart kütüphanelerde yok)
gidiyorum                 gid             N/A (Python standart kütüphanelerde yok)
gelecekler                gel             N/A (Python standart kütüphanelerde yok)
yapmışlar                 yap             N/A (Python standart kütüphanelerde yok)
koşuyordu                 koş             N/A (Python standart kütüphanelerde yok)
okuyacağım                okuy            N/A (Python standart kütüphanelerde yok)
güzeller        