# TF-IDF Vectorization Nedir? Nasıl Kullanılır?

##  Vectorize İşlemi Nedir?

Doğal dil işleme (NLP) alanında, metin verilerinin sayısal verilere dönüştürülmesi gerekir. Bu işleme vektörleştirme (vectorization) denir. Çünkü makine öğrenmesi algoritmaları sayısal girdilerle çalışır, metinleri doğrudan anlayamaz.

Örneğin: 
"Ben elma yiyorum"
"Sen armut yiyorsun"
Bu cümlelerin her bir kelimesi bir özelliğe (feature) dönüştürülerek sayısal vektörler elde edilir.

##  TF-IDF Nedir?

TF-IDF, bir kelimenin bir belgede ne kadar önemli olduğunu ölçen bir istatistiksel yöntemdir.

- TF (Term Frequency): Bir kelimenin belgede kaç kez geçtiği.
- IDF (Inverse Document Frequency): O kelimenin tüm belgelerde ne kadar nadir geçtiği.

Formül:
```
TF-IDF(t, d) = TF(t, d) * log(N / DF(t))
```
- *t*: terim (kelime)
- *d*: belge (doküman)
- *N*: toplam belge sayısı
- *DF(t)*: t terimini içeren belge sayısı


##  Python ile TF-IDF Örneği

###  Gerekli Kütüphaneler - Python ve Scikit Learn

###  Örnek Belgeler
```python
documents = [
    "Ben elma yiyorum",
    "Sen armut yiyorsun",
    "O muz yemeyi seviyor",
    "Biz elma ve armut yiyoruz"
]
```

###  TF-IDF Vektörleştirme
```python
vectorizer = TfidfVectorizer()
tfidf_matrix = vectorizer.fit_transform(documents)
```

### Özellik İsimleri ve Matris
```python
print("Kelimeler:", vectorizer.get_feature_names_out())
print("\nTF-IDF Matrisi:")
print(tfidf_matrix.toarray())
```


### Çıktı Örneği
```
Kelimeler: ['armut' 'ben' 'biz' 'elma' 'muz' 'o' 'seviyor' 've' 'yemeyi' 'yiyoruz' 'yiyorsun' 'yiyorum']

TF-IDF Matrisi:
[[0.         0.7071     0.         0.7071     0.         0.         0.         0.         0.         0.         0.         0.        ]
 [0.7071     0.         0.         0.         0.         0.         0.         0.         0.         0.         0.7071     0.        ]
 [0.         0.         0.         0.         0.5774     0.5774     0.5774     0.         0.5774     0.         0.         0.        ]
 [0.5        0.         0.5        0.5        0.         0.         0.         0.5        0.         0.5        0.         0.        ]]
```