# Tanimoto Benzerliği

### Tanimoto (Jaccard) Benzerliği

Tanimoto benzerliği, Jaccard benzerliğini taban alarak oluşturulmuştur. iki kümenin ne kadar çok elemanı paylaştığını ölçen bir benzerlik metriğidir. İki kümenin kesişimini, birleşimine bölerek benzerlik oranını hesaplar. Formülü aşağıdaki gibidir:

<img src='https://iq.opengenus.org/content/images/2020/09/jaccard.png' width='400' height='400'> 

Burada:
- `A ∩ B` kümelerin kesişimi,
- `A ∪ B` kümelerin birleşimi.

Tanimoto (Jaccard) benzerliği, ikili veya binarize edilmiş verilerin kullanıldığı bilgisayar bilimi, ekoloji, genomik, kimya gibi alanlarda yaygın olarak kullanılır. 0 ile 1 arasında değer alabilir.

### Matris Benzerliği

Matris benzerliği, genellikle piksel değerlerini kullanarak iki görsel arasındaki farkı matrisler yardımıyla ölçer. Piksel değerleri arasındaki farkı veya benzerliği hesaplamak için farklı metrikler kullanabilir. Örneğin, L1 veya L2 normları veya mutlak fark gibi metrikler kullanılabilir.

### Tanimoto ile Matris Benzerliği Arasındaki Farklar

Bu iki benzerlik algoritması farklı yaklaşımlar kullanıldığından ötürü sonuçlarda farklılaşıyor:

- Tanimoto benzerliği, görüntüleri siyah beyaz matrislere dönüştürüp piksel değerlerini kullanarak benzerlik hesaplar. Bu yaklaşım, renk tonlarından ziyade yalnızca varlık veya yokluğu dikkate alır. Bundan dolayı da benzerlik oranı yüksek çıkma eğilimindedir.
- Matris benzerliği ise renkli piksel değerlerini kullanarak daha detaylı bir farklılık ve benzerlik değeri elde etmeye çalışır. Bu yaklaşım renk farklarını da içerir.

Sonuçlar arasındaki bu farklılık, iki yöntemin de farklı özellikleri nedeniyle oluşabilir. Bir yöntemin diğerine üstün olduğunu söylemek için, hangi benzerlik metriğinin spesifik senaryoda daha uygun olduğunu anlamak önemlidir. Örneğin, Tanimoto (Jaccard) benzerliği ikili veya ikili hale getirilmiş verilerde kullanılırken matris benzerliği daha genel durumlarda kullanılabilir.

## Tanimoto Benzerliği

In [1]:
import numpy as np
from PIL import Image

def jaccard_similarity(matrix1, matrix2):
    intersection = np.logical_and(matrix1, matrix2)
    union = np.logical_or(matrix1, matrix2)
    return intersection.sum() / union.sum()

def png_to_matrix(file_path):
    img = Image.open(file_path).convert('L')
    img_arr = np.array(img)
    return img_arr

file1 = 'gorsel1.png'
file2 = 'gorsel2.png'


matrix1 = png_to_matrix(file1)
matrix2 = png_to_matrix(file2)

similarity = jaccard_similarity(matrix1, matrix2)

print(f'Benzerlik orani: {similarity}')

Benzerlik orani: 0.995361906808377


## Matris Benzerliği

In [2]:
import cv2
import numpy as np

def matris_benzerligi(gorsel_1, gorsel_2):
    yukseklik = gorsel_1.shape[0]
    genislik = gorsel_1.shape[1]

    fark = cv2.absdiff(gorsel_1,gorsel_2)

    farklilik_oran = np.mean(fark) * 100 / 255
    print('Iki gorsel arasindaki farklilik orani :' + str(farklilik_oran))

    benzerlik_oran = 100 - farklilik_oran
    print('Iki gorsel arasindaki benzerlik orani :' + str(benzerlik_oran))

    farkMatris = np.zeros(shape=(yukseklik, genislik, 3), dtype=np.uint8)
    mask = fark <= 0
    farkMatris[mask] = 255
    farkMatris[~mask] = gorsel_2[~mask]

    cv2.imwrite('farkMatris.png',farkMatris)
    print('Iki gorsel arasindaki farkliliklar, farkMatris.png dosyasi olarak kayit edildi')

if __name__ == '__main__':
    gorsel_1 = cv2.imread('gorsel1.png')
    gorsel_2 = cv2.imread('gorsel2.png')
    matris_benzerligi(gorsel_1, gorsel_2)

Iki gorsel arasindaki farklilik orani :32.44940104341378
Iki gorsel arasindaki benzerlik orani :67.55059895658621
Iki gorsel arasindaki farkliliklar, farkMatris.png dosyasi olarak kayit edildi
