In [1]:
import pandas as pd
import numpy as np
import timm
import torchvision.transforms as T

from wildlife_tools.features import SuperPointExtractor, SiftExtractor, AlikedExtractor, DiskExtractor, DeepFeatures
from wildlife_tools.similarity import CosineSimilarity, MatchLOFTR, MatchLightGlue
from wildlife_tools.data.dataset import ImageDataset
from wildlife_tools.similarity.wildfusion import SimilarityPipeline, WildFusion
from wildlife_tools.similarity.calibration import IsotonicCalibration

metadata = {'metadata':  pd.read_csv('../tests/TestDataset/metadata.csv'), 'root': '../tests/TestDataset'}
transform = T.Compose([T.Resize([224, 224]), T.ToTensor()])
dataset = ImageDataset(**metadata, transform=transform)


# WildFusion
- Run wildfusion as mean of
    - LightGlue + SuperPoint
    - LightGlue + ALIKED
    - LightGlue + DISK
    - LightGlue + SIFT
    - LOFTR
    - Deep features of MegaDescriptor-L

Additionally, shortlist is created using MegaDescriptor-L scores. It can be used to significantly speed up the matching pipelines by using only `B` samples from database per query, which are selected based on score in the shortlist.

In [None]:
pipelines = [

    SimilarityPipeline(
        matcher = MatchLightGlue(features='superpoint'),
        extractor = SuperPointExtractor(),
        transform = T.Compose([
            T.Resize([512, 512]),
            T.ToTensor()
        ]),
        calibration = IsotonicCalibration()
    ),

    SimilarityPipeline(
        matcher = MatchLightGlue(features='aliked'),
        extractor = AlikedExtractor(),
        transform = T.Compose([
            T.Resize([512, 512]),
            T.ToTensor()
        ]),
        calibration = IsotonicCalibration()
    ),

    SimilarityPipeline(
        matcher = MatchLightGlue(features='disk'),
        extractor = DiskExtractor(),
        transform = T.Compose([
            T.Resize([512, 512]),
            T.ToTensor()
        ]),
        calibration = IsotonicCalibration()
    ),

    SimilarityPipeline(
        matcher = MatchLightGlue(features='sift'),
        extractor = SiftExtractor(),
        transform = T.Compose([
            T.Resize([512, 512]),
            T.ToTensor()
        ]),
        calibration = IsotonicCalibration()
    ),

    SimilarityPipeline(
        matcher = MatchLOFTR(pretrained='outdoor'),
        extractor = None,
        transform = T.Compose([
            T.Resize([512, 512]),
            T.Grayscale(),
            T.ToTensor(),
        ]),
        calibration = IsotonicCalibration()
    ),

    SimilarityPipeline(
        matcher = CosineSimilarity(),
        extractor = DeepFeatures(
            model = timm.create_model('hf-hub:BVRA/wildlife-mega-L-384', num_classes=0, pretrained=True)
        ),
        transform = T.Compose([
            T.Resize(size=(384, 384)),
            T.ToTensor(),
            T.Normalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225)),
        ]),
        calibration = IsotonicCalibration()
    ),
]


priority_pipeline =  SimilarityPipeline(
    matcher = CosineSimilarity(),
    extractor = DeepFeatures(
        model = timm.create_model('hf-hub:BVRA/wildlife-mega-L-384', num_classes=0, pretrained=True)
    ),
    transform = T.Compose([
        T.Resize(size=(384, 384)),
        T.ToTensor(),
        T.Normalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225)),
    ]),
)

wildfusion = WildFusion(calibrated_pipelines = pipelines, priority_pipeline = priority_pipeline)

In [3]:
wildfusion.fit_calibration(dataset, dataset)

100%|█████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00,  4.06it/s]
100%|█████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00, 11.64it/s]
100%|█████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00,  8.39it/s]
100%|█████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00,  6.11it/s]
100%|█████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00, 10.44it/s]
100%|█████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 32.05it/s]
100%|█████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00,  8.16it/s]
100%|█████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00,  9.49it/s]
100%|█████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 44.09it/s]
100%|█████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00,  

### Basic WildFusion
- Run for all pairs
- Note that there are ones at a diagonal at the query and database that are the same datasets.

In [4]:
wildfusion(dataset, dataset)

100%|█████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00,  8.43it/s]
100%|█████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00,  9.78it/s]
100%|█████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 28.07it/s]
100%|█████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00,  9.76it/s]
100%|█████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00, 10.36it/s]
100%|█████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 26.57it/s]
100%|█████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00,  8.12it/s]
100%|█████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00,  9.56it/s]
100%|█████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 42.97it/s]
100%|█████████████████████████████████████████████████████████████████| 3/3 [00:00<00:00,  

array([[1.00000000e+00, 8.41624476e-01, 8.53761989e-02, 2.58286972e-03],
       [8.45939177e-01, 1.00000000e+00, 2.93104603e-03, 1.28648551e-02],
       [5.72058793e-02, 2.93104603e-03, 1.00000000e+00, 6.89334981e-01],
       [3.01374998e-04, 1.28648551e-02, 6.97637682e-01, 1.00000000e+00]])

### Accelerated WildFusion

In [5]:
wildfusion(dataset, dataset, B=1)

100%|█████████████████████████████████████████████████████████████████| 1/1 [00:12<00:00, 12.78s/it]
100%|█████████████████████████████████████████████████████████████████| 1/1 [00:13<00:00, 13.06s/it]
100%|█████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00, 12.79it/s]
100%|█████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00, 14.07it/s]
100%|█████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 37.05it/s]
100%|█████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00, 12.82it/s]
100%|█████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00, 12.13it/s]
100%|█████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 44.40it/s]
100%|█████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00, 15.36it/s]
100%|█████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00, 1

array([[  1., -inf, -inf, -inf],
       [-inf,   1., -inf, -inf],
       [-inf, -inf,   1., -inf],
       [-inf, -inf, -inf,   1.]], dtype=float32)

In [6]:
wildfusion(dataset, dataset, B=2)

100%|█████████████████████████████████████████████████████████████████| 1/1 [00:12<00:00, 12.98s/it]
100%|█████████████████████████████████████████████████████████████████| 1/1 [00:12<00:00, 12.80s/it]
100%|█████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00, 11.46it/s]
100%|█████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00, 13.94it/s]
100%|█████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 34.92it/s]
100%|█████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00, 18.04it/s]
100%|█████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00, 15.17it/s]
100%|█████████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 33.35it/s]
100%|█████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00, 12.49it/s]
100%|█████████████████████████████████████████████████████████████████| 4/4 [00:00<00:00, 1

array([[1.        , 0.84016925,       -inf,       -inf],
       [0.85628253, 1.        ,       -inf,       -inf],
       [      -inf,       -inf, 1.        , 0.68457514],
       [      -inf,       -inf, 0.69002765, 1.        ]], dtype=float32)