Python library : torch_crosscor

The torch_crosscorr library provides a fast implementation of ZNCC for calculating the normalized cross-correlation between one real image and one another on PyTorch.

We provide 3 differents ways to compute the ZNCC, depending on your needs :

Using spatial PyTorch convolution (Spatial)
Using the hadamard product in the frequency domain (FFT)
Using a naive approach that makes the scalar product on the unfolded image

The normalization can be made using the Lewis technique which consists to compute the denominator using integral images which reduces a lot the complexity of the algorithm.

Computation time :

~3.23 ms (FFT)
~1.43 s (Spatial) (x442 faster)
~2.37 s (Naive) (x734 faster)

Check speed comparison at the end of this readme.

References :

Lewis, J.P.. (1994). Fast Template Matching. Vis. Interface. 95. - https://www.researchgate.net/publication/242325076_Fast_Template_Matching

Install library

%%bash
if !python -c "import torch_crosscor" 2>/dev/null; then
    pip install https://github.com/Simon-Bertrand/FastCrossCorr-PyTorch/archive/main.zip
fi

Import library

import torch_crosscorr

�[1m[�[0m�[34;49mnotice�[0m�[1;39;49m]�[0m�[39;49m A new release of pip is available: �[0m�[31;49m23.2.1�[0m�[39;49m -> �[0m�[32;49m24.0�[0m
�[1m[�[0m�[34;49mnotice�[0m�[1;39;49m]�[0m�[39;49m To update, run: �[0m�[32;49mpip install --upgrade pip�[0m

!pip install -q matplotlib torchvision
import torch
import matplotlib.pyplot as plt

def imshow(im):
    if len(im.shape) == 4:
        im = im[0]
    fig, axes = plt.subplots(1, im.size(0), figsize=(12, 4))
    for ax, imC in zip(axes, im):
        im_ = ax.imshow(imC, cmap="gray")
        ax.yaxis.set_visible(False)
    fig.subplots_adjust(right=0.8)
    cbar_ax = fig.add_axes([0.85, 0.15, 0.05, 0.7])
    fig.colorbar(im_, cax=cbar_ax)
    plt.show()


i, j = 65, 40
sizeX, sizeY = 58, 58
im = torch.randn(1, 3, 256, 256, dtype=torch.float64)
imT = im[:, :, i - sizeX // 2 : i + sizeX // 2 + 1, j - sizeY // 2 : j + sizeY // 2 + 1]

CHECK EQUALITY BETWEEN METHODS

for normalize in ["ncorr", "corr"]:
    for modeTest in [("fft", "spatial"), ("naive", "spatial"), ("fft", "naive")]:
        print(f"Method : {normalize} {modeTest}")
        print(
            "Max L1 distance : ",
            (
                torch_crosscorr.FastNormalizedCrossCorrelation(normalize, modeTest[0])(im, imT)
                - torch_crosscorr.FastNormalizedCrossCorrelation(normalize, modeTest[1])(im, imT)
            )
            .abs()
            .max()
            .item(),
        )
        print("{:=^45}".format(""))

Method : ncorr ('fft', 'spatial')
Max L1 distance :  1.3322676295501878e-15
=============================================
Method : ncorr ('naive', 'spatial')
Max L1 distance :  1.3322676295501878e-15
=============================================
Method : ncorr ('fft', 'naive')
Max L1 distance :  2.220446049250313e-16
=============================================
Method : corr ('fft', 'spatial')
Max L1 distance :  4.547473508864641e-12
=============================================
Method : corr ('naive', 'spatial')
Max L1 distance :  4.547473508864641e-12
=============================================
Method : corr ('fft', 'naive')
Max L1 distance :  9.094947017729282e-13
=============================================

LOAD IMAGE AND TEST IF RANDOM EXTRACTED CENTER POSITIONS ARE CORRECTLY FOUND

Install notebook dependencies

!pip install -q requests
import requests

�[1m[�[0m�[34;49mnotice�[0m�[1;39;49m]�[0m�[39;49m A new release of pip is available: �[0m�[31;49m23.2.1�[0m�[39;49m -> �[0m�[32;49m24.0�[0m
�[1m[�[0m�[34;49mnotice�[0m�[1;39;49m]�[0m�[39;49m To update, run: �[0m�[32;49mpip install --upgrade pip�[0m

Load Mandrill image

import tempfile
import torchvision
import torch.nn.functional as F

with tempfile.NamedTemporaryFile() as fp:
    fp.write(requests.get("https://upload.wikimedia.org/wikipedia/commons/a/ab/Mandrill-k-means.png").content)
    im = F.interpolate((torchvision.io.read_image(fp.name, torchvision.io.ImageReadMode.RGB).unsqueeze(0)
    .to(torch.float64)
    .div(255)), size=(256, 256), mode='bicubic', align_corners=False)

Run multiple tests to check if random crop center is correclty found by the ZNCC.

import random
success = 0
failed = 0
pts = []
for _ in range(500):
    imH = random.randint(64, 128)
    imW = random.randint(64, 128)
    i = random.randint(imH // 2 + 1, im.size(-2) - imH // 2 - 1)
    j = random.randint(imW // 2 + 1, im.size(-1) - imW // 2 - 1)

    imT = im[:, :, i - imH // 2 : i + imH // 2 + 1, j - imW // 2 : j + imW // 2 + 1]
    if (
        (
            torch_crosscorr.FastNormalizedCrossCorrelation.findArgmax(
                torch_crosscorr.FastNormalizedCrossCorrelation("ncorr", "fft")(im, imT)
            )
            - torch.Tensor([[[i]], [[j]]])
        ).abs()
        < 3
    ).all():
        pts += [
            dict(
                i=i,
                imH=imH,
                imW=imW,
                j=j,
                success=True,
            )
        ]
        success += 1
    else:
        pts += [
            dict(
                i=i,
                imH=imH,
                imW=imW,
                j=j,
                success=False,
            )
        ]
        failed += 1

plt.imshow(im[0].moveaxis(0, -1))
ax = plt.gca()
for pt in pts:
    ax.add_patch(
        plt.Rectangle(
            (pt["j"] - pt["imW"] // 2, pt["i"] - pt["imH"] // 2),
            pt["imW"],
            pt["imH"],
            edgecolor="g" if pt["success"] else "r",
            facecolor="none",
            linewidth=0.5,
        )
    )

Clipping input data to the valid range for imshow with RGB data ([0..1] for floats or [0..255] for integers).

Total errors :

dict(success=success, failed=failed)

{'success': 500, 'failed': 0}

SPEEDTEST

%timeit torch_crosscorr.FastNormalizedCrossCorrelation("ncorr","fft")(im, imT)
%timeit torch_crosscorr.FastNormalizedCrossCorrelation("ncorr","spatial")(im, imT)
%timeit torch_crosscorr.FastNormalizedCrossCorrelation("ncorr", "naive")(im, imT)

3.23 ms ± 443 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
1.43 s ± 10.8 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
2.37 s ± 22.8 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
figs		figs
torch_crosscorr		torch_crosscorr
.gitignore		.gitignore
LICENSE		LICENSE
README.ipynb		README.ipynb
README.md		README.md
generate_readme.sh		generate_readme.sh
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

figs

figs

torch_crosscorr

torch_crosscorr

.gitignore

.gitignore

LICENSE

LICENSE

README.ipynb

README.ipynb

README.md

README.md

generate_readme.sh

generate_readme.sh

pyproject.toml

pyproject.toml

requirements.txt

requirements.txt

Repository files navigation

Python library : torch_crosscor

References :

Install library

Import library

CHECK EQUALITY BETWEEN METHODS

LOAD IMAGE AND TEST IF RANDOM EXTRACTED CENTER POSITIONS ARE CORRECTLY FOUND

SPEEDTEST

About

Releases

Packages

Contributors 2

Languages

License

Simon-Bertrand/FastCrossCorr-PyTorch

Folders and files

Latest commit

History

Repository files navigation

Python library : torch_crosscor

References :

Install library

Import library

CHECK EQUALITY BETWEEN METHODS

LOAD IMAGE AND TEST IF RANDOM EXTRACTED CENTER POSITIONS ARE CORRECTLY FOUND

SPEEDTEST

About

Resources

License

Stars

Watchers

Forks

Languages