#

near-duplicate-detection

Here are 14 public repositories matching this topic...

sayakpaul / near-dup-parser

Holds code for near-duplicate image parser using optimized image classifiers.

tensorflow keras bit lsh vision tensorrt vector-similarity random-projection near-duplicate-detection bit-resnet

Updated Sep 16, 2021
Jupyter Notebook

SasheVuchkov / near-duplicate-docs

Simple library for finding duplicate and near-duplicate text documents in massive sets/libraries/databases

jaccard-similarity similarity-search near-duplicates near-duplicate-detection

Updated Jan 17, 2022
TypeScript

giulio-derasmo / Search-Engine-Evaluation-and-Near-Duplicate-Detection

Exploiting the PyTerrier library to build a Search Engine and resolve the Near Duplicate Detection tasks.

python search-engine data-mining lsh locality-sensitive-hashing search-engine-optimization near-duplicate-detection pyterrier

Updated Sep 20, 2022
Jupyter Notebook

LexCybermac / smlr

A Simple Image Clustering Script using CLIP and Hierarchial Clustering

clustering clip dataset-management near-duplicate-detection

Updated Apr 27, 2023
Python

MaviVestini / ADM-LT_HW1

First homework for the Advance Data Mining course

search-engine minhash-lsh-algorithm near-duplicate-detection

Updated Feb 13, 2024
HTML

vitali-fedulov / imagehash

Fast image similarity search with hash tables (Golang). Version 1

similarity image-hash image-hashing similarity-search image-similarity near-duplicate similarity-detection similar-images near-duplicate-detection

Updated Mar 30, 2024
Go

vitali-fedulov / images4

Image similarity in Golang. Version 4 (LATEST)

image-hash image-deduplication image-hashing-algorithms image-similarity similar-images near-duplicate-detection

Updated Apr 6, 2024
Go

iscc-specs

iscc / iscc-specs

ISCC: International Standard Content Code

identifiers perceptual-hashes media-identifiers content-identification near-duplicate-detection

Updated Apr 30, 2024
Python

Logan-Fouts / Thesis

Bachelor's Thesis on Near-Duplicate Image Detection. This repo contains all resources, code, and documentation developed during the process.

machine-learning thesis-project near-duplicate-detection

Updated May 22, 2024
Python

vitali-fedulov / imagehash2

Fast image similarity search with hash tables (Golang). Version 2 (LATEST)

similarity image-hash image-hashing similarity-search image-similarity near-duplicate similarity-detection similar-images near-duplicate-detection

Updated Sep 3, 2024
Go

kamil-sita / image-copy-finder

Multi module project focused on near-duplicate search for images.

Updated Oct 5, 2024
Java

s-emanuilov / LangVec

Language of Vectors (LangVec) is a simple Python library designed for transforming numerical vector data into a language-like structure using a predefined set of words (lexicon).

similarity-measures similarity-search duplicate-detection near-duplicate-detection semantic-search-ai

Updated Oct 7, 2024
Python

blackmonk13 / looks_like_it

an application for comparing images using various image hashing algorithms

dart cross-platform image-processing pattern-recognition image-comparison flutter linux-app image-analysis visual-search windows-app duplicate-detection image-hashing-algorithms image-similarity imagehash flutter-ui flutter-app riverpod average-hash-algorithm near-duplicate-detection

Updated Oct 15, 2024
Dart

justinbt1 / Akin

Python library for detecting near duplicate texts in a corpus at scale using Locality Sensitive Hashing, as described in chapter three of Mining Massive Datasets.

text-similarity minhash locality-sensitive-hashing text-processing deduplication near-duplicate-detection

Updated Oct 19, 2024
Python

Improve this page

Add a description, image, and links to the near-duplicate-detection topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the near-duplicate-detection topic, visit your repo's landing page and select "manage topics."