# **Пример работы с Hash:**

### **Hash** - класс для сравнения датасетов с помощью хэшей.

## **Инициализация объектов**

```python
def __init__(
    self, 
    Dataset1: Dataset, 
    Dataset2: Dataset, 
    results_path: str = ""
):
```

**Параметры:**
- **Dataset1**: объект класса Dataset с первым датасетом.
- **Dataset2**: объект класса Dataset со вторым датасетом.
- **results_path**: путь для сохранения файлов .csv с результатами.

In [1]:
from visdatcompy import Dataset, Hash

# Создаём два объекта с датасетами
dataset1 = Dataset(r"../datasets/drone")
dataset2 = Dataset(r"../datasets/drone")

# Выводим краткую информацию для проверки
dataset1.info()
dataset2.info()

hash = Hash(dataset1, dataset2, results_path = "../results/hash")
# results_path - путь для сохранения файлов .csv с результатами.


[V] Dataset Information:
[%] Название датасета: drone
[%] Количество изображений: 11
[%] Путь к датасету: ../datasets/drone


[V] Dataset Information:
[%] Название датасета: drone
[%] Количество изображений: 11
[%] Путь к датасету: ../datasets/drone



## **Методы**

### **1. find_similars() - метод для поиска пар схожих изображений**

```python
def find_similars(
        compare_method: str = "average",
        return_df: bool = True,
        to_csv: bool = False,
        echo: bool = False,
    ):
```

**Параметры:**
- **compare_method (str)**: метод сравнения.
- **to_csv (bool)**: опция экспорта результатов в csv файл.
- **echo (bool)**: логирование в консоль.

**Возвращает:**
- **pd.DataFrame**: пары схожих изображений.

#### **Флаги методов compare_method**

| Характеристика     | Флаг              | Описание                                                                                                                                          |
| ------------------ | ----------------- | ------------------------------------------------------------------------------------------------------------------------------------------------- |
| AverageHash        | "average"         | Рассчитывает хэш-значение на основе среднего значения пикселей, быстрый алгоритм хэширования изображений, но подходит только для простых случаев. |
| PHash              | "p"               | Улучшенная версия AverageHash, медленнее чем AverageHash, но может адаптироваться к более широкому спектру ситуаций.                              |
| MarrHildrethHash   | "marr_hildreth"   | Значение хэша рассчитывается на основе оператора граней Марра-Хилдрета, что является самым медленным, но более дискриминативным методом.          |
| RadialVarianceHash | "radial_variance" | Рассчитывает хэш-значение на основе преобразования Радона.                                                                                        |
| BlockMeanHash      | "block_mean"      | Рассчитывает хэш-значение на основе среднего значения блоков, представленного в том же статье, что и MarrHildrethHash.                            |
| ColorMomentHash    | "color_moment"    | Рассчитывает хэш-значение на основе моментов цвета, представленного в той же статье, что и RadialVarianceHash.                                    |

#### **Пример использования**

In [2]:
hash.find_similars(compare_method='p', echo=True)


[$] Сравнение [0_1.jpg - 0_2.jpg]: Хэш: 38.0
[$] Сравнение [0_1.jpg - 0_3.jpg]: Хэш: 33.0
[$] Сравнение [0_1.jpg - 0_4.jpg]: Хэш: 29.0
[$] Сравнение [0_1.jpg - 1_1.jpg]: Хэш: 32.0
[$] Сравнение [0_1.jpg - 1_2.jpg]: Хэш: 40.0
[$] Сравнение [0_1.jpg - 1_3.jpg]: Хэш: 26.0
[$] Сравнение [0_1.jpg - 2_1.jpg]: Хэш: 22.0
[$] Сравнение [0_1.jpg - 2_2.jpg]: Хэш: 29.0
[$] Сравнение [0_1.jpg - 2_3.jpg]: Хэш: 29.0
[$] Сравнение [0_1.jpg - 2_4.jpg]: Хэш: 30.0
[$] Сравнение [0_1.jpg - 3_1.jpg]: Хэш: 30.0
[$] Сравнение [0_1.jpg - 3_2.jpg]: Хэш: 39.0
[$] Сравнение [0_1.jpg - 3_3.jpg]: Хэш: 33.0
[$] Сравнение [0_1.jpg - 3_4.jpg]: Хэш: 36.0
[$] Сравнение [0_1.jpg - 4_1.jpg]: Хэш: 34.0
[$] Сравнение [0_1.jpg - 4_2.jpg]: Хэш: 26.0
[$] Сравнение [0_1.jpg - 5_1.jpg]: Хэш: 34.0
[$] Сравнение [0_1.jpg - 5_2.jpg]: Хэш: 25.0
[$] Сравнение [0_1.jpg - 5_3.jpg]: Хэш: 27.0
[$] Сравнение [0_1.jpg - 5_4.jpg]: Хэш: 32.0
[$] Сравнение [0_1.jpg - 5_5.jpg]: Хэш: 30.0
[$] Сравнение [0_1.jpg - 5_6.jpg]: Хэш: 26.0
[$] Сравн

Unnamed: 0,similar_image_name
0_1.jpg,2_1.jpg
0_2.jpg,0_4.jpg
0_3.jpg,2_3.jpg
0_4.jpg,0_2.jpg
1_1.jpg,1_3.jpg
1_2.jpg,1_1.jpg
1_3.jpg,1_1.jpg
2_1.jpg,0_1.jpg
2_2.jpg,0_2.jpg
2_3.jpg,3_1.jpg


### **hash_matrix() - метод для создания матрицы сравнения двух датасетов**

```python
def hash_matrix(
        compare_method: str = "average",
        return_df: bool = True,
        to_csv: bool = False,
        echo: bool = False,
):
```

**Параметры:**
- **compare_method (str)**: метод сравнения.
- **return_df (bool)**: опция возвращения результата.
- **to_csv (bool)**: опция экспорта результатов в csv файл.
- **echo (bool)**: логирование в консоль.

**Возвращает:**
- **pd.DataFrame**: пары схожих изображений.

```python
def find_similars(
        compare_method: str = "average",
        return_df: bool = True,
        to_csv: bool = False,
        echo: bool = False,
):
```

**Параметры:**
- **compare_method (str)**: метод сравнения.
- **to_csv (bool)**: опция экспорта результатов в csv файл.
- **echo (bool)**: логирование в консоль.

**Возвращает:**
- **Optional(pd.DataFrame, None)**: пары схожих изображений или None.

#### **Пример использования**

In [5]:
hash.matrix(echo=True)


[$] Сравнение [0_1.jpg - 0_1.jpg]: Хэш: 0.0
[$] Сравнение [0_1.jpg - 0_2.jpg]: Хэш: 23.0
[$] Сравнение [0_1.jpg - 0_3.jpg]: Хэш: 25.0
[$] Сравнение [0_1.jpg - 0_4.jpg]: Хэш: 20.0
[$] Сравнение [0_1.jpg - 1_1.jpg]: Хэш: 29.0
[$] Сравнение [0_1.jpg - 1_2.jpg]: Хэш: 30.0
[$] Сравнение [0_1.jpg - 1_3.jpg]: Хэш: 31.0
[$] Сравнение [0_1.jpg - 2_1.jpg]: Хэш: 34.0
[$] Сравнение [0_1.jpg - 2_2.jpg]: Хэш: 29.0
[$] Сравнение [0_1.jpg - 2_3.jpg]: Хэш: 31.0
[$] Сравнение [0_1.jpg - 2_4.jpg]: Хэш: 27.0
[$] Сравнение [0_1.jpg - 3_1.jpg]: Хэш: 32.0
[$] Сравнение [0_1.jpg - 3_2.jpg]: Хэш: 30.0
[$] Сравнение [0_1.jpg - 3_3.jpg]: Хэш: 31.0
[$] Сравнение [0_1.jpg - 3_4.jpg]: Хэш: 31.0
[$] Сравнение [0_1.jpg - 4_1.jpg]: Хэш: 30.0
[$] Сравнение [0_1.jpg - 4_2.jpg]: Хэш: 24.0
[$] Сравнение [0_1.jpg - 5_1.jpg]: Хэш: 42.0
[$] Сравнение [0_1.jpg - 5_2.jpg]: Хэш: 42.0
[$] Сравнение [0_1.jpg - 5_3.jpg]: Хэш: 28.0
[$] Сравнение [0_1.jpg - 5_4.jpg]: Хэш: 22.0
[$] Сравнение [0_1.jpg - 5_5.jpg]: Хэш: 29.0
[$] Сравне

Unnamed: 0,0_1.jpg,0_2.jpg,0_3.jpg,0_4.jpg,1_1.jpg,1_2.jpg,1_3.jpg,2_1.jpg,2_2.jpg,2_3.jpg,...,3_3.jpg,3_4.jpg,4_1.jpg,4_2.jpg,5_1.jpg,5_2.jpg,5_3.jpg,5_4.jpg,5_5.jpg,5_6.jpg
0_1.jpg,0.0,23.0,25.0,20.0,29.0,30.0,31.0,34.0,29.0,31.0,...,31.0,31.0,30.0,24.0,42.0,42.0,28.0,22.0,29.0,29.0
0_2.jpg,23.0,0.0,28.0,27.0,24.0,31.0,34.0,25.0,34.0,24.0,...,32.0,34.0,21.0,21.0,37.0,31.0,39.0,23.0,32.0,32.0
0_3.jpg,25.0,28.0,0.0,25.0,28.0,31.0,28.0,29.0,26.0,26.0,...,32.0,30.0,21.0,23.0,31.0,35.0,25.0,27.0,38.0,30.0
0_4.jpg,20.0,27.0,25.0,0.0,25.0,30.0,31.0,24.0,37.0,33.0,...,33.0,31.0,26.0,24.0,34.0,40.0,32.0,28.0,37.0,35.0
1_1.jpg,29.0,24.0,28.0,25.0,0.0,27.0,26.0,31.0,30.0,26.0,...,32.0,32.0,25.0,27.0,37.0,29.0,35.0,27.0,36.0,32.0
1_2.jpg,30.0,31.0,31.0,30.0,27.0,0.0,31.0,24.0,29.0,29.0,...,37.0,29.0,28.0,30.0,42.0,38.0,32.0,32.0,31.0,31.0
1_3.jpg,31.0,34.0,28.0,31.0,26.0,31.0,0.0,35.0,34.0,26.0,...,28.0,26.0,35.0,31.0,29.0,31.0,27.0,35.0,40.0,38.0
2_1.jpg,34.0,25.0,29.0,24.0,31.0,24.0,35.0,0.0,35.0,31.0,...,35.0,29.0,22.0,24.0,36.0,34.0,34.0,30.0,31.0,37.0
2_2.jpg,29.0,34.0,26.0,37.0,30.0,29.0,34.0,35.0,0.0,28.0,...,32.0,38.0,31.0,31.0,31.0,31.0,25.0,27.0,36.0,28.0
2_3.jpg,31.0,24.0,26.0,33.0,26.0,29.0,26.0,31.0,28.0,0.0,...,20.0,22.0,25.0,23.0,35.0,27.0,37.0,37.0,44.0,30.0
