In [1]:
import os 
import numpy as np
import tifffile

In [2]:
def class_counter(dir, keyword, num_classes):
    class_counts = np.zeros(num_classes, dtype=np.uint64)
    
    # Przejście przez wszystkie pliki w katalogu
    for filename in os.listdir(dir):
        if filename.endswith('.tif') and keyword in filename:
            # Wczytanie obrazu maski TIFF
            filepath = os.path.join(dir, filename)
            mask = tifffile.imread(filepath)
            
            # Zliczanie wystąpień każdej klasy
            unique_classes, counts = np.unique(mask, return_counts=True)
            for c, count in zip(unique_classes, counts):
                if c < num_classes:
                    class_counts[c] += count
    
    return class_counts

In [3]:
# Ścieżka do katalogu z maskami TIFF
dir = r'F:\mgr_datasets\multi_newclass\training_chips'

# Słowo kluczowe, które występuje w nazwach plików mask
keyword = 'mask'

# Liczba klas
num_classes = 14

# Obliczenie wystąpień każdej klasy
class_occurrences = class_counter(dir, keyword, num_classes)

# Wydrukowanie wyników
for class_index, count in enumerate(class_occurrences):
    print(f'Klasa {class_index}: {count} wystąpień')

Klasa 0: 11399470 wystąpień
Klasa 1: 17768757 wystąpień
Klasa 2: 8551902 wystąpień
Klasa 3: 8673157 wystąpień
Klasa 4: 1033720 wystąpień
Klasa 5: 1676721 wystąpień
Klasa 6: 610730 wystąpień
Klasa 7: 932940 wystąpień
Klasa 8: 2725008 wystąpień
Klasa 9: 788181 wystąpień
Klasa 10: 735117 wystąpień
Klasa 11: 1015481 wystąpień
Klasa 12: 2428988 wystąpień
Klasa 13: 38850740 wystąpień


In [4]:
def calculate_class_weights(class_occurrences):
    total_occurrences = np.sum(class_occurrences)
    class_weights = total_occurrences / (class_occurrences * len(class_occurrences))
    class_weights /= np.sum(class_weights)  # Normalizacja, aby suma wag wynosiła 1
    return class_weights

# Liczba wystąpień każdej klasy
# class_occurrences = np.array([9219318, 17760950, 6591864, 8669221, 1957130, 1676721, 610543, 932940, 2725008, 788181, 735117, 1015481, 5617606, 38840656])

# Obliczenie wag klas
class_weights = calculate_class_weights(class_occurrences)
class_weights=class_weights*14

# Wydrukowanie wyników
for class_index, weight in enumerate(class_weights):
    print(f'Klasa {class_index}: Waga = {weight:.6f}')

Klasa 0: Waga = 0.135443
Klasa 1: Waga = 0.086893
Klasa 2: Waga = 0.180542
Klasa 3: Waga = 0.178017
Klasa 4: Waga = 1.493609
Klasa 5: Waga = 0.920829
Klasa 6: Waga = 2.528079
Klasa 7: Waga = 1.654955
Klasa 8: Waga = 0.566594
Klasa 9: Waga = 1.958907
Klasa 10: Waga = 2.100310
Klasa 11: Waga = 1.520436
Klasa 12: Waga = 0.635645
Klasa 13: Waga = 0.039741


In [5]:
for _, weight in enumerate(class_weights):
    print(f'{weight:.6f},')

0.135443,
0.086893,
0.180542,
0.178017,
1.493609,
0.920829,
2.528079,
1.654955,
0.566594,
1.958907,
2.100310,
1.520436,
0.635645,
0.039741,
