In [20]:
import os
import scipy.io as sio
import json

def count_people_in_shanghaitech(images_dir, annotations_dir, output_json_path):
    """
    Przetwarza zbiór ShanghaiTech, zapisując liczbę osób na każdym zdjęciu w pliku JSON.
    
    Args:
        images_dir (str): Ścieżka do folderu z obrazami (.jpg).
        annotations_dir (str): Ścieżka do folderu z adnotacjami (.mat).
        output_json_path (str): Ścieżka do pliku JSON, który zapisze {nazwa_zdjęcia: liczba_osób}.
    """
    image_counts = {}
    
    for img_name in os.listdir(images_dir):
        if not img_name.endswith('.jpg'):
            continue
        
        # Wczytaj adnotacje (punkty osób)
        mat_path = os.path.join(annotations_dir, 'GT_' + img_name.replace('.jpg', '.mat')).replace("\\", "/")
        mat = sio.loadmat(mat_path)
        points = mat['image_info'][0][0][0][0][0]  # Struktura plików .mat w ShanghaiTech
        
        # Liczba osób = liczba punktów
        num_people = len(points)
        image_counts[img_name] = num_people
    
    # Zapisz wynik w JSON
    with open(output_json_path, 'w') as f:
        json.dump(image_counts, f, indent=4)
    
    print(f"Zapisano liczbę osób dla {len(image_counts)} zdjęć w: {output_json_path}")

# Przykład użycia:
count_people_in_shanghaitech(
    images_dir="ShanghaiTech/part_B/train_data/images",
    annotations_dir="ShanghaiTech/part_B/train_data/ground-truth",
    output_json_path="ShanghaiTech_train_people_counts.json"
)

count_people_in_shanghaitech(
    images_dir="ShanghaiTech/part_B/test_data/images",
    annotations_dir="ShanghaiTech/part_B/test_data/ground-truth",
    output_json_path="ShanghaiTech_test_people_counts.json"
)

Zapisano liczbę osób dla 400 zdjęć w: ShanghaiTech_train_people_counts.json
Zapisano liczbę osób dla 316 zdjęć w: ShanghaiTech_test_people_counts.json


In [None]:
import torch
from torch.utils.data import Dataset
from PIL import Image
import json
import os

class ShanghaiTechDataset(Dataset):
    def __init__(self, images_dir, json_counts_path, transform=None):
        self.images_dir = images_dir
        self.transform = transform
        
        with open(json_counts_path, 'r') as f:
            self.counts = json.load(f)
        
        self.image_names = list(self.counts.keys())
    
    def __len__(self):
        return len(self.image_names)
    
    def __getitem__(self, idx):
        img_name = self.image_names[idx]
        img_path = os.path.join(self.images_dir, img_name)
        
        image = Image.open(img_path).convert('RGB')
        if self.transform:
            image = self.transform(image)
        
        num_people = self.counts[img_name]
        return image, torch.tensor(num_people, dtype=torch.float32)  # float32 dla regresji

# Przykład użycia:
dataset = ShanghaiTechDataset(
    images_dir="path/to/shanghaitech/images",
    json_counts_path="shanghaitech_people_counts.json",
    transform=torchvision.transforms.ToTensor()  # Można dodać augmentację
)

dataloader = torch.utils.data.DataLoader(dataset, batch_size=32, shuffle=True)