# Reprezentacja sekwencji szkieletowych

- Normalizacja pozycji:
    - np. odjęcie pozycji biodra jako punktu odniesienia (położenie względne),
    - normalizacja skali.
- Radzenie sobie z różną długością sekwencji:
    - przycięcie / uzupełnianie (padding) do ustalonej długości,
    - ewentualnie próbkowanie co N klatek.

Punktem odniesienia został ustawiony punkt pozycji biodra. W COCO punkty biodra są oznaczone indeksami 11 (lewe biodro) oraz 12 (prawe biodro), co jest napisane w wygenerowanych plikach JSON po detekcji.

```json
"meta_info": {
		"dataset_name": "coco",
		"num_keypoints": 17,
		"keypoint_id2name": {
			"0": "nose",
			"1": "left_eye",
			"2": "right_eye",
			"3": "left_ear",
			"4": "right_ear",
			"5": "left_shoulder",
			"6": "right_shoulder",
			"7": "left_elbow",
			"8": "right_elbow",
			"9": "left_wrist",  
			"10": "right_wrist",
			"11": "left_hip",  // <-- lewe biodro
			"12": "right_hip", // <-- prawe biodro
			"13": "left_knee",
			"14": "right_knee",
			"15": "left_ankle",
			"16": "right_ankle"
		},
}
```

Szkielet postaci w detektorze zawiera **17 punktów kluczowych (keypointów)**, które są oznaczone współrzędnymi **[x,y]**. Stąd późniejszy rozmiar (17, 2) np:

```json
"keypoints": [
		[
		205.00148010253906, // <-- X
		322.10467529296875  // <-- Y
		],
		itd...
]
```

In [1]:
import os
import glob
import json
import numpy as np
import random
import pandas as pd
from tqdm import tqdm

Funkcja `normalize_frame` przyjmuje tablice punktów (17, 2) dla jednej klatki.

Zwraca znormalizowane punkty względem środka bioder (średnia arytmetyczna z lewego i prawego biodra).

In [2]:
def normalize_frame(keypoints):
    kps = np.array(keypoints)

    # pozycje bioder
    left_hip = 11
    right_hip = 12

    # pozycja środka bioder
    hip_center = (kps[left_hip] + kps[right_hip]) / 2.0

    # centrownie punktów względem bioder
    centered_kps = kps - hip_center

    # skalowanie - wybieramy najwyżej i najniżej położone keypointy na osi Y jako odniesienie do wyznaczenia wysokości
    min_y = np.min(centered_kps[:, 1])
    max_y = np.max(centered_kps[:, 1])
    height = max_y - min_y + 1e-6 # dodaje bardzo małą wartość aby uniknąć dzielenia przez 0

    normalized_kps = centered_kps / height

    return normalized_kps

Funkcja `load_data` wczytuje sekwencje ...

In [3]:
def load_data(root_dir, fall_csv, adl_csv):
    cols = ['sequence_name', 'frame_number', 'label']
    fall = pd.read_csv(fall_csv, header=None, usecols=[0, 1, 2], names=cols)
    adl = pd.read_csv(adl_csv, header=None, usecols=[0, 1, 2], names=cols)
    df = pd.concat([fall, adl], ignore_index=True)

    keypoints = []
    labels = []
    sequences = []

    # szukanie wszystkich plików json
    search_pattern = os.path.join(root_dir, "*", "*.json")
    json_files = glob.glob(search_pattern)
    print(f"Znaleziono {len(json_files)} plików JSON.")

    # --- pętla przetwarzająca ---
    for json_path in tqdm(json_files, desc="Przetwarzanie plików"):

        filename = os.path.basename(json_path)

    # ---
        seq_name = None
        if "fall-" in filename:
            idx = filename.find("fall-")
            seq_name = filename[idx : idx+7]
        elif 'adl-' in filename:
            idx = filename.find("adl-")
            seq_name = filename[idx : idx+6]

        if not seq_name:
            continue

        seq_df = df[df['sequence_name'] == seq_name]

        if seq_df.empty:
            continue

    # --- wczytanie jsona ---
        try:
            with open(json_path, 'r') as f:
                data = json.load(f)
        except Exception as e:
            print(f"Błąd odczytu {json_path}: {e}")
            continue

    # --- ekstrakcja klatek ---
        if 'instance_info' not in data:
            print(f"Brak pola 'instace_info' w {json_path}")
            continue

        # sortowanie klatek dla pewności
        # frames_data = sorted(data['instance_info'], key=lambda x: x['frame_id'])

        for frame in data['instance_info']:

            frame_id = frame['frame_id']

        # --- dopasowanie etykiety ---
            row = seq_df[seq_df['frame_number'] == frame_id]
            if row.empty:
                continue

            raw_label = row.iloc[0]['label']

            # 0 to 'fall' więc pomijamy zgodnie z instrukcją
            if raw_label == 0:
                continue

            # mapowanie na klasy 0/1
            # jeżeli -1 (postać nie leży) => 0
            # jeżeli 1 (postać leży) => 1
            binary_label = 0 if raw_label == -1 else 1

        # --- ekstrakcja punktów ---
            if not frame.get("instances"):
                continue

            raw_kps = frame['instances'][0]['keypoints'] # zakładamy jedną osobę

            # normalizacja względem bioder
            norm_kps = normalize_frame(raw_kps)

            sequences.append(seq_name)
            keypoints.append(norm_kps)
            labels.append(binary_label)

    return np.array(sequences), np.array(keypoints), np.array(labels)

Uruchomienie + raport

In [4]:
# ścieżka do głównego folderu z wynikami po detekcji
csv_file_fall = "../UR_fall_det/csv/urfall-cam0-falls.csv"
csv_file_adl = "../UR_fall_det/csv/urfall-cam0-adls.csv"
results_folder = "../results"

sequences, X, y = load_data(results_folder, csv_file_fall, csv_file_adl)

print("\n--- RAPORT ---")
print(f"Wczytano {len(X)} sekwencji")

Znaleziono 69 plików JSON.


Przetwarzanie plików: 100%|██████████| 69/69 [00:08<00:00,  8.15it/s]


--- RAPORT ---
Wczytano 9627 sekwencji





Przykładowa sekwencja

> X[X] - klatka **X** wszystkie keypointy

> X[X][Y] - keypointy w stawie **Y** w klatce **X**

> X[X][Y][Z] - keypoint(x,y) **Z** z keypointów **Y** w klatce **X**

In [5]:
rand = random.randint(0, len(X) - 1)
print(f"Kształt danych: {X.shape} (Klatki, Punkty, XY)")

print("\nPrzykładowe znormalizowane punkty (keypointy):")
print("* punkty 11 i 12 powinny być blisko 0 bo to punkty biodra")
print("          X           Y")
for i in range(17):
    print(f"{i}: {X[rand][i]} {('*' if i==11 or i==12 else '')}")

print("\nLosowe 10 klatek z etykietami (0 - stoi, 1 - leży)")
for _ in range(0, 10):
    rand = random.randint(0, len(X) - 1)
    print(f'Klatka[{rand}] | {y[rand]}')

Kształt danych: (9627, 17, 2) (Klatki, Punkty, XY)

Przykładowe znormalizowane punkty (keypointy):
* punkty 11 i 12 powinny być blisko 0 bo to punkty biodra
          X           Y
0: [-0.01785713 -0.44047622] 
1: [ 0.00595233 -0.46428574] 
2: [-0.04166673 -0.46428574] 
3: [ 0.05357138 -0.46428574] 
4: [-0.06547618 -0.46428574] 
5: [ 0.12500004 -0.34523811] 
6: [-0.11309524 -0.33333338] 
7: [ 0.18452374 -0.19047622] 
8: [-0.14880949 -0.17857142] 
9: [ 0.19642854 -0.03571425] 
10: [-0.17261909 -0.0238096 ] 
11: [0.07738098 0.        ] *
12: [-0.07738098  0.        ] *
13: [0.06547618 0.27380953] 
14: [-0.08928578  0.26190472] 
15: [0.05357138 0.5       ] 
16: [-0.08928578  0.53571425] 

Losowe 10 klatek z etykietami (0 - stoi, 1 - leży)
Klatka[5353] | 1
Klatka[2405] | 0
Klatka[5939] | 1
Klatka[2827] | 0
Klatka[2307] | 0
Klatka[3570] | 0
Klatka[2991] | 0
Klatka[241] | 0
Klatka[5205] | 0
Klatka[3030] | 0


In [7]:
target_seq = random.choice(sequences)
mask = (sequences == target_seq)
X_adl = X[mask]

print(f"Sekwencja: {target_seq}")
print(f"Długość sekwencji: {len(X_adl)} klatek")
print(f"Kształt sekwencji: {X_adl.shape} (Klatki, Punkty, XY)")

Sekwencja: adl-11
Długość sekwencji: 261 klatek
Kształt sekwencji: (261, 17, 2) (Klatki, Punkty, XY)


In [11]:
print("Zapisywanie datasetu...")
np.savez_compressed('../data/dataset_urfall.npz', X=X, y=y, sequences=sequences)
print("Gotowe! Plik 'dataset_urfall.npz' został utworzony w folderze ../data.")

Zapisywanie datasetu...
Gotowe! Plik 'dataset_urfall.npz' został utworzony w folderze ../data.
