# Caricamento del dataset Pen


Il task "pen" richiede a una mano robotica (Adroit Hand) di manipolare una penna per portarla in una certa orientazione nello spazio. Il seguente notebook si propone di osservare il comportamento quando viene tolta la possibilità alla mano di muovere le dita di medio, anulare e mignolo e anche bloccare le osservazioni su tali dita.

Se si volesse far sì che le dita non compaiano affatto nel simulatore, sarebbe necessario lavorare sui file xml di Adroit.

In [1]:
import minari
import gymnasium as gym
from gymnasium.wrappers import TransformAction, TransformObservation
import time

# Carica il dataset
dataset = minari.load_dataset("D4RL/pen/expert-v2")

# Recupera e memorizza tutti gli episodi in una lista
episodes = list(dataset.iterate_episodes())

In [2]:
# actions:
# ┌────────────┬──────────────┐
# │ Parte      │ Indici       │
# ├────────────┼──────────────┤
# │ Polso      │ 0–1          │
# │ Indice     │ 2–5          │
# │ Medio      │ 6–9          │
# │ Anulare    │ 10–13        │
# │ Mignolo    │ 14–18        │
# │ Pollice    │ 19–23        │
# └────────────┴──────────────┘

# observations:
# ┌──────────────────────────────┬──────────────┐
# │ Parte                        │ Indici       │
# ├──────────────────────────────┼──────────────┤
# │ Polso                        │ 0–1          │
# │ Indice                       │ 2–5          │
# │ Medio                        │ 6–9          │
# │ Anulare                      │ 10–13        │
# │ Mignolo                      │ 14–18        │
# │ Pollice                      │ 19–23        │
# │ Posizione penna (x, y, z)    │ 24–26        │
# │ Velocità penna (lin. + ang.) │ 27–32        │
# │ Rotazione penna (relativa)   │ 33–35        │
# │ Rotazione target (relativa)  │ 36–38        │
# │ Distanza penna-target (lin.) │ 39–41        │
# │ Distanza penna-target (rot.) │ 42–44        │
# └──────────────────────────────┴──────────────┘


def transform_action(action):
    action = action.copy()
    action[6:18] = 0
    return action

def transform_observation(observation):
    observation

In [3]:

# Crea l'ambiente con render e seed fisso
env = dataset.recover_environment(render_mode="human", camera_id=4)
env = TransformAction(env, transform_action, env.action_space)
env = TransformObservation(env, transform_observation, env.observation_space)

#print(env.unwrapped.model.opt.gravity[:])


In [4]:
# Seleziona sempre lo stesso episodio
episode = episodes[22]

env.reset(seed=150)

total_reward = 0
for action in episode.actions:
    _, reward, _, _, _ = env.step(action)
    time.sleep(0.01)
    total_reward += reward

print(f"Total reward: {total_reward}")
env.close()

2025-04-10 18:02:49.367 python[62890:984943] +[IMKClient subclass]: chose IMKClient_Modern
2025-04-10 18:02:49.367 python[62890:984943] +[IMKInputSession subclass]: chose IMKInputSession_Modern


Total reward: 18.178865544942582
