In [1]:
import numpy as np
import quaternion
import torch as T
import mujoco

from gymnasium.spaces import Space

from unitree_robot.train.environments import Go2Env, MujocoEnv
from unitree_robot.train.training import Trainer
from unitree_robot.train.experiments import StandUpExperiment

In [8]:
MJCF_PATH = "./external/unitree_mj_models/go2/scene.xml"
SEED = 0
DEVICE = "cuda:0"
BODY_ANGLE_REWARD_SCALE = 1.0
BODY_HEIGHT_REWARD_SCALE = 1.0
ENERGY_REWARD_SCALE = 1.0
JOINT_LIMIT_REWARD_SCALE = 1.0

SIM_FRAMES_PER_STEP = 5 # number of frames that are simulated between each 'decision step' by the network
TRAIN_EPOCHS = 100

NETWORK_HIDDEN_SIZE = 16
UNROLL_LENGTH = 512 # number of actions taken in the environment (inbetween these actions there are SIM_FRAMES_PER_STEP steps of simulation)
NUM_UNROLLS = 4 # number of full unrolls to collect training samples
MINIBATCH_SIZE = 64 # the sequence length that is trained on (UNROLL_LENGTH has to be divisible by this number)
TRAIN_BATCH_SIZE = 8 # the number of sequences that are used for a single training step (all batches are used in one epoch)

In [9]:
np.random.seed(seed=SEED)

experiment=StandUpExperiment(
    body_name = "base_link",
    body_angle_reward_scale = BODY_ANGLE_REWARD_SCALE,
    body_height_reward_scale = BODY_HEIGHT_REWARD_SCALE,
    energy_reward_scale = ENERGY_REWARD_SCALE,
    joint_limit_reward_scale = JOINT_LIMIT_REWARD_SCALE
)

env = Go2Env(
    model_path = MJCF_PATH,
    sim_frames_per_step = SIM_FRAMES_PER_STEP,
    experiment = experiment
)


trainer = Trainer(
    env=env,
    device=DEVICE,
    network_hidden_size=NETWORK_HIDDEN_SIZE,
    rng_seed=SEED
)

Trainer: device set to gpu (cuda) !


In [10]:
trainer.train(
    epochs=TRAIN_EPOCHS,
    unroll_length=UNROLL_LENGTH,
    num_unrolls=NUM_UNROLLS,
    minibatch_size=MINIBATCH_SIZE,
    train_batch_size=TRAIN_BATCH_SIZE
)

epoch: 0


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:08<00:00,  2.05s/it]


	loss -> [ 0.21330389380455017 ]
epoch: 1


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.93s/it]


	loss -> [ 0.1850176304578781 ]
epoch: 2


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:10<00:00,  2.58s/it]


	loss -> [ 0.15733372420072556 ]
epoch: 3


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:10<00:00,  2.51s/it]


	loss -> [ 0.23617511242628098 ]
epoch: 4


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:08<00:00,  2.08s/it]


	loss -> [ 0.2519177868962288 ]
epoch: 5


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.93s/it]


	loss -> [ 0.23780903965234756 ]
epoch: 6


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.77s/it]


	loss -> [ 0.20171912014484406 ]
epoch: 7


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.86s/it]


	loss -> [ 0.18587236106395721 ]
epoch: 8


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.57s/it]


	loss -> [ 0.2676638811826706 ]
epoch: 9


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.65s/it]


	loss -> [ 0.26279520988464355 ]
epoch: 10


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.59s/it]


	loss -> [ 0.24106590449810028 ]
epoch: 11


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.59s/it]


	loss -> [ 0.22563975304365158 ]
epoch: 12


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:05<00:00,  1.45s/it]


	loss -> [ 0.1910305619239807 ]
epoch: 13


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.54s/it]


	loss -> [ 0.21306122839450836 ]
epoch: 14


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.62s/it]


	loss -> [ 0.19728705286979675 ]
epoch: 15


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.50s/it]


	loss -> [ 0.18635985255241394 ]
epoch: 16


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.70s/it]


	loss -> [ 0.18041186779737473 ]
epoch: 17


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.59s/it]


	loss -> [ 0.18263913691043854 ]
epoch: 18


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.68s/it]


	loss -> [ 0.17704521119594574 ]
epoch: 19


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.83s/it]


	loss -> [ 0.15989281982183456 ]
epoch: 20


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.71s/it]


	loss -> [ 0.15177970379590988 ]
epoch: 21


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.70s/it]


	loss -> [ 0.18631352484226227 ]
epoch: 22


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.71s/it]


	loss -> [ 0.15993021428585052 ]
epoch: 23


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.64s/it]


	loss -> [ 0.124566450715065 ]
epoch: 24


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.61s/it]


	loss -> [ 0.15222102403640747 ]
epoch: 25


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.70s/it]


	loss -> [ 0.16050106287002563 ]
epoch: 26


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.62s/it]


	loss -> [ 0.14043741673231125 ]
epoch: 27


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.75s/it]


	loss -> [ 0.15007076412439346 ]
epoch: 28


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.58s/it]


	loss -> [ 0.15081653743982315 ]
epoch: 29


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.79s/it]


	loss -> [ 0.11202938854694366 ]
epoch: 30


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.72s/it]


	loss -> [ 0.13011933118104935 ]
epoch: 31


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:08<00:00,  2.01s/it]


	loss -> [ 0.12328419834375381 ]
epoch: 32


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.95s/it]


	loss -> [ 0.12402165681123734 ]
epoch: 33


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.78s/it]


	loss -> [ 0.13273176550865173 ]
epoch: 34


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.66s/it]


	loss -> [ 0.1064729355275631 ]
epoch: 35


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.78s/it]


	loss -> [ 0.038031741976737976 ]
epoch: 36


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.79s/it]


	loss -> [ -0.013674603775143623 ]
epoch: 37


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.86s/it]


	loss -> [ -0.01348111405968666 ]
epoch: 38


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:09<00:00,  2.27s/it]


	loss -> [ -0.007943127304315567 ]
epoch: 39


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.92s/it]


	loss -> [ 0.008830424398183823 ]
epoch: 40


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.75s/it]


	loss -> [ 0.03062536008656025 ]
epoch: 41


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.77s/it]


	loss -> [ 0.014357434585690498 ]
epoch: 42


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.71s/it]


	loss -> [ 0.025270987302064896 ]
epoch: 43


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.63s/it]


	loss -> [ 0.01754819229245186 ]
epoch: 44


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.62s/it]


	loss -> [ 0.0036024414002895355 ]
epoch: 45


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.80s/it]


	loss -> [ 0.020912783220410347 ]
epoch: 46


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.80s/it]


	loss -> [ 0.010381223633885384 ]
epoch: 47


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.56s/it]


	loss -> [ 0.02745538018643856 ]
epoch: 48


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.77s/it]


	loss -> [ 0.03946384973824024 ]
epoch: 49


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.81s/it]


	loss -> [ 0.04808701202273369 ]
epoch: 50


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.75s/it]


	loss -> [ 0.028877709060907364 ]
epoch: 51


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.70s/it]


	loss -> [ 0.03437553718686104 ]
epoch: 52


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.88s/it]


	loss -> [ 0.06016594357788563 ]
epoch: 53


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:09<00:00,  2.40s/it]


	loss -> [ 0.050657570362091064 ]
epoch: 54


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.86s/it]


	loss -> [ 0.05884991027414799 ]
epoch: 55


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.81s/it]


	loss -> [ 0.06592126563191414 ]
epoch: 56


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.84s/it]


	loss -> [ 0.05483806133270264 ]
epoch: 57


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.76s/it]


	loss -> [ 0.07307950407266617 ]
epoch: 58


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.71s/it]


	loss -> [ 0.08348728343844414 ]
epoch: 59


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.88s/it]


	loss -> [ 0.07376619055867195 ]
epoch: 60


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.73s/it]


	loss -> [ 0.0745643898844719 ]
epoch: 61


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.82s/it]


	loss -> [ 0.09140775352716446 ]
epoch: 62


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.86s/it]


	loss -> [ 0.09368184208869934 ]
epoch: 63


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.85s/it]


	loss -> [ 0.110688716173172 ]
epoch: 64


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.86s/it]


	loss -> [ 0.11026499420404434 ]
epoch: 65


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.81s/it]


	loss -> [ 0.11596052348613739 ]
epoch: 66


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.75s/it]


	loss -> [ 0.12775664776563644 ]
epoch: 67


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.76s/it]


	loss -> [ 0.11277443915605545 ]
epoch: 68


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.90s/it]


	loss -> [ 0.11517738550901413 ]
epoch: 69


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.88s/it]


	loss -> [ 0.11233793944120407 ]
epoch: 70


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.90s/it]


	loss -> [ 0.11398233100771904 ]
epoch: 71


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:08<00:00,  2.06s/it]


	loss -> [ 0.11939375847578049 ]
epoch: 72


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.94s/it]


	loss -> [ 0.1240156851708889 ]
epoch: 73


unrolling: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [08:30<00:00, 127.68s/it]


	loss -> [ 0.13254813104867935 ]
epoch: 74


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:05<00:00,  1.47s/it]


	loss -> [ 0.14617697149515152 ]
epoch: 75


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.55s/it]


	loss -> [ 0.13310877978801727 ]
epoch: 76


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.64s/it]


	loss -> [ 0.14248434454202652 ]
epoch: 77


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:05<00:00,  1.31s/it]


	loss -> [ 0.14674841612577438 ]
epoch: 78


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.75s/it]


	loss -> [ 0.14253833144903183 ]
epoch: 79


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:05<00:00,  1.45s/it]


	loss -> [ 0.15111207216978073 ]
epoch: 80


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:05<00:00,  1.40s/it]


	loss -> [ 0.1593775898218155 ]
epoch: 81


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:05<00:00,  1.48s/it]


	loss -> [ 0.17099923640489578 ]
epoch: 82


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:05<00:00,  1.44s/it]


	loss -> [ 0.16867278516292572 ]
epoch: 83


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.51s/it]


	loss -> [ 0.16955886036157608 ]
epoch: 84


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.85s/it]


	loss -> [ 0.191817969083786 ]
epoch: 85


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.77s/it]


	loss -> [ 0.1787400096654892 ]
epoch: 86


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.73s/it]


	loss -> [ 0.16860400140285492 ]
epoch: 87


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.59s/it]


	loss -> [ 0.19030683487653732 ]
epoch: 88


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.72s/it]


	loss -> [ 0.1844019889831543 ]
epoch: 89


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.81s/it]


	loss -> [ 0.2019842565059662 ]
epoch: 90


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.79s/it]


	loss -> [ 0.1936681717634201 ]
epoch: 91


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.89s/it]


	loss -> [ 0.19938819110393524 ]
epoch: 92


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.84s/it]


	loss -> [ 0.17263320833444595 ]
epoch: 93


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.91s/it]


	loss -> [ 0.18872889876365662 ]
epoch: 94


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.91s/it]


	loss -> [ 0.18200941383838654 ]
epoch: 95


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.74s/it]


	loss -> [ 0.2003410905599594 ]
epoch: 96


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.67s/it]


	loss -> [ 0.21477951854467392 ]
epoch: 97


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.64s/it]


	loss -> [ 0.19619829952716827 ]
epoch: 98


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:07<00:00,  1.96s/it]


	loss -> [ 0.1978287473320961 ]
epoch: 99


unrolling: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:06<00:00,  1.72s/it]

	loss -> [ 0.18933570384979248 ]





---

---

# Visualization

In [1]:
env.model.camera("main").pos = np.array([1, 1, 3])

try:
    i = 0
    while True:
        
        action = env.action_space.sample()
        env.do_simulation(ctrl=action, n_frames=5)

        env.render(cam_offset=np.array([1,1,5]))

        # print(env.data.qfrc_actuator)
       
        # print(r.as_euler("xyz", degrees=True))
        print(calc_angle(env.data.body("base").xquat))
        
        i += 1
        
except Exception as e:
    raise e
finally:
    env.close()

NameError: name 'np' is not defined

In [9]:
from unitree_robot.train.environments import lookat


target = env.data.cam("main").xpos + np.array([0, 0, -1])
target

# lookat(env.data.cam("main").xpos, target)


<mujoco._structs.MjData at 0x2b5a63c05b0>

In [2]:
# env.action_space

# len(env.data.qpos)

# env.data.("imu_quat")


# q_rotate = quaternion.as_quat_array(env.data.sensor("imu_quat").data)
# quaternion.rotate_vectors(q_rotate, np.array([0,0,1]))
# (np.array([1, 0, 0]))




# env.get_sensor_state()

# env.data.xquat.shape