实现多类型观测值存储和学习 #33

StepNeverStop · 2021-01-05T01:32:34Z

向量
射线
多图像

- fix `sac` - fix `is_continuous` of unity wrapper - rename `*DEC` to `*DCT`

- support multi-vector and multi-visual input - optimize `gym` and `unity` wrapper - fix `ActorCriticValueCts` - tag 2.0.0 - add `ObsSpec` - refactor `SingleAgentEnvArgs` and `MultiAgentEnvArgs` - remove `self.s_dim`, use `self.concat_vector_dim` instead - stop using vector input normalization temporarily

StepNeverStop · 2021-01-05T12:11:53Z

目前已经实现了基于NamedTuple的数据格式，对于智能体的观测状态，其必须被赋值vector和visual两个字段，如果智能体仅包含向量/图像输入，其另一项被默认赋值为np.full((n_agents, 0), [])，这在一定程度上浪费了存储内存，因此测试一下该默认值所消耗的内存大小，代码如下：

import sys
import numpy as np

empty10_0 = np.full((10,0), [])
empty1000_0 = np.full((1000,0), [])

random10_1 = np.random.random((10, 1))
random1000_1 = np.random.random((1000, 1))

def f(x):
    return sys.getsizeof(x)

print(f(()), f([]), f([[]]),f(np.asarray([])), f(np.asarray([[]])))
print(f(empty10_0), f(empty1000_0), f(random10_1), f(random1000_1))

最后结果输出为：

56 72 80 96 112
112 112 192 8112

由此可见，二维的空numpy数组，无论shape如何，其恒占用112个bytes，不算很多，但是当存储的经验较多时，依旧会空消耗不少内存，因此有待优化。

StepNeverStop · 2021-01-05T12:23:29Z

另外，在测试NamedTuple、namedtuple和tuple对象所消耗的空间时，得到了迷惑的答案，元组对象所占字节很少，不知为何元组对象内所存numpy矩阵对象的内存并未计算在元组所消耗内存中。

from typing import NamedTuple
from collections import namedtuple

x = np.random.random((100, 100))
y = np.random.random((100, 100))

NT = NamedTuple('a', [('x', np.ndarray),('y', np.ndarray)])(x, y)
nt = namedtuple('a', 'x, y')(x, y)
t = tuple((x,y))

print(f(x), f(y))
print(f(NT), f(nt), f(t))
print(f(NT.x))

结果：

80112 80112
72 72 72
80112

StepNeverStop · 2021-01-06T01:30:22Z

实现多向量观测输入时，自适应神经网络结构的功能，比如输出维度为8，则DNN结构可为32->8，如果输入维度为120，则DNN结构可自动推断为256->128->16

1. fixed n-step replay buffer 2. reconstruct representation net 3. remove 'use_stack' 4. implement multi-agent algorithms with shared parameters 5. optimized agent network

instead. (#31, #33)

StepNeverStop created this issue from a note in Tasks (To Do) Jan 5, 2021

StepNeverStop moved this from To Do to In Progress in Tasks Jan 5, 2021

StepNeverStop added a commit that referenced this issue Jan 5, 2021

perf&fix: remove .vector and .visual (#33)

b9e5beb

- fix `sac` - fix `is_continuous` of unity wrapper - rename `*DEC` to `*DCT`

StepNeverStop added the enhancement New feature or request label Jan 5, 2021

StepNeverStop self-assigned this Jan 5, 2021

StepNeverStop added a commit that referenced this issue Jan 6, 2021

fix(unity): fix multi-vector and multi-visual training (#33)

37943ea

StepNeverStop added a commit that referenced this issue Jan 6, 2021

feat: implement adaptive multi-vector network (#33)

e3b46d9

StepNeverStop added the optimization Better performance or solution label Jan 6, 2021

StepNeverStop added a commit that referenced this issue Jan 7, 2021

fix: fix multi-vector parsing (#33)

fa6287f

StepNeverStop added a commit that referenced this issue Jul 6, 2021

perf(data): remove namedtuple and NamedTuple, use dataclasses.@DataClass

a0e5be7

instead. (#31, #33)

StepNeverStop added a commit that referenced this issue Aug 25, 2021

perf: reconstruct repo(#47, #25, #46, #34, #31, #33, #39, #41, #45, #26)

67b8979

StepNeverStop closed this as completed Aug 27, 2021

StepNeverStop moved this from In Progress to Done in Tasks Aug 27, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

实现多类型观测值存储和学习 #33

实现多类型观测值存储和学习 #33

StepNeverStop commented Jan 5, 2021

StepNeverStop commented Jan 5, 2021

StepNeverStop commented Jan 5, 2021 •

edited

Loading

StepNeverStop commented Jan 6, 2021

实现多类型观测值存储和学习 #33

实现多类型观测值存储和学习 #33

Comments

StepNeverStop commented Jan 5, 2021

StepNeverStop commented Jan 5, 2021

StepNeverStop commented Jan 5, 2021 • edited Loading

StepNeverStop commented Jan 6, 2021

StepNeverStop commented Jan 5, 2021 •

edited

Loading