worker_loop看起来是读取了本地的数据，然后发送给了remote node。导致效率不高 #13

umialpha · 2021-09-30T05:50:45Z

测试情景

使用fashion_mnist_train_test.py。 �FashionMNIST预先下载到本地(download=False)，remote node没有下载，但是程序依然可以运行。

猜测：
worker_loop读取了本地训练数据，然后发送给了remote node？对ray不是很熟悉，只是猜测。如果真是这样，这样的效率其实很低。更需要的模式是：

The text was updated successfully, but these errors were encountered:

umialpha · 2021-09-30T06:09:41Z

看了一下FashionMNIST是把数据预读到了内存。所以dataset再传输的过程会非常大。我再测试一下不预读到内存的情况

eedalong · 2021-09-30T08:20:45Z

是这样的，分布式的情况下本身会带来网络的开销，我们必须的确保数据预处理的时间 >> 网络时间才能拿到收益的。不是所有的鱼处理都适合做分布式预处理的。然后你说的没错，FashionMNIST数据集是一次性把数据集加载到内存中的

umialpha closed this as completed Oct 11, 2021