In [1]:
# 4.6.1 计算设备
import mxnet as mx
from mxnet import nd
from mxnet.gluon import nn

# mx.cpu()表⽰所有的物理CPU和内存。
# mx.gpu()只代表⼀块GPU和相应的显存。
mx.cpu(1),mx.gpu(),mx.gpu(1)

(cpu(1), gpu(0), gpu(1))

In [2]:
# 4.6.2 NDArray的GPU计算 
# 在默认情况下，NDArray存在内存上。
x=nd.array([1,2,3])
x


[1. 2. 3.]
<NDArray 3 @cpu(0)>

In [3]:
# 通过NDArray的context属性来查看该NDArray所在的设备。 
x.context

cpu(0)

In [4]:
# GPU上的存储 
# 1.在创建NDArray的时候通过ctx参数指定存储设备。
a=nd.array([1,2,3],ctx=mx.gpu())
a


[1. 2. 3.]
<NDArray 3 @gpu(0)>

In [5]:
B=nd.random.uniform(shape=(2,3),ctx=mx.gpu())
B


[[0.6686509  0.17409194 0.3850025 ]
 [0.24678314 0.35134333 0.8404298 ]]
<NDArray 2x3 @gpu(0)>

In [6]:
# 2.通过copyto函数和as_in_context函数在设备之间传输数据。 
# 将内存上的NDArray变量x复制到gpu(0)上。 x->gpu
y=x.copyto(mx.gpu())
y


[1. 2. 3.]
<NDArray 3 @gpu(0)>

In [7]:
m=nd.array([1,1,1])
n=nd.array([1,2,3])
# copyto还可以复制NDArray变量m复制到NDArray变量n上(m->n),但m，n形状必须相同
t=m.copyto(n)
t,n

(
 [1. 1. 1.]
 <NDArray 3 @cpu(0)>,
 
 [1. 1. 1.]
 <NDArray 3 @cpu(0)>)

In [8]:
z=x.as_in_context(mx.gpu())
z


[1. 2. 3.]
<NDArray 3 @gpu(0)>

In [9]:
# 如果源变量和⽬标变量的context⼀致，as_in_context函数使⽬标变量和源变量共享源变量的内存或显存。 
y.as_in_context(mx.gpu()) is y

True

In [10]:
# 而copyto函数总是为⽬标变量开新的内存或显存。 
y.copyto(mx.gpu()) is y

False

In [11]:
# GPU上的计算 
# MXNet的计算会在数据的context属性所指定的设备上执⾏。
# 为了使⽤GPU计算，我们只需要事先将数据存储在显存上。计算结果会⾃动保存在同⼀块显卡的显存上。 
(z+2).exp()*y


[ 20.085537 109.1963   445.2395  ]
<NDArray 3 @gpu(0)>

In [12]:
# MXNet要求计算的所有输⼊数据都在内存或同⼀块显卡的显存上。
# 这样设计的原因是CPU和不同的GPU之间的数据交互通常⽐较耗时。
# x*y
# 当我们打印NDArray或将NDArray转换成NumPy格式时，如果数据不在内存⾥，
# MXNet会将它先复制到内存，从而造成额外的传输开销。 

In [13]:
# 4.6.3 Gluon的GPU计算
# Gluon的模型可以在初始化时通过ctx参数指定设备
net=nn.Sequential()
net.add(nn.Dense(1))
net.initialize(ctx=mx.gpu())# 将模型参数初始化在显存上。 

In [14]:
# 当输⼊是显存上的NDArray时，Gluon会在同⼀块显卡的显存上计算结果。 
net(y)


[[0.0068339 ]
 [0.01366779]
 [0.02050169]]
<NDArray 3x1 @gpu(0)>

In [15]:
net[0].weight.data()


[[0.0068339]]
<NDArray 1x1 @gpu(0)>

In [16]:


mx.gpu??
mx.cpu??
mx.gpu??



x.as_in_context??
x.copyto??