In [1]:
import tensorflow as tf

获取当前主机上，**程序可见**的运算设备列表：带有experimental字样的，都是在以后版本可能会改变写法的！
- gpus = tf.config.experimental.list_physical_devices( device_type = 'GPU' )
- cpus = tf.config.experimental.list_physical_devices( device_type = 'CPU' )

In [4]:
# 我是有GPU的，但是我安装的是Tensorflow-cpu，所以该程序看不见我那块GPU！
gpus = tf.config.experimental.list_physical_devices( device_type = 'GPU' )
gpus

[]

In [5]:
cpus = tf.config.experimental.list_physical_devices( device_type = 'CPU' )
cpus

[PhysicalDevice(name='/physical_device:CPU:0', device_type='CPU')]

设定当前程序可见的设备，即程序只会用你设定可见的设备：该语言写到程序最前面！
- gpus = tf.config.experimental.list_physical_devices( device_type = 'GPU' )
- tf.config.experimental.set_visible_devices( devices = gpus[0:4], device_type = 'GPU' )

同样效果的操作：用环境变量控制，不推荐！
- import os
- os.environ[ 'CUDA_VISIBLE_DEVICES' ] = '0,1,2,3,4'

设置**显存**的使用策略：默认下Tensorflow会使用几乎所有可用的显存！下面是两种常见的显存设置策略
- 仅在需要时申请显存空间（程序初始运行时消耗很少的显存，随着程序的运行需求增大而动态申请显存）：
- 直接限定消耗固定大小的显存，若超出就报错：

In [None]:
# 1. 多张卡的动态申请：
# 容易出现的问题：如果某些显卡已经被程序所占，则该卡不能被进行如下设置！
gpus = tf.config.experimental.list_physical_devices( device_type = 'GPU' )
tf.config.experimental.set_visible_devices( devices = gpus[4:6], device_type = 'GPU' )  # 仅可见4张卡

for gpu in gpus[4:6]:
    tf.config.experimental.set_memory_growth( device = gpu, enable = True )

In [None]:
# 2. 设定消耗固定显存，超出报错：
gpus = tf.config.experimental.list_physical_devices( device_type = 'GPU' )
tf.config.experimental.set_visible_devices( devices = gpus[0:2], device_type = 'GPU' )  # 仅可见4张卡

# 每一张卡单独设定：
tf.config.experimental.set_virtual_device_configuration( 
    gpus[0],
    [ tf.config.experimental.VirtualDeviceConfiguration( memory_limit = 10240 ) ]
)

tf.config.experimental.set_virtual_device_configuration( 
    gpus[1],
    [ tf.config.experimental.VirtualDeviceConfiguration( memory_limit = 10240 ) ]
)

tf.config.experimental.set_virtual_device_configuration( 
    gpus[2],
    [ tf.config.experimental.VirtualDeviceConfiguration( memory_limit = 10240 ) ]
)