In [1]:
import torch
use_cuda = torch.cuda.is_available()

In [2]:
torch.cuda.current_device()

0

In [3]:
torch.cuda.device_count()

2

In [4]:
torch.cuda.get_device_name(0)

'Tesla K80'

In [7]:
import torch
import torch.nn as nn

# 確認可用的 GPU 數量
device_count = torch.cuda.device_count()
print("可用的 GPU 數量：", device_count)

# 檢查是否有至少兩個可用的 GPU
if device_count < 2:
    print("系統上的 GPU 數量不足，無法在兩個 GPU 上運行程式碼。")
    exit()

# 定義模型
class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        self.fc = nn.Linear(10, 5)

    def forward(self, x):
        return self.fc(x)

# 建立模型
model = MyModel()

# 指定兩個 GPU 的 device IDs
device1 = torch.device("cuda:0")
device2 = torch.device("cuda:1")

# 將模型移動到第一個 GPU
model.to(device1)

# 在第一個 GPU 上創建輸入張量
input_tensor1 = torch.randn(10, 10).to(device1)

# 建立模型的複本，移動到第二個 GPU
model2 = MyModel()
model2.to(device2)

# 在第二個 GPU 上創建輸入張量
input_tensor2 = torch.randn(10, 10).to(device2)

# 在兩個 GPU 上執行計算
with torch.cuda.device(device1):
    output1 = model(input_tensor1)

with torch.cuda.device(device2):
    output2 = model2(input_tensor2)

# 將結果移回 CPU 或合併結果
output1 = output1.to("cpu")
output2 = output2.to("cpu")
merged_output = torch.cat([output1, output2], dim=0)

print("計算結果：", merged_output)


可用的 GPU 數量： 2
計算結果： tensor([[-0.7590, -0.4708,  0.2896, -0.6696, -0.2129],
        [-0.5638, -0.2819,  0.4481, -0.5891, -0.0515],
        [-0.1075, -0.0949,  0.1688, -0.4538, -0.4283],
        [-0.3708, -0.3003, -0.0473,  0.2497, -0.5544],
        [-0.5383,  0.2033, -0.6988, -0.7751, -0.0226],
        [-0.2270,  0.2444, -0.3936, -0.0570, -0.6307],
        [ 0.3330,  0.4805, -0.3101, -0.0993, -0.5016],
        [-1.4283, -0.2140,  0.6914, -0.8494, -0.1189],
        [ 0.0459,  0.1797, -0.2149, -0.1494, -0.2397],
        [ 0.7235,  0.1472,  0.2309,  0.0468,  0.0087],
        [ 0.4711, -1.7408, -0.4935,  1.0903, -0.4885],
        [-0.3255,  1.1619, -0.3112,  1.0745, -1.5568],
        [ 0.5323, -0.2378, -0.0841, -0.0148,  0.3711],
        [-1.1238,  1.6141, -0.2578,  0.7390, -1.6973],
        [-1.0016, -0.2256,  0.3355,  0.1234, -0.3571],
        [ 0.5881,  0.0259,  0.5200, -0.2217, -0.0382],
        [ 0.1251,  1.0232,  0.1356, -0.9037,  0.3627],
        [ 0.2211, -0.3341,  0.1317, -0.4378, 

In [10]:
import torch

# 確認可用的 GPU 數量
device_count = torch.cuda.device_count()
print("可用的 GPU 數量：", device_count)

# 檢查是否有至少兩個可用的 GPU
if device_count < 2:
    print("系統上的 GPU 數量不足，無法在兩個 GPU 上運行程式碼。")
    exit()

# 指定兩個 GPU 的 device IDs
device1 = torch.device("cuda:0")
device2 = torch.device("cuda:1")

# 在第一個 GPU 上進行運算
with torch.cuda.device(device1):
    # 建立模型
    model1 = MyModel().to(device1)
    input_tensor1 = torch.randn(10, 10).to(device1)
    output1 = model1(input_tensor1)
    print("第一個 GPU 上的計算結果：", output1)

# 在第二個 GPU 上進行運算
with torch.cuda.device(device2):
    # 建立模型
    model2 = MyModel().to(device2)
    input_tensor2 = torch.randn(10, 10).to(device2)
    output2 = model2(input_tensor2)
    print("第二個 GPU 上的計算結果：", output2)


可用的 GPU 數量： 2
第一個 GPU 上的計算結果： tensor([[-0.1459, -0.1534,  0.7309,  0.3647,  0.9250],
        [-0.1357, -0.2351,  0.6441,  0.0348, -0.0303],
        [ 0.5310,  0.7900,  1.0667,  0.9989,  0.5784],
        [-0.1958, -0.3272, -0.3495, -0.3941, -0.0589],
        [ 0.3061, -0.0690,  0.4494,  0.2026,  0.7814],
        [-0.1388,  0.3680,  0.0729,  0.0380,  0.6804],
        [-0.5484, -0.1583,  0.1468, -1.3566, -0.0049],
        [ 0.6335,  0.3845,  0.3377, -0.2140, -0.0589],
        [-0.4645, -0.0454,  0.6996, -0.0893,  0.7411],
        [-0.0895,  0.2486, -0.4159,  0.2451,  0.9898]], device='cuda:0',
       grad_fn=<AddmmBackward0>)
第二個 GPU 上的計算結果： tensor([[ 1.4271e+00,  2.3908e-01, -1.5710e-01,  5.8725e-02,  8.8830e-01],
        [-7.3465e-01, -3.5177e-01,  4.0889e-01, -8.3700e-02, -5.5197e-01],
        [ 6.1514e-01, -1.1656e+00,  2.3096e-01,  3.7953e-01,  8.0007e-02],
        [ 5.8639e-03, -8.2411e-01, -3.1226e-01,  2.1048e+00, -3.4119e-01],
        [ 2.5821e-01, -8.9238e-01, -1.0338e-01,  6.51