In [8]:
import numpy as np
import cupy as cp
import time

def matrix_multiply_cpu(matrix_a, matrix_b):
    # Проверка корректности перемножения
    if matrix_a.shape[1] != matrix_b.shape[0]:
        raise ValueError("Неправильные размеры матриц для перемножения")

    result = np.zeros((matrix_a.shape[0], matrix_b.shape[1]))

    start_time = time.time()
    for i in range(matrix_a.shape[0]):
        for j in range(matrix_b.shape[1]):
            for k in range(matrix_a.shape[1]):
                result[i, j] += matrix_a[i, k] * matrix_b[k, j]
    end_time = time.time()

    return result, end_time - start_time

def matrix_multiply_gpu(matrix_a, matrix_b):
    # Проверка корректности перемножения
    if matrix_a.shape[1] != matrix_b.shape[0]:
        raise ValueError("Неправильные размеры матриц для перемножения")

    # Перенос матриц на GPU
    matrix_a_gpu = cp.asarray(matrix_a)
    matrix_b_gpu = cp.asarray(matrix_b)

    start_time = time.time()
    result_gpu = cp.dot(matrix_a_gpu, matrix_b_gpu)
    result = cp.asnumpy(result_gpu)  # Возвращаем результат на CPU
    end_time = time.time()

    return result, end_time - start_time

if __name__ == "__main__":
    matrix_size = (1000, 1000)
    matrix_a = np.random.rand(*matrix_size)
    matrix_b = np.random.rand(*matrix_size)

    result_cpu, time_cpu = matrix_multiply_cpu(matrix_a, matrix_b)
    result_gpu, time_gpu = matrix_multiply_gpu(matrix_a, matrix_b)

    print(f"Результат на CPU:\n{result_cpu}")
    print(f"Время на CPU: {time_cpu} секунд")

    print(f"Результат на GPU:\n{result_gpu}")
    print(f"Время на GPU: {time_gpu} секунд")

Результат на CPU:
[[243.18308409 249.12520272 252.88324306 ... 248.56073694 251.58382753
  238.84813173]
 [244.89363166 256.14268848 252.42904967 ... 252.2370358  252.68774878
  241.81672409]
 [243.21589992 257.13578152 256.92665338 ... 247.41355395 250.17217928
  240.86652593]
 ...
 [248.99109108 258.15349436 260.98494705 ... 259.19589889 259.30617321
  246.14162672]
 [243.10765788 256.0719056  257.54818472 ... 254.6849639  251.36533832
  242.18877473]
 [250.25414595 255.8101921  260.94872877 ... 258.4487663  257.74523575
  246.55741561]]
Время на CPU: 670.6450788974762 секунд
Результат на GPU:
[[243.18308409 249.12520272 252.88324306 ... 248.56073694 251.58382753
  238.84813173]
 [244.89363166 256.14268848 252.42904967 ... 252.2370358  252.68774878
  241.81672409]
 [243.21589992 257.13578152 256.92665338 ... 247.41355395 250.17217928
  240.86652593]
 ...
 [248.99109108 258.15349436 260.98494705 ... 259.19589889 259.30617321
  246.14162672]
 [243.10765788 256.0719056  257.54818472 ...