In [25]:
import numpy as np
import cupy as cp
import time

def validate_matrix_dims(mat1, mat2):
    """Проверка, что умножение матриц возможно."""
    if mat1.shape[1] != mat2.shape[0]:
        raise ValueError("Размеры матриц не соответствуют правилам умножения")

def cpu_matrix_mult(mat1, mat2):
    """Умножение матриц на CPU."""
    validate_matrix_dims(mat1, mat2)  # Вызов проверки совместимости

    output = np.zeros((mat1.shape[0], mat2.shape[1]))

    start = time.time()
    for row in range(mat1.shape[0]):
        for col in range(mat2.shape[1]):
            for index in range(mat1.shape[1]):
                output[row, col] += mat1[row, index] * mat2[index, col]
    end = time.time()

    return output, end - start

def gpu_matrix_mult(mat1, mat2):
    """Умножение матриц на GPU."""
    validate_matrix_dims(mat1, mat2)  # Вызов проверки совместимости

    # Перенос данных матриц на графическую карту
    mat1_gpu = cp.asarray(mat1)
    mat2_gpu = cp.asarray(mat2)

    start = time.time()
    result_gpu = cp.dot(mat1_gpu, mat2_gpu)  # Быстрое умножение на GPU
    final_result = cp.asnumpy(result_gpu)    # Перенос результата обратно на CPU
    end = time.time()

    return final_result, end - start

if __name__ == "__main__":
    shape = (800, 800)
    mat1 = np.random.random(shape)
    mat2 = np.random.random(shape)

    cpu_result, cpu_exec_time = cpu_matrix_mult(mat1, mat2)
    gpu_result, gpu_exec_time = gpu_matrix_mult(mat1, mat2)

    print(f"Результат на CPU:\n{cpu_result}")
    print(f"Время выполнения на CPU: {cpu_exec_time:.6f} сек")

    print(f"Результат на GPU:\n{gpu_result}")
    print(f"Время выполнения на GPU: {gpu_exec_time:.6f} сек")

Результат на GPU:
[[3201.23757687 3199.47697142 3186.4354442  ... 3228.09359811
  3227.70937288 3204.99890313]
 [3184.75077622 3197.95424746 3162.72903421 ... 3219.96002871
  3226.02096866 3224.8402993 ]
 [3166.50851725 3194.3580369  3142.02590525 ... 3204.39042322
  3193.13866587 3198.02161461]
 ...
 [3185.81632596 3206.51571228 3172.45297105 ... 3222.5473441
  3207.79519441 3216.79038462]
 [3185.95648882 3190.01605641 3176.99306429 ... 3205.35556954
  3194.93820379 3203.61622905]
 [3202.94353192 3205.6545944  3180.73888337 ... 3227.90318977
  3226.66441057 3214.85166794]]
Время выполнения на GPU: 31.147587 сек
