In [None]:
# импорт необходимых библиотек
import cupy as cp
import numpy as np
import time

# функция перемножения матриц на CPU
def matmul_on_cpu(a, b):
  c = np.zeros((a.shape[0], b.shape[1])) # итоговая матрица размером (кол-во трок матрицы a, кол-во трок матрицы b)
  start = time.time() # фиксируем начало замера времени выполнения
  # стандартный алгоритм перемножения матриц
  for i in range(a.shape[0]): 
      for j in range(b.shape[1]): 
          for k in range(a.shape[1]): 
              c[i, j] += a[i, k] * b[k, j] # итоговая матрица
  end = time.time() # фиксируем конец замера времени выполнения
  all_time = end - start # рассчитываем время выполнения 

  return c, all_time

# функция перемножения матриц на GPU
def matmul_on_gpu(a, b):
  # перенос матриц на GPU (создание копий матриц)
  a_gpu = cp.asarray(a)
  b_gpu = cp.asarray(b)
  start = time.time() # фиксируем начало замера времени выполнения
  c_gpu = cp.dot(a_gpu, b_gpu) # перемножение матриц на GPU
  # возвращаем результат на CPU
  c = cp.asnumpy(c_gpu) 
  end = time.time() # фиксируем конец замера времени выполнения
  all_time = end - start # рассчитываем время выполнения

  return c, all_time


if __name__ == "__main__":
  size = (100, 100) # размерность матриц
  # создаем две случайные матрицы 
  a = np.random.rand(*size)
  b = np.random.rand(*size)

  dot_on_cpu, t_on_cpu = matmul_on_cpu(a, b) # вызов функции перемножения матриц на CPU
  dot_on_gpu, t_on_gpu = matmul_on_gpu(a, b) # вызов функции перемножения матриц на GPU
    
  # вывод результатов
  print(f"Результат перемножения матриц на CPU:\n{dot_on_cpu}")
  print(f"Время на CPU: {t_on_cpu} секунд")
  print(f"Результат перемножения матриц на GPU:\n{dot_on_gpu}")
  print(f"Время на GPU: {t_on_gpu} секунд")

Результат перемножения матриц на CPU:
[[30.35348332 24.91027015 26.86643843 ... 25.62803783 27.07720539
  25.69426427]
 [27.0825895  23.09068979 23.61869659 ... 24.87093785 23.90883288
  21.24557237]
 [30.71128737 24.74640688 27.95006019 ... 26.00335176 27.04660868
  26.89495757]
 ...
 [26.51097837 21.95680602 24.33448113 ... 24.97502046 24.21916602
  22.77288518]
 [28.12473642 24.77895962 27.84059867 ... 27.45817754 26.67354385
  23.23626628]
 [27.07095096 23.59284469 27.11903193 ... 26.24578188 25.80149607
  23.23511144]]
Время на CPU: 0.5732624530792236 секунд
Результат перемножения матриц на GPU:
[[30.35348332 24.91027015 26.86643843 ... 25.62803783 27.07720539
  25.69426427]
 [27.0825895  23.09068979 23.61869659 ... 24.87093785 23.90883288
  21.24557237]
 [30.71128737 24.74640688 27.95006019 ... 26.00335176 27.04660868
  26.89495757]
 ...
 [26.51097837 21.95680602 24.33448113 ... 24.97502046 24.21916602
  22.77288518]
 [28.12473642 24.77895962 27.84059867 ... 27.45817754 26.673543