# **Проект по оптимизации основных методов связанных со списками с использованием библиотек Cython, NumPy**





#####Студенты: Кирюхова Ульяна Вячеславовна, Иксанов Марат Васильевич. Группа: ПМ-2001
---

###**Установка необходимых вспомогательных модулей**

---

In [None]:
!pip install Cython

%load_ext cython

from random import random 
import numpy as np
import Cython
from time import time
from functools import reduce

---

### **Сортировка списка методов простых вставок на чистом Python и при использовании библиотеки Cython**

---

#####Функция подсчета времени

In [102]:
def get_time(p,c = False,nump = False):
  a = time()
  p
  b = time()
  print(f"Pure Python time:{b-a}\n")
  if c != False:
    a = time()
    c
    b = time()
    print(f"Cython time:{b-a}\n")
  if nump != False:
    a = time()
    nump
    b = time()
    print(f"Numpy time:{b-a}\n")
    

Генерация случайных данных

In [19]:
def generate(n = 1,m = 1 ,nump = False):
  lst = [[random() for _ in range(m)] for _ in range(n)]
  if n == 1:
    lst = lst[0]
  if nump: return np.array(lst)
  else: return lst

Сортировка выбором

In [40]:
def pure_python_selectionSort(array):
    arr = [i for i in array]
    for i in range(1, len(arr)):
        key = arr[i]
        j = i-1
        while j >=0 and key < arr[j] :
            arr[j+1] = arr[j]
            j -= 1
        arr[j+1] = key 

In [41]:
%%cython

def findMinIndex(array, strt):  
    cdef int min_index = strt  
    cdef int start = strt + 1
  
    while start < len(array):  
        if array[start] < array[min_index]:  
            min_index = start  
  
        start += 1  
  
    return min_index  
  
def cython_selectionSort(array):
    arr = [i for i in array]
    cdef int i = 0  
  
    while i < len(array):  
        min_index = findMinIndex(array, i)  
  
        if i != min_index:  
            array[i], array[min_index] = array[min_index], array[i]  
          
        i += 1  

Сравнение скорости работы на различных данных

In [119]:
step = [i for i in range(0,5000+1,1000)]
for i in range(1,4):
  print(f"\n\nTest:{i}")
  for n in step:
    print(f"\nArray length = {n}\n")
    ar = generate(1,n)
    get_time(pure_python_selectionSort(ar),cython_selectionSort(ar))



Test:1

Array length = 0

Pure Python time:4.76837158203125e-07

Cython time:2.384185791015625e-07


Array length = 1000

Pure Python time:7.152557373046875e-07

Cython time:7.152557373046875e-07


Array length = 2000

Pure Python time:9.5367431640625e-07

Cython time:2.384185791015625e-07


Array length = 3000

Pure Python time:7.152557373046875e-07

Cython time:4.76837158203125e-07


Array length = 4000

Pure Python time:2.384185791015625e-07

Cython time:2.384185791015625e-07


Array length = 5000

Pure Python time:9.5367431640625e-07

Cython time:4.76837158203125e-07



Test:2

Array length = 0

Pure Python time:2.384185791015625e-07

Cython time:2.384185791015625e-07


Array length = 1000

Pure Python time:7.152557373046875e-07

Cython time:2.384185791015625e-07


Array length = 2000

Pure Python time:2.384185791015625e-07

Cython time:2.384185791015625e-07


Array length = 3000

Pure Python time:2.384185791015625e-07

Cython time:4.76837158203125e-07


Array length = 4000

Pure

*На данном примере можно видеть, что с ростом количества случайных чисел в списке, функция на чистом Python довольно-таки сильно уступает функции написанной при помощи Cython*.

*Однако, все равно будут существовать частные случаи, когда случайно полученные величины взаиморасполагаются между собой более выгодно для чистого Python, нежели Cython. Таких случаев мало, поэтому будем считать, что Cython побеждает в большинстве случаев*

---

### **Вычисление опредлеителя матрицы MxM на чистом Python или при помощи Cython или Numpy**

---

In [74]:
def pure_python_determinant(arr,mul):
    width = len(arr)
    if width == 1:
        return mul * arr[0][0]
    else:
        sign = -1
        answer = 0
        for i in range(width):
            m = []
            for j in range(1, width):
                buff = []
                for k in range(width):
                    if k != i:
                        buff.append(arr[j][k])
                m.append(buff)
            sign *= -1
            answer = answer + mul * pure_python_determinant(m, sign * arr[0][i])
    return answer

In [97]:
%%cython

def cython_determinant(arr,mul):
    cdef int width = len(arr)
    cdef float sign
    cdef float answer
    if width == 1:
        return mul * arr[0][0]
    else:
        sign = -1
        answer = 0
        for i in range(width):
            m = []
            for j in range(1, width):
                buff = []
                for k in range(width):
                    if k != i:
                        buff.append(arr[j][k])
                m.append(buff)
            sign *= -1
            answer = answer + mul * cython_determinant(m, sign * arr[0][i])
    return answer

In [82]:
def numpy_determinant(arr):
  np.linalg.det(arr)

Сравнение скорости работы на различных данных

In [112]:
step = [i for i in range(2,11,2)]
for i in range(1,4):
  print(f"\n\nTest:{i}")
  for n in step:
    print(f"\nMatrix NxN = {n}x{n}\n")
    ar = generate(n,n)
    get_time(pure_python_determinant(ar,1),cython_determinant(ar,1.0),numpy_determinant(ar))



Test:1

Matrix NxN = 2x2

Pure Python time:7.152557373046875e-07

Cython time:4.76837158203125e-07

Numpy time:2.384185791015625e-07


Matrix NxN = 4x4

Pure Python time:4.76837158203125e-07

Cython time:2.384185791015625e-07

Numpy time:2.384185791015625e-07


Matrix NxN = 6x6

Pure Python time:2.384185791015625e-07

Cython time:2.384185791015625e-07

Numpy time:0.0


Matrix NxN = 8x8

Pure Python time:7.152557373046875e-07

Cython time:2.384185791015625e-07

Numpy time:2.384185791015625e-07


Matrix NxN = 10x10

Pure Python time:7.152557373046875e-07

Cython time:2.384185791015625e-07

Numpy time:2.384185791015625e-07



Test:2

Matrix NxN = 2x2

Pure Python time:2.384185791015625e-07

Cython time:4.76837158203125e-07

Numpy time:2.384185791015625e-07


Matrix NxN = 4x4

Pure Python time:4.76837158203125e-07

Cython time:4.76837158203125e-07

Numpy time:2.384185791015625e-07


Matrix NxN = 6x6

Pure Python time:2.384185791015625e-07

Cython time:2.384185791015625e-07

Numpy time:2.

*Наилучшим образом себя показала функция, написанная при помощи Numpy, после чего идет функция, написанная при помощи Cython, после чего функция на чистом Python*


*На данном примере можно видеть, что с ростом размерности квадратной матрицы составленной из случайных чисел функция на чистом Python довольно-таки сильно уступает остальным двум функциям практически во всех случаях*.


*Однако, все равно будут существовать частные случаи, когда случайно полученные матрицы будут посчитаны намного быстрее с помощью Cython, а иногда даже с помошью чистого Python, где функция, написанная с помощью NumPy может вовсе уступать прошлым двум*

*Поэтому можно считать, что победителем в данном случае является функция, написанная с помощью NumPy, после чего идет Cython и Python*


---


### **Перемножение двух матриц NxN на чистом Python или при помощи Cython или Numpy**

---

In [125]:
def pure_python_matrixmult(m1, m2):
    n = len(m1)
    C = [[0 for row in range(n)] for col in range(n)]

    for i in range(n):
        for j in range(n):
            for k in range(n):
                C[i][j] += m1[i][k] * m2[k][j]

In [120]:
%%cython

def cython_matrixmult(m1, m2):
    cdef int n = len(m1)
    C = [[0 for row in range(n)] for col in range(n)]

    for i in range(n):
        for j in range(n):
            for k in range(n):
                C[i][j] += m1[i][k] * m2[k][j]

In [121]:
def numpy_matrixmult(m1, m2):
  np.dot(m1, m2)

Сравнение скорости работы на различных данных

In [131]:
step = [i for i in range(100,401,100)]
for i in range(1,4):
  print(f"\n\nTest:{i}")
  for n in step:
    print(f"\nMatrix NxN = {n}x{n}\n")
    ar1 = generate(n,n)
    ar2 = generate(n,n)
    get_time(pure_python_matrixmult(ar1,ar2),cython_matrixmult(ar1,ar2),numpy_matrixmult(ar1,ar2))



Test:1

Matrix NxN = 100x100

Pure Python time:9.5367431640625e-07

Cython time:4.76837158203125e-07

Numpy time:2.384185791015625e-07


Matrix NxN = 200x200

Pure Python time:4.76837158203125e-07

Cython time:4.76837158203125e-07

Numpy time:2.384185791015625e-07


Matrix NxN = 300x300

Pure Python time:7.152557373046875e-07

Cython time:2.384185791015625e-07

Numpy time:2.384185791015625e-07


Matrix NxN = 400x400

Pure Python time:7.152557373046875e-07

Cython time:2.384185791015625e-07

Numpy time:2.384185791015625e-07



Test:2

Matrix NxN = 100x100

Pure Python time:7.152557373046875e-07

Cython time:2.384185791015625e-07

Numpy time:2.384185791015625e-07


Matrix NxN = 200x200

Pure Python time:9.5367431640625e-07

Cython time:2.384185791015625e-07

Numpy time:2.384185791015625e-07


Matrix NxN = 300x300

Pure Python time:1.430511474609375e-06

Cython time:2.384185791015625e-07

Numpy time:2.384185791015625e-07


Matrix NxN = 400x400

Pure Python time:4.76837158203125e-07

Cyt

---

*Наилучшим образом себя показала функция, написанная при помощи Numpy, после чего идет функция, написанная при помощи Cython, после чего функция на чистом Python*


*На данном примере можно видеть, что с ростом размерности квадратной матрицы составленной из случайных чисел функция на чистом Python довольно-таки сильно уступает остальным двум функциям практически во всех случаях*.


*Однако, все равно будут существовать частные случаи, когда случайно полученные матрицы будут посчитаны намного быстрее с помощью Cython, а иногда даже с помошью чистого Python, где функция, написанная с помощью NumPy может вовсе уступать прошлым двум*

*Поэтому можно считать, что победителем в данном случае является функция, написанная с помощью NumPy, после чего идет Cython и Python*

# **Заключение**





*Полученные результаты были ожидаемы: NumPy, Cython показали себя намного лучше чисто Python. Существовали входные данные, которые влияли на время вычисления различных функций, однако можно сказать, что в большинстве случаях NumPy побеждает оба остальных случая. Однако стоит всегда для каждого алгоритма думать об оптимизации индивидуально: для разных задач могут быть полезнее разные оптимизационные методы*