# Внутренние устройства типов данных для математических вычислений Python, Numpy, Pytorch.

**Статья основана на второй главе этой <a href="https://github.com/jakevdp/PythonDataScienceHandbook">книги</a> (Introduction to NumPy), но дополнена уточнениями и расширенна главой про broadcasting. Книжка очень хорошая. :-)**

## Подключение библиотек

In [1]:
import time
import numpy as np

## Введение 

При анализе данных приходится иметь дело с числовыми массивами огромных размеров.  Для того, чтобы математические операции занимали минимальное количества времени и памяти необходимо понимание внутреннего устройства структур, использующихся для хранения и манипуляций с ними.  

## Типы данных в Python

Python в отличии от С++ и Java является не строго типизированном языком программирования, что дает ему огромную гибкость. 

**Пример**

```c++
/* C code */
int result = 0;
for(int i=0; i<100; i++){
    result += i;
}
```

```python
# Python code
result = 0
for i in range(100):
    result += i
```

Ключевое отличие в том, что в С++ тип каждой переменной определяется при ее создании и не может быть изменен в дальнейшим. В Python же тип переменной определяется динамически, во время выполнения. Это означает, что мы можем присвоить переменной данные любого типа, меняя при этом тип самой переменной.  

**Пример**

In [2]:
var = 3; print(type(var)) #Создали переменную типа int 

<class 'int'>


In [3]:
var = '3'; print(type(var)) #Меняем значения и тип переменной 

<class 'str'>


На С++ такие манипуляции просто невозможны.

```c++
/* C code */
int result = 0;
result = "Ноль"; # Вызовет ошибку так, как result не строка, а число  
```

Понимание этого очень важно для эффективной манипуляции данными в data science.

## Внутренние устройство типа Integer в Python

Python написан на языке С и каждый тип данных в нем, как мы видели ранее, является классом в Python.

In [6]:
print(type(0)); print(type(0.8)); print(type("ooo"));

<class 'int'>
<class 'float'>
<class 'str'>


В то время как на стороне С каждый тип приставляет из себя структуру, содержащую набор полей.

Для примера **var = 10** не просто переменная типа integer, это указатель на структуру языка С. Рассмотрим подробно поля этой структуры. 

In [4]:
==============================================

SyntaxError: invalid syntax (<ipython-input-4-b07b9f614f72>, line 1)

## Сложение матриц 

In [None]:
size_of_vec = 100000


X_list = list(range(size_of_vec))
Y_list = list(range(size_of_vec))


X_numpy = np.arange(size_of_vec, dtype=int)
Y_numpy = np.arange(size_of_vec, dtype=int)

In [None]:
type(Y_list)

In [None]:
A = array.array('i', X_list)
B = array.array('i', Y_list)

In [None]:
def pure_python_version():
    t1 = time.time()
    Z = [X_list[i] + Y_list[i] for i in range(len(X_list)) ]
    return time.time() - t1

def numpy_version():
    t1 = time.time()
    Z = [A[i] + B[i] for i in range(len(A)) ]
    return time.time() - t1


t1 = pure_python_version()
t2 = numpy_version()
print(t1, t2)
print("Numpy is in this example " + str(t1/t2) + " faster!")

In [None]:
=====================================================================

In [None]:
import array
L = list(range(10))
A = array.array('i', X_list)
B = array.array('i', Y_list)

In [None]:
t1 = time.time()
Z = X_numpy + Y_numpy
numpy = time.time() - t1

In [None]:
len(Z)

In [None]:
t1 = time.time()
Z = A + B
arr = time.time() - t1

In [None]:
len(Z)

In [None]:
print(numpy, arr)
print("Numpy is in this example " + str(arr/numpy) + " faster!")

In [None]:
import torch
import math
import numpy as np

In [None]:
print(torch.__config__.show())

In [None]:
print(torch.__config__.parallel_info())

In [None]:
np.show_config()

In [None]:
==========================

In [None]:
%load_ext line_profiler

In [None]:
%load_ext memory_profiler

In [None]:
from mprun_demo import test_me

In [None]:
%mprun -f test_me test_me(1500, 1000)

In [None]:
%lprun -f test_me test_me(1000, 10000)

In [None]:
torch.cuda.memory_reserved()

In [None]:
print(torch.__version__)

In [None]:
print(torch.cuda.memory_summary())

In [None]:
======================================================

In [None]:
torch.cuda.memory_allocated()

In [None]:
# Load Scalene
%load_ext scalene

In [None]:
M1 = np.random.rand(10100,1000)

In [None]:
M2 = np.random.rand(1000,10100)

In [None]:
def mul_matrix(M1,M2):
    M1 = np.random.rand(10100,1000)
    M2 = np.random.rand(1000,10100)
    m3 = M1 @ M2
    return m3 + 1

In [None]:
y = mul_matrix(M1,M2)

In [None]:
%scrun --profile-all mul_matrix(M1,M2)

In [None]:
==========================

In [None]:
m3 = torch.from_numpy(M1)
m4 = torch.from_numpy(M2)

In [None]:
cuda = torch.device('cuda')

In [None]:
m3 = m3.to(cuda)

In [None]:
m4 = m4.to(cuda)

In [None]:
m = m3 @ m4

In [None]:
%%scalene --reduced-profile
# Profile more than one line of code in a cell\
MR = M1 * M2
MR += 3

In [None]:
%scrun --help

=====================================

In [None]:
def test_me1():
    return np.array(np.random.uniform(0, 100, size=(10**8)))

In [None]:
import numpy as np

def test_me():
    for i in range(6):
        x = np.array(range(10**7))
        y = test_me1()

In [None]:
# Profile just one line of code
%scrun --reduced-profile test_me()

In [None]:
%%scalene --reduced-profile
# Profile more than one line of code in a cell
x = 0
for i in range(1000):
    for j in range(1000):
        x += 1

In [None]:
cuda = torch.device('cuda')