In [2]:
import numpy as np
import scipy

# Numpy и Scipy 
## А что мы только что сделали в модуле выше?
Мы импортировали numpy и scipy - основные библиотеки для работы с численными даннами в python, это необходимо для работы с ними, поэтому **обязательно выполните cell выше**. Большая часть их функций совпадает/копирует функции matlab и наоборот. Также, определенная часть из этих функций - старые, но очень эффективные алгоритмы из C и Fortran обернутые в python (см. [f2py](https://docs.scipy.org/doc/numpy/f2py/)). Это позволяет python обходить тот факт, что это интерпретируемый язык и работать намного быстрее; быстроты добавляет и тот факт, что большая часть из операций работает векторно и не использует циклы, а это в свою очередь быстрее из-за большого количество хитрых "хаков" и фокусов, например [этот ответ на стаковерфлоу](https://stackoverflow.com/questions/35091979/why-is-vectorization-faster-in-general-than-loops), [BLAS](https://en.wikipedia.org/wiki/Basic_Linear_Algebra_Subprograms) и [алгоритм Штрассена](https://en.wikipedia.org/wiki/Strassen_algorithm). Это позволяет ему конкурировать по скорости c Fortran и C. Одним из хороших примеров является [эта статья](https://modelingguru.nasa.gov/docs/DOC-1762), хоть и написанная около 10 лет назад, когда у numpy была гораздо меньшая аудитория и меньший арсенал методов.

## Основы массивов

Основой numpy являются `ndarray` - статические n-мерные массивы. 

In [48]:
np.info(np.ndarray) # напоминаю, что по каждой вещи можно получить хелп таким образом

 ndarray()

ndarray(shape, dtype=float, buffer=None, offset=0,
        strides=None, order=None)

An array object represents a multidimensional, homogeneous array
of fixed-size items.  An associated data-type object describes the
format of each element in the array (its byte-order, how many bytes it
occupies in memory, whether it is an integer, a floating point number,
or something else, etc.)

Arrays should be constructed using `array`, `zeros` or `empty` (refer
to the See Also section below).  The parameters given here refer to
a low-level method (`ndarray(...)`) for instantiating an array.

For more information, refer to the `numpy` module and examine the
methods and attributes of an array.

Parameters
----------
(for the __new__ method; see Notes below)

shape : tuple of ints
    Shape of created array.
dtype : data-type, optional
    Any object that can be interpreted as a numpy data type.
buffer : object exposing buffer interface, optional
    Used to fill the array with data.
of

Создание и основные параметры:

In [10]:
a = np.array([0, 1, 2, 3])
a

[0 1 2 3]
1


4

Размер массива:

In [19]:
print(a.shape) 

(4,)


In [20]:
len(a) # длина массива 

4

Массив побольше:

In [21]:
b = np.array([[0, 1, 2], [3, 4, 5]])
print(b)

[[0 1 2]
 [3 4 5]]


Соответсующий размер: 

In [18]:
print (b.shape)

(2, 3)


Заметьте, что здесь используется tuple - кортеж. Мы о нем не говорили, однако он используется достаточно редко. Если вам все же интересно, можете почитать о нем [здесь](https://pythonworld.ru/tipy-dannyx-v-python/kortezhi-tuple.html)

Заметьте, что длина массива даст неочевидный результат, а точнее его первое измерение:

In [22]:
len(b)

2

Существует целая армия разнообразных функций для создавания массивов, самые распространенные примеры:

In [25]:
print ('zeros: ')
print (np.zeros([3,3]))

print('ones:')
print(np.ones([3,3]))

print('Единичная матрица:')
print(np.eye(3))

zeros: 
[[0. 0. 0.]
 [0. 0. 0.]
 [0. 0. 0.]]
ones:
[[1. 1. 1.]
 [1. 1. 1.]
 [1. 1. 1.]]
Единичная матрица:
[[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]


Однако пожалуй самыми частоиспользуемыми является создание массивов с заданным шагом:

In [27]:
np.arange(1,5,0.1) # первое значение, последнее(не включительно!), шаг 

array([1. , 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2. , 2.1, 2.2,
       2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2.9, 3. , 3.1, 3.2, 3.3, 3.4, 3.5,
       3.6, 3.7, 3.8, 3.9, 4. , 4.1, 4.2, 4.3, 4.4, 4.5, 4.6, 4.7, 4.8,
       4.9])

И постоянного шага заданной длины:

In [31]:
c = np.linspace(1,5,10) # первое значение, последнее(на этот раз включительно), количество элементов
print(c)

[1.         1.44444444 1.88888889 2.33333333 2.77777778 3.22222222
 3.66666667 4.11111111 4.55555556 5.        ]


Вообще говоря, при создании массива можно указать тип данных, однако дефолтным является float64:

In [38]:
d = np.array([1, 2, 3], dtype=int)
print('Тип только что созданного массива:', d.dtype)
print('Тип массива саозданного в предыдущем cell-е:', c.dtype)

Тип только что созданного массива: int64
Тип массива саозданного в предыдущем cell-е: float64


## Индексирование массивов
Numpy позволяет делать еще больше фич с индексированием, которое иногда позволяет одной строчкой решать достаточно нетривиальные проблемы, однако, давайте сначала посмотрим на базовые примеры, например на получение столбца:

In [43]:
e = np.zeros([5,5])
print(e)
print('\n') # символ перехода на новую строку

e[:, 2] = 1
print(e)

[[0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]]


[[0. 0. 1. 0. 0.]
 [0. 0. 1. 0. 0.]
 [0. 0. 1. 0. 0.]
 [0. 0. 1. 0. 0.]
 [0. 0. 1. 0. 0.]]


Или даже так:

In [50]:
e[2, :] = np.arange(1, 6)
print(e, '\n')
print('Уже самостоятельный вектор:', e[2, :])

[[0. 0. 1. 0. 0.]
 [0. 0. 1. 0. 0.]
 [1. 2. 3. 4. 5.]
 [0. 0. 1. 0. 0.]
 [0. 0. 1. 0. 0.]] 

Уже самостоятельный вектор: [1. 2. 3. 4. 5.]


Пожалуй, самая клевая фича это бинарные(или булевые) маски. С помощью них можно хитрым образом индексировать массив, выбирая какие элементы нас интересуют:

In [80]:
a = np.random.randint(0, 21, 15) 
print(a)

print(a % 3 == 0) 


mask = (a % 3 == 0) # выбираем только элементы делящиеся на три
extract_from_a = a[mask] # или,  a[a%3==0]
print('Делятся на три только:', list(extract_from_a)) # конвертация в лист чтобы смотрелась красивее

[14 18 13 12 16  7 17  5  2  2  1 19 11 20 19]
[False  True False  True False False False False False False False False
 False False False]
Делятся на три только: [18, 12]
