<h2 style="text-align: center;"><b>Python. Занятие 2: Numpy, Scipy</b></h2>

<img align=left src="https://cdn.fedoramagazine.org/wp-content/uploads/2015/11/Python_logo.png" width=400 height=250/>

<img src="https://steemit-production-imageproxy-thumbnail.s3.amazonaws.com/DQmPzrCtkniAypHNkuGgEdqcmzzCxD6xCYKD7uFNDyZQLTv_1680x8400" width=400 height=200 />

---

## Библиотека NumPy

Пакет **`NumPy`** предоставляет $n$-мерные однородные массивы (все элементы одного типа); в них нельзя вставить или удалить элемент в произвольном месте. В `numpy` реализовано много операций над массивами в целом. Если задачу можно решить, произведя некоторую последовательность операций над массивами, то это будет столь же эффективно, как в `C` или `matlab`, поскольку функции этой библиотеки реализованы специальным образом (на C, и далее заточены под Python).

In [None]:
import numpy as np

## 1.Одномерные массивы (векторы)

Массивы и про операции над ними. Они выглядят следующим образом:

In [None]:
x = [3, 4, 1]
print(x)

Давайте преобразуем наш массив в __numpy__ массив:

In [None]:
a = np.array(x)
print(a, type(a))

In [None]:
a.std()

`print` печатает массивы в удобной форме.

In [None]:
print(a/4)

`numpy` предоставляет несколько типов для целых (`int16`, `int32`, `int64`) и чисел с плавающей точкой (`float32`, `float64`).

In [None]:
a.dtype, a.dtype.name, a.itemsize

In [None]:
b = np.array([0., 2, 1])
b.dtype

Точно такой же массив.

In [None]:
c = np.array([0.1, 2, 1], dtype=np.float64)
print(c)

Преобразование данных

In [None]:
print(c.dtype)
print(c.astype(int))
print(c.astype(str))

Так для чего нам нужны эти массивы, почему нам может не хватать возможностей обычных массивов?

In [None]:
set([0,1,4,2,2,2]) - set([0,2,90])

In [None]:
print(x)
print(x * 5)

In [None]:
print(a)
print(a * 5)

In [None]:
print(type(x))
print(x ** 2)

In [None]:
print(a ** 2)

Функция arange подобна range. Аргументы могут быть с плавающей точкой. Следует избегать ситуаций, когда (конец−начало)/шаг - целое число, потому что в этом случае включение последнего элемента зависит от ошибок округления. Лучше, чтобы конец диапазона был где-то посредине шага.

In [None]:
a = [4,5,7, "56"]
print(a)
print(type(a))

In [None]:
print(list(range(8)))
print(*range(0, 8))
print([2,5])
print(2,5)


In [None]:
print(type(np.arange(0, 8)))

In [None]:
print(np.arange(0, -8, -0.5))

Но самое главное:

In [None]:
%time np.arange(0, 50000000)
%time list(range(0, 50000000))

Последовательности чисел с постоянным шагом можно также создавать функцией linspace. Начало и конец диапазона включаются; последний аргумент - число точек.

Можно задать список индексов.

In [None]:
print(a[[False, False,  True,  True, False, False,  True,  True]])

Сравнения дают булевы массивы.

In [None]:
print(a > 3)
a[a > 3]

## 2.Операции над одномерными массивами

Следующие арифметические операции проводятся **поэлементно**.

In [None]:
a = np.array([1, 2, 4])
b = np.array([6, 5, 3])

In [None]:
print(a + b)

In [None]:
print(a - b)

Поэлементное умножение (произведение):

In [None]:
print(a * b)

Скалярное произведение 
$a~\cdot~b = (a_1, a_2, .., a_n) \cdot (b_1, b_2, .., b_n) = a_1b_1 + a_2b_2 + .. + b_nb_n = \sum_{i=1}^{n} a_ib_i$:


In [None]:
print(a,b)

In [None]:
print(np.dot(a, b))

Поэлементное умножение:

In [None]:
print(a*b)

In [None]:
print(a / (b + 1))

`numpy` содержит элементарные функции, которые тоже применяются к массивам поэлементно. Они называются **универсальными функциями (`ufunc`)**.

In [None]:
a.round()

Сумма и произведение всех элементов массива; максимальный и минимальный элемент; среднее

In [None]:
print(b)

In [None]:
b = np.array([[1,2],
              [3,4]])

In [None]:
b.sum(), b.prod(), b.min(), b.max(), b.mean()

Константы:


In [None]:
print(np.e, np.pi)

Функция `sort` возвращает отсортированную копию, метод `sort` сортирует на месте (*inplace*).

In [None]:
b = np.arange(9, -1,-1)

print(np.sort(b))
print(b)

Функции delete, insert и append не меняют массив на месте, а возвращают новый массив, в котором удалены, вставлены в середину или добавлены в конец какие-то элементы.


In [None]:
a = np.arange(10, -1, -1)
print(a)
a = np.delete(a, [5, 7])
print(a)

In [None]:
a = np.insert(a, [2, 3], [-100, -200])
print(a)

In [None]:
a = np.append(a, [1, 2, 3])
print(a)

## Двумерные массивы (матрицы)

$$
A = \begin{bmatrix}
    x_{11} & x_{12} & x_{13} & \dots  & x_{1n} \\
    x_{21} & x_{22} & x_{23} & \dots  & x_{2n} \\
    \vdots & \vdots & \vdots & \ddots & \vdots \\
    x_{m1} & x_{m2} & x_{m3} & \dots  & x_{mn}
\end{bmatrix}
$$

Вернемся к массиву __a__

In [None]:
x = [[5,9,7],[3, 4, 1]]
a = np.array(x)

`ndarray.ndim` — число осей (измерений) массива. Как уже было сказано, в мире Python число измерений часто называют рангом

Наш массив одномерный, то есть просто строчка, поэтому

In [None]:
a.ndim

`ndarray.shape` — размеры массива, его форма. Это кортеж натуральных чисел, показывающий длину массива по каждой оси. Для матрицы из n строк и m столбов, shape будет (n,m). 

В $n$-мерном случае возвращается кортеж размеров по каждой координате.

In [None]:
a.shape

In [None]:
len(a)

In [None]:
a.size

**Вопрос:** 
 >Как связаны элементы кортежа shape, ndim, size?

**Ответ:**

__Обратите внимание:__ вектор и одномерный массив тождественные понятия в `NumPy`. Помимо этого, также существуют понятия _вектор-столбец_ и _вектор-строка_, которые, несмотря на то что математически задают один и тот же объект, являются двумерными массивами и имеют другое значение поля __`shape`__ (в этом случае поле состоит из двух чисел, одно из которых равно единице). Эти тонкости будут рассмотрены в следующем уроке.

In [None]:
b[:,np.newaxis, :].shape

In [None]:
print('shape():', b.shape,'\nndim():', b.ndim, '\nsize():', b.size, '\nlen():', len(b))

## Операции с матрицами

In [None]:
A = np.array([[1, 0], [0, 1]])
B = np.array([[4, 1], [2, 2]])

In [None]:
print(A + B)

In [None]:
print(A - B)

In [None]:
print(A / B)

In [None]:
print(A * B)

__Напоминание теории.__ __Транспонированной матрицей__ $A^{T}$ называется матрица, полученная из исходной матрицы $A$ заменой строк на столбцы. Формально: элементы матрицы $A^{T}$ определяются как $a^{T}_{ij} = a_{ji}$, где $a^{T}_{ij}$ — элемент матрицы $A^{T}$, стоящий на пересечении строки с номером $i$ и столбца с номером $j$.

В `NumPy` транспонированная матрица вычисляется с помощью функции __`numpy.transpose()`__ или с помощью _метода_ __`array.T`__, где __`array`__ — нужный двумерный массив.

In [None]:
a = np.array([[1, 2], [3, 4]])
b = np.transpose(a)
c = a.T.T

In [None]:
print("Матрица:\n", a)
print("Транспонирование функцией:\n", b)
print("Транспонирование методом:\n",  c)

__Напоминание теории.__ Операция __умножения__ определена для двух матриц, таких что число столбцов первой равно числу строк второй. 

Пусть матрицы $A$ и $B$ таковы, что $A \in \mathbb{R}^{n \times k}$ и $B \in \mathbb{R}^{k \times m}$. __Произведением__ матриц $A$ и $B$ называется матрица $C$, такая что $c_{ij} = \sum_{r=1}^{k} a_{ir}b_{rj}$, где $c_{ij}$ — элемент матрицы $C$, стоящий на пересечении строки с номером $i$ и столбца с номером $j$.

В `NumPy` произведение матриц вычисляется с помощью функции __`numpy.dot(a, b, ...)`__ или с помощью _метода_ __`array1.dot(array2)`__, где __`array1`__ и __`array2`__ — перемножаемые матрицы.

In [None]:
y = np.array([1, 0])
z = np.dot(A, y)

In [None]:
y = np.linalg.solve(A, z)
print(y)

#### Линейная алгебра (модуль `np.linalg`)

In [None]:
A = np.array([[1, 0], [0, 1]])
x = np.array([[4, 1], [2, 2]])
b = np.dot(A, x)
print(b)

* Решение линейной системы __$Ax=b$__:

In [None]:
x = np.linalg.solve(A, b)
print(x)

### Библиотека SciPy

* Оптимизация функции (нахождение минимума/максимума):

In [None]:
from scipy.optimize import minimize

Обязательно посмотрите документацию, сходу не очевидно, как именно использовать:

In [None]:
?minimize

Опмтимизируем (минимизируем) простую функцию:

In [None]:
def f(x):
    return x ** 2

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt

x = np.arange(-3, 3, .1)
y = f(x)

plt.plot(x,y)
plt.show()

In [None]:
res = minimize(f, x0=100)

In [None]:
res

Тут нужно смотреть на 4 строчки: `fun, message, success и x`  
`fun` - значние функции в точке минимума  
`message` - служебное сообщение об окончании процесса (может быть "успешно", как здесь, или сообщение о том, что что-то пошло не так ("не сошлось"))  
`success` - True, если успешно сошлось (но лучше всегда всё же смотреть и `message`)  
`x` - точка, в которой достигается минимум