# Numpy и основы линейной алгебры

семинарист: Альперович Вадим 

```tg: @vadik_alp```

---

# Introduction

<img src="https://ipython.org/_static/IPy_header.png"></img>

### IPython
является оболочкой **Read-Evaluate-Print Loop** для интерактивной разработки Python. Он поддерживает интерактивную визуализацию с использованием графических инструментов GUI и предоставляет ядро ​​для Jupyter.

<p><img alt="jupyter logo" width="90" src="https://upload.wikimedia.org/wikipedia/commons/thumb/3/38/Jupyter_logo.svg/1200px-Jupyter_logo.svg.png" hspace="50px" align="left" vspace="0px"></p>

### Jupyter Notebook 

серверно-клиентское приложение, позволяющее редактировать и запускать ipython notebook через веб-браузер. Jupyter Notebook может быть запущено на локальном рабочей машине, не требующей доступа в Интернет, или может быть установлено на удаленном сервере и доступно через Интернет.

**Useful links:**

- Anaconda: https://www.anaconda.com/products/individual
- Miniconda: https://docs.conda.io/en/latest/miniconda.html
- Markdown: https://www.markdownguide.org/basic-syntax

<p><img alt="Colaboratory logo" width="100" src="https://colab.research.google.com/img/colab_favicon_256px.png" hspace="10px" align="left" vspace="0px"></p>


### Google Colaboratory


Colaboratory позволяет писать и выполнять код Python в браузере. При этом:
- не требуется никакой настройки;
- вы получаете бесплатный доступ к графическим процессорам;
- предоставлять доступ к документам другим людям очень просто.


# Introduction to Jupyter

In [None]:
print(1)

In [None]:
x = 1
x

In [None]:
print("x:", x)

Одно из самых полезных **преимуществ** – встроенный редактор $\LaTeX$, который позволяет просто набирать и оформлять формулы:

<br>

$$ \sum_{i=1}^Nx_i^n + y^n = \frac{z^n}{10!}$$

In [None]:
%%time
print(0)

In [None]:
%pwd

In [None]:
!pip freeze

# Numpy

<p><img alt="Colaboratory logo"  width="300" src="https://upload.wikimedia.org/wikipedia/commons/thumb/3/31/NumPy_logo_2020.svg/1280px-NumPy_logo_2020.svg.png" hspace="10px" vspace="0px"></p>



— библиотека с открытым исходным кодом для языка программирования Python. Возможности: поддержка многомерных массивов; поддержка высокоуровневых математических функций, предназначенных для работы с многомерными массивами.

Useful links:
- [Why is NumPy fast?](https://numpy.org/doc/stable/user/whatisnumpy.html)
- [NumPy documentation](https://numpy.org/doc/stable/user/absolute_beginners.html)
- [100 задач NumPy](https://pythonworld.ru/numpy/100-exercises.html)

In [None]:
!pip install numpy

In [None]:
import numpy as np

### Creating matrix / vector

In [None]:
lists = [[26, 1, 0], [5, 13, 5], [18, 3, 1], [13, 10, 0]]
data = np.array(lists)

In [None]:
data.shape

In [None]:
data.dtype

In [None]:
matrix = np.zeros((5, 10)) # np.ones, np.empty

In [None]:
vec = np.arange(5)
print(vec)
print(vec.shape)

In [None]:
np.random.randint(100, size=(5, 10))

In [None]:
# np.set_printoptions(precision=4)
np.random.rand(5, 10)

In [None]:
?np.array

In [None]:
np.zeros((3, 2, 7)).shape

### Operations

* element-wise
* aggregations
* matrix

In [None]:
# element-wise
data + data

In [None]:
data * data

In [None]:
data ** 2

In [None]:
a = np.arange(12).reshape(3, 4)
b = np.zeros((3, 4))
a * b

In [None]:
a + b

In [None]:
np.exp(data)

In [None]:
### aggregate
np.sum(data)

In [None]:
np.sum(data, axis=1) 

In [None]:
np.sum(data, axis=0)

In [None]:
np.prod(a, axis=1)

In [None]:
a

In [None]:
np.mean(data, axis=0)

In [None]:
### matrix operations
x = np.random.rand(3, 4)
y = np.random.rand(4, 10)
np.dot(x, y)

In [None]:
x @ y

In [None]:
v = np.ones(3)
np.dot(data, v) # (4, 3) x (3,) -> (4,)

In [None]:
v.shape

In [None]:
v = np.ones((3, 1))
np.dot(data, v) # (4, 3) x (3, 1) -> (4, 1)

In [None]:
data @ v

In [None]:
data.dot(v)

In [None]:
np.sum(data, axis=1)
data.sum(axis=1)

In [None]:
np.eye(5)

In [None]:
np.linalg.inv(np.eye(5)) # inverse matrix

In [None]:
np.linalg.solve()

#### Скалярное произведение

Скалярное произведение в пространстве $\mathbb{R}^{n}$ для двух векторов $x = (x_{1}, \dots, x_{n})$ и $y = (y_{1}, \dots, y_{n})$ определяется как:

$$
\langle x, y \rangle = \sum_{i=1}^n x_{i} y_{i}.
$$

Скалярное произведение двух векторов можно вычислять с помощью функции __`numpy.dot(a, b, ...)`__ или _метода_ __`vec1.dot(vec2)`__, где __`vec1`__ и __`vec2`__ — исходные векторы.

In [None]:
a = np.array([1, 2, 3])
b = np.array([6, 5, 4])
np.dot(a, b)

#### Угол между векторами


$$
\left| x \right| = \sqrt{\langle x, x \rangle} = \sqrt{\sum_{i=1}^n x_{i}^2} 
$$
____
Теперь, когда мы знаем расстояние между двумя ненулевыми векторами и их длины, мы можем вычислить угол между ними через скалярное произведение:

$$
\langle x, y \rangle = \left| x \right| | y | \cos(\alpha)
\implies \cos(\alpha) = \frac{\langle x, y \rangle}{\left| x \right| | y |},
$$

где $\alpha \in [0, \pi]$ — угол между векторами $x$ и $y$.

In [None]:
from numpy.linalg import norm

a = np.array([0, 0, 1])
b = np.array([0, 1, 0])

cos_angle = np.dot(a, b) / (norm(a)  * norm(b))

print('Косинус угла между a и b:', cos_angle)
print('Сам угол:', np.rad2deg(np.arccos(cos_angle)))

### Indexing

In [None]:
data[1]

In [None]:
data[:, 2]

In [None]:
data[:2, :2]

In [None]:
data[::2]

In [None]:
data[::2, -1]

In [None]:
data[-2:, -2:]

In [None]:
data[[1, 2]]

In [None]:
data[:, [True, True, False]] # логическая индексация

In [None]:
# перемешать строки в случайном порядке
np.random.permutation(data)

In [None]:
idxs = np.random.permutation(np.arange(data.shape[0]))
data[idxs]

In [None]:
data[::-1]

In [None]:
data

### Merging 

In [None]:
new_data = np.array([[14, 4, 1], [1, 11, 9]])

In [None]:
new_data

In [None]:
long_data = np.vstack((data, new_data))

In [None]:
long_data

In [None]:
np.hstack((data, data))

In [None]:
np.concatenate((data, new_data), axis=1)

np.hstack((data, new_data)) # ошибка

In [None]:
np.hstack((long_data, long_data.sum(axis=1).reshape(6, 1)))

In [None]:
long_data.shape

In [None]:
long_data.sum(axis=1).shape

In [None]:
##### newaxis

In [None]:
sums = long_data.sum(axis=1)

In [None]:
sums

In [None]:
sums.shape

In [None]:
sums[:, np.newaxis]

In [None]:
sums[:, np.newaxis].shape

In [None]:
sums[np.newaxis, :].shape

##### Broadcasting

In [None]:
sums

In [None]:
long_data

In [None]:
long_data / sums

In [None]:
long_data / sums.reshape(-1, 1)

In [None]:
long_data / sums[:, np.newaxis]

In [None]:
long_data.shape, sums.shape

In [None]:
# Задача: создать таблицу умножения до 9

In [None]:
numbers = np.arange(10)

In [None]:
numbers[:, np.newaxis] * numbers[np.newaxis, :]

### Binary arrays

In [None]:
bin_array = np.array([True, False, True, False])

In [None]:
np.all(bin_array)

In [None]:
np.any(bin_array)

In [None]:
np.sum(bin_array)

In [None]:
yes = long_data[:, 0]
no = long_data[:, 1]
np.sum(yes<no)

### Why use Numpy?

In [None]:
n = 300
A = np.random.rand(n, n)
B = np.random.rand(n, n)

In [None]:
%%time
C = np.zeros((n, n))
for i in range(n):
    for j in range(n):
        for k in range(n):
            C[i, j] += A[i, k] * B[k, j]

In [None]:
%%time
C = A @ B

**Do use NumPy, not loops**