# Основы Numpy и Scipy

In [None]:
import numpy as np

Наши задачи на этом уроке:

- работа с многомерными массивами;
- основы аугментации данных;
- выполнение сложных математических операций с помощью стандартных функций.

## Многомерные массивы

### Создание

In [None]:
a = np.array([1, 2, 3, 4])

In [None]:
print(a)

In [None]:
a.shape

In [None]:
a = np.array([[1, 2, 3], [4, 5, 6]])

In [None]:
print(a)

In [None]:
a.shape

In [None]:
np.zeros((3, 3))

In [None]:
np.ones((3, 3))

In [None]:
np.empty((2, 2))

In [None]:
np.eye(3)

In [None]:
np.diag((1, 2, 3, 4))

In [None]:
np.arange(5)

In [None]:
np.arange(1, 10, 2)

In [None]:
np.linspace(0, 100, num=11)

In [None]:
np.linspace(0, 100, num=11, dtype='int')

In [None]:
def init_func(x, y):
    return x * 10 + y

In [None]:
np.fromfunction(init_func, (3, 4))

### Изменение размера

In [None]:
a = np.array([[1, 2, 3], [4, 5, 6]])

In [None]:
# Без копирования
a.ravel()

In [None]:
# С копированием
a.flatten()

In [None]:
# Через итератор:
for i in a.flat:
    print(i)

In [None]:
print(a)

In [None]:
a.reshape(3, 2)

In [None]:
# In-place:
a.resize(3, 2)

In [None]:
print(a)

In [None]:
a = [[1, 2, 3], [4, 5, 6]]
b = [[5, 6, 7], [8, 9, 0]]

In [None]:
c = np.hstack((a, b))

In [None]:
print(c)

In [None]:
np.hsplit(c, 2)

In [None]:
np.vstack((a, b))

### Арифметика

In [None]:
a = np.array([1, 2, 3, 4])
b = np.array([5, 6, 7, 8])

In [None]:
a + 1

In [None]:
a + b

In [None]:
a * b

In [None]:
a @ b

### Индексация

In [None]:
a = np.array([[1, 2, 3], [4, 5, 6], [0, 0, 2]])

In [None]:
print(a)

In [None]:
first_row = a[0]

In [None]:
print(first_row)

In [None]:
first_column = a[:,0]

In [None]:
print(first_column)

In [None]:
print(a[:, 1:])

In [None]:
a < 5

In [None]:
print(a[a<5])

In [None]:
a[:, 1] < 5

In [None]:
a[a[:, 1] < 5]

### Транспонирование

In [None]:
print(a.T)

### Сортировка

In [None]:
np.sort(a.T)

### Аугментация

In [None]:
np.flip(a, axis=1)

In [None]:
np.roll(a, 1, axis=1)

In [None]:
np.save('my_file', a)

In [None]:
b = np.load('my_file.npy')

In [None]:
print(b)

In [None]:
np.savetxt('b.csv', b, header='first, second, third', delimiter=',')

### Импорт в Pandas

In [None]:
import pandas as pd

In [None]:
df = pd.DataFrame(a, columns=['first', 'second', 'third'])

In [None]:
df

In [None]:
df = pd.read_csv('b.csv')

In [None]:
df

In [None]:
df.describe()

In [None]:
df.describe().T

### Статистика

In [None]:
values, counts = np.unique(a, return_counts=True)

In [None]:
print(values)
print(counts)

In [None]:
a.mean()

In [None]:
np.mean(a, axis=0)

In [None]:
np.median(a, axis=0)

In [None]:
a.mean(axis=1)

In [None]:
np.max(a, axis=0)

In [None]:
a = np.array([0.01, 0.02, 0.1, 0.87, 0.0])

In [None]:
np.argmax(a)

## SciPy

### Задача на площадь под кривой

#### Решение через определенный интеграл

In [None]:
from scipy.integrate import quad

In [None]:
def f(x):
    return -x**2 + 3 * x + 5

In [None]:
sq, err = quad(f, 1, 4)

In [None]:
print(f'{sq} ± {err:.15f}')

#### Приближенное решение

In [None]:
from scipy.integrate import trapezoid

In [None]:
x = np.linspace(0, 10, 200)

In [None]:
y = np.array([f(x) for x in x])

In [None]:
trapezoid(y[(x >=1) & (x < 4)], x[(x >=1) & (x < 4)])

#### Восстановление кривой по точкам

In [None]:
from scipy.optimize import curve_fit

In [None]:
def func(x, a, b, c):
    return a * x ** 2 + b * x + c

In [None]:
# noise = 0.1 * np.random.uniform(size=x.size)

In [None]:
coefs, _ = curve_fit(func, x[(x >=1) & (x < 4)], (y)[(x >=1) & (x < 4)])

In [None]:
coefs

#### Нахождение экстремума

In [None]:
from scipy.optimize import minimize

In [None]:
minimize(lambda x: -f(x), 0)

In [None]:
result = minimize(lambda x: -f(x), 0)

In [None]:
print(f'Max y = {-result["fun"]} at x = {result["x"]}')

### Линейная алгебра

In [None]:
a = np.array([[1, 2],
             [3, 4]])
b = np.array([[2, 2],
              [0, 0]])

In [None]:
a * b

In [None]:
a @ b

In [None]:
m = [[a[i] @ b.T[j] for j in range(b.T.shape[0])] for i in range(a.shape[0])]

In [None]:
print(m)

In [None]:
m == a @ b

In [None]:
np.array_equal(m, a @ b)

In [None]:
np.eye(2)

In [None]:
a @ np.eye(2)

In [None]:
np.array_equal(a, a @ np.eye(a.shape[0]))

$$kX = y$$

3x + 2y = 2

x - y = 4

5y + z = -1

In [None]:
from scipy.linalg import inv, solve

In [None]:
k = np.array([
              [3, 2,  0],
              [1, -1, 0],
              [0, 5,  1]
            ])

In [None]:
y = np.array([2, 4, -1])

In [None]:
inv(k) @ y

In [None]:
solve(k, y)

In [None]:
k @ np.array([ 2., -2.,  9.])

# Домашнее задание

## Easy

Решите систему линейных уравнений:
3x - 2y = -6
5x + y = 3

In [None]:
# Ваш код ниже:


## Normal / Hard

В репозитории лежит файл `00000e74ad.npy`. Он описывает процесс слияния двух черных дыр, зафиксированный с помощью лазерных интерферометров. Загрузите его в массив numpy. У вас должен получиться массив 3 * 4096 (три разных устройства делали запись одного события 2048 раз в секунду в течение 2 секунд).

Отмасштабируйте сигнал (поделите все значения на максимальное по массиву).

In [None]:
# Ваш код ниже:


## Только Hard

Самостоятельно ознакомьтесь с методами обработки сигнала в `scipy.signal`. Попробуйте отфильтровать сигнал в диапазоне 30-400 Гц.

In [None]:
from scipy import signal

<details>
<summary>Подсказка (нажмите, чтобы посмотреть):</summary>
Один из способов (используется фильтр Баттерворта, пропущенные аргументы заполняйте исходя из условия задачи):<br/>
    <code>sos = signal.butter(__, [__, ___], btype="________", output="sos", fs=____)
data_filt = signal.sosfilt(sos, ваш_массив, axis=1)</code>
</details>

In [None]:
# Ваш код ниже


Сделайте три аугментированные версии отфильтрованного сигнала:
- поменяйте первую и вторую строки местами;
- переверните все строки задом наперед;
- сдвиньте сигнал с помощью `roll` на 5 мс вперед или назад.

Сохраните результаты в отдельные npy-файлы.