# Ввод и вывод данных

#### Файлы NumPy (npy, npz)
load(file[, mmap_mode, allow_pickle, …]) - загрузка массивов из файлов формата .npy, .npz, а также pickle объектов и pickle файлов.

save(file, arr[, allow_pickle, fix_imports]) - сохранение массива в .npy двоичном файле.

savez(file, *args, **kwds) - сохранение нескольких массивов в несжатом .npz файле.

savez_compressed(file, *args, **kwds) - сохранение нескольких массивов в сжатом .npz файле.

#### Текстовые файлы
loadtxt(fname[, dtype, comments, delimiter, …]) - Загрузка данных из текстового файла.

savetxt(fname, X[, fmt, delimiter, newline, …]) - Сохранение массива в текстовом файле.

genfromtxt(fname[, dtype, comments, …]) - Загрузка данных из текстового файла с указанием правил обработки отсутствующих и прочих значений.

fromregex(file, regexp, dtype[, encoding]) - Создание массива из данных текстового файла с использованием регулярных выражений.

fromstring(string[, dtype, count, sep]) - Создание одномерного массива из данных в строке.

ndarray.tofile(fid[, sep, format]) - Запись массива в текстовый или двоичный (по умолчанию) файл.

ndarray.tolist() - Представление массива NumPy в виде списка Python.


In [1]:
import numpy as np

arr = np.loadtxt('array_ex.txt', delimiter=', ')
print(arr)

OSError: array_ex.txt not found.

In [None]:
np. savetxt('array_ex2.txt', arr, delimiter=', ')


####  Необработанные бинарные файлы
fromfile(file[, dtype, count, sep]) - Создание массива из данных в текстовом или двоичном файле.

ndarray.tofile(fid[, sep, format]) - Запись массива в текстовый или двоичный (по умолчанию) файл.

####  Строковое представление
array2string(a[, max_line_width, precision, …]) - Возвращает строковое представление массива.

array_repr(arr[, max_line_width, precision, …]) - Возвращает строковое представление массива вместе с информацией о его типе и типе его данных.

array_str(a[, max_line_width, precision, …]) - Возвращает строковое представление массива.

format_float_positional(x[, precision, …]) - Возвращает строковое представление числа с плавающей точкой.

format_float_scientific(x[, precision, …]) - Возвращает строковое представление числа с плавающей точкой в научной нотации.

####  Параметры текстового представления

set_printoptions([precision, threshold, …]) - Позволяет настроить параметры вывода массивов на экран.

get_printoptions() - Возвращает текущие параметры вывода массивов на экран.


####  Источники данных

DataSource([destpath]) - Использование локальных и сетевых источников данных по указанному пути или URL-адресу.

####  Системы счисления

binary_repr(num[, width]) - Возвращает строковое представление числа в двоичной системе счисления.

base_repr(number[, base, padding]) - Возвращает строковое представление числа в заданной системе счисления.

## Простая визуализация

### Pyplot

Основным элементом изображения, которое строит pyplot является Фигура (Figure), на нее накладываются один или более графиков, осей, надписей и т.п. Для построения графика используется команда plot().

In [None]:
import matplotlib.pyplot as plt
plt.plot()

In [None]:
plt.plot([1, 7, 3, 5, 11, 1]) # Значения из этого списка будут отложены по оси ординат (ось y), а по оси абсцисс (ось x) будут отложены индексы элементов массива

In [None]:
# Зададим значения по осям
plt.plot([1, 5, 10, 15, 20], [1, 7, 3, 5, 11]) 

In [None]:
import numpy as np
x = np.linspace(0,3,5)
y = np.linspace(0,8,5)
plt.plot(x, y) # График прямой
plt.show() 

In [None]:
plt.plot(x, y, 'o')

In [None]:
# Построение графика
plt.title("Линейная зависимость y = x") # заголовок
plt.xlabel("x") # ось абсцисс
plt.ylabel("y") # ось ординат
plt.grid()      # включение отображение сетки
plt.plot(x, y)  # построение графика

In [None]:
plt.plot(x, y, "r--")  # построение графика

# [SciPy](https://docs.scipy.org/doc/numpy/docs/howto_document.html#howto-document)

SciPy представляет собой совокупность математических алгоритмов и функций, построенных как расширение Numpy на Python. Он значительно расширяет возможности интерактивной сессии Python, предоставляя пользователю команды высокого уровня и классы для управления и визуализации данных. Со SciPy интерактивный сеанс Python становится средой обработки данных и системой прототипирования соперничающей с такими системами, как MATLAB, IDL, Octave, R-Lab, and SciLab.


| Подпакет  |Описание  | 
|:------------- |:---------------| 
|cluster | Алгоритмы кластеризации| 
| constants| Физические и математические константы| 
| fftpack| Подпрограммы быстрого преобразования Фурье| 
| integrate| Интегрирование и решение обыкновенных дифференциальных уравнений| 
| interpolate| Интерполяционные и сглаживающие сплайны| 
| io| Ввод и вывод| 
| linalg| Линейная алгебра| 
| ndimage| обработка N-мерных изображений| 
| odr| Мультиплексирование с ортогональным расстояние регрессии| 
| optimize| Оптимизация и поиск корневых структур| 
| signal| Обработка сигналов| 
| sparse| Разреженные матрицы и связанные с ними процедуры| 
| spatial| Пространственные структуры данных и алгоритмы| 
| special| Специальные функции| 
| stats| Статистические распределения и функции| 
| weave| C/C ++ интеграция| 


### Ввод вывод
Пример работы с файлами Matlab

In [None]:
from scipy import io as spio

a = np.ones((3, 3))
spio.savemat('file.mat', {'a': a})

data = spio.loadmat('file.mat')
print(data['a'])

### Линейная алгебра

In [None]:
from scipy import linalg

**scipy.linalg.det()** вычисляет определитель квадратной матрицы

In [None]:
arr = np.array([[1, 2],
                [3, 4]])
print(linalg.det(arr))



arr = np.array([[3, 2],
                [6, 4]])

print(linalg.det(arr))

print(linalg.det(np.ones((3, 4))))


**scipy.linalg.inv()** вычисляет обратную квадратной матрицы

In [None]:
arr = np.array([[1, 2],
                [3, 4]])

iarr = linalg.inv(arr)
print(iarr)

# Сделаем проверку
np.allclose(np.dot(arr, iarr), np.eye(2))  # Сравним результат произведения матрицы на обратную матрицу с единичной матрицей

**scipy.linalg.svd()** разложение по сингулярным числам

In [None]:
arr = np.arange(9).reshape((3, 3)) + np.diag([1, 0, 1])
uarr, spec, vharr = linalg.svd(arr)
print(uarr, spec, vharr)

In [None]:
spec

### Интерполяция

In [None]:
from scipy.interpolate import interp1d

In [None]:
measured_time = np.linspace(0, 1, 10)
noise = (np.random.random(10)*2 - 1) * 1e-1
measures = np.sin(2 * np.pi * measured_time) + noise # Функция, график которой  близок к функции синуса

In [None]:
linear_interp = interp1d(measured_time, measures) # Построим функцию линейной интерполяции

interpolation_time = np.linspace(0, 1, 50) # Построим функцию линейной интерполяции
linear_results = linear_interp(interpolation_time)

In [None]:
import matplotlib.pyplot as plt
plt.plot(interpolation_time, linear_results) # график линии
plt.show()

In [None]:
cubic_interp = interp1d(measured_time, measures, kind='cubic') # Построим функцию кубической интерполяции
cubic_results = cubic_interp(interpolation_time)

plt.plot(interpolation_time, cubic_results)
plt.show()

### Оптимизация

Оптимизация - это проблема нахождения численного решения минимизации или равенства.

In [None]:
from scipy import optimize

In [None]:
# Данные с шумом
x_data = np.linspace(-5, 5, num=50)
y_data = 2.9 * np.sin(1.5 * x_data) + np.random.normal(size=50)

plt.scatter(x_data, y_data) # график точек
plt.show()

In [None]:
def test_func(x, a, b): # Определим тестовую функцию
    return a * np.sin(b * x)

params, params_covariance = optimize.curve_fit(test_func, x_data, y_data, p0=[2, 2]) # Произведем подбор параметров a и b для наилучшей аппроксимации исходных данных
print(params)

### Поиск минимума скалярной функции

In [None]:
def f(x):
    return x**2 + 10*np.sin(x)

x = np.arange(-10, 10, 0.1)
plt.plot(x, f(x)) 
plt.show()

 **scipy.optimize.minimize()** Поиск минимума в окрестности точки

In [None]:
result = optimize.minimize(f, x0=0)
result

In [None]:
result.x # Координаты минимума

### Упражнение

Постройте график функции и найдите глобальные минимумы ![image.png](attachment:image.png)

**scipy.integrate** численное интегрирование

In [None]:
from scipy.integrate import quad
res, err = quad(np.sin, 0, np.pi/2) # Интеграл sin(x)dx от 0 до пи/2
res

**Двойные интегралы**

Общая форма dblquad – это **scipy.integrate.dblquad (func, a, b, gfun, hfun)**, где func – это имя интегрируемой функции, a и b – это нижний и верхний пределы переменной x соответственно, а gfun и hfun – это имена функций, которые определяют нижний и верхний пределы. переменной у.

## Упражнение


Вычислить интеграл ![image.png](attachment:image.png) по области 0<=x<=1, 0<=y<=1

## Полиномы

Существует два (взаимозаменяемых) способа работы с 1-мерными полиномами в SciPy. 

Во-первых, использовать класс poly1d из NumPy. Этот класс принимает коэффициенты или корни полинома для инициализации полинома. Затем полиномиальный объект может быть обработан в алгебраических выражениях, интегрирован, дифференцирован? оценен и выведен в форме полинома. 
Другой способ работы с многочленами — как с массивом коэффициентов: первый элемент массива дает коэффициент старшего порядка. Есть явные функции сложения, вычитания, умножения, деления, интегрирования, дифференцирования, и вычисления полиномов, представленных в виде последовательности коэффициентов.

In [None]:
from numpy import poly1d
p = poly1d([3,4,5])
print(p)

print(p*p)

print(p.integ(k=6))

print(p.deriv())


Другой способ обработки полиномов - это массив коэффициентов, при этом первый элемент массива дает коэффициент наивысшей степени. Существуют явные функции для сложения, вычитания, умножения, деления, интегрирования, дифференцирования и оценки полиномов, представленных в виде последовательностей коэффициентов.

## Упражнение

p(x)= x^4+2x^3-11x^2-13x+23
 
 1) Определить корни полинома (исп. np.roots)
 
 2) Вычислить значения полинома в точках 5, 10, 0,5
 
 3) Найти производную функции

**scipy.ndimage** обработка изображений

In [None]:
from scipy import misc
face = misc.face()
f = misc.face()
import matplotlib.pyplot as plt
plt.imshow(f)


In [None]:
from scipy import ndimage # Сдвиг, вращение и масштабирование
shifted_face2 = ndimage.shift(face, (50, 50), mode='nearest')
plt.imshow(shifted_face2)

In [None]:
cropped_face = f[50:-50, 50:-50]
plt.imshow(cropped_face)

In [None]:
zoomed_face = ndimage.zoom(f, 2)
plt.imshow(zoomed_face)

In [None]:
rotated_face = ndimage.rotate(f, 30)
plt.imshow(rotated_face)

In [None]:
ace = misc.face(gray=True)
face = face[:512, -512:]  # Обрезаем изображение

noisy_face = np.copy(face).astype(np.float)
noisy_face += face.std() * 0.5 * np.random.standard_normal(face.shape)
plt.imshow(noisy_face)

In [None]:
face1 = misc.face()
plt.imshow(face1)