# Как мы с вами будем жить

Все будет лежать здесь  

<font size="24pt" style="font-family: Times">[https://bit.ly/3DR0pkZ](https://bit.ly/3DR0pkZ)</font>
<img src="img/course-qr-code.png" width="50%">

# Среда разработки Jupyter Notebook
Мы будем работать в среде [Jupyter Notebook](https://jupyter.org/) так как она является свободно распространяемой и позволяет выполнять отдельные фрагменты кода, а не программу целиком. Подобное бывает очень удобно при изучении отдельных классов и методов, а также при многочисленных прогонах различных версий программы, отличающейся лишь небольшими исправлениями.

Среда является стандартом де-факто для обучения и исследований, так как позволяет чередовать фрагменты кода с комментариями, что делает ее похожей на статью или фрагмент книги. Справку по взаимодействию со средой можно получить нажав на клавишу **H**. Комментарии могут размечаться при помощи языка [HTML](http://htmlbook.ru/) или [Markdown](https://github.com/google/styleguide/blob/gh-pages/docguide/style.md), принятого на сайте GitHub.

Для того, чтобы начать редактирование ячейки, необходимо выбрать ее и нажать Enter или дважды кликнуть по ячейке. Для ячеек с кодом или редактируемых ячеек с комментариями достаточно кликнуть в область редактирования.

Прочитать про "магию Юпитера" можно, например, [здесь](https://ipython.readthedocs.io/en/stable/interactive/magics.html).

Если вы не хотите ставить себе Юпитер, можно воспользоваться одной из бесплатных альтернатив: полноценные локальные среды разработки [PyCharm](https://www.jetbrains.com/pycharm/), [VS Code](https://code.visualstudio.com/) или другие, а также онлайн-редактор с виртуальной машиной (в том числе, с предоставлением видеокарты) [Google Colab](https://colab.research.google.com/).

# Бибилиотека NumPy

Библиотека NumPy предназначена для быстрой обработки однородных (в основном числовых) массивов.

Основным объектом библиотеки является многомерный массив ndarray. Этот массив может быть создан из списка или другого итерируемого объекта Python.

In [1]:
import numpy as np

In [2]:
l = [[1, 2, 3], [4, 5, 6]]
nd = np.array(l)
nd

array([[1, 2, 3],
       [4, 5, 6]])

Массив имеет ряд функций для работы с его формой.

In [3]:
print(nd.ndim)  # Размерность массива
print(nd.shape)  # Количество элементов по каждой размерности
print(nd.dtype)  # Тип элементов
print(nd.data)  # Буфер с элементами

2
(2, 3)
int64
<memory at 0x7fb76463c1e0>


Массивы numpy позволяют проводить арифметические операции быстрее, чем над списками. Помимо этого, для этих массивов есть масса стандартных математических функций.

In [4]:
l = list(range(1000000))
nd = np.array(range(1000000))

In [5]:
%%time
sum(l)

CPU times: user 9.43 ms, sys: 0 ns, total: 9.43 ms
Wall time: 9.83 ms


499999500000

In [6]:
%%time
nd.sum()

CPU times: user 1.28 ms, sys: 855 µs, total: 2.14 ms
Wall time: 6.41 ms


499999500000

Сравним скорость работы скалярного произведения.

In [7]:
%%time
s = 0
for a in l:
    s += a * a
print(s)

333332833333500000
CPU times: user 127 ms, sys: 580 µs, total: 128 ms
Wall time: 127 ms


In [8]:
%%time
s = sum(map(lambda x: x * x, l))

CPU times: user 67.6 ms, sys: 2.55 ms, total: 70.1 ms
Wall time: 69.4 ms


In [9]:
%%time
nd.dot(nd)

CPU times: user 2.37 ms, sys: 0 ns, total: 2.37 ms
Wall time: 1.24 ms


333332833333500000

Массив может создаваться по-разному в зависимости от типа объектов. Желаемый тип можно передать при создании в параметре dtype.

In [10]:
np.array([[1, 2], [3, 4]], dtype=np.int32)

array([[1, 2],
       [3, 4]], dtype=int32)

In [11]:
np.array([[complex(1, 2), 2], [3, 4]], dtype=complex)

array([[1.+2.j, 2.+0.j],
       [3.+0.j, 4.+0.j]])

In [12]:
np.array([[1.1, 2.2], [3.3, 4.4]], dtype=np.float32)

array([[1.1, 2.2],
       [3.3, 4.4]], dtype=float32)

In [13]:
ttt = np.array([[1.1, 2.2], [3.3, 4.4]], dtype=np.float128)
ttt.dtype

dtype('float128')

# Индексирование массивов

Индекс пишется в единых квадратных скобках через запятую. Порядок следования индексов - как в С++.

In [7]:
nd = np.array([[1, 2, 3], [4, 5, 6]])
nd[0, 1]

2

Как и в случае со списками Python, можно использовать срезы для создания прямоугольных фрагментов. Срезы подчиняются темм же правилам.

In [15]:
nd[0:2, 1:3]

array([[2, 3],
       [5, 6]])

In [16]:
nd[1, 0:3:2]

array([4, 6])

Срезы могут использоваться не только для чтения элементов, но и для записи.

In [8]:
nd[1, 0:3:2] = -1
nd

array([[ 1,  2,  3],
       [-1,  5, -1]])

# Создание массива и изменение его размеров
Для создания стандартных массивов библиотека предоставляет массу функций.

In [18]:
np.zeros(
    (5, 5), dtype=np.int32
)  # Функция создает массив заданной размерности, заполненный нулями.

array([[0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0]], dtype=int32)

In [19]:
np.ones((5, 5))  # Функция создает массив заданной размерности, заполненный нулями.

array([[1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.]])

In [20]:
np.linspace(0, 2, 11)  # Массив из 9 элементов от 0 до 2 включительно.

array([0. , 0.2, 0.4, 0.6, 0.8, 1. , 1.2, 1.4, 1.6, 1.8, 2. ])

In [21]:
np.arange(1, 10, 2)  # Аналог стандартного range

array([1, 3, 5, 7, 9])

In [22]:
%%time
nd = np.array(range(1000000))

CPU times: user 56.5 ms, sys: 28.1 ms, total: 84.6 ms
Wall time: 84.4 ms


In [11]:
%%time
nd = np.arange(1000000)

CPU times: user 2.06 ms, sys: 17 ms, total: 19 ms
Wall time: 18.1 ms


Для преобразования размерности массива используется функция `reshape`.

In [14]:
np.reshape(nd, (1000, 1000))

array([[     0,      1,      2, ...,    997,    998,    999],
       [  1000,   1001,   1002, ...,   1997,   1998,   1999],
       [  2000,   2001,   2002, ...,   2997,   2998,   2999],
       ...,
       [997000, 997001, 997002, ..., 997997, 997998, 997999],
       [998000, 998001, 998002, ..., 998997, 998998, 998999],
       [999000, 999001, 999002, ..., 999997, 999998, 999999]])

In [25]:
np.reshape(nd, (200, 5000))

array([[     0,      1,      2, ...,   4997,   4998,   4999],
       [  5000,   5001,   5002, ...,   9997,   9998,   9999],
       [ 10000,  10001,  10002, ...,  14997,  14998,  14999],
       ...,
       [985000, 985001, 985002, ..., 989997, 989998, 989999],
       [990000, 990001, 990002, ..., 994997, 994998, 994999],
       [995000, 995001, 995002, ..., 999997, 999998, 999999]])

Один из параметров размера массива может равняться -1. В этом случае он ыводится из резмеров массива.

In [26]:
np.array([[1, 2, 3], [4, 5, 6]]).reshape((1, -1))

array([[1, 2, 3, 4, 5, 6]])

In [27]:
np.array([[1, 2, 3], [4, 5, 6]]).reshape((-1, 1))

array([[1],
       [2],
       [3],
       [4],
       [5],
       [6]])

In [28]:
np.array([[1, 2, 3], [4, 5, 6]]).reshape((-1, 2))

array([[1, 2],
       [3, 4],
       [5, 6]])

Функция `meshgrid` создает массивы с декартовым произведением индексов. Количество массивов на выходе равно количеству массивов на входе, то есть размерности пространств совпадают. Параметр `indexing` позволяет менять порядок следования индексов (принимает значения 'xy' или 'ij').

In [29]:
np.meshgrid(np.arange(5), np.arange(20, 23), indexing="xy")

[array([[0, 1, 2, 3, 4],
        [0, 1, 2, 3, 4],
        [0, 1, 2, 3, 4]]),
 array([[20, 20, 20, 20, 20],
        [21, 21, 21, 21, 21],
        [22, 22, 22, 22, 22]])]

# Арифметические и другие операции

В состав библиотеки входят функции для расчета арифметических, тригонометрических, логических, матричных и других функций. 

С полным списком функций можно ознакомиться [здесь](https://docs.scipy.org/doc/numpy/reference/routines.math.html).

In [15]:
nd = np.arange(1000000)

In [16]:
%%time
(nd * nd + nd) / nd

CPU times: user 7.35 ms, sys: 15.3 ms, total: 22.7 ms
Wall time: 22 ms




array([        nan, 2.00000e+00, 3.00000e+00, ..., 9.99998e+05,
       9.99999e+05, 1.00000e+06])

In [32]:
m2 = np.meshgrid(np.arange(5), np.arange(20, 23), indexing="ij")
m2[0] + 3 * m2[1]

array([[60, 63, 66],
       [61, 64, 67],
       [62, 65, 68],
       [63, 66, 69],
       [64, 67, 70]])

In [17]:
np.around(((nd * nd + nd) / nd))  # Округление результатов.

  np.around(((nd * nd + nd) / nd))  # Округление результатов.


array([        nan, 2.00000e+00, 3.00000e+00, ..., 9.99998e+05,
       9.99999e+05, 1.00000e+06])

In [34]:
np.arange(1000) * np.arange(1001)

ValueError: operands could not be broadcast together with shapes (1000,) (1001,) 

In [35]:
np.hypot(nd, nd)  # Возвращает гипотенузы для заданных массивов катетов.

array([0.00000000e+00, 1.41421356e+00, 2.82842712e+00, ...,
       1.41420932e+06, 1.41421073e+06, 1.41421215e+06])

In [36]:
np.cumsum(nd[:100])  # Кумулятивная сумма элементов.

array([   0,    1,    3,    6,   10,   15,   21,   28,   36,   45,   55,
         66,   78,   91,  105,  120,  136,  153,  171,  190,  210,  231,
        253,  276,  300,  325,  351,  378,  406,  435,  465,  496,  528,
        561,  595,  630,  666,  703,  741,  780,  820,  861,  903,  946,
        990, 1035, 1081, 1128, 1176, 1225, 1275, 1326, 1378, 1431, 1485,
       1540, 1596, 1653, 1711, 1770, 1830, 1891, 1953, 2016, 2080, 2145,
       2211, 2278, 2346, 2415, 2485, 2556, 2628, 2701, 2775, 2850, 2926,
       3003, 3081, 3160, 3240, 3321, 3403, 3486, 3570, 3655, 3741, 3828,
       3916, 4005, 4095, 4186, 4278, 4371, 4465, 4560, 4656, 4753, 4851,
       4950])

In [37]:
np.log10(nd[1:10])

array([0.        , 0.30103   , 0.47712125, 0.60205999, 0.69897   ,
       0.77815125, 0.84509804, 0.90308999, 0.95424251])

In [38]:
np.sin(nd)

array([ 0.        ,  0.84147098,  0.90929743, ...,  0.21429647,
       -0.70613761, -0.97735203])

In [39]:
np.isnan(((nd * nd + nd) / nd))

  np.isnan(((nd * nd + nd) / nd))


array([ True, False, False, ..., False, False, False])

Логические операции могут использовать специальные функции (`logical_and`, `logical_or`, `logical_not`, `logical_xor`, `greater`, `greater_equal`, ...) или операторы битовой логики.

In [40]:
np.greater(nd * 2, nd)

array([False,  True,  True, ...,  True,  True,  True])

In [41]:
np.isnan(((nd * nd + nd) / nd)) & np.greater(nd * 2, nd)  # Поэлементное логическое и.

  np.isnan(((nd * nd + nd) / nd)) & np.greater(nd * 2, nd) # Поэлементное логическое и.


array([False, False, False, ..., False, False, False])

In [21]:
# Оператор свертки по массиву conv_oper сигнала nd1.
nd1 = np.zeros(100)
nd1[1] = 1
nd1[20] = 10
nd1[21] = 9
nd1[29] = -10
nd1[30] = 20
nd1[31] = 25

conv_oper = np.array([1, 2, 3, 4, -3, -2, -1])
np.convolve(nd1, conv_oper)


#  0   0   0   0   0   0  0  1  0  0  0   0  10  9   0  0
#                                     -1, -2, -3, 4, 3, 2,  1
#  0   1   2   3   4  -3  8  28 48

array([   0.,    1.,    2.,    3.,    4.,   -3.,   -2.,   -1.,    0.,
          0.,    0.,    0.,    0.,    0.,    0.,    0.,    0.,    0.,
          0.,    0.,   10.,   29.,   48.,   67.,    6.,  -47.,  -28.,
         -9.,    0.,  -10.,    0.,   35.,   70.,  185.,   60., -105.,
        -70.,  -25.,    0.,    0.,    0.,    0.,    0.,    0.,    0.,
          0.,    0.,    0.,    0.,    0.,    0.,    0.,    0.,    0.,
          0.,    0.,    0.,    0.,    0.,    0.,    0.,    0.,    0.,
          0.,    0.,    0.,    0.,    0.,    0.,    0.,    0.,    0.,
          0.,    0.,    0.,    0.,    0.,    0.,    0.,    0.,    0.,
          0.,    0.,    0.,    0.,    0.,    0.,    0.,    0.,    0.,
          0.,    0.,    0.,    0.,    0.,    0.,    0.,    0.,    0.,
          0.,    0.,    0.,    0.,    0.,    0.,    0.])

# Операции линейной алгебры

Список операций можно найти [здесь](https://docs.scipy.org/doc/numpy/reference/routines.linalg.html).

In [22]:
nd = np.arange(1000000)
nd4 = nd.reshape((1000, 1000))

In [23]:
np.linalg.norm(nd[:1000])

18243.72494859534

In [24]:
%%time
_ = np.linalg.qr(nd4)

CPU times: user 841 ms, sys: 2.03 s, total: 2.88 s
Wall time: 522 ms


In [47]:
%%time
_ = np.linalg.svd(nd4)

CPU times: user 1.34 s, sys: 1.28 s, total: 2.62 s
Wall time: 427 ms


In [48]:
np.linalg.solve(nd4, nd[1000:2000])

LinAlgError: Singular matrix

# Генерация случайных чисел
Библиотека numpy предоставляет гораздо более удобные функции для генерации случайных чисел.

Список функций находится [здесь](https://docs.scipy.org/doc/numpy/reference/random/generator.html).

In [49]:
np.random.normal(
    10, 2, 15
)  # Генерирует 15 нормально распределенных чисел со средним в 10 и дисперсией 2

array([ 6.59877409,  7.37089955,  9.61041413, 10.58630329, 11.73502409,
        8.68923075,  7.87689399, 12.08952293, 11.64706908, 13.60520336,
        7.35248439, 10.4050864 , 10.07498312, 10.8850213 , 10.44950434])

In [50]:
# Генерирует 15 чисел, распределенных по лог-нормальному закону, мат. ожидание = 10, дисперсиея = 2
np.random.lognormal(10, 2, 15)

array([1.87158312e+05, 1.38205258e+06, 1.00622124e+05, 2.35342325e+03,
       6.30223182e+03, 1.16162826e+04, 5.10261069e+03, 2.57885521e+05,
       1.62885529e+04, 8.48916141e+03, 1.31212506e+06, 1.93777176e+04,
       4.88262686e+02, 4.12828864e+04, 1.71564869e+03])

In [51]:
# Генерирует 15 чисел, распределенных по бета-распределению, с параметрами 10 и 2
np.random.beta(10, 2, 15)

array([0.9583667 , 0.86681498, 0.89682722, 0.80301203, 0.88375948,
       0.76849508, 0.7518996 , 0.82346491, 0.85721015, 0.77469057,
       0.86170185, 0.85952986, 0.80061014, 0.86874813, 0.93385677])