<a href="https://colab.research.google.com/github/Ezendos/paszi/blob/master/Mathematics.ipynb"><img align="left" src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open in Colab" title="Open and Execute in Google Colaboratory" target="_blank"></a>

# Mathematics

## Математика в Python

Python — универсальный язык программирования, и поэтому его часто используют для решения математических задач. Он включает встроенные типы для работы c целыми числами и числами c плавающей точкой, пригодные для выполнения базовых математических вычислений, c которыми приходится сталкиваться в типичных приложениях. В случаях, когда предъявляются повышенные требования к точности расчетов или появляется необходимость провести более сложные математические операции, стандартная библиотека реализует дополнительные возможности в виде следующих модулей:

## decimal

При работе с числами с плавающей точкой мы сталкиваемся с тем, что в результате вычислений получаем результат не совсем верный с человеческой точки зрения:

In [1]:
0.1 + 0.2 == 0.3

False

Такое поведение объясняется особенностями реализации `float` обычно соответствующее стандарту IEEE 754 и аппаратно реализуемое в современных компьютерах.

In [2]:
a = 0.1 + 0.2
a

0.30000000000000004

### IEEE-754

Число одинарной точности (32-bit)

![float](https://upload.wikimedia.org/wikipedia/commons/thumb/d/d2/Float_example.svg/590px-Float_example.svg.png)

Число двойной точности (64-bit)

![double](https://upload.wikimedia.org/wikipedia/commons/thumb/a/a9/IEEE_754_Double_Floating_Point_Format.svg/618px-IEEE_754_Double_Floating_Point_Format.svg.png)

В расчетах, требующих повышенную точность предпочтительнее использовать десятичные числа с фиксированной точкой.

Модуль `decimal` реализует арифметику чисел c фиксированной точностью и чисел c плавающей точкой c использованием модели, понятной большинству людей. Экземпляр `Decimal` обеспечивает точное представление любого числа, c округлением как вниз, так и вверх, используя заданное предельное значение количества значащих цифр.

Ключевым компонентом для работы с числами в этом модуле является класс `Decimal`. Создаем объект с помощью конструктора, после чего его можно использовать в арифметических операциях.

In [3]:
from decimal import *
getcontext().prec = 3 # по умолчанию 28
a = 0.1 + 0.2
b = Decimal("0.1") + Decimal("0.2")
b

Decimal('0.3')

In [4]:
float(b)
b

Decimal('0.3')

Изменять поведение модуля `decimal` можно при помощи *контекста*. Контекст  определяет точность, правила округления, ограничения на экспоненты, флаги результатов операций и средства активации исключений. Контексты могут применяться ко всем
экземплярам `Decimal` как в потоке, так и локально, в пределах небольшого участка кода. 

За контекст отвечает функция `getcontext()`

Атрибут `prec` управляет точностью, поддерживаемой для новых значений, которые создаются в результате выполнения математических операций. Значение `prec` не изменяет количество значимых цифр вводимого числа, но обязательно изменит его после выполнения математических операций. По умолчанию `prec` равна 28.

In [5]:
getcontext().prec = 5
Decimal('1.23456789')

Decimal('1.23456789')

In [6]:
getcontext().prec = 5
1*Decimal('1.23456789')

Decimal('1.2346')

In [7]:
getcontext().prec = 5
Decimal('1.23456789') - Decimal('0.23456789')

Decimal('1.0000')

Извлечение текущего глобального контекста:

In [8]:
getcontext()

Context(prec=5, rounding=ROUND_HALF_EVEN, Emin=-999999, Emax=999999, capitals=1, clamp=0, flags=[Inexact, Rounded], traps=[InvalidOperation, DivisionByZero, Overflow])

Возможная ошибка в применеии конструктора `decimal` - не использовать строку в аргументе при вводе чисел с точкой. 

Важно понимать, что если задано число с плавающей точкой, то его двоичное представление преобразуется без потерь в точный десятичный эквивалент.

In [9]:
from decimal import *

c = Decimal(0.1) + Decimal(0.2)
c

Decimal('0.30000')

In [10]:
c = float(c)
c

0.3

In [11]:
0.1 + 0.2  == c

False

Некоторые математические функции реализованы как методы класса `Decimal`

In [12]:
Decimal(3).sqrt()

Decimal('1.7321')

In [13]:
Decimal('2.718281').ln()

Decimal('1.0000')

In [14]:
Decimal(1).exp()

Decimal('2.7183')

In [15]:
Decimal(1001).log10()

Decimal('3.0004')

Метод `quantize()` округляет число представленное объектом `decimal`.

В качестве первого аргумента передается также объект `Decimal`, который указывает формат округления числа.

Вторым аргументом является одна из констант, определяющая правило округления.

In [16]:
Decimal('7.325').quantize(Decimal('.01'), rounding=ROUND_DOWN)

Decimal('7.32')

In [17]:
Decimal('7.325').quantize(Decimal('1.'), rounding=ROUND_UP)

Decimal('8')

## fractions

Модуль `fractions` позволяет выполнять арифметические действия над рациональными числами. Модуль предоставляет класс рациональных чисел `Fraction`, экземпляры которого могут создаваться на основе двух целых чисел, другого рационального числа или строки. Экземпляры класса `Fraction` имеют свойства числитель (`numerator`) и знаменатель (`denominator`).

Сосздадим несколько экземпляров дробей

In [18]:
from fractions import *
Fraction()    #  по умолчанию numerator=0, denominator=1

Fraction(0, 1)

In [19]:
Fraction(numerator=1, denominator=2)    #  равносильно Fraction(1, 2)

Fraction(1, 2)

Если числитель и знаменатель имеют общие делители, то перед созданием рационального числа они будут сокращены:

In [20]:
Fraction(8, 16), Fraction(15, 30)

(Fraction(1, 2), Fraction(1, 2))

Полезным свойством экземпляров `Fraction` является возможность преобразования чисел c плавающей точкой в приближенную рациональную дробь. Это реализуется при помощи метода `limit_denominator(max_denominator)`, где `max_denominator` определеяет максимальное значение знаменателя дроби.

In [21]:
Fraction('3.1415926535897932').limit_denominator(100)

Fraction(311, 99)

## random

Модуль `random` предоставляет быстрый генератор псевдослучайных чисел, основанный на алгоритме под названием *вихрь Мерсенна*. Этот алгоритм, первоначально разработанный для расчетов методом Монте-Карло, генерирует числа, подчиняющиеся равномерному распределению c большим периодом повторения, что делает его весьма удобным для широкого ряда приложений.

Сразу стоит отметить, что данный модуль использует метод генерации псевдослучайных чисел **не обладающий криптографической стойкостью**, так как он абсолютно детерминирован (каждое последующее его состояние, предопределено предыдущим). Это, впрочем, не должно сильно повлиять на научные расчеты или игровые механизмы.

### Случайные числа
Функция `random()` возвращает следующее случайное число c плавающей точкой из генерируемой последовательности. Все генерируемые значения принадлежат диапазону чисел $0 \leq n < 1.0$

In [22]:
from random import *

In [23]:
random()

0.23762228916762496

Метод `seed` инициализирует генератор (задает его начальное состояние).

Если параметр a не указан или равен `None`, то в качестве `seed` используется текущее системное время.
Праметр `version` может быть установлен только в два значения: `version = 1` — все биты объектов `str`, `bytes` и `bytearray` используются для их преобразования в объект `int`; `version = 2` — преобразует `str` и `byte`s в более узкий диапазон объектов `int`

Создадим свой экземпляр генератора псевдослучайных чисел. Используем класс `Random()`

In [24]:
rng1 = Random()
rng1.random()

0.16318679884208176

Все генераторы могут иметь разное внутреннее состояние, что очень удобно для воспроизводимости результатов.

In [25]:
rng2 = Random()
rng1.seed(8)
rng1.random()

0.2267058593810488

In [26]:
rng2.seed(8)
rng2.random()

0.2267058593810488

`random.SystemRandom()` - класс, который позволяет создать экземпляр генератора, использующим в качестве источника случайности (энтропии) ресурсы операционной системы

In [27]:
rng = SystemRandom()
rng.random()

0.09199037664378373

Данный клас основан на функции `os.urandom(n)`, которая возвращает `n` случайных байтов. Эта функция доступна не на всех операционных системах, но в зависимости от реализации источника энтропии в используемой системе, полученные данные могут быть использованы для криптографических целей (с определенными ограничениями, конечно же). В то же время, использование данной функции может быть не совсем удобно в плане того, что она нечувствительна к начальному состоянию `seed`.

`random.getstate()` - возвращает кортеж с параметрами внутреннего состояния генератора, который может быть использован для воссоздания этого состояния.

In [28]:
state1 = rng1.getstate()
state2 = rng2.getstate()
state1 == state2 # наши генераторы находятся в одинаковом состоянии

True

In [29]:
print(state1)

(3, (266635169, 2144395981, 458747983, 4010662865, 3022780346, 882302241, 1459629124, 185738937, 3485401394, 2702708497, 2179495949, 3547416914, 27590322, 1866537336, 899661273, 173533040, 376934025, 959344847, 2319221944, 1451551301, 3520072117, 3647941168, 4270765945, 2695110663, 974586477, 1933072989, 1181983634, 3280233305, 1743743746, 1539316056, 2226103580, 1782728435, 515351363, 312426138, 912786256, 1063896008, 3173991248, 4004967873, 2849831204, 2977163988, 1999223748, 2537804743, 2862624525, 3309920811, 189306316, 4261570536, 3180215740, 2171574260, 3642353605, 1699607127, 3050675778, 1262172627, 917641954, 242451926, 775992062, 3512913794, 3101094049, 3709278724, 2741847696, 3358912603, 1236146181, 595787072, 2924205382, 3690767371, 789405426, 775933873, 3312146656, 2726864681, 587271351, 1981116488, 4215644332, 2011585839, 1207102875, 2689536002, 3437286179, 2386026298, 2475693590, 3242902582, 377686807, 1981388630, 4107042548, 998823789, 3520047369, 441742825, 633737921, 3

`random.setstate(state)` - задает внутреннее состояние генератора на основе кортежа с его параметрами.

In [30]:
rng3 = Random()
state3 = rng3.getstate()
state3 == state1

False

In [31]:
rng3.setstate(state1)
print(rng1.random())
print(rng3.random())

0.9622950358343828
0.9622950358343828


`random.randrange([start],[stop],[step])` - возвращает случайное целое число из указанного диапазона.

Функция принмает три аргумента: `start`, `stop`, `step`, использование которых абсолютно аналогично их использованию в функции `range()`. 

In [32]:
randrange(10)    #  случайное из интервала [0; 10)

9

In [33]:
randrange(10, 100, 2)    #  случайное четное из интервала [10; 100)

86

`random.getrandbits(k)` - возвращает целое число состоящее из k случайных бит.

In [34]:
getrandbits(2*8)

41970

Благодаря данному методу random.randrange() может работать со сколь угодно большими диапазонами: 

In [35]:
randrange(2**1000)

998338394469638038450286613630598128676591766274127914273181700843617119538705087295388934242850102540296227312511102878928843533173531667102498624919264860380037617917445825686851216599516394293242030268831780218432641042762523755097386143945721027459822802784993067849254835360223951562599470198868

`random.randint(a, b)` возвращает случайное целое число из интервала $[a,b]$. Является эквивалентной команде `random.randrange(a, b+1)`

In [36]:
randint(1, 100)

49

### Случайные последовательности
`random.choice(seq)` - возвращает случайный элемент из непустой последовательности `seq`, если `seq` пуст, то будет вызвано исключение `IndexError`.

In [37]:
choice([13, 'a', 111, 'cd', 8])

8

`random.choices(population, weights=None, *, cum_weights=None, k=1)` - возвращает список размера `k` элементов, выбранных из `population`. (добавлена в 3.6)

`weights` – последовательность, которая задает относительные веса при выборе элементов из набора `population`. Перед выполнением выбора относительные веса `weights` конвертируются в совокупные веса `cum_weights`;

`cum_weights` – альтернативная последовательность к weights. Если задана последовательность `cum_weights`, то устанавливаются совокупные (cumulative) веса при выборе элементов из набора `population`. Например, относительные веса $[ 1, 3, -2, 5 ]$ есть эквивалентные совокупным (cumulative weights) весам $[ 1, 4, 2, 7 ]$.

In [38]:
mylist = ["apple", "banana", "cherry"]

print(choices(mylist, weights = [10, 1, 1], k = 14))

['apple', 'apple', 'apple', 'banana', 'apple', 'apple', 'apple', 'apple', 'apple', 'apple', 'apple', 'apple', 'apple', 'apple']


`random.shuffle(x[, random])` - перемешивает элементы последовательности `x`. Последовательность должна быть изменяемой. Данная функция ничего не возвращает, а изменяет непосредственно сам объект последовательности

In [39]:
mylist = [1, 2, 3, 4, 5, 6]
shuffle(mylist)
mylist

[5, 2, 6, 4, 1, 3]

Необязательный параметр `random` принимает имя функции которая выдает случайные числа с плавающей точкой в диапазоне $[0.0, 1.0)$, с единственным условием – данная функция не должна принимать параметры. По умолчанию это функция `random()`

`random.sample(population, k)` - тот же `choices`, но без весов.

In [40]:
sample(mylist, 3)

[4, 3, 5]

Если последовательность содержит повторы, то они могут присутствовать и в возвращаемой выборке.

## math

Модуль `math` реализует многие из специальных функций, специфицированных стандартом IEEE, которые обычно содержатся в платформозависимых библиотеках C и предназначены для выполнения сложных математических операций c использованием значений c плавающей точкой, включая логарифмические и тригонометрические операции. Несмотря на то что числа комплексного типа `complex` являются встроенными, данный модуль их не поддерживает и всегда вызывает исключение при их использовании. Для того что бы использовать математические функции с комплексными числами обратитесь к модулю `cmath`.

Ниже приведён список констант `math`, точность которых ограничена только точностью чисел c плавающей точкой в соответствии c установленной на данной платформе библиотекой C.

In [41]:
import math
print('pi: {:.30f}'.format(math.pi))
print('e: {:.30f}'.format(math.e))
print('tau: {:.30f}'.format(math.tau))
print('nan: {:.30f}'.format(math.nan))
print('inf: {:.30f}'.format(math.inf))

pi: 3.141592653589793115997963468544
e: 2.718281828459045090795598298428
tau: 6.283185307179586231995926937088
nan: nan
inf: inf


Не следует использовать оператор == для сравнения чисел с плавающей точкой. 

Вместо == стоит применять функцию **mаth.isсlоsе(х, у)**

In [42]:
a = 0.1 + 0.2
b = 0.3
a == b

False

In [43]:
math.isclose(a,b)

True

## statistics

Модуль `statistics` реализует базовые статистические формулы, обеспечивающие проведение вычислений c использованием различных числовых типов Python (`int`, `float`, `Decimal` и `Fraction`). Очевидно, этот модуль не является конкурентом таким библиотекам как NumPy или SciPy.

### Показатели центра распределения
среднее значение (арифметическое, геометрическое, гармоническое), медиана, мода.

In [44]:
from statistics import *
data = [1, 2, 2, 5, 10, 12, 15, 44]
print('Среднее арифметическое: {:0.2f}'.format(mean(data)))
print('Среднее геометрическое: {:0.2f}'.format(geometric_mean(data)))
print('Среднее гармоническое: {:0.2f}'.format(harmonic_mean(data)))
print('Медиана: {:0.2f}'.format(median(data)))
print('Мода: {:0.2f}'.format(mode(data)))

Среднее арифметическое: 11.38
Среднее геометрическое: 5.96
Среднее гармоническое: 3.24
Медиана: 7.50
Мода: 2.00


Дисперсия и стандартное отклонение

Для выражения степени разброса значений относительно среднего по набору статистики используют две характеристики. Дисперсия — это среднее значение квадрата разности между каждым из значений и средним, а стандартное отклонение — это квадратный корень из дисперсии. Большие значения дисперсии или стандартного отклонения означают большую степень разброса данных в наборе, тогда как их небольшие значения свидетельствуют о кластеризации данных вокруг среднего значения. $$\sigma^2 = \frac{\sum_{i}(x_{i} - mean())^2}{n-1} $$

In [45]:
data = [0.0, 0.25, 0.25, 1.25, 1.5, 1.75, 2.75, 3.25]
variance(data)

1.4285714285714286

In [46]:
stdev([1.5, 2.5, 2.5, 2.75, 3.25, 4.75])

1.0810874155219827

## Источники и ссылки:

[Семён Лукашевский - pyprog.pro - Справочник по стандартной библиотеке языка Python](https://pyprog.pro/python/st_lib/standart_library.html)

Даг Хеллман - Стандартная библиотека Python 3. Справочник с примерами

Холден Стив, Рейвенскрофт Анна - Python. Справочник. Полное описание языка

[docs.python.org](https://docs.python.org)