<a href="https://colab.research.google.com/github/Ezendos/paszi/blob/master/Mathematics.ipynb"><img align="left" src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open in Colab" title="Open and Execute in Google Colaboratory" target="_blank"></a>

# Mathematics

## Математика в Python

Python — универсальный язык программирования, и поэтому его часто используют для решения математических задач. Он включает встроенные типы для работы c целыми числами и числами c плавающей точкой, пригодные для выполнения базовых математических вычислений, c которыми приходится сталкиваться в типичных приложениях. В случаях, когда предъявляются повышенные требования к точности расчетов или появляется необходимость провести более сложные математические операции, стандартная библиотека реализует дополнительные возможности в виде следующих модулей:

## decimal

При работе с числами с плавающей точкой мы сталкиваемся с тем, что в результате вычислений получаем результат не совсем верный с человеческой точки зрения:

In [None]:
0.1 + 0.2 == 0.3

Такое поведение объясняется особенностями реализации `float` обычно соответствующее стандарту IEEE 754 и аппаратно реализуемое в современных компьютерах.

In [2]:
a = 0.1 + 0.2
a

### IEEE-754

Число одинарной точности (32-bit) `float` в C

![float](https://upload.wikimedia.org/wikipedia/commons/thumb/d/d2/Float_example.svg/590px-Float_example.svg.png)

Число двойной точности (64-bit) `float` в Python; `double` в C

![double](https://upload.wikimedia.org/wikipedia/commons/thumb/a/a9/IEEE_754_Double_Floating_Point_Format.svg/618px-IEEE_754_Double_Floating_Point_Format.svg.png)

В расчетах, требующих повышенную точность предпочтительнее использовать десятичные числа с фиксированной точкой.

Модуль `decimal` реализует арифметику чисел c фиксированной точностью и чисел c плавающей точкой c использованием модели, понятной большинству людей. Экземпляр `Decimal` обеспечивает точное представление любого числа, c округлением как вниз, так и вверх, используя заданное предельное значение количества значащих цифр.

Ключевым компонентом для работы с числами в этом модуле является класс `Decimal`. Создаем объект с помощью конструктора, после чего его можно использовать в арифметических операциях.

In [3]:
from decimal import *
getcontext().prec = 3 # по умолчанию 28
a = 0.1 + 0.2
b = Decimal("0.1") + Decimal("0.2")
b

Decimal('0.3')

In [4]:
float(b)
b

Decimal('0.3')

Изменять поведение модуля `decimal` можно при помощи *контекста*. Контекст  определяет точность, правила округления, ограничения на экспоненты, флаги результатов операций и средства активации исключений. Контексты могут применяться ко всем
экземплярам `Decimal` как в потоке, так и локально, в пределах небольшого участка кода. 

За контекст отвечает функция `getcontext()`

Атрибут `prec` управляет точностью, поддерживаемой для новых значений, которые создаются в результате выполнения математических операций. Значение `prec` не изменяет количество значимых цифр вводимого числа, но обязательно изменит его после выполнения математических операций. По умолчанию `prec` равна $28$.

In [5]:
getcontext().prec = 5
Decimal('1.23456789')

Decimal('1.23456789')

In [6]:
getcontext().prec = 5
1*Decimal('1.23456789')

Decimal('1.2346')

In [7]:
getcontext().prec = 5
Decimal('1.23456789') - Decimal('0.23456789')

Decimal('1.0000')

Извлечение текущего глобального контекста:

In [8]:
getcontext()

Context(prec=5, rounding=ROUND_HALF_EVEN, Emin=-999999, Emax=999999, capitals=1, clamp=0, flags=[Inexact, Rounded], traps=[InvalidOperation, DivisionByZero, Overflow])

\* Возможная ошибка в применеии конструктора `decimal` - не использовать строку в аргументе при вводе чисел с точкой. 

Важно понимать, что если задано число с плавающей точкой, то его двоичное представление преобразуется без потерь в точный десятичный эквивалент.

In [9]:
from decimal import *

c = Decimal(0.1) + Decimal(0.2)
c

Decimal('0.30000')

In [10]:
c = float(c)
c

0.3

In [11]:
0.1 + 0.2  == c

False

Некоторые математические функции реализованы как методы класса `Decimal`

In [12]:
Decimal(3).sqrt()

Decimal('1.7321')

In [13]:
Decimal('2.718281').ln()

Decimal('1.0000')

In [14]:
Decimal(1).exp()

Decimal('2.7183')

In [15]:
Decimal(1001).log10()

Decimal('3.0004')

Метод `quantize()` округляет число представленное объектом `decimal`.

В качестве первого аргумента передается также объект `Decimal`, который указывает формат округления числа.

Вторым аргументом является одна из констант, определяющая правило округления.

In [16]:
Decimal('7.325').quantize(Decimal('.01'), rounding=ROUND_DOWN)

Decimal('7.32')

In [17]:
Decimal('7.325').quantize(Decimal('1.'), rounding=ROUND_UP)

Decimal('8')

## fractions

Модуль `fractions` позволяет выполнять арифметические действия над рациональными числами. Модуль предоставляет класс рациональных чисел `Fraction`, экземпляры которого могут создаваться на основе двух целых чисел, другого рационального числа или строки. Экземпляры класса `Fraction` имеют свойства числитель (`numerator`) и знаменатель (`denominator`).

Сосздадим несколько экземпляров дробей

In [18]:
from fractions import *
Fraction()    #  по умолчанию numerator=0, denominator=1

Fraction(0, 1)

In [19]:
Fraction(numerator=1, denominator=2)    #  равносильно Fraction(1, 2)

Fraction(1, 2)

Если числитель и знаменатель имеют общие делители, то перед созданием рационального числа они будут сокращены:

In [20]:
Fraction(8, 16), Fraction(15, 30)

(Fraction(1, 2), Fraction(1, 2))

Полезным свойством экземпляров `Fraction` является возможность преобразования чисел c плавающей точкой в приближенную рациональную дробь. Это реализуется при помощи метода `limit_denominator(max_denominator)`, где `max_denominator` определеяет максимальное значение знаменателя дроби.

In [21]:
Fraction('3.1415926535897932').limit_denominator(100)

Fraction(311, 99)

## random

Модуль `random` предоставляет быстрый генератор псевдослучайных чисел, основанный на алгоритме под названием *вихрь Мерсенна*. Этот алгоритм, первоначально разработанный для расчетов методом Монте-Карло, генерирует числа, подчиняющиеся равномерному распределению c большим периодом повторения, что делает его весьма удобным для широкого ряда приложений.

\*Сразу стоит отметить, что данный модуль использует метод генерации псевдослучайных чисел **не обладающий криптографической стойкостью**. Он абсолютно детерминирован (каждое последующее его состояние, предопределено предыдущим). Это, впрочем, не сильно влияет на научные расчеты или игровые механизмы.

### Случайные числа
Функция `random()` возвращает следующее случайное число c плавающей точкой из генерируемой последовательности. Все генерируемые значения принадлежат диапазону чисел $0 \leq n < 1.0$

In [22]:
from random import *

In [23]:
random()

0.6517418641327372

Метод `seed` инициализирует генератор (задает его начальное состояние).

Если параметр a не указан или равен `None`, то в качестве `seed` используется текущее системное время.
Праметр `version` может быть установлен только в два значения: `version = 1` — все биты объектов `str`, `bytes` и `bytearray` используются для их преобразования в объект `int`; `version = 2` — преобразует `str` и `byte`s в более узкий диапазон объектов `int`

Создадим свой экземпляр генератора псевдослучайных чисел. Используем класс `Random()`

In [24]:
rng1 = Random()
rng1.random()

0.48268645248281616

Все генераторы могут иметь разное внутреннее состояние, что очень удобно для воспроизводимости результатов.

In [25]:
rng2 = Random()
rng1.seed(8)
rng1.random()

0.2267058593810488

In [26]:
rng2.seed(8)
rng2.random()

0.2267058593810488

`random.SystemRandom()` - класс, который позволяет создать экземпляр генератора, использующим в качестве источника случайности (энтропии) ресурсы операционной системы

In [27]:
rng = SystemRandom()
rng.random()

0.3396093616312793

Данный клас основан на функции `os.urandom(n)`, которая возвращает `n` случайных байтов. Эта функция доступна не на всех операционных системах, но в зависимости от реализации источника энтропии в используемой системе, полученные данные могут быть более криптографически стойкими. В то же время, использование данной функции может быть не совсем удобно в плане того, что она нечувствительна к начальному состоянию `seed`.

`random.getstate()` - возвращает кортеж с параметрами внутреннего состояния генератора, который может быть использован для воссоздания этого состояния.

In [28]:
state1 = rng1.getstate()
state2 = rng2.getstate()
state1 == state2 # наши генераторы находятся в одинаковом состоянии

True

In [29]:
print(state1)

(3, (266635169, 2144395981, 458747983, 4010662865, 3022780346, 882302241, 1459629124, 185738937, 3485401394, 2702708497, 2179495949, 3547416914, 27590322, 1866537336, 899661273, 173533040, 376934025, 959344847, 2319221944, 1451551301, 3520072117, 3647941168, 4270765945, 2695110663, 974586477, 1933072989, 1181983634, 3280233305, 1743743746, 1539316056, 2226103580, 1782728435, 515351363, 312426138, 912786256, 1063896008, 3173991248, 4004967873, 2849831204, 2977163988, 1999223748, 2537804743, 2862624525, 3309920811, 189306316, 4261570536, 3180215740, 2171574260, 3642353605, 1699607127, 3050675778, 1262172627, 917641954, 242451926, 775992062, 3512913794, 3101094049, 3709278724, 2741847696, 3358912603, 1236146181, 595787072, 2924205382, 3690767371, 789405426, 775933873, 3312146656, 2726864681, 587271351, 1981116488, 4215644332, 2011585839, 1207102875, 2689536002, 3437286179, 2386026298, 2475693590, 3242902582, 377686807, 1981388630, 4107042548, 998823789, 3520047369, 441742825, 633737921, 3

`random.setstate(state)` - задает внутреннее состояние генератора на основе кортежа с его параметрами.

In [30]:
rng3 = Random()
state3 = rng3.getstate()
state3 == state1

False

In [31]:
rng3.setstate(state1)
print(rng1.random())
print(rng3.random())

0.9622950358343828
0.9622950358343828


`random.randrange([start],[stop],[step])` - возвращает случайное целое число из указанного диапазона.

Функция принмает три аргумента: `start`, `stop`, `step`, использование которых абсолютно аналогично их использованию в функции `range()`. 

In [32]:
randrange(10)    #  случайное из интервала [0; 10)

4

In [33]:
randrange(10, 100, 2)    #  случайное четное из интервала [10; 100)

40

`random.getrandbits(k)` - возвращает целое число состоящее из $k$ случайных бит.

In [34]:
getrandbits(2*8)

10882

`random.randint(a, b)` возвращает случайное целое число из интервала $[a,b]$. Является эквивалентной команде `random.randrange(a, b+1)`

In [35]:
randint(1, 100)

70

### Случайные последовательности
`random.choice(seq)` - возвращает случайный элемент из непустой последовательности `seq`, если `seq` пуст, то будет вызвано исключение `IndexError`.

In [36]:
choice([13, 'a', 111, 'cd', 8])

111

`random.choices(population, weights=None, *, cum_weights=None, k=1)` - возвращает список размера `k` элементов, выбранных из `population`. (добавлена в 3.6)

`weights` – последовательность, которая задает относительные веса при выборе элементов из набора `population`. Перед выполнением выбора относительные веса `weights` конвертируются в совокупные веса `cum_weights`;

`cum_weights` – альтернативная последовательность к weights. Если задана последовательность `cum_weights`, то устанавливаются совокупные (cumulative) веса при выборе элементов из набора `population`. Например, относительные веса $[ 1, 3, -2, 5 ]$ есть эквивалентные совокупным (cumulative weights) весам $[ 1, 4, 2, 7 ]$.

In [37]:
mylist = ["apple", "banana", "cherry"]

print(choices(mylist, weights = [10, 1, 1], k = 14))

['apple', 'apple', 'apple', 'apple', 'cherry', 'apple', 'apple', 'apple', 'apple', 'apple', 'apple', 'apple', 'apple', 'apple']


`random.shuffle(x[, random])` - перемешивает элементы последовательности `x`. Последовательность должна быть изменяемой. Данная функция ничего не возвращает, а изменяет непосредственно сам объект последовательности

In [38]:
mylist = [1, 2, 3, 4, 5, 6]
shuffle(mylist)
mylist

[5, 6, 1, 4, 2, 3]

Необязательный параметр `random` принимает имя функции которая выдает случайные числа с плавающей точкой в диапазоне $[0.0, 1.0)$, с единственным условием – данная функция не должна принимать параметры. По умолчанию это функция `random()`

`random.sample(population, k)` - тот же `choices`, но без весов.

In [39]:
sample(mylist, 3)

[3, 2, 5]

Если последовательность содержит повторы, то они могут присутствовать и в возвращаемой выборке.

`random()` является *однородным распределением*, но стандартной библиотекой также поддерживаются *неоднородные распределения*, которые обеспечивают более точное моделирование для некоторых ситуаций. `random.normalvariate(mu, sigma)` `random.gauss(mu, sigma)` `random.triangular(low, high, mode)` - некоторые из них.

## math

Модуль `math` реализует многие из специальных функций, специфицированных стандартом IEEE, которые обычно содержатся в платформозависимых библиотеках C и предназначены для выполнения сложных математических операций c использованием значений c плавающей точкой, включая логарифмические и тригонометрические операции. Несмотря на то что числа комплексного типа `complex` являются встроенными, данный модуль их не поддерживает и всегда вызывает исключение при их использовании. Для того что бы использовать математические функции с комплексными числами обратитесь к модулю `cmath`.

Ниже приведён *список констант* `math`, точность которых ограничена только точностью чисел c плавающей точкой в соответствии c установленной на данной платформе библиотекой C.

In [40]:
import math
print(' pi:', math.pi)
print('  e:', math.e)
print('tau:', math.tau)
print('nan:', math.nan)
print('inf:', math.inf)

 pi: 3.141592653589793
  e: 2.718281828459045
tau: 6.283185307179586
nan: nan
inf: inf


\* Не следует использовать оператор == для сравнения чисел с плавающей точкой. 

Вместо == стоит применять функцию **mаth.isсlоsе(х, у)**

In [41]:
a = 0.1 + 0.2
b = 0.3
a == b

False

In [42]:
math.isclose(a,b)

True

Модуль `math` включает три функции, предназначенные для преобразования значений c плавающей точкой в целые числа. В этих функциях используются разные подходы к выполнению данного преобразования, и каждая из них оказывается удобной в тех или иных обстоятельствах.

Самая простая из них — функция `trunc()`, которая отбрасывает дробную часть, оставляя только целочисленную часть значения.

Функция `floor()` округляет значение до наибольшего из предшествующих целых чисел, функция `ceil()` — до наименьшего из следующих целых чисел.

Функция `trunc()` эквивалентна непосредственному преобразованию в тип `int`.

In [43]:
a = -2.5
math.trunc(a)
print('trunc:', math.trunc(a))
print('floor:', math.floor(a))
print(' ceil:', math.ceil(a))

trunc: -2
floor: -3
 ceil: -2


Рассмотрим альтернативные представления значений с плавающей точкой. 

Функция `modf()` получает единственный аргумент в виде числа c плавающей точкой и возвращает кортеж, содержащий дробную и целую части входного значения.

In [44]:
math.modf(1.5)

(0.5, 1.0)

Функция `frexp()` возвращает мантиссу ($m$) и экспоненту ($e$) числа c плавающей точкой. Эту функцию можно использовать для создания представления значения в более переносимой форме. Функция `frexp()` использует формулу $x = m \cdot 2^e$ и возвращает значения $m$ и $e$.

In [45]:
math.frexp(0.1)

(0.8, -3)

 Функция `ldexp ()` — обратная по отношению к функции `frexp ()`.

In [46]:
math.ldexp(0.8, -3)

0.1

Для вычисления абсолютной величины числа c плавающей точкой используется функция `fabs()`. 

Если требуется определить знак числа, будь то для присвоения его набору значений или для сравнения c другими значениями, используйте функцию `copysign()`, позволяющую установить знак для любого корректного значения.

Дополнительная функция наподобие `copysign()` нужна по той причине, что непосредственное сравнение nan и -nan c другими значениями не работает.

In [47]:
print(math.fabs(-1.1))

1.1


In [48]:
print(math.copysign(2.3, -1))

-2.3


Из-за проблематичного представления значений с плавающей точкой в двоичном коде, модуль math включает функцию `fsum()`, предназначенную для вычисления суммы последовательности чисел c плавающей точкой c использованием эффективного алгоритма, который минимизирует подобные ошибки.

In [49]:
data = [0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1]
print('sum:', sum(data))
print('fsum:', math.fsum(data))

sum: 0.9999999999999999
fsum: 1.0


Функцию `factorial()` обычно используют для расчета количества перестановок или сочетаний элементов последовательности.

In [50]:
math.factorial(3)

6

Функция `gamma()` похожа на функцию `factorial()`, но работает c вещественными числами, а факториал вычисляется для значения аргумента, уменьшенного на 1 (гамма-функция равна $(n - 1)!$ ). Нулевое значение аргумента недопустимо, поскольку оно приводит к отрицательному начальному значению факториала.

Функция `lgamma()` возвращает натуральный логарифм абсолютной величины гамма-функции для входного значения.

In [51]:
print('gamma: ', math.gamma(4))
print('gamma: ', math.lgamma(4))

gamma:  6.0
gamma:  1.7917594692280554


Функция `fmod()` предоставляет более точную реализацию деления по модулю для значений c плавающей точкой. 
Функция `gcd()` позволяет находить наибольший общий делитель двух чисел. 

In [52]:
print('fmod: ', math.fmod(5, 2))
print('gcd: ', math.gcd(4, 8))

fmod:  1.0
gcd:  4


В Python имеется встроенный оператор возведения в степень `**`, но в тех случаях, когда другой функции необходимо передать аргумент в виде вызываемого объекта, может оказаться полезной функция `pow()`.

In [53]:
math.pow(2, 2)

4.0

Квадратный корень - `sqrt()`

Логарифм - `log()`

Функция `loglp()` используется для вычисления рядов Ньютона-Меркатора (натуральный логарифм $1 + x$).

Функция `exp()` вычисляет экспоненциальную функцию $e^x$.

Функция `expm1()` — обратная по отношению к функции `loglp()` и вычисляет выражение $е^х - 1$.

In [54]:
print('sqrt: ', math.sqrt(16))
print('log: ', math.log(8, 2))
print('log1p: ', math.log1p(2))
print('exp: ', math.exp(2))
print('expm1: ', math.expm1(2))

sqrt:  4.0
log:  3.0
log1p:  1.0986122886681098
exp:  7.38905609893065
expm1:  6.38905609893065


C помощью функции `radians()`градусы можно преобразовать в радианы. Для преобразования радианов в градусы используйте функцию `degrees()`.

In [55]:
print('radians: ', math.radians(90))
print('degrees: ', math.degrees(1.5707963267948966))

radians:  1.5707963267948966
degrees:  90.0


Для вычисления длины гипотенузы прямоугольного треугольника есть функция `hypot()`.

In [56]:
math.hypot(3, 4)

5.0

Тригонометрические функции: `math.sin(x)`, `math.cos(x)`, `math.tan(x)`, `math.asin(x)`, `math.acos(x)`, `math.atan(x)`.

Гиперболические функции: `math.sinh(x)`, `math.cosh(x)`, `math.tanh(x)`, `math.asinh(x)`, `math.acosh(x)`, `math.atanh(x)`.

Гауссова функция ошибок используется в статистике.

In [57]:
math.erf(0.476936276)

0.49999999981622084

Дополнительная функция ошибок `erfc()` вычисляет значения, эквивалентные выражению `1 - erf (x)`. Реализация функции `erfc()` устраняет потерю точности для небольших значений `x` при вычитании из `1`.

In [58]:
math.erfc(-0.25)

1.276326390168237

## statistics

Модуль `statistics` реализует базовые статистические формулы, обеспечивающие проведение вычислений c использованием различных числовых типов Python (`int`, `float`, `Decimal` и `Fraction`). Очевидно, этот модуль не является конкурентом таким библиотекам как `NumPy` или `SciPy`.

### Показатели центра распределения
среднее значение (арифметическое, геометрическое, гармоническое), медиана, мода.

In [59]:
from statistics import *
data = [1, 2, 2, 5, 10, 12, 15, 44]
print('Среднее арифметическое:', fmean(data))
print('Среднее геометрическое:', geometric_mean(data))
print('Среднее гармоническое:', harmonic_mean(data))
print('Медиана:', median(data))
print('Мода:', mode(data))

Среднее арифметическое: 11.375
Среднее геометрическое: 5.956201712872148
Среднее гармоническое: 3.235294117647059
Медиана: 7.5
Мода: 2


### Дисперсия и стандартное отклонение

Для выражения степени разброса значений относительно среднего по набору статистики используют две характеристики:

*Дисперсия* — это среднее значение квадрата разности между каждым из значений и средним; *стандартное отклонение* — это квадратный корень из дисперсии.

Большие значения дисперсии или стандартного отклонения означают большую степень разброса данных в наборе, тогда как их небольшие значения свидетельствуют о кластеризации данных вокруг среднего значения.

Формула дисперсии: $$D = \sigma^2 = \frac{\sum_{i}(x_{i} - mean())^2}{n-1} $$

Модуль `statistics` реализует дисперсию двумя функциями:

`pvariance()` - для вычисления дисперсии генеральной совокупности данных

`variance()` - для расчетов дисперсии выборки из популяции

In [60]:
data = [0.0, 0.25, 0.25, 1.25, 1.5, 1.75, 2.75, 3.25]
pvariance(data)

1.25

In [61]:
variance(data)

1.4285714285714286

Стандартное отклонение реализовано аналагично:

`pstdev()` - для вычисления стандартного отклонения генеральной совокупности данных

`stdev()` - для расчетов стандартного отклонения  из популяции

In [62]:
pstdev(data)

1.118033988749895

In [63]:
stdev(data)

1.1952286093343936

### `NormalDist` объекты
Готовое решение классических вероятностных задач.

`NormalDist` - инструмент создания и использования нормальных распределений случайной величины.

Класс `NormalDist(mu=0.0,sigma=1.0)` - создает `NormalDist` объект, в котором `mu` - среднее арифметическое, а `sigma` - стандартное отклонение.

Метод `from_samples(data)` - создает экземпляр нормального распределения из данных, используя `fmean()` и `stdev()`.

Пример задачи:

Известно, что результаты SAT (Академический оценочный тест) в среднем составляют $1060$ балла, с стандартным отклонением в $195$ баллов. Определить процент студентов, с результатом в границах $[1100..1200]$.

решается в три строчки кода:

In [64]:
sat = NormalDist(1060, 195)
fraction = sat.cdf(1200 + 0.5) - sat.cdf(1100 - 0.5)
round(fraction * 100.0, 1)

18.4

## Источники и ссылки:

[Семён Лукашевский - pyprog.pro - Справочник по стандартной библиотеке языка Python](https://pyprog.pro/python/st_lib/standart_library.html)

[docs.python.org](https://docs.python.org)

Даг Хеллман - Стандартная библиотека Python 3. Справочник с примерами

Холден Стив, Рейвенскрофт Анна - Python. Справочник. Полное описание языка