**Формула энтропии** (Шеннон):

   $ H = -\sum p_i \log_2 p_i $,  
   где $ p_i $ — вероятность события $ i $.  
   Измеряет неопределенность или информационную ёмкость (в битах). Максимальна при равных вероятностях, минимальна (ноль) при предсказуемом исходе.

**Общий смысл**: энтропия растёт с увеличением хаоса или неопределённости.

In [None]:
import math

shennon = lambda X: -sum([x * math.log2(x) for x in X if x != 0])

a = [0, 1]
# shennon(a) will result in an error because of the 0 value.  The below code will work if a is something like:
a = [0.5, 0.5]
shennon(a)

1.0

In [None]:
[1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0]

[1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 0, 1, 1, 1, 1]
[1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 1, 0], [1, 1, 1, 1]
[1, 0, 1, 0, 1, 0, 1, 0, 1, 0], [1, 1, 0]
[1, 0, 1, 0, 1, 0, 1, 0, 1], [0], [1, 1], [0]

Когда одна из вероятностей равна нулю, логарифм этой вероятности не определён. Однако в формуле энтропии Шеннона это не вызывает проблем благодаря свойству предела:

$$ \lim_{p \to 0} p \log p = 0 $$

Это означает, что если одна из вероятностей $$ p_i = 0 $$, то слагаемое $$ p_i \log p_i $$ также стремится к нулю и может быть считано равным нулю.

Таким образом, когда вы рассчитываете энтропию по формуле:

$$ H = -\sum_{i=1}^{n} p_i \log_b p_i $$

вы можете просто пропустить члены с $$ p_i = 0 $$, поскольку их вклад в сумму будет равен нулю.

Этот подход позволяет избежать проблем с неопределённостью логарифма при нулевой вероятности и обеспечивает непрерывность формулы для всех допустимых распределений вероятностей[2][3].